Support for Windows Registry.
Mon, 26 Oct 2009 11:03:07 +0000 (11:03 +0000)
Thu, 29 Oct 2009 15:58:23 +0000 (15:58 +0000)
In hivex/:  This mini-library allows us to extract Windows
Registry binary files ("hives").

There are also two tools: hivexml converts a hive to a
self-describing XML format.  hivexget can be used to extract
single subkeys from a hive.

New tool: virt-win-reg.  This is a wrapper around the library
functionality allowing you to pull out data from the registries
of Windows guests.

19 files changed:
hivex/LICENSE [new file with mode: 0644]
hivex/ [new file with mode: 0644]
hivex/README [new file with mode: 0644]
hivex/hivex.c [new file with mode: 0644]
hivex/hivex.h [new file with mode: 0644]
hivex/hivex.pod [new file with mode: 0644]
hivex/hivexget.c [new file with mode: 0644]
hivex/hivexget.pod [new file with mode: 0644]
hivex/hivexml.c [new file with mode: 0644]
hivex/hivexml.pod [new file with mode: 0644]
tools/virt-win-reg [new file with mode: 0755]

@@ -66,6 +66,10 @@ haskell/Guestfs010Launch
@@ -76,6 +80,7 @@ html/virt-inspector.1.html
diff --git a/HACKING b/HACKING
@@ -86,6 +86,10 @@ fish/
         Haskell bindings.
+       Hive extraction library, for reading Windows Registry files.
+       See hivex/README for more details.
         Some guest images to test against.  These are gzipped to save
         space.  You have to unzip them before use.
@@ -17,7 +17,7 @@
-SUBDIRS = gnulib/lib src daemon appliance fish po examples images \
+SUBDIRS = gnulib/lib hivex src daemon appliance fish po examples images \
        gnulib/tests capitests regressions test-tool
 # NB: Must build inspector directory after perl and before ocaml.
diff --git a/README b/README
@@ -50,6 +50,8 @@ Requirements
 - genisoimage / mkisofs
+- libxml2
 - (Optional) Augeas (
 - perldoc (pod2man, pod2text) to generate the manual pages and
@@ -86,6 +86,7 @@ if test "$gl_gcc_warnings" = yes; then
   # ?? -Wstrict-overflow
   nw="$nw -Wunsafe-loop-optimizations" # just a warning that an optimization
                                     # was not possible, safe to ignore
+  nw="$nw -Wpacked"                 # Allow attribute((packed)) on structs
   gl_MANYWARN_COMPLEMENT([ws], [$ws], [$nw])
@@ -415,6 +416,11 @@ dnl For i18n.
+dnl libxml2 is used by the hivex library.
+PKG_CHECK_MODULES([LIBXML2], [libxml-2.0])
 dnl Check for OCaml (optional, for OCaml bindings).
@@ -722,6 +728,7 @@ AC_CONFIG_FILES([Makefile
+                hivex/Makefile
                  ocaml/META perl/Makefile.PL])
diff --git a/hivex/LICENSE b/hivex/LICENSE
new file mode 100644 (file)
index 0000000..fb885da
--- /dev/null
@@ -0,0 +1,506 @@
+# libguestfs
+# Copyright (C) 2009 Red Hat Inc.
+# This program is free software; you can redistribute it and/or modify
+# it under the terms of the GNU General Public License as published by
+# the Free Software Foundation; either version 2 of the License, or
+# (at your option) any later version.
+# This program is distributed in the hope that it will be useful,
+# but WITHOUT ANY WARRANTY; without even the implied warranty of
+# GNU General Public License for more details.
+# You should have received a copy of the GNU General Public License
+# along with this program; if not, write to the Free Software
+# Foundation, Inc., 675 Mass Ave, Cambridge, MA 02139, USA.
+EXTRA_DIST = hivex.pod hivexml.pod hivexget.pod
+libhivex_la_SOURCES = \
+  hivex.c \
+  hivex.h
+libhivex_la_LDFLAGS = -version-info 0:0:0
+libhivex_la_CFLAGS = \
+bin_PROGRAMS = hivexml hivexget
+hivexml_SOURCES = \
+  hivexml.c
+hivexml_LDADD = $(LIBXML2_LIBS)
+hivexml_CFLAGS = \
+hivexget_SOURCES = \
+  hivexget.c
+hivexget_LDADD =
+hivexget_CFLAGS = \
+man_MANS = hivex.3 hivexml.1 hivexget.1
+hivex.3: hivex.pod
+       $(POD2MAN) \
+         --section 3 \
+         -c "Windows Registry" \
+         --name "hivex" \
+         --release "$(PACKAGE_NAME)-$(PACKAGE_VERSION)" \
+         $< > $@-t; mv $@-t $@
+hivexml.1: hivexml.pod
+       $(POD2MAN) \
+         --section 1 \
+         -c "Windows Registry" \
+         --name "hivexml" \
+         --release "$(PACKAGE_NAME)-$(PACKAGE_VERSION)" \
+         $< > $@-t; mv $@-t $@
+hivexget.1: hivexget.pod
+       $(POD2MAN) \
+         --section 1 \
+         -c "Windows Registry" \
+         --name "hivexget" \
+         --release "$(PACKAGE_NAME)-$(PACKAGE_VERSION)" \
+         $< > $@-t; mv $@-t $@
+hivex - by Richard W.M. Jones,
+Copyright (C) 2009 Red Hat Inc.
+This is a self-contained library for reading Windows Registry "hive"
+binary files.
+It is totally dedicated to reading the files and doesn't deal with
+writing or modifying them in any way.
+Unlike many other tools in this area, it doesn't use the textual .REG
+format for output, because parsing that is as much trouble as parsing
+the original binary format.  Instead it makes the file available
+through a C API, or there is a separate program to export the hive as
+This library was derived from several sources:
+ . NTREG registry reader/writer library by Petter Nordahl-Hagen
+    (LGPL v2.1 licensed library and program)
+ .
+ . dumphive (a BSD-licensed Pascal program by Markus Stephany)
+Like NTREG, this library only attempts to read Windows NT registry
+files (ie. not Windows 3.1 or Windows 95/98/ME).  See the link above
+for documentation on the older formats if you wish to read them.
+Unlike NTREG, this code is much more careful about handling error
+cases, corrupt and malicious registry files, and endianness.
+The license for this library is LGPL v2.1, but not later versions.
+For full details, see the file LICENSE in this directory.
+/* hivex - Windows Registry "hive" extraction library.
+ * Copyright (C) 2009 Red Hat Inc.
+ * Derived from code by Petter Nordahl-Hagen under a compatible license:
+ *   Copyright (c) 1997-2007 Petter Nordahl-Hagen.
+ * Derived from code by Markus Stephany under a compatible license:
+ *   Copyright (c) 2000-2004, Markus Stephany.
+ *
+ * This library is free software; you can redistribute it and/or
+ * modify it under the terms of the GNU Lesser General Public
+ * License as published by the Free Software Foundation;
+ * version 2.1 of the License.
+ *
+ * This library is distributed in the hope that it will be useful,
+ * but WITHOUT ANY WARRANTY; without even the implied warranty of
+ * Lesser General Public License for more details.
+ *
+ * See file LICENSE for the full license.
+ */
+#include <stdio.h>
+#include <stdlib.h>
+#include <stdint.h>
+#include <string.h>
+#include <endian.h>
+#include <fcntl.h>
+#include <unistd.h>
+#include <errno.h>
+#include <iconv.h>
+#include <sys/mman.h>
+#include <sys/stat.h>
+#include <assert.h>
+#include "hivex.h"
+struct hive_h {
+  int fd;
+  size_t size;
+  int msglvl;
+  /* Memory-mapped (readonly) registry file. */
+  union {
+    char *addr;
+    struct ntreg_header *hdr;
+  };
+  /* Use a bitmap to store which file offsets are valid (point to a
+   * used block).  We only need to store 1 bit per 32 bits of the file
+   * (because blocks are 4-byte aligned).  We found that the average
+   * block size in a registry file is ~50 bytes.  So roughly 1 in 12
+   * bits in the bitmap will be set, making it likely a more efficient
+   * structure than a hash table.
+   */
+  char *bitmap;
+#define BITMAP_SET(bitmap,off) (bitmap[(off)>>5] |= 1 << (((off)>>2)&7))
+#define BITMAP_CLR(bitmap,off) (bitmap[(off)>>5] &= ~ (1 << (((off)>>2)&7)))
+#define BITMAP_TST(bitmap,off) (bitmap[(off)>>5] & (1 << (((off)>>2)&7)))
+#define IS_VALID_BLOCK(h,off)                 \
+  (((off) & 3) == 0 &&                      \
+   (off) >= 0x1000 &&                       \
+   (off) < (h)->size &&                     \
+   BITMAP_TST((h)->bitmap,(off)))
+  /* Fields from the header, extracted from little-endianness. */
+  size_t rootoffs;              /* Root key offset (always an nk-block). */
+  /* Stats. */
+  size_t pages;                 /* Number of hbin pages read. */
+  size_t blocks;                /* Total number of blocks found. */
+  size_t used_blocks;           /* Total number of used blocks found. */
+  size_t used_size;             /* Total size (bytes) of used blocks. */
+/* NB. All fields are little endian. */
+struct ntreg_header {
+  char magic[4];                /* "regf" */
+  uint32_t unknown1;
+  uint32_t unknown2;
+  char last_modified[8];
+  uint32_t unknown3;            /* 1 */
+  uint32_t unknown4;            /* 3 */
+  uint32_t unknown5;            /* 0 */
+  uint32_t unknown6;            /* 1 */
+  uint32_t offset;              /* offset of root key record - 4KB */
+  uint32_t blocks;              /* size in bytes of data (filesize - 4KB) */
+  uint32_t unknown7;            /* 1 */
+  char name[0x1fc-0x2c];
+  uint32_t csum;                /* checksum: sum of 32 bit words 0-0x1fb. */
+} __attribute__((__packed__));
+struct ntreg_hbin_page {
+  char magic[4];                /* "hbin" */
+  uint32_t offset_first;        /* offset from 1st block */
+  uint32_t offset_next;         /* offset of next (relative to this) */
+  char unknown[20];
+  /* Linked list of blocks follows here. */
+} __attribute__((__packed__));
+struct ntreg_hbin_block {
+  int32_t seg_len;              /* length of this block (-ve for used block) */
+  char id[2];                   /* the block type (eg. "nk" for nk record) */
+  /* Block data follows here. */
+} __attribute__((__packed__));
+#define BLOCK_ID_EQ(h,offs,eqid) \
+  (strncmp (((struct ntreg_hbin_block *)((h)->addr + (offs)))->id, (eqid), 2) == 0)
+static size_t
+block_len (hive_h *h, size_t blkoff, int *used)
+  struct ntreg_hbin_block *block;
+  block = (struct ntreg_hbin_block *) (h->addr + blkoff);
+  int32_t len = le32toh (block->seg_len);
+  if (len < 0) {
+    if (used) *used = 1;
+    len = -len;
+  } else {
+    if (used) *used = 0;
+  }
+  return (size_t) len;
+struct ntreg_nk_record {
+  int32_t seg_len;              /* length (always -ve because used) */
+  char id[2];                   /* "nk" */
+  uint16_t flags;
+  char timestamp[12];
+  uint32_t parent;              /* offset of owner/parent */
+  uint32_t nr_subkeys;          /* number of subkeys */
+  uint32_t unknown1;
+  uint32_t subkey_lf;           /* lf record containing list of subkeys */
+  uint32_t unknown2;
+  uint32_t nr_values;           /* number of values */
+  uint32_t vallist;             /* value-list record */
+  uint32_t sk;                  /* offset of sk-record */
+  uint32_t classname;           /* offset of classname record */
+  char unknown3[16];
+  uint32_t unknown4;
+  uint16_t name_len;            /* length of name */
+  uint16_t classname_len;       /* length of classname */
+  char name[1];                 /* name follows here */
+} __attribute__((__packed__));
+struct ntreg_lf_record {
+  int32_t seg_len;
+  char id[2];                   /* "lf" */
+  uint16_t nr_keys;             /* number of keys in this record */
+  struct {
+    uint32_t offset;            /* offset of nk-record for this subkey */
+    char name[4];               /* first 4 characters of subkey name */
+  } keys[1];
+} __attribute__((__packed__));
+struct ntreg_ri_record {
+  int32_t seg_len;
+  char id[2];                   /* "ri" */
+  uint16_t nr_offsets;          /* number of pointers to lh records */
+  uint32_t offset[1];           /* list of pointers to lh records */
+} __attribute__((__packed__));
+/* This has no ID header. */
+struct ntreg_value_list {
+  int32_t seg_len;
+  uint32_t offset[1];           /* list of pointers to vk records */
+} __attribute__((__packed__));
+struct ntreg_vk_record {
+  int32_t seg_len;              /* length (always -ve because used) */
+  char id[2];                   /* "vk" */
+  uint16_t name_len;            /* length of name */
+  /* length of the data:
+   * If data_len is <= 4, then it's stored inline.
+   * If data_len is 0x80000000, then it's an inline dword.
+   * Top bit may be set or not set at random.
+   */
+  uint32_t data_len;
+  uint32_t data_offset;         /* pointer to the data (or data if inline) */
+  hive_type data_type;          /* type of the data */
+  uint16_t unknown1;            /* possibly always 1 */
+  uint16_t unknown2;
+  char name[1];                 /* key name follows here */
+} __attribute__((__packed__));
+hive_h *
+hivex_open (const char *filename, int flags)
+  hive_h *h = NULL;
+  h = calloc (1, sizeof *h);
+  if (h == NULL)
+    goto error;
+  h->msglvl = flags & HIVEX_OPEN_MSGLVL_MASK;
+  const char *debug = getenv ("HIVEX_DEBUG");
+  if (debug && strcmp (debug, "1") == 0)
+    h->msglvl = 2;
+  if (h->msglvl >= 2)
+    printf ("hivex_open: created handle %p\n", h);
+  h->fd = open (filename, O_RDONLY);
+  if (h->fd == -1)
+    goto error;
+  struct stat statbuf;
+  if (fstat (h->fd, &statbuf) == -1)
+    goto error;
+  h->size = statbuf.st_size;
+  h->addr = mmap (NULL, h->size, PROT_READ, MAP_SHARED, h->fd, 0);
+  if (h->addr == MAP_FAILED)
+    goto error;
+  if (h->msglvl >= 2)
+    printf ("hivex_open: mapped file at %p\n", h->addr);
+  /* Check header. */
+  if (h->hdr->magic[0] != 'r' ||
+      h->hdr->magic[1] != 'e' ||
+      h->hdr->magic[2] != 'g' ||
+      h->hdr->magic[3] != 'f') {
+    fprintf (stderr, "hivex: %s: not a Windows NT Registry hive file\n",
+             filename);
+    errno = ENOTSUP;
+    goto error;
+  }
+  h->bitmap = calloc (1 + h->size / 32, 1);
+#if 0                           /* Doesn't work. */
+  /* Header checksum. */
+  uint32_t *daddr = h->addr;
+  size_t i;
+  uint32_t sum = 0;
+  for (i = 0; i < 0x1fc / 4; ++i) {
+    sum += le32toh (*daddr);
+    daddr++;
+  }
+  if (sum != le32toh (h->hdr->csum)) {
+    fprintf (stderr, "hivex: %s: bad checksum in hive header\n", filename);
+    errno = EINVAL;
+    goto error;
+  }
+  h->rootoffs = le32toh (h->hdr->offset) + 0x1000;
+  if (h->msglvl >= 2)
+    printf ("hivex_open: root offset = %zu\n", h->rootoffs);
+  /* We'll set this flag when we see a block with the root offset (ie.
+   * the root block).
+   */
+  int seen_root_block = 0, bad_root_block = 0;
+  /* Read the pages and blocks.  The aim here is to be robust against
+   * corrupt or malicious registries.  So we make sure the loops
+   * always make forward progress.  We add the address of each block
+   * we read to a hash table so pointers will only reference the start
+   * of valid blocks.
+   */
+  size_t off;
+  struct ntreg_hbin_page *page;
+  for (off = 0x1000; off < h->size; off += le32toh (page->offset_next)) {
+    h->pages++;
+    page = (struct ntreg_hbin_page *) (h->addr + off);
+    if (page->magic[0] != 'h' ||
+        page->magic[1] != 'b' ||
+        page->magic[2] != 'i' ||
+        page->magic[3] != 'n') {
+      /* This error is seemingly common in uncorrupt registry files. */
+      /*
+      fprintf (stderr, "hivex: %s: ignoring trailing garbage at end of file (at %zu, after %zu pages)\n",
+               filename, off, h->pages);
+      */
+      break;
+    }
+    if (h->msglvl >= 2)
+      printf ("hivex_open: page at %zu\n", off);
+    if (le32toh (page->offset_next) <= sizeof (struct ntreg_hbin_page) ||
+        (le32toh (page->offset_next) & 3) != 0) {
+      fprintf (stderr, "hivex: %s: pagesize %d at %zu, bad registry\n",
+               filename, le32toh (page->offset_next), off);
+      errno = ENOTSUP;
+      goto error;
+    }
+    /* Read the blocks in this page. */
+    size_t blkoff;
+    struct ntreg_hbin_block *block;
+    int32_t seg_len;
+    for (blkoff = off + 0x20;
+         blkoff < off + le32toh (page->offset_next);
+         blkoff += seg_len) {
+      h->blocks++;
+      int is_root = blkoff == h->rootoffs;
+      if (is_root)
+        seen_root_block = 1;
+      block = (struct ntreg_hbin_block *) (h->addr + blkoff);
+      int used;
+      seg_len = block_len (h, blkoff, &used);
+      if (seg_len <= 4 || (seg_len & 3) != 0) {
+        fprintf (stderr, "hivex: %s: block size %d at %zu, bad registry\n",
+                 filename, le32toh (block->seg_len), blkoff);
+        errno = ENOTSUP;
+        goto error;
+      }
+      if (h->msglvl >= 2)
+        printf ("hivex_open: %s block id %d,%d at %zu%s\n",
+                used ? "used" : "free", block->id[0], block->id[1], blkoff,
+                is_root ? " (root)" : "");
+      if (is_root && !used)
+        bad_root_block = 1;
+      if (used) {
+        h->used_blocks++;
+        h->used_size += seg_len;
+        /* Root block must be an nk-block. */
+        if (is_root && (block->id[0] != 'n' || block->id[1] != 'k'))
+          bad_root_block = 1;
+        /* Note this blkoff is a valid address. */
+        BITMAP_SET (h->bitmap, blkoff);
+      }
+    }
+  }
+  if (!seen_root_block) {
+    fprintf (stderr, "hivex: %s: no root block found\n", filename);
+    errno = ENOTSUP;
+    goto error;
+  }
+  if (bad_root_block) {
+    fprintf (stderr, "hivex: %s: bad root block (free or not nk)\n", filename);
+    errno = ENOTSUP;
+    goto error;
+  }
+  if (h->msglvl >= 1)
+    printf ("hivex_open: successfully read Windows Registry hive file:\n"
+            "  pages:                  %zu\n"
+            "  blocks:                 %zu\n"
+            "  blocks used:            %zu\n"
+            "  bytes used:             %zu\n",
+            h->pages, h->blocks, h->used_blocks, h->used_size);
+  return h;
+ error:;
+  int err = errno;
+  if (h) {
+    free (h->bitmap);
+    if (h->addr && h->size && h->addr != MAP_FAILED)
+      munmap (h->addr, h->size);
+    if (h->fd >= 0)
+      close (h->fd);
+    free (h);
+  }
+  errno = err;
+  return NULL;
+hivex_close (hive_h *h)
+  int r;
+  free (h->bitmap);
+  munmap (h->addr, h->size);
+  r = close (h->fd);
+  free (h);
+  return r;
+hivex_root (hive_h *h)
+  hive_node_h ret = h->rootoffs;
+  if (!IS_VALID_BLOCK (h, ret)) {
+    errno = ENOKEY;
+    return 0;
+  }
+  return ret;
+char *
+hivex_node_name (hive_h *h, hive_node_h node)
+  if (!IS_VALID_BLOCK (h, node) || !BLOCK_ID_EQ (h, node, "nk")) {
+    errno = EINVAL;
+    return NULL;
+  }
+  struct ntreg_nk_record *nk = (struct ntreg_nk_record *) (h->addr + node);
+  /* AFAIK the node name is always plain ASCII, so no conversion
+   * to UTF-8 is necessary.  However we do need to nul-terminate
+   * the string.
+   */
+  /* nk->name_len is unsigned, 16 bit, so this is safe ...  However
+   * we have to make sure the length doesn't exceed the block length.
+   */
+  size_t len = le16toh (nk->name_len);
+  size_t seg_len = block_len (h, node, NULL);
+  if (sizeof (struct ntreg_nk_record) + len - 1 > seg_len) {
+    if (h->msglvl >= 2)
+      printf ("hivex_node_name: returning EFAULT because node name is too long (%zu, %zu)\n",
+              len, seg_len);
+    errno = EFAULT;
+    return NULL;
+  }
+  char *ret = malloc (len + 1);
+  if (ret == NULL)
+    return NULL;
+  memcpy (ret, nk->name, len);
+  ret[len] = '\0';
+  return ret;
+#if 0
+/* I think the documentation for the sk and classname fields in the nk
+ * record is wrong, or else the offset field is in the wrong place.
+ * Otherwise this makes no sense.  Disabled this for now -- it's not
+ * useful for reading the registry anyway.
+ */
+hivex_node_security (hive_h *h, hive_node_h node)
+  if (!IS_VALID_BLOCK (h, node) || !BLOCK_ID_EQ (h, node, "nk")) {
+    errno = EINVAL;
+    return 0;
+  }
+  struct ntreg_nk_record *nk = (struct ntreg_nk_record *) (h->addr + node);
+  hive_node_h ret = le32toh (nk->sk);
+  ret += 0x1000;
+  if (!IS_VALID_BLOCK (h, ret)) {
+    errno = EFAULT;
+    return 0;
+  }
+  return ret;
+hivex_node_classname (hive_h *h, hive_node_h node)
+  if (!IS_VALID_BLOCK (h, node) || !BLOCK_ID_EQ (h, node, "nk")) {
+    errno = EINVAL;
+    return 0;
+  }
+  struct ntreg_nk_record *nk = (struct ntreg_nk_record *) (h->addr + node);
+  hive_node_h ret = le32toh (nk->classname);
+  ret += 0x1000;
+  if (!IS_VALID_BLOCK (h, ret)) {
+    errno = EFAULT;
+    return 0;
+  }
+  return ret;
+hive_node_h *
+hivex_node_children (hive_h *h, hive_node_h node)
+  if (!IS_VALID_BLOCK (h, node) || !BLOCK_ID_EQ (h, node, "nk")) {
+    errno = EINVAL;
+    return NULL;
+  }
+  struct ntreg_nk_record *nk = (struct ntreg_nk_record *) (h->addr + node);
+  size_t nr_subkeys_in_nk = le32toh (nk->nr_subkeys);
+  /* Deal with the common "no subkeys" case quickly. */
+  hive_node_h *ret;
+  if (nr_subkeys_in_nk == 0) {
+    ret = malloc (sizeof (hive_node_h));
+    if (ret == NULL)
+      return NULL;
+    ret[0] = 0;
+    return ret;
+  }
+  /* Arbitrarily limit the number of subkeys we will ever deal with. */
+  if (nr_subkeys_in_nk > 1000000) {
+    errno = ERANGE;
+    return NULL;
+  }
+  /* The subkey_lf field can point either to an lf-record, which is
+   * the common case, or if there are lots of subkeys, to an
+   * ri-record.
+   */
+  size_t subkey_lf = le32toh (nk->subkey_lf);
+  subkey_lf += 0x1000;
+  if (!IS_VALID_BLOCK (h, subkey_lf)) {
+    if (h->msglvl >= 2)
+      printf ("hivex_node_children: returning EFAULT because subkey_lf is not a valid block (%zu)\n",
+              subkey_lf);
+    errno = EFAULT;
+    return NULL;
+  }
+  struct ntreg_hbin_block *block =
+    (struct ntreg_hbin_block *) (h->addr + subkey_lf);
+  /* Points to lf-record?  (Note, also "lh" but that is basically the
+   * same as "lf" as far as we are concerned here).
+   */
+  if (block->id[0] == 'l' && (block->id[1] == 'f' || block->id[1] == 'h')) {
+    struct ntreg_lf_record *lf = (struct ntreg_lf_record *) block;
+    /* Check number of subkeys in the nk-record matches number of subkeys
+     * in the lf-record.
+     */
+    size_t nr_subkeys_in_lf = le16toh (lf->nr_keys);
+    if (h->msglvl >= 2)
+      printf ("hivex_node_children: nr_subkeys_in_nk = %zu, nr_subkeys_in_lf = %zu\n",
+              nr_subkeys_in_nk, nr_subkeys_in_lf);
+    if (nr_subkeys_in_nk != nr_subkeys_in_lf) {
+      errno = ENOTSUP;
+      return NULL;
+    }
+    size_t len = block_len (h, subkey_lf, NULL);
+    if (8 + nr_subkeys_in_lf * 8 > len) {
+      if (h->msglvl >= 2)
+        printf ("hivex_node_children: returning EFAULT because too many subkeys (%zu, %zu)\n",
+                nr_subkeys_in_lf, len);
+      errno = EFAULT;
+      return NULL;
+    }
+    /* Allocate space for the returned values.  Note that
+     * nr_subkeys_in_lf is limited to a 16 bit value.
+     */
+    ret = malloc ((1 + nr_subkeys_in_lf) * sizeof (hive_node_h));
+    if (ret == NULL)
+      return NULL;
+    size_t i;
+    for (i = 0; i < nr_subkeys_in_lf; ++i) {
+      hive_node_h subkey = lf->keys[i].offset;
+      subkey += 0x1000;
+      if (!IS_VALID_BLOCK (h, subkey)) {
+        if (h->msglvl >= 2)
+          printf ("hivex_node_children: returning EFAULT because subkey is not a valid block (%zu)\n",
+                  subkey);
+        errno = EFAULT;
+        free (ret);
+        return NULL;
+      }
+      ret[i] = subkey;
+    }
+    ret[i] = 0;
+    return ret;
+  }
+  /* Points to ri-record? */
+  else if (block->id[0] == 'r' && block->id[1] == 'i') {
+    struct ntreg_ri_record *ri = (struct ntreg_ri_record *) block;
+    size_t nr_offsets = le16toh (ri->nr_offsets);
+    /* Count total number of children. */
+    size_t i, count = 0;
+    for (i = 0; i < nr_offsets; ++i) {
+      hive_node_h offset = ri->offset[i];
+      offset += 0x1000;
+      if (!IS_VALID_BLOCK (h, offset)) {
+        if (h->msglvl >= 2)
+          printf ("hivex_node_children: returning EFAULT because ri-offset is not a valid block (%zu)\n",
+                  offset);
+        errno = EFAULT;
+        return NULL;
+      }
+      if (!BLOCK_ID_EQ (h, offset, "lf") && !BLOCK_ID_EQ (h, offset, "lh")) {
+        errno = ENOTSUP;
+        return NULL;
+      }
+      struct ntreg_lf_record *lf =
+        (struct ntreg_lf_record *) (h->addr + offset);
+      count += le16toh (lf->nr_keys);
+    }
+    if (h->msglvl >= 2)
+      printf ("hivex_node_children: nr_subkeys_in_nk = %zu, counted = %zu\n",
+              nr_subkeys_in_nk, count);
+    if (nr_subkeys_in_nk != count) {
+      errno = ENOTSUP;
+      return NULL;
+    }
+    /* Copy list of children.  Note nr_subkeys_in_nk is limited to
+     * something reasonable above.
+     */
+    ret = malloc ((1 + nr_subkeys_in_nk) * sizeof (hive_node_h));
+    if (ret == NULL)
+      return NULL;
+    count = 0;
+    for (i = 0; i < nr_offsets; ++i) {
+      hive_node_h offset = ri->offset[i];
+      offset += 0x1000;
+      if (!IS_VALID_BLOCK (h, offset)) {
+        if (h->msglvl >= 2)
+          printf ("hivex_node_children: returning EFAULT because ri-offset is not a valid block (%zu)\n",
+                  offset);
+        errno = EFAULT;
+        return NULL;
+      }
+      if (!BLOCK_ID_EQ (h, offset, "lf") && !BLOCK_ID_EQ (h, offset, "lh")) {
+        errno = ENOTSUP;
+        return NULL;
+      }
+      struct ntreg_lf_record *lf =
+        (struct ntreg_lf_record *) (h->addr + offset);
+      size_t j;
+      for (j = 0; j < le16toh (lf->nr_keys); ++j) {
+        hive_node_h subkey = lf->keys[j].offset;
+        subkey += 0x1000;
+        if (!IS_VALID_BLOCK (h, subkey)) {
+          if (h->msglvl >= 2)
+            printf ("hivex_node_children: returning EFAULT because indirect subkey is not a valid block (%zu)\n",
+                    subkey);
+          errno = EFAULT;
+          free (ret);
+          return NULL;
+        }
+        ret[count++] = subkey;
+      }
+    }
+    ret[count] = 0;
+    return ret;
+  }
+  else {
+    errno = ENOTSUP;
+    return NULL;
+  }
+/* Very inefficient, but at least having a separate API call
+ * allows us to make it more efficient in future.
+ */
+hivex_node_get_child (hive_h *h, hive_node_h node, const char *nname)
+  hive_node_h *children = NULL;
+  char *name = NULL;
+  hive_node_h ret = 0;
+  children = hivex_node_children (h, node);
+  if (!children) goto error;
+  size_t i;
+  for (i = 0; children[i] != 0; ++i) {
+    name = hivex_node_name (h, children[i]);
+    if (!name) goto error;
+    if (strcasecmp (name, nname) == 0) {
+      ret = children[i];
+      break;
+    }
+    free (name); name = NULL;
+  }
+ error:
+  free (children);
+  free (name);
+  return ret;
+hivex_node_parent (hive_h *h, hive_node_h node)
+  if (!IS_VALID_BLOCK (h, node) || !BLOCK_ID_EQ (h, node, "nk")) {
+    errno = EINVAL;
+    return 0;
+  }
+  struct ntreg_nk_record *nk = (struct ntreg_nk_record *) (h->addr + node);
+  hive_node_h ret = le32toh (nk->parent);
+  ret += 0x1000;
+  printf ("parent = %zu\n", ret);
+  if (!IS_VALID_BLOCK (h, ret)) {
+    if (h->msglvl >= 2)
+      printf ("hivex_node_parent: returning EFAULT because parent is not a valid block (%zu)\n",
+              ret);
+    errno = EFAULT;
+    return 0;
+  }
+  return ret;
+hive_value_h *
+hivex_node_values (hive_h *h, hive_node_h node)
+  if (!IS_VALID_BLOCK (h, node) || !BLOCK_ID_EQ (h, node, "nk")) {
+    errno = EINVAL;
+    return 0;
+  }
+  struct ntreg_nk_record *nk = (struct ntreg_nk_record *) (h->addr + node);
+  size_t nr_values = le32toh (nk->nr_values);
+  if (h->msglvl >= 2)
+    printf ("hivex_node_values: nr_values = %zu\n", nr_values);
+  /* Deal with the common "no values" case quickly. */
+  hive_node_h *ret;
+  if (nr_values == 0) {
+    ret = malloc (sizeof (hive_node_h));
+    if (ret == NULL)
+      return NULL;
+    ret[0] = 0;
+    return ret;
+  }
+  /* Arbitrarily limit the number of values we will ever deal with. */
+  if (nr_values > 100000) {
+    errno = ERANGE;
+    return NULL;
+  }
+  /* Get the value list and check it looks reasonable. */
+  size_t vlist_offset = le32toh (nk->vallist);
+  vlist_offset += 0x1000;
+  if (!IS_VALID_BLOCK (h, vlist_offset)) {
+    if (h->msglvl >= 2)
+      printf ("hivex_node_values: returning EFAULT because value list is not a valid block (%zu)\n",
+              vlist_offset);
+    errno = EFAULT;
+    return NULL;
+  }
+  struct ntreg_value_list *vlist =
+    (struct ntreg_value_list *) (h->addr + vlist_offset);
+  size_t len = block_len (h, vlist_offset, NULL);
+  if (4 + nr_values * 4 > len) {
+    if (h->msglvl >= 2)
+      printf ("hivex_node_values: returning EFAULT because value list is too long (%zu, %zu)\n",
+              nr_values, len);
+    errno = EFAULT;
+    return NULL;
+  }
+  /* Allocate return array and copy values in. */
+  ret = malloc ((1 + nr_values) * sizeof (hive_node_h));
+  if (ret == NULL)
+    return NULL;
+  size_t i;
+  for (i = 0; i < nr_values; ++i) {
+    hive_node_h value = vlist->offset[i];
+    value += 0x1000;
+    if (!IS_VALID_BLOCK (h, value)) {
+      if (h->msglvl >= 2)
+        printf ("hivex_node_values: returning EFAULT because value is not a valid block (%zu)\n",
+                value);
+      errno = EFAULT;
+      free (ret);
+      return NULL;
+    }
+    ret[i] = value;
+  }
+  ret[i] = 0;
+  return ret;
+/* Very inefficient, but at least having a separate API call
+ * allows us to make it more efficient in future.
+ */
+hivex_node_get_value (hive_h *h, hive_node_h node, const char *key)
+  hive_value_h *values = NULL;
+  char *name = NULL;
+  hive_value_h ret = 0;
+  values = hivex_node_values (h, node);
+  if (!values) goto error;
+  size_t i;
+  for (i = 0; values[i] != 0; ++i) {
+    name = hivex_value_key (h, values[i]);
+    if (!name) goto error;
+    if (strcasecmp (name, key) == 0) {
+      ret = values[i];
+      break;
+    }
+    free (name); name = NULL;
+  }
+ error:
+  free (values);
+  free (name);
+  return ret;
+char *
+hivex_value_key (hive_h *h, hive_value_h value)
+  if (!IS_VALID_BLOCK (h, value) || !BLOCK_ID_EQ (h, value, "vk")) {
+    errno = EINVAL;
+    return 0;
+  }
+  struct ntreg_vk_record *vk = (struct ntreg_vk_record *) (h->addr + value);
+  /* AFAIK the key is always plain ASCII, so no conversion to UTF-8 is
+   * necessary.  However we do need to nul-terminate the string.
+   */
+  /* vk->name_len is unsigned, 16 bit, so this is safe ...  However
+   * we have to make sure the length doesn't exceed the block length.
+   */
+  size_t len = le16toh (vk->name_len);
+  size_t seg_len = block_len (h, value, NULL);
+  if (sizeof (struct ntreg_vk_record) + len - 1 > seg_len) {
+    if (h->msglvl >= 2)
+      printf ("hivex_value_key: returning EFAULT because key length is too long (%zu, %zu)\n",
+              len, seg_len);
+    errno = EFAULT;
+    return NULL;
+  }
+  char *ret = malloc (len + 1);
+  if (ret == NULL)
+    return NULL;
+  memcpy (ret, vk->name, len);
+  ret[len] = '\0';
+  return ret;
+hivex_value_type (hive_h *h, hive_value_h value, hive_type *t, size_t *len)
+  if (!IS_VALID_BLOCK (h, value) || !BLOCK_ID_EQ (h, value, "vk")) {
+    errno = EINVAL;
+    return -1;
+  }
+  struct ntreg_vk_record *vk = (struct ntreg_vk_record *) (h->addr + value);
+  if (t)
+    *t = le32toh (vk->data_type);
+  if (len) {
+    *len = le32toh (vk->data_len);
+    if (*len == 0x80000000) {   /* special case */
+      *len = 4;
+      if (t) *t = hive_t_dword;
+    }
+    *len &= 0x7fffffff;
+  }
+  return 0;
+char *
+hivex_value_value (hive_h *h, hive_value_h value,
+                   hive_type *t_rtn, size_t *len_rtn)
+  if (!IS_VALID_BLOCK (h, value) || !BLOCK_ID_EQ (h, value, "vk")) {
+    errno = EINVAL;
+    return NULL;
+  }
+  struct ntreg_vk_record *vk = (struct ntreg_vk_record *) (h->addr + value);
+  hive_type t;
+  size_t len;
+  t = le32toh (vk->data_type);
+  len = le32toh (vk->data_len);
+  if (len == 0x80000000) {      /* special case */
+    len = 4;
+    t = hive_t_dword;
+  }
+  len &= 0x7fffffff;
+  if (h->msglvl >= 2)
+    printf ("hivex_value_value: value=%zu, t=%d, len=%zu\n",
+            value, t, len);
+  if (t_rtn)
+    *t_rtn = t;
+  if (len_rtn)
+    *len_rtn = len;
+  /* Arbitrarily limit the length that we will read. */
+  if (len > 1000000) {
+    errno = ERANGE;
+    return NULL;
+  }
+  char *ret = malloc (len);
+  if (ret == NULL)
+    return NULL;
+  /* If length is <= 4 it's always stored inline. */
+  if (len <= 4) {
+    memcpy (ret, (char *) &vk->data_offset, len);
+    return ret;
+  }
+  size_t data_offset = vk->data_offset;
+  data_offset += 0x1000;
+  if (!IS_VALID_BLOCK (h, data_offset)) {
+    if (h->msglvl >= 2)
+      printf ("hivex_value_value: returning EFAULT because data offset is not a valid block (%zu)\n",
+              data_offset);
+    errno = EFAULT;
+    free (ret);
+    return NULL;
+  }
+  /* Check that the declared size isn't larger than the block its in. */
+  size_t blen = block_len (h, data_offset, NULL);
+  if (blen < len) {
+    if (h->msglvl >= 2)
+      printf ("hivex_value_value: returning EFAULT because data is longer than its block (%zu, %zu)\n",
+              blen, len);
+    errno = EFAULT;
+    free (ret);
+    return NULL;
+  }
+  char *data = h->addr + data_offset + 4;
+  memcpy (ret, data, len);
+  return ret;
+static char *
+windows_utf16_to_utf8 (/* const */ char *input, size_t len)
+  iconv_t ic = iconv_open ("UTF-8", "UTF-16");
+  if (ic == (iconv_t) -1)
+    return NULL;
+  /* iconv(3) has an insane interface ... */
+  /* Mostly UTF-8 will be smaller, so this is a good initial guess. */
+  size_t outalloc = len;
+ again:;
+  size_t inlen = len;
+  size_t outlen = outalloc;
+  char *out = malloc (outlen + 1);
+  if (out == NULL) {
+    int err = errno;
+    iconv_close (ic);
+    errno = err;
+    return NULL;
+  }
+  char *inp = input;
+  char *outp = out;
+  size_t r = iconv (ic, &inp, &inlen, &outp, &outlen);
+  if (r == (size_t) -1) {
+    if (errno == E2BIG) {
+      /* Try again with a larger output buffer. */
+      free (out);
+      outalloc *= 2;
+      goto again;
+    }
+    else {
+      /* Else some conversion failure, eg. EILSEQ, EINVAL. */
+      int err = errno;
+      iconv_close (ic);
+      free (out);
+      errno = err;
+      return NULL;
+    }
+  }
+  *outp = '\0';
+  iconv_close (ic);
+  return out;
+char *
+hivex_value_string (hive_h *h, hive_value_h value)
+  hive_type t;
+  size_t len;
+  char *data = hivex_value_value (h, value, &t, &len);
+  if (data == NULL)
+    return NULL;
+  if (t != hive_t_string && t != hive_t_expand_string && t != hive_t_link) {
+    free (data);
+    errno = EINVAL;
+    return NULL;
+  }
+  char *ret = windows_utf16_to_utf8 (data, len);
+  free (data);
+  if (ret == NULL)
+    return NULL;
+  return ret;
+static void
+free_strings (char **argv)
+  if (argv) {
+    size_t i;
+    for (i = 0; argv[i] != NULL; ++i)
+      free (argv[i]);
+    free (argv);
+  }
+/* Get the length of a UTF-16 format string.  Handle the string as
+ * pairs of bytes, looking for the first \0\0 pair.
+ */
+static size_t
+utf16_string_len_in_bytes (const char *str)
+  size_t ret = 0;
+  while (str[0] || str[1]) {
+    str += 2;
+    ret += 2;
+  }
+  return ret;
+/* */
+char **
+hivex_value_multiple_strings (hive_h *h, hive_value_h value)
+  hive_type t;
+  size_t len;
+  char *data = hivex_value_value (h, value, &t, &len);
+  if (data == NULL)
+    return NULL;
+  if (t != hive_t_multiple_strings) {
+    free (data);
+    errno = EINVAL;
+    return NULL;
+  }
+  size_t nr_strings = 0;
+  char **ret = malloc ((1 + nr_strings) * sizeof (char *));
+  if (ret == NULL) {
+    free (data);
+    return NULL;
+  }
+  ret[0] = NULL;
+  char *p = data;
+  size_t plen;
+  while (p < data + len && (plen = utf16_string_len_in_bytes (p)) > 0) {
+    nr_strings++;
+    char **ret2 = realloc (ret, (1 + nr_strings) * sizeof (char *));
+    if (ret2 == NULL) {
+      free_strings (ret);
+      free (data);
+      return NULL;
+    }
+    ret = ret2;
+    ret[nr_strings-1] = windows_utf16_to_utf8 (p, plen);
+    ret[nr_strings] = NULL;
+    if (ret[nr_strings-1] == NULL) {
+      free_strings (ret);
+      free (data);
+      return NULL;
+    }
+    p += plen + 2 /* skip over UTF-16 \0\0 at the end of this string */;
+  }
+  free (data);
+  return ret;
+hivex_value_dword (hive_h *h, hive_value_h value)
+  hive_type t;
+  size_t len;
+  char *data = hivex_value_value (h, value, &t, &len);
+  if (data == NULL)
+    return -1;
+  if ((t != hive_t_dword && t != hive_t_dword_be) || len != 4) {
+    free (data);
+    errno = EINVAL;
+    return -1;
+  }
+  int32_t ret = *(int32_t*)data;
+  free (data);
+  if (t == hive_t_dword)        /* little endian */
+    ret = le32toh (ret);
+  else
+    ret = be32toh (ret);
+  return ret;
+hivex_value_qword (hive_h *h, hive_value_h value)
+  hive_type t;
+  size_t len;
+  char *data = hivex_value_value (h, value, &t, &len);
+  if (data == NULL)
+    return -1;
+  if (t != hive_t_qword || len != 8) {
+    free (data);
+    errno = EINVAL;
+    return -1;
+  }
+  int64_t ret = *(int64_t*)data;
+  free (data);
+  ret = le64toh (ret);          /* always little endian */
+  return ret;
+hivex_visit (hive_h *h, const struct hivex_visitor *visitor, size_t len,
+             void *opaque, int flags)
+  return hivex_visit_node (h, hivex_root (h), visitor, len, opaque, flags);
+static int hivex__visit_node (hive_h *h, hive_node_h node, const struct hivex_visitor *vtor, char *unvisited, void *opaque, int flags);
+hivex_visit_node (hive_h *h, hive_node_h node,
+                  const struct hivex_visitor *visitor, size_t len, void *opaque,
+                  int flags)
+  struct hivex_visitor vtor;
+  memset (&vtor, 0, sizeof vtor);
+  /* Note that len might be larger *or smaller* than the expected size. */
+  size_t copysize = len <= sizeof vtor ? len : sizeof vtor;
+  memcpy (&vtor, visitor, copysize);
+  /* This bitmap records unvisited nodes, so we don't loop if the
+   * registry contains cycles.
+   */
+  char *unvisited = malloc (1 + h->size / 32);
+  if (unvisited == NULL)
+    return -1;
+  memcpy (unvisited, h->bitmap, 1 + h->size / 32);
+  int r = hivex__visit_node (h, node, &vtor, unvisited, opaque, flags);
+  free (unvisited);
+  return r;
+static int
+hivex__visit_node (hive_h *h, hive_node_h node,
+                   const struct hivex_visitor *vtor, char *unvisited,
+                   void *opaque, int flags)
+  int skip_bad = flags & HIVEX_VISIT_SKIP_BAD;
+  char *name = NULL;
+  hive_value_h *values = NULL;
+  hive_node_h *children = NULL;
+  char *key = NULL;
+  char *str = NULL;
+  char **strs = NULL;
+  int i;
+  /* Return -1 on all callback errors.  However on internal errors,
+   * check if skip_bad is set and suppress those errors if so.
+   */
+  int ret = -1;
+  if (!BITMAP_TST (unvisited, node)) {
+    if (h->msglvl >= 2)
+      printf ("hivex__visit_node: contains cycle: visited node %zu already\n",
+              node);
+    errno = ELOOP;
+    return skip_bad ? 0 : -1;
+  }
+  BITMAP_CLR (unvisited, node);
+  name = hivex_node_name (h, node);
+  if (!name) return skip_bad ? 0 : -1;
+  if (vtor->node_start && vtor->node_start (h, opaque, node, name) == -1)
+    goto error;
+  values = hivex_node_values (h, node);
+  if (!values) {
+    ret = skip_bad ? 0 : -1;
+    goto error;
+  }
+  for (i = 0; values[i] != 0; ++i) {
+    hive_type t;
+    size_t len;
+    if (hivex_value_type (h, values[i], &t, &len) == -1) {
+      ret = skip_bad ? 0 : -1;
+      goto error;
+    }
+    key = hivex_value_key (h, values[i]);
+    if (key == NULL) {
+      ret = skip_bad ? 0 : -1;
+      goto error;
+    }
+    switch (t) {
+    case hive_t_none:
+      str = hivex_value_value (h, values[i], &t, &len);
+      if (str == NULL) {
+        ret = skip_bad ? 0 : -1;
+        goto error;
+      }
+      if (t != hive_t_none) {
+        ret = skip_bad ? 0 : -1;
+        goto error;
+      }
+      if (vtor->value_none &&
+          vtor->value_none (h, opaque, node, values[i], t, len, key, str) == -1)
+        goto error;
+      free (str); str = NULL;
+      break;
+    case hive_t_string:
+    case hive_t_expand_string:
+    case hive_t_link:
+      str = hivex_value_string (h, values[i]);
+      if (str == NULL) {
+        if (errno != EILSEQ && errno != EINVAL) {
+          ret = skip_bad ? 0 : -1;
+          goto error;
+        }
+        if (vtor->value_string_invalid_utf16) {
+          str = hivex_value_value (h, values[i], &t, &len);
+          if (vtor->value_string_invalid_utf16 (h, opaque, node, values[i], t, len, key, str) == -1)
+            goto error;
+          free (str); str = NULL;
+        }
+        break;
+      }
+      if (vtor->value_string &&
+          vtor->value_string (h, opaque, node, values[i], t, len, key, str) == -1)
+        goto error;
+      free (str); str = NULL;
+      break;
+    case hive_t_dword:
+    case hive_t_dword_be: {
+      int32_t i32 = hivex_value_dword (h, values[i]);
+      if (vtor->value_dword &&
+          vtor->value_dword (h, opaque, node, values[i], t, len, key, i32) == -1)
+        goto error;
+      break;
+    }
+    case hive_t_qword: {
+      int64_t i64 = hivex_value_qword (h, values[i]);
+      if (vtor->value_qword &&
+          vtor->value_qword (h, opaque, node, values[i], t, len, key, i64) == -1)
+        goto error;
+      break;
+    }
+    case hive_t_binary:
+      str = hivex_value_value (h, values[i], &t, &len);
+      if (str == NULL) {
+        ret = skip_bad ? 0 : -1;
+        goto error;
+      }
+      if (t != hive_t_binary) {
+        ret = skip_bad ? 0 : -1;
+        goto error;
+      }
+      if (vtor->value_binary &&
+          vtor->value_binary (h, opaque, node, values[i], t, len, key, str) == -1)
+        goto error;
+      free (str); str = NULL;
+      break;
+    case hive_t_multiple_strings:
+      strs = hivex_value_multiple_strings (h, values[i]);
+      if (strs == NULL) {
+        if (errno != EILSEQ && errno != EINVAL) {
+          ret = skip_bad ? 0 : -1;
+          goto error;
+        }
+        if (vtor->value_string_invalid_utf16) {
+          str = hivex_value_value (h, values[i], &t, &len);
+          if (vtor->value_string_invalid_utf16 (h, opaque, node, values[i], t, len, key, str) == -1)
+            goto error;
+          free (str); str = NULL;
+        }
+        break;
+      }
+      if (vtor->value_multiple_strings &&
+          vtor->value_multiple_strings (h, opaque, node, values[i], t, len, key, strs) == -1)
+        goto error;
+      free_strings (strs); strs = NULL;
+      break;
+    case hive_t_resource_list:
+    case hive_t_full_resource_description:
+    case hive_t_resource_requirements_list:
+    default:
+      str = hivex_value_value (h, values[i], &t, &len);
+      if (str == NULL) {
+        ret = skip_bad ? 0 : -1;
+        goto error;
+      }
+      if (vtor->value_other &&
+          vtor->value_other (h, opaque, node, values[i], t, len, key, str) == -1)
+        goto error;
+      free (str); str = NULL;
+      break;
+    }
+    free (key); key = NULL;
+  }
+  children = hivex_node_children (h, node);
+  if (children == NULL) {
+    ret = skip_bad ? 0 : -1;
+    goto error;
+  }
+  for (i = 0; children[i] != 0; ++i) {
+    if (h->msglvl >= 2)
+      printf ("hivex__visit_node: %s: visiting subkey %d (%zu)\n",
+              name, i, children[i]);
+    if (hivex__visit_node (h, children[i], vtor, unvisited, opaque, flags) == -1)
+      goto error;
+  }
+  if (vtor->node_end && vtor->node_end (h, opaque, node, name) == -1)
+    goto error;
+  ret = 0;
+ error:
+  free (name);
+  free (values);
+  free (children);
+  free (key);
+  free (str);
+  free_strings (strs);
+  return ret;
+/* hivex - Windows Registry "hive" extraction library.
+ * Copyright (C) 2009 Red Hat Inc.
+ * Derived from code by Petter Nordahl-Hagen under a compatible license:
+ *   Copyright (c) 1997-2007 Petter Nordahl-Hagen.
+ * Derived from code by Markus Stephany under a compatible license:
+ *   Copyright (c)2000-2004, Markus Stephany.
+ *
+ * This library is free software; you can redistribute it and/or
+ * modify it under the terms of the GNU Lesser General Public
+ * License as published by the Free Software Foundation;
+ * version 2.1 of the License.
+ *
+ * This library is distributed in the hope that it will be useful,
+ * but WITHOUT ANY WARRANTY; without even the implied warranty of
+ * Lesser General Public License for more details.
+ *
+ * See file LICENSE for the full license.
+ */
+#ifndef HIVEX_H_
+#define HIVEX_H_
+#ifdef __cplusplus
+extern "C" {
+/* NOTE: This API is documented in the man page hivex(3). */
+typedef struct hive_h hive_h;
+typedef size_t hive_node_h;
+typedef size_t hive_value_h;
+enum hive_type {
+  /* Just a key without a value. */
+  hive_t_none = 0,
+  /* A UTF-16 Windows string. */
+  hive_t_string = 1,
+  /* A UTF-16 Windows string that contains %env% (environment variable
+   * substitutions).
+   */
+  hive_t_expand_string = 2,
+  /* A blob of binary. */
+  hive_t_binary = 3,
+  /* Two ways to encode DWORDs (32 bit words).  The first is little-endian. */
+  hive_t_dword = 4,
+  hive_t_dword_be = 5,
+  /* Symbolic link, we think to another part of the registry tree. */
+  hive_t_link = 6,
+  /* Multiple UTF-16 Windows strings, each separated by zero byte.  See:
+   *
+   */
+  hive_t_multiple_strings = 7,
+  /* These three are unknown. */
+  hive_t_resource_list = 8,
+  hive_t_full_resource_description = 9,
+  hive_t_resource_requirements_list = 10,
+  /* A QWORD (64 bit word).  This is stored in the file little-endian. */
+  hive_t_qword = 11
+typedef enum hive_type hive_type;
+#define HIVEX_OPEN_VERBOSE      1
+#define HIVEX_OPEN_DEBUG        2
+extern hive_h *hivex_open (const char *filename, int flags);
+extern int hivex_close (hive_h *h);
+extern hive_node_h hivex_root (hive_h *h);
+extern char *hivex_node_name (hive_h *h, hive_node_h node);
+extern hive_node_h *hivex_node_children (hive_h *h, hive_node_h node);
+extern hive_node_h hivex_node_get_child (hive_h *h, hive_node_h node, const char *name);
+extern hive_node_h hivex_node_parent (hive_h *h, hive_node_h node);
+extern hive_value_h *hivex_node_values (hive_h *h, hive_node_h node);
+extern hive_value_h hivex_node_get_value (hive_h *h, hive_node_h node, const char *key);
+extern char *hivex_value_key (hive_h *h, hive_value_h value);
+extern int hivex_value_type (hive_h *h, hive_value_h value, hive_type *t, size_t *len);
+extern char *hivex_value_value (hive_h *h, hive_value_h value, hive_type *t, size_t *len);
+extern char *hivex_value_string (hive_h *h, hive_value_h value);
+extern char **hivex_value_multiple_strings (hive_h *h, hive_value_h value);
+extern int32_t hivex_value_dword (hive_h *h, hive_value_h value);
+extern int64_t hivex_value_qword (hive_h *h, hive_value_h value);
+struct hivex_visitor {
+  int (*node_start) (hive_h *, void *opaque, hive_node_h, const char *name);
+  int (*node_end) (hive_h *, void *opaque, hive_node_h, const char *name);
+  int (*value_string) (hive_h *, void *opaque, hive_node_h, hive_value_h, hive_type t, size_t len, const char *key, const char *str);
+  int (*value_multiple_strings) (hive_h *, void *opaque, hive_node_h, hive_value_h, hive_type t, size_t len, const char *key, char **argv);
+  int (*value_string_invalid_utf16) (hive_h *, void *opaque, hive_node_h, hive_value_h, hive_type t, size_t len, const char *key, const char *str);
+  int (*value_dword) (hive_h *, void *opaque, hive_node_h, hive_value_h, hive_type t, size_t len, const char *key, int32_t);
+  int (*value_qword) (hive_h *, void *opaque, hive_node_h, hive_value_h, hive_type t, size_t len, const char *key, int64_t);
+  int (*value_binary) (hive_h *, void *opaque, hive_node_h, hive_value_h, hive_type t, size_t len, const char *key, const char *value);
+  int (*value_none) (hive_h *, void *opaque, hive_node_h, hive_value_h, hive_type t, size_t len, const char *key, const char *value);
+  int (*value_other) (hive_h *, void *opaque, hive_node_h, hive_value_h, hive_type t, size_t len, const char *key, const char *value);
+extern int hivex_visit (hive_h *h, const struct hivex_visitor *visitor, size_t len, void *opaque, int flags);
+extern int hivex_visit_node (hive_h *h, hive_node_h node, const struct hivex_visitor *visitor, size_t len, void *opaque, int flags);
+#ifdef __cplusplus
+#endif /* HIVEX_H_ */
+=encoding utf8
+=head1 NAME
+hivex - Windows Registry "hive" extraction library
+=head1 SYNOPSIS
+ hive_h *hivex_open (const char *filename, int flags);
+ int hivex_close (hive_h *h);
+libhivex is a library for extracting the contents of Windows Registry
+"hive" files.  It is designed to be secure against buggy or malicious
+registry files, and to have limited functionality (writing or
+modifying these files is not in the scope of this library).
+Unlike many other tools in this area, it doesn't use the textual .REG
+format for output, because parsing that is as much trouble as parsing
+the original binary format.  Instead it makes the file available
+through a C API, or there is a separate program to export the hive as
+XML (see L<hivexml(1)>), or to get individual keys (see
+=over 4
+=item hive_h *hivex_open (const char *filename, int flags);
+Opens the hive named C<filename> for reading.
+Flags is an ORed list of the open flags (or C<0> if you don't
+want to pass any flags).  Currently the only
+flags defined are:
+=over 4
+Verbose messages.
+Very verbose messages, suitable for debugging problems in the library
+This is also selected if the C<HIVEX_DEBUG> environment variable
+is set to 1.
+C<hivex_open> returns a hive handle.  On error this returns NULL and
+sets C<errno> to indicate the error.
+=item int hivex_close (hive_h *h);
+Close a hive handle and free all associated resources.
+Returns 0 on success.  On error this returns -1 and sets errno.
+=over 4
+=item hive_node_h hivex_root (hive_h *h);
+Return root node of the hive.  All valid registries must contain
+a root node.
+On error this returns 0 and sets errno.
+=item char *hivex_node_name (hive_h *h, hive_node_h node);
+Return the name of the node.  The name is reencoded as UTF-8
+and returned as a C string.
+The string should be freed by the caller when it is no longer needed.
+Note that the name of the root node is a dummy, such as
+C<$$$PROTO.HIV> (other names are possible: it seems to depend on the
+tool or program that created the hive in the first place).  You can
+only know the "real" name of the root node by knowing which registry
+file this hive originally comes from, which is knowledge that is
+outside the scope of this library.
+On error this returns NULL and sets errno.
+=item hive_node_h *hivex_node_children (hive_h *h, hive_node_h node);
+Return a 0-terminated array of nodes which are the subkeys
+(children) of C<node>.
+The array should be freed by the caller when it is no longer needed.
+On error this returns NULL and sets errno.
+=item hive_node_h hivex_node_get_child (hive_h *h, hive_node_h node, const char *name);
+Return the child of node with the name C<name>, if it exists.
+The name is matched case insensitively.
+If the child node does not exist, this returns 0 without
+setting errno.
+On error this returns 0 and sets errno.
+=item hive_node_h hivex_node_parent (hive_h *h, hive_node_h node);
+Return the parent of C<node>.
+On error this returns 0 and sets errno.
+The parent pointer of the root node in registry files that we
+have examined seems to be invalid, and so this function will
+return an error if called on the root node.
+The enum below describes the possible types for the value(s)
+stored at each node.
+ enum hive_type {
+   hive_t_none = 0,
+   hive_t_string = 1,
+   hive_t_expand_string = 2,
+   hive_t_binary = 3,
+   hive_t_dword = 4,
+   hive_t_dword_be = 5,
+   hive_t_link = 6,
+   hive_t_multiple_strings = 7,
+   hive_t_resource_list = 8,
+   hive_t_full_resource_description = 9,
+   hive_t_resource_requirements_list = 10,
+   hive_t_qword = 11
+ };
+=over 4
+=item hive_value_h *hivex_node_values (hive_h *h, hive_node_h node);
+Return the 0-terminated array of (key, value) pairs attached to
+this node.
+The array should be freed by the caller when it is no longer needed.
+On error this returns NULL and sets errno.
+=item hive_value_h hivex_node_get_value (hive_h *h, hive_node_h node, const char *key);
+Return the value attached to this node which has the name C<key>,
+if it exists.
+The key name is matched case insensitively.
+Note that to get the default key, you should pass the empty
+string C<""> here.  The default key is often written C<"@">, but
+inside hives that has no meaning and won't give you the
+default key.
+If no such key exists, this returns 0 and does not set errno.
+On error this returns 0 and sets errno.
+=item char *hivex_value_key (hive_h *h, hive_value_h value);
+Return the key (name) of a (key, value) pair.  The name
+is reencoded as UTF-8 and returned as a C string.
+The string should be freed by the caller when it is no longer needed.
+Note that this function can return a zero-length string.  In the
+context of Windows Registries, this means that this value is the
+default key for this node in the tree.  This is usually written
+as C<"@">.
+On error this returns NULL and sets errno.
+=item int hivex_value_type (hive_h *h, hive_value_h value, hive_type *t, size_t *len);
+Return the data type and length of the value in this (key, value)
+pair.  See also C<hivex_value_value> which returns all this
+information, and the value itself.  Also, C<hivex_value_*> functions
+below which can be used to return the value in a more useful form when
+you know the type in advance.
+Returns 0 on success.  On error this returns -1 and sets errno.
+=item char *hivex_value_value (hive_h *h, hive_value_h value, hive_type *t, size_t *len);
+Return the value of this (key, value) pair.  The value should
+be interpreted according to its type (see C<hive_type>).
+The value is returned in an array of bytes of length C<len>.
+The value should be freed by the caller when it is no longer needed.
+On error this returns NULL and sets errno.
+=item char *hivex_value_string (hive_h *h, hive_value_h value);
+If this value is a string, return the string reencoded as UTF-8
+(as a C string).  This only works for values which have type
+C<hive_t_string>, C<hive_t_expand_string> or C<hive_t_link>.
+The string should be freed by the caller when it is no longer needed.
+On error this returns NULL and sets errno.
+=item char **hivex_value_multiple_strings (hive_h *h, hive_value_h value);
+If this value is a multiple-string, return the strings reencoded
+as UTF-8 (as a NULL-terminated array of C strings).  This only
+works for values which have type C<hive_t_multiple_strings>.
+The string array and each string in it should be freed by the
+caller when they are no longer needed.
+On error this returns NULL and sets errno.
+=item int32_t hivex_value_dword (hive_h *h, hive_value_h value);
+If this value is a DWORD (Windows int32), return it.  This only works
+for values which have type C<hive_t_dword> or C<hive_t_dword_be>.
+=item int64_t hivex_value_qword (hive_h *h, hive_value_h value);
+If this value is a QWORD (Windows int64), return it.  This only
+works for values which have type C<hive_t_qword>.
+The visitor pattern is useful if you want to visit all nodes
+in the tree or all nodes below a certain point in the tree.
+First you set up your own C<struct hivex_visitor> with your
+callback functions.
+Each of these callback functions should return 0 on success or -1
+on error.  If any callback returns -1, then the entire visit
+terminates immediately.  If you don't need a callback function at
+all, set the function pointer to NULL.
+ struct hivex_visitor {
+   int (*node_start) (hive_h *, void *opaque, hive_node_h, const char *name);
+   int (*node_end) (hive_h *, void *opaque, hive_node_h, const char *name);
+   int (*value_string) (hive_h *, void *opaque, hive_node_h, hive_value_h,
+         hive_type t, size_t len, const char *key, const char *str);
+   int (*value_multiple_strings) (hive_h *, void *opaque, hive_node_h,
+         hive_value_h, hive_type t, size_t len, const char *key, char **argv);
+   int (*value_string_invalid_utf16) (hive_h *, void *opaque, hive_node_h,
+         hive_value_h, hive_type t, size_t len, const char *key,
+         const char *str);
+   int (*value_dword) (hive_h *, void *opaque, hive_node_h, hive_value_h,
+         hive_type t, size_t len, const char *key, int32_t);
+   int (*value_qword) (hive_h *, void *opaque, hive_node_h, hive_value_h,
+         hive_type t, size_t len, const char *key, int64_t);
+   int (*value_binary) (hive_h *, void *opaque, hive_node_h, hive_value_h,
+         hive_type t, size_t len, const char *key, const char *value);
+   int (*value_none) (hive_h *, void *opaque, hive_node_h, hive_value_h,
+         hive_type t, size_t len, const char *key, const char *value);
+   int (*value_other) (hive_h *, void *opaque, hive_node_h, hive_value_h,
+         hive_type t, size_t len, const char *key, const char *value);
+ };
+=over 4
+=item int hivex_visit (hive_h *h, const struct hivex_visitor *visitor, size_t len, void *opaque, int flags);
+Visit all the nodes recursively in the hive C<h>.
+C<visitor> should be a C<hivex_visitor> structure with callback
+fields filled in as required (unwanted callbacks can be set to
+NULL).  C<len> must be the length of the 'visitor' struct (you
+should pass C<sizeof (struct hivex_visitor)> for this).
+This returns 0 if the whole recursive visit was completed
+successfully.  On error this returns -1.  If one of the callback
+functions returned an error than we don't touch errno.  If the
+error was generated internally then we set errno.
+You can skip bad registry entries by setting C<flag> to
+C<HIVEX_VISIT_SKIP_BAD>.  If this flag is not set, then a bad registry
+causes the function to return an error immediately.
+This function is robust if the registry contains cycles or
+pointers which are invalid or outside the registry.  It detects
+these cases and returns an error.
+=item int hivex_visit_node (hive_h *h, hive_node_h node, const struct hivex_visitor *visitor, size_t len, void *opaque);
+Same as C<hivex_visit> but instead of starting out at the root, this
+starts at C<node>.
+Note: To understand the relationship between hives and the common
+Windows Registry keys (like C<HKEY_LOCAL_MACHINE>) please see the
+Wikipedia page on the Windows Registry.
+The Windows Registry is split across various binary files, each
+file being known as a "hive".  This library only handles a single
+hive file at a time.
+Hives are n-ary trees with a single root.  Each node in the tree
+has a name.
+Each node in the tree (including non-leaf nodes) may have an
+arbitrary list of (key, value) pairs attached to it.  It may
+be the case that one of these pairs has an empty key.  This
+is referred to as the default key for the node.
+The (key, value) pairs are the place where the useful data is
+stored in the registry.  The key is always a string (possibly the
+empty string for the default key).  The value is a typed object
+(eg. string, int32, binary, etc.).
+Many functions in this library set errno to indicate errors.
+These are the values of errno you may encounter:
+=over 4
+=item ENOTSUP
+Corrupt or unsupported Registry file format.
+=item ENOKEY
+Missing root key.
+=item EINVAL
+Passed an invalid argument to the function.
+=item EFAULT
+Followed a Registry pointer which goes outside
+the registry or outside a registry block.
+=item ELOOP
+Registry contains cycles.
+=item ERANGE
+Field in the registry out of range.
+=head1 SEE ALSO
+=head1 AUTHORS
+Richard W.M. Jones (C<rjones at redhat dot com>)
+Copyright (C) 2009 Red Hat Inc.
+Derived from code by Petter Nordahl-Hagen under a compatible license:
+Copyright (c) 1997-2007 Petter Nordahl-Hagen.
+Derived from code by Markus Stephany under a compatible license:
+Copyright (c)2000-2004, Markus Stephany.
+This library is free software; you can redistribute it and/or
+modify it under the terms of the GNU Lesser General Public
+License as published by the Free Software Foundation;
+version 2.1 of the License.
+This library is distributed in the hope that it will be useful,
+but WITHOUT ANY WARRANTY; without even the implied warranty of
+Lesser General Public License for more details.
+See file LICENSE for the full license.
+/* hivexget - Get single subkeys or values from a hive.
+ * Copyright (C) 2009 Red Hat Inc.
+ *
+ * This program is free software; you can redistribute it and/or modify
+ * it under the terms of the GNU General Public License as published by
+ * the Free Software Foundation; either version 2 of the License, or
+ * (at your option) any later version.
+ *
+ * This program is distributed in the hope that it will be useful,
+ * but WITHOUT ANY WARRANTY; without even the implied warranty of
+ * GNU General Public License for more details.
+ *
+ * You should have received a copy of the GNU General Public License along
+ * with this program; if not, write to the Free Software Foundation, Inc.,
+ * 51 Franklin Street, Fifth Floor, Boston, MA 02110-1301 USA.
+ */
+#include <stdio.h>
+#include <stdlib.h>
+#include <string.h>
+#include <stdint.h>
+#include <inttypes.h>
+#include <errno.h>
+#include "hivex.h"
+main (int argc, char *argv[])
+  if (argc < 3 || argc > 4) {
+    fprintf (stderr, "hivexget regfile path [key]\n");
+    exit (1);
+  }
+  char *file = argv[1];
+  char *path = argv[2];
+  char *key = argv[3];          /* could be NULL */
+  if (path[0] != '\\') {
+    fprintf (stderr, "hivexget: path must start with a \\ character\n");
+    exit (1);
+  }
+  if (path[1] == '\\') {
+  doubled:
+    fprintf (stderr, "hivexget: %s: \\ characters in path are doubled - are you escaping the path parameter correctly?\n", path);
+    exit (1);
+  }
+  hive_h *h = hivex_open (file, 0);
+  if (h == NULL) {
+  error:
+    perror (file);
+    exit (1);
+  }
+  /* Navigate to the desired node. */
+  hive_node_h node = hivex_root (h);
+  if (!node)
+    goto error;
+  char *p = path+1, *pnext;
+  size_t len;
+  while (*p) {
+    len = strcspn (p, "\\");
+    if (len == 0)
+      goto doubled;
+    if (p[len] == '\\') {
+      p[len] = '\0';
+      pnext = p + len + 1;
+    } else
+      pnext = p + len;
+    errno = 0;
+    node = hivex_node_get_child (h, node, p);
+    if (node == 0) {
+      if (errno)
+        goto error;
+      /* else node not found */
+      fprintf (stderr, "hivexget: %s: %s: path element not found\n",
+               path, p);
+      exit (2);
+    }
+    p = pnext;
+  }
+  /* Get the desired key, or print all keys. */
+  if (key) {
+    hive_value_h value;
+    errno = 0;
+    if (key[0] == '@' && key[1] == '\0') /* default key written as "@" */
+      value = hivex_node_get_value (h, node, "");
+    else
+      value = hivex_node_get_value (h, node, key);
+    if (value == 0) {
+      if (errno)
+        goto error;
+      /* else key not found */
+      fprintf (stderr, "hivexget: %s: key not found\n", key);
+      exit (2);
+    }
+    /* Print the value. */
+    hive_type t;
+    size_t len;
+    if (hivex_value_type (h, value, &t, &len) == -1)
+      goto error;
+    switch (t) {
+    case hive_t_string:
+    case hive_t_expand_string:
+    case hive_t_link: {
+      char *str = hivex_value_string (h, value);
+      if (!str)
+        goto error;
+      puts (str); /* note: this adds a single \n character */
+      free (str);
+      break;
+    }
+    case hive_t_dword:
+    case hive_t_dword_be: {
+      int32_t j = hivex_value_dword (h, value);
+      printf ("%" PRIi32 "\n", j);
+      break;
+    }
+    case hive_t_qword: {
+      int64_t j = hivex_value_qword (h, value);
+      printf ("%" PRIi64 "\n", j);
+      break;
+    }
+    case hive_t_multiple_strings: {
+      char **strs = hivex_value_multiple_strings (h, value);
+      if (!strs)
+        goto error;
+      size_t j;
+      for (j = 0; strs[j] != NULL; ++j) {
+        puts (strs[j]);
+        free (strs[j]);
+      }
+      free (strs);
+      break;
+    }
+    case hive_t_none:
+    case hive_t_binary:
+    case hive_t_resource_list:
+    case hive_t_full_resource_description:
+    case hive_t_resource_requirements_list:
+    default: {
+      char *data = hivex_value_value (h, value, &t, &len);
+      if (!data)
+        goto error;
+      if (fwrite (data, 1, len, stdout) != len)
+        goto error;
+      free (data);
+      break;
+    }
+    } /* switch */
+  } else {
+    /* No key specified, so print all keys in this node.  We do this
+     * in a format which looks like the output of regedit, although
+     * this isn't a particularly useful format.
+     */
+    hive_value_h *values;
+    values = hivex_node_values (h, node);
+    if (values == NULL)
+      goto error;
+    size_t i;
+    for (i = 0; values[i] != 0; ++i) {
+      char *key = hivex_value_key (h, values[i]);
+      if (!key) goto error;
+      if (*key) {
+        putchar ('"');
+        size_t j;
+        for (j = 0; key[j] != 0; ++j) {
+          if (key[j] == '"' || key[j] == '\\')
+            putchar ('\\');
+          putchar (key[j]);
+        }
+        putchar ('"');
+      } else
+        printf ("\"@\"");       /* default key in regedit files */
+      putchar ('=');
+      free (key);
+      hive_type t;
+      size_t len;
+      if (hivex_value_type (h, values[i], &t, &len) == -1)
+        goto error;
+      switch (t) {
+      case hive_t_string:
+      case hive_t_expand_string:
+      case hive_t_link: {
+        char *str = hivex_value_string (h, values[i]);
+        if (!str)
+          goto error;
+        if (t != hive_t_string)
+          printf ("str(%d):", t);
+        putchar ('"');
+        size_t j;
+        for (j = 0; str[j] != 0; ++j) {
+          if (str[j] == '"' || str[j] == '\\')
+            putchar ('\\');
+          putchar (str[j]);
+        }
+        putchar ('"');
+        free (str);
+        break;
+      }
+      case hive_t_dword:
+      case hive_t_dword_be: {
+        int32_t j = hivex_value_dword (h, values[i]);
+        printf ("dword:%08" PRIx32 "\"", j);
+        break;
+      }
+      case hive_t_qword: /* sic */
+      case hive_t_none:
+      case hive_t_binary:
+      case hive_t_multiple_strings:
+      case hive_t_resource_list:
+      case hive_t_full_resource_description:
+      case hive_t_resource_requirements_list:
+      default: {
+        char *data = hivex_value_value (h, values[i], &t, &len);
+        if (!data)
+          goto error;
+        printf ("hex(%d):", t);
+        size_t j;
+        for (j = 0; j < len; ++j) {
+          if (j > 0)
+            putchar (',');
+          printf ("%02x", data[j]);
+        }
+        break;
+      }
+      } /* switch */
+      putchar ('\n');
+    } /* for */
+    free (values);
+  }
+  if (hivex_close (h) == -1)
+    goto error;
+  exit (0);
+=encoding utf8
+=head1 NAME
+hivexget - Get subkey from a Windows Registry binary "hive" file
+=head1 SYNOPSIS
+ hivexget hivefile '\Path\To\SubKey'
+ hivexget hivefile '\Path\To\SubKey' name
+I<Note:> This is a low-level tool.  For a more convenient way to
+navigate the Windows Registry in Windows virtual machines, see
+This program navigates through a Windows Registry binary "hive"
+file and extracts I<either> all the (key, value) data pairs
+stored in that subkey I<or> just the single named data item.
+In the first form:
+ hivexget hivefile '\Path\To\SubKey'
+C<hivefile> is some Windows Registry binary hive, and C<\Path\To\Subkey>
+is a path within that hive.  I<NB> the path is relative to the top
+of this hive, and is I<not> the full path as you would use in Windows
+(eg. C<\HKEY_LOCAL_MACHINE> is not a valid path).
+If the subkey exists, then the output lists all data pairs under this
+subkey, in a format compatible with C<regedit> in Windows.
+In the second form:
+ hivexget hivefile '\Path\To\SubKey' name
+C<hivefile> and path are as above.  C<name> is the name of the value
+of interest (use C<@> for the default value).
+The corresponding data item is printed "raw" (ie. no processing or
+escaping) except:
+=over 4
+=item 1
+If it's a string we will convert it from Windows UTF-16 to UTF-8, if
+this conversion is possible.  The string is printed with a single
+trailing newline.
+=item 2
+If it's a multiple-string value, each string is printed on a separate
+=item 3
+If it's a numeric value, it is printed as a decimal number.
+=head1 SEE ALSO
+=head1 AUTHORS
+Richard W.M. Jones (C<rjones at redhat dot com>)
+Copyright (C) 2009 Red Hat Inc.
+This program is free software; you can redistribute it and/or modify
+it under the terms of the GNU General Public License as published by
+the Free Software Foundation; either version 2 of the License, or
+(at your option) any later version.
+This program is distributed in the hope that it will be useful,
+but WITHOUT ANY WARRANTY; without even the implied warranty of
+GNU General Public License for more details.
+You should have received a copy of the GNU General Public License along
+with this program; if not, write to the Free Software Foundation, Inc.,
+51 Franklin Street, Fifth Floor, Boston, MA 02110-1301 USA.
+/* hivexml - Convert Windows Registry "hive" to XML file.
+ * Copyright (C) 2009 Red Hat Inc.
+ *
+ * This program is free software; you can redistribute it and/or modify
+ * it under the terms of the GNU General Public License as published by
+ * the Free Software Foundation; either version 2 of the License, or
+ * (at your option) any later version.
+ *
+ * This program is distributed in the hope that it will be useful,
+ * but WITHOUT ANY WARRANTY; without even the implied warranty of
+ * GNU General Public License for more details.
+ *
+ * You should have received a copy of the GNU General Public License along
+ * with this program; if not, write to the Free Software Foundation, Inc.,
+ * 51 Franklin Street, Fifth Floor, Boston, MA 02110-1301 USA.
+ */
+#include <stdio.h>
+#include <stdlib.h>
+#include <string.h>
+#include <stdint.h>
+#include <inttypes.h>
+#include <unistd.h>
+#include <errno.h>
+#include <libxml/xmlwriter.h>
+#include "hivex.h"
+/* Callback functions. */
+static int node_start (hive_h *, void *, hive_node_h, const char *name);
+static int node_end (hive_h *, void *, hive_node_h, const char *name);
+static int value_string (hive_h *, void *, hive_node_h, hive_value_h, hive_type t, size_t len, const char *key, const char *str);
+static int value_multiple_strings (hive_h *, void *, hive_node_h, hive_value_h, hive_type t, size_t len, const char *key, char **argv);
+static int value_string_invalid_utf16 (hive_h *, void *, hive_node_h, hive_value_h, hive_type t, size_t len, const char *key, const char *str);
+static int value_dword (hive_h *, void *, hive_node_h, hive_value_h, hive_type t, size_t len, const char *key, int32_t);
+static int value_qword (hive_h *, void *, hive_node_h, hive_value_h, hive_type t, size_t len, const char *key, int64_t);
+static int value_binary (hive_h *, void *, hive_node_h, hive_value_h, hive_type t, size_t len, const char *key, const char *value);
+static int value_none (hive_h *, void *, hive_node_h, hive_value_h, hive_type t, size_t len, const char *key, const char *value);
+static int value_other (hive_h *, void *, hive_node_h, hive_value_h, hive_type t, size_t len, const char *key, const char *value);
+static struct hivex_visitor visitor = {
+  .node_start = node_start,
+  .node_end = node_end,
+  .value_string = value_string,
+  .value_multiple_strings = value_multiple_strings,
+  .value_string_invalid_utf16 = value_string_invalid_utf16,
+  .value_dword = value_dword,
+  .value_qword = value_qword,
+  .value_binary = value_binary,
+  .value_none = value_none,
+  .value_other = value_other
+#define XML_CHECK(proc, args)                                           \
+  do {                                                                  \
+    if ((proc args) == -1) {                                            \
+      fprintf (stderr, "%s: failed to write XML document\n", #proc);    \
+      exit (1);                                                         \
+    }                                                                   \
+  } while (0)
+main (int argc, char *argv[])
+  int c;
+  int open_flags = 0;
+  int visit_flags = 0;
+  while ((c = getopt (argc, argv, "dk")) != EOF) {
+    switch (c) {
+    case 'd':
+      open_flags |= HIVEX_OPEN_DEBUG;
+      break;
+    case 'k':
+      visit_flags |= HIVEX_VISIT_SKIP_BAD;
+      break;
+    default:
+      fprintf (stderr, "hivexml [-dk] regfile > output.xml\n");
+      exit (1);
+    }
+  }
+  if (optind + 1 != argc) {
+    fprintf (stderr, "hivexml: missing name of input file\n");
+    exit (1);
+  }
+  hive_h *h = hivex_open (argv[optind], open_flags);
+  if (h == NULL) {
+    perror (argv[optind]);
+    exit (1);
+  }
+  /* Note both this macro, and xmlTextWriterStartDocument leak memory.  There
+   * doesn't seem to be any way to recover that memory, but it's not a
+   * large amount.
+   */
+  xmlTextWriterPtr writer;
+  writer = xmlNewTextWriterFilename ("/dev/stdout", 0);
+  if (writer == NULL) {
+    fprintf (stderr, "xmlNewTextWriterFilename: failed to create XML writer\n");
+    exit (1);
+  }
+  XML_CHECK (xmlTextWriterStartDocument, (writer, NULL, "utf-8", NULL));
+  XML_CHECK (xmlTextWriterStartElement, (writer, BAD_CAST "hive"));
+  if (hivex_visit (h, &visitor, sizeof visitor, writer, visit_flags) == -1) {
+    perror (argv[optind]);
+    exit (1);
+  }
+  if (hivex_close (h) == -1) {
+    perror (argv[optind]);
+    exit (1);
+  }
+  XML_CHECK (xmlTextWriterEndElement, (writer));
+  XML_CHECK (xmlTextWriterEndDocument, (writer));
+  xmlFreeTextWriter (writer);
+  exit (0);
+static int
+node_start (hive_h *h, void *writer_v, hive_node_h node, const char *name)
+  xmlTextWriterPtr writer = (xmlTextWriterPtr) writer_v;
+  XML_CHECK (xmlTextWriterStartElement, (writer, BAD_CAST "node"));
+  XML_CHECK (xmlTextWriterWriteAttribute, (writer, BAD_CAST "name", BAD_CAST name));
+  return 0;
+static int
+node_end (hive_h *h, void *writer_v, hive_node_h node, const char *name)
+  xmlTextWriterPtr writer = (xmlTextWriterPtr) writer_v;
+  XML_CHECK (xmlTextWriterEndElement, (writer));
+  return 0;
+static void
+start_value (xmlTextWriterPtr writer,
+             const char *key, const char *type, const char *encoding)
+  XML_CHECK (xmlTextWriterStartElement, (writer, BAD_CAST "value"));
+  XML_CHECK (xmlTextWriterWriteAttribute, (writer, BAD_CAST "type", BAD_CAST type));
+  if (encoding)
+    XML_CHECK (xmlTextWriterWriteAttribute, (writer, BAD_CAST "encoding", BAD_CAST encoding));
+  if (*key)
+    XML_CHECK (xmlTextWriterWriteAttribute, (writer, BAD_CAST "key", BAD_CAST key));
+  else                          /* default key */
+    XML_CHECK (xmlTextWriterWriteAttribute, (writer, BAD_CAST "default", BAD_CAST "1"));
+static void
+end_value (xmlTextWriterPtr writer)
+  XML_CHECK (xmlTextWriterEndElement, (writer));
+static int
+value_string (hive_h *h, void *writer_v, hive_node_h node, hive_value_h value,
+              hive_type t, size_t len, const char *key, const char *str)
+  xmlTextWriterPtr writer = (xmlTextWriterPtr) writer_v;
+  const char *type;
+  switch (t) {
+  case hive_t_string: type = "string"; break;
+  case hive_t_expand_string: type = "expand"; break;
+  case hive_t_link: type = "link"; break;
+  case hive_t_none:
+  case hive_t_binary:
+  case hive_t_dword:
+  case hive_t_dword_be:
+  case hive_t_multiple_strings:
+  case hive_t_resource_list:
+  case hive_t_full_resource_description:
+  case hive_t_resource_requirements_list:
+  case hive_t_qword:
+    abort ();                   /* internal error - should not happen */
+  default:
+    type = "unknown";
+  }
+  start_value (writer, key, type, NULL);
+  XML_CHECK (xmlTextWriterWriteString, (writer, BAD_CAST str));
+  end_value (writer);
+  return 0;
+static int
+value_multiple_strings (hive_h *h, void *writer_v, hive_node_h node,
+                        hive_value_h value, hive_type t, size_t len,
+                        const char *key, char **argv)
+  xmlTextWriterPtr writer = (xmlTextWriterPtr) writer_v;
+  start_value (writer, key, "string-list", NULL);
+  size_t i;
+  for (i = 0; argv[i] != NULL; ++i) {
+    XML_CHECK (xmlTextWriterStartElement, (writer, BAD_CAST "string"));
+    XML_CHECK (xmlTextWriterWriteString, (writer, BAD_CAST argv[i]));
+    XML_CHECK (xmlTextWriterEndElement, (writer));
+  }
+  end_value (writer);
+  return 0;
+static int
+value_string_invalid_utf16 (hive_h *h, void *writer_v, hive_node_h node,
+                            hive_value_h value, hive_type t, size_t len,
+                            const char *key,
+                            const char *str /* original data */)
+  xmlTextWriterPtr writer = (xmlTextWriterPtr) writer_v;
+  const char *type;
+  switch (t) {
+  case hive_t_string: type = "bad-string"; break;
+  case hive_t_expand_string: type = "bad-expand"; break;
+  case hive_t_link: type = "bad-link"; break;
+  case hive_t_multiple_strings: type = "bad-string-list"; break;
+  case hive_t_none:
+  case hive_t_binary:
+  case hive_t_dword:
+  case hive_t_dword_be:
+  case hive_t_resource_list:
+  case hive_t_full_resource_description:
+  case hive_t_resource_requirements_list:
+  case hive_t_qword:
+    abort ();                   /* internal error - should not happen */
+  default:
+    type = "unknown";
+  }
+  start_value (writer, key, type, "base64");
+  XML_CHECK (xmlTextWriterWriteBase64, (writer, str, 0, len));
+  end_value (writer);
+  return 0;
+static int
+value_dword (hive_h *h, void *writer_v, hive_node_h node, hive_value_h value,
+             hive_type t, size_t len, const char *key, int32_t v)
+  xmlTextWriterPtr writer = (xmlTextWriterPtr) writer_v;
+  start_value (writer, key, "int32", NULL);
+  XML_CHECK (xmlTextWriterWriteFormatString, (writer, "%" PRIi32, v));
+  end_value (writer);
+  return 0;
+static int
+value_qword (hive_h *h, void *writer_v, hive_node_h node, hive_value_h value,
+             hive_type t, size_t len, const char *key, int64_t v)
+  xmlTextWriterPtr writer = (xmlTextWriterPtr) writer_v;
+  start_value (writer, key, "int64", NULL);
+  XML_CHECK (xmlTextWriterWriteFormatString, (writer, "%" PRIi64, v));
+  end_value (writer);
+  return 0;
+static int
+value_binary (hive_h *h, void *writer_v, hive_node_h node, hive_value_h value,
+              hive_type t, size_t len, const char *key, const char *v)
+  xmlTextWriterPtr writer = (xmlTextWriterPtr) writer_v;
+  start_value (writer, key, "binary", "base64");
+  XML_CHECK (xmlTextWriterWriteBase64, (writer, v, 0, len));
+  end_value (writer);
+  return 0;
+static int
+value_none (hive_h *h, void *writer_v, hive_node_h node, hive_value_h value,
+            hive_type t, size_t len, const char *key, const char *v)
+  xmlTextWriterPtr writer = (xmlTextWriterPtr) writer_v;
+  start_value (writer, key, "none", "base64");
+  if (len > 0) XML_CHECK (xmlTextWriterWriteBase64, (writer, v, 0, len));
+  end_value (writer);
+  return 0;
+static int
+value_other (hive_h *h, void *writer_v, hive_node_h node, hive_value_h value,
+             hive_type t, size_t len, const char *key, const char *v)
+  xmlTextWriterPtr writer = (xmlTextWriterPtr) writer_v;
+  const char *type;
+  switch (t) {
+  case hive_t_none:
+  case hive_t_binary:
+  case hive_t_dword:
+  case hive_t_dword_be:
+  case hive_t_qword:
+  case hive_t_string:
+  case hive_t_expand_string:
+  case hive_t_link:
+  case hive_t_multiple_strings:
+    abort ();                   /* internal error - should not happen */
+  case hive_t_resource_list: type = "resource-list"; break;
+  case hive_t_full_resource_description: type = "resource-description"; break;
+  case hive_t_resource_requirements_list: type = "resource-requirements"; break;
+  default:
+    type = "unknown";
+  }
+  start_value (writer, key, type, "base64");
+  if (len > 0) XML_CHECK (xmlTextWriterWriteBase64, (writer, v, 0, len));
+  end_value (writer);
+  return 0;
+=encoding utf8
+=head1 NAME
+hivexml - Convert Windows Registry binary "hive" into XML
+=head1 SYNOPSIS
+ hivexml [-dk] hivefile > output.xml
+This program converts a single Windows Registry binary "hive"
+file into a self-describing XML format.
+=head1 OPTIONS
+=over 4
+=item B<-d>
+Enable lots of debug messages.  If you find a Registry file
+that this program cannot parse, please enable this option and
+post the complete output I<and> the Registry file in your
+bug report.
+=item B<-k>
+Keep going even if we find errors in the Registry file.  This
+skips over any parts of the Registry that we cannot read.
+=head1 SEE ALSO
+=head1 AUTHORS
+Richard W.M. Jones (C<rjones at redhat dot com>)
+Copyright (C) 2009 Red Hat Inc.
+This program is free software; you can redistribute it and/or modify
+it under the terms of the GNU General Public License as published by
+the Free Software Foundation; either version 2 of the License, or
+(at your option) any later version.
+This program is distributed in the hope that it will be useful,
+but WITHOUT ANY WARRANTY; without even the implied warranty of
+GNU General Public License for more details.
+You should have received a copy of the GNU General Public License along
+with this program; if not, write to the Free Software Foundation, Inc.,
+51 Franklin Street, Fifth Floor, Boston, MA 02110-1301 USA.
@@ -48,9 +48,10 @@ while(-l $path) {
 # Get the absolute path of the parent directory
 $path = abs_path(dirname($path).'/..');
+$ENV{PATH}            = $path.'/hivex:'.$ENV{PATH};
 $ENV{LD_LIBRARY_PATH} = $path.'/src/.libs';
 $ENV{LIBGUESTFS_PATH} = $path.'/appliance';
 $ENV{PERL5LIB}        = $path.'/perl/blib/lib:'.$path.'/perl/blib/arch';
-print (join " ", ("$path/tools/virt-$tool", @ARGV), "\n");
+#print (join " ", ("$path/tools/virt-$tool", @ARGV), "\n");
 exec('perl', "$path/tools/virt-$tool", @ARGV);
+#!/usr/bin/perl -w
+# virt-win-reg
+# Copyright (C) 2009 Red Hat Inc.
+# This program is free software; you can redistribute it and/or modify
+# it under the terms of the GNU General Public License as published by
+# the Free Software Foundation; either version 2 of the License, or
+# (at your option) any later version.
+# This program is distributed in the hope that it will be useful,
+# but WITHOUT ANY WARRANTY; without even the implied warranty of
+# GNU General Public License for more details.
+# You should have received a copy of the GNU General Public License
+# along with this program; if not, write to the Free Software
+# Foundation, Inc., 675 Mass Ave, Cambridge, MA 02139, USA.
+use warnings;
+use strict;
+use Sys::Guestfs;
+use Sys::Guestfs::Lib qw(open_guest get_partitions resolve_windows_path
+  inspect_all_partitions inspect_partition
+  inspect_operating_systems mount_operating_system);
+use Pod::Usage;
+use Getopt::Long;
+use File::Temp qw/tempdir/;
+use Locale::TextDomain 'libguestfs';
+=encoding utf8
+=head1 NAME
+virt-win-reg - Display Windows Registry entries from a Windows guest
+=head1 SYNOPSIS
+ virt-win-reg [--options] domname '\Path\To\Subkey' name ['\Path'...]
+ virt-win-reg [--options] domname '\Path\To\Subkey' @ ['\Path'...]
+ virt-win-reg [--options] domname '\Path\To\Subkey' ['\Path'...]
+ virt-win-reg [--options] disk.img [...] '\Path\To\Subkey' (name|@)
+This program can display Windows Registry entries from a Windows
+The first parameter is the libvirt guest name or the raw disk image of
+the Windows guest.
+Then follow one or more sets of path specifiers.  The path must begin
+with a C<\> (backslash) character, and may be something like
+C<'\HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Windows NT\CurrentVersion'>.
+The next parameter after that is either a value name, the single
+at-character C<@>, or missing.
+If it's a value name, then we print the data associated with that
+value.  If it's C<@>, then we print the default data associated with
+the subkey.  If it's missing, then we print all the data associated
+with the subkey.
+If this is confusing, look at the L</EXAMPLES> section below.
+Usually you should use single quotes to protect backslashes in the
+path from the shell.
+Paths and value names are case-insensitive.
+The program currently supports Windows NT-derived guests starting with
+Windows XP through to at least Windows 7.
+Registry support is done for C<\HKEY_LOCAL_MACHINE\SAM>,
+C<\HKEY_USERS\$SID> and C<\HKEY_CURRENT_USER> are B<not> supported at
+this time.
+=head2 NOTES
+This program is only meant for simple access to the registry.  If you
+want to do complicated things with the registry, we suggest you
+download the Registry hive files from the guest using C<libguestfs(3)>
+or C<guestfish(1)> and access them locally, eg. using C<hivex(3)>,
+C<hivexml(1)> or C<reged(1)>.
+=head1 EXAMPLES
+ $ virt-win-reg MyWinGuest \
+   '\HKEY_LOCAL_MACHINE\Software\Microsoft\Windows NT\CurrentVersion' \
+   ProductName
+ Microsoft Windows Server 2003
+ $ virt-win-reg MyWinGuest \
+   '\HKEY_LOCAL_MACHINE\System\ControlSet001\Control' SystemBootDevice
+ multi(0)disk(0)rdisk(0)partition(1)
+ $ virt-win-reg MyWinGuest \
+   '\HKEY_LOCAL_MACHINE\System\ControlSet001\Control'
+ "CurrentUser"="USERNAME"
+ "WaitToKillServiceTimeout"="20000"
+ "SystemBootDevice"="multi(0)disk(0)rdisk(0)partition(1)"
+(please suggest some more)
+=head1 OPTIONS
+=over 4
+my $help;
+=item B<--help>
+Display brief help.
+my $version;
+=item B<--version>
+Display version number and exit.
+my $uri;
+=item B<--connect URI> | B<-c URI>
+If using libvirt, connect to the given I<URI>.  If omitted, then we
+connect to the default libvirt hypervisor.
+If you specify guest block devices directly, then libvirt is not used
+at all.
+GetOptions ("help|?" => \$help,
+            "version" => \$version,
+            "connect|c=s" => \$uri,
+    ) or pod2usage (2);
+pod2usage (1) if $help;
+if ($version) {
+    my $g = Sys::Guestfs->new ();
+    my %h = $g->version ();
+    print "$h{major}.$h{minor}.$h{release}$h{extra}\n";
+    exit
+# Split the command line at the first path.  Paths begin with
+# backslash so this is predictable.
+my @lib_args;
+my $i;
+for ($i = 0; $i < @ARGV; ++$i) {
+    if (substr ($ARGV[$i], 0, 1) eq "\\") {
+       @lib_args = @ARGV[0 .. ($i-1)];
+       @ARGV = @ARGV[$i .. $#ARGV];
+       last;
+    }
+pod2usage (__"virt-win-reg: no VM name, disk images or Registry path given") if 0 == @lib_args;
+my $g;
+if ($uri) {
+    $g = open_guest (\@lib_args, address => $uri);
+} else {
+    $g = open_guest (\@lib_args);
+$g->launch ();
+# List of possible filesystems.
+my @partitions = get_partitions ($g);
+# Now query each one to build up a picture of what's in it.
+my %fses =
+    inspect_all_partitions ($g, \@partitions,
+      use_windows_registry => 0);
+my $oses = inspect_operating_systems ($g, \%fses);
+my @roots = keys %$oses;
+die __"no root device found in this operating system image" if @roots == 0;
+die __"multiboot operating systems are not supported by virt-win-reg" if @roots > 1;
+my $root_dev = $roots[0];
+my $os = $oses->{$root_dev};
+mount_operating_system ($g, $os);
+# Create a working directory to store the downloaded registry files.
+my $tmpdir = tempdir (CLEANUP => 1);
+# Now process each request in turn.
+my $winfile;
+my $localhive;
+my $path;
+for ($i = 0; $i < @ARGV; ++$i) {
+    $_ = $ARGV[$i];
+    if (/^\\HKEY_LOCAL_MACHINE\\SAM(\\.*)/i) {
+       $winfile = "/windows/system32/config/sam";
+       $localhive = "$tmpdir/sam";
+       $path = $1;
+    }
+    elsif (/^\\HKEY_LOCAL_MACHINE\\SECURITY(\\.*)/i) {
+       $winfile = "/windows/system32/config/security";
+       $localhive = "$tmpdir/security";
+       $path = $1;
+    }
+    elsif (/^\\HKEY_LOCAL_MACHINE\\SOFTWARE(\\.*)/i) {
+       $winfile = "/windows/system32/config/software";
+       $localhive = "$tmpdir/software";
+       $path = $1;
+    }
+    elsif (/^\\HKEY_LOCAL_MACHINE\\SYSTEM(\\.*)/i) {
+       $winfile = "/windows/system32/config/system";
+       $localhive = "$tmpdir/system";
+       $path = $1;
+    }
+    elsif (/^\\HKEY_USERS\\.DEFAULT(\\.*)/i) {
+       $winfile = "/windows/system32/config/default";
+       $localhive = "$tmpdir/default";
+       $path = $1;
+    }
+    else {
+       die "virt-win-reg: $_: not a supported Windows Registry path\n"
+    }
+    unless (-f $localhive) {
+       # Check the hive file exists and get the real name.
+       eval {
+           $winfile = $g->case_sensitive_path ($winfile);
+           $g->download ($winfile, $localhive);
+       };
+       if ($@) {
+           die "virt-win-reg: $winfile: could not download registry file: $@\n"
+       }
+    }
+    # What sort of request is it?  Peek at the next arg.
+    my $name; # will be: undefined, @ or a name
+    if ($i+1 < @ARGV) {
+       if (substr ($ARGV[$i+1], 0, 1) ne "\\") {
+           $name = $ARGV[$i+1];
+           $i++;
+       }
+    }
+    my @cmd;
+    if (defined $name) {
+       @cmd = ("hivexget", $localhive, $path, $name);
+    } else {
+       @cmd = ("hivexget", $localhive, $path);
+    }
+    system (@cmd) == 0
+       or die "hivexget command failed: $?\n";
+=head1 SEE ALSO
+=head1 AUTHOR
+Richard W.M. Jones L<>
+Copyright (C) 2009 Red Hat Inc.
+This program is free software; you can redistribute it and/or modify
+it under the terms of the GNU General Public License as published by
+the Free Software Foundation; either version 2 of the License, or
+(at your option) any later version.
+This program is distributed in the hope that it will be useful,
+but WITHOUT ANY WARRANTY; without even the implied warranty of
+GNU General Public License for more details.
+You should have received a copy of the GNU General Public License
+along with this program; if not, write to the Free Software
+Foundation, Inc., 675 Mass Ave, Cambridge, MA 02139, USA.