Spin off hivex as a separate upstream project.
authorRichard Jones <rjones@redhat.com>
Mon, 22 Feb 2010 12:53:16 +0000 (12:53 +0000)
committerRichard Jones <rjones@redhat.com>
Mon, 22 Feb 2010 13:19:21 +0000 (13:19 +0000)
This commit makes the semi-independent hivex library into a
separate upstream project.  The git repo for hivex is now:


Downloads of hivex are available here:


All questions, patches, bugs etc should be sent to the libguestfs
mailing list and bug tracker.

39 files changed:
hivex/LICENSE [deleted file]
hivex/Makefile.am [deleted file]
hivex/README [deleted file]
hivex/byte_conversions.h [deleted file]
hivex/example1 [deleted file]
hivex/example2 [deleted file]
hivex/example3 [deleted file]
hivex/example4 [deleted file]
hivex/example5 [deleted file]
hivex/example6 [deleted file]
hivex/hivex.c [deleted file]
hivex/hivex.h [deleted file]
hivex/hivex.pod [deleted file]
hivex/hivexget [deleted file]
hivex/hivexget.pod [deleted file]
hivex/hivexml.c [deleted file]
hivex/hivexml.pod [deleted file]
hivex/hivexsh.c [deleted file]
hivex/hivexsh.pod [deleted file]
hivex/t/Makefile.am [deleted file]
hivex/t/README [deleted file]
hivex/t/minimal [deleted file]
hivex/tools/Makefile.am [deleted file]
hivex/tools/clearheaderfields.ml [deleted file]
hivex/tools/counter.ml [deleted file]
hivex/tools/counter.mli [deleted file]
hivex/tools/fillemptyhbins.ml [deleted file]
hivex/tools/truncatefile.ml [deleted file]
hivex/tools/visualizer.ml [deleted file]
hivex/tools/visualizer_NT_time.ml [deleted file]
hivex/tools/visualizer_utils.ml [deleted file]

index 899e973..a18908f 100644 (file)
@@ -80,18 +80,9 @@ haskell/Guestfs010Launch
diff --git a/HACKING b/HACKING
index 7dbc360..900980a 100644 (file)
@@ -92,9 +92,10 @@ fuse/
         Haskell bindings.
-        Hive extraction library, for reading Windows Registry files.
-        See hivex/README for more details.
+hivex/ [removed in 1.0.85]
+       This used to contain the hivex library for reading and
+       writing Windows Registry binary hive files.  This is now
+       available as a separate upstream project.
         Some guest images to test against.  These are gzipped to save
index 0abe3dd..c1fc85d 100644 (file)
@@ -19,7 +19,7 @@ include $(top_srcdir)/subdir-rules.mk
-SUBDIRS = gnulib/lib hivex src daemon appliance fish po examples images \
+SUBDIRS = gnulib/lib src daemon appliance fish po examples images \
        gnulib/tests capitests regressions test-tool
 # NB: Must build inspector directory after perl and before ocaml.
@@ -118,10 +118,6 @@ HTMLFILES = \
        html/guestfs.3.html \
        html/guestfish.1.html \
        html/guestmount.1.html \
-       html/hivex.3.html \
-       html/hivexget.1.html \
-       html/hivexml.1.html \
-       html/hivexsh.1.html \
        html/virt-cat.1.html \
        html/virt-df.1.html \
        html/virt-edit.1.html \
diff --git a/README b/README
index 42e7777..8ad0d65 100644 (file)
--- a/README
+++ b/README
@@ -52,7 +52,7 @@ Requirements
 - genisoimage / mkisofs
-- libxml2
+- (Optional) hivex to build Windows Registry support
 - (Optional) FUSE to build the FUSE module
index 1ba449e..744d24a 100644 (file)
@@ -422,10 +422,16 @@ dnl For i18n.
-dnl libxml2 is used by the hivex library.
-PKG_CHECK_MODULES([LIBXML2], [libxml-2.0])
+dnl hivex library (highly recommended).
+dnl This used to be a part of libguestfs, but was spun off into its
+dnl own separate upstream project in libguestfs 1.0.85.
+        HAVE_HIVEX=no
+        AC_MSG_WARN([Hivex library and headers are missing, so optional Windows Registry tools won't be built])])
 dnl FUSE is optional to build the FUSE module.
@@ -736,9 +742,6 @@ AC_CONFIG_FILES([Makefile
-                 hivex/Makefile
-                 hivex/t/Makefile
-                 hivex/tools/Makefile
                  ocaml/META perl/Makefile.PL])
diff --git a/hivex/LICENSE b/hivex/LICENSE
deleted file mode 100644 (file)
index 38dec6d..0000000
+++ /dev/null
diff --git a/hivex/Makefile.am b/hivex/Makefile.am
deleted file mode 100644 (file)
index 66c5bf1..0000000
+++ /dev/null
-  if (!h->writable) {
-    errno = EROFS;
-    return 0;
-  }
-  if (!IS_VALID_BLOCK (h, parent) || !BLOCK_ID_EQ (h, parent, "nk")) {
-    errno = EINVAL;
-    return 0;
-  }
-  if (name == NULL || strlen (name) == 0) {
-    errno = EINVAL;
-    return 0;
-  }
-  if (hivex_node_get_child (h, parent, name) != 0) {
-    errno = EEXIST;
-    return 0;
-  }
-  /* Create the new nk-record. */
-  static const char nk_id[2] = { 'n', 'k' };
-  size_t seg_len = sizeof (struct ntreg_nk_record) + strlen (name);
-  hive_node_h node = allocate_block (h, seg_len, nk_id);
-  if (node == 0)
-    return 0;
-  if (h->msglvl >= 2)
-    fprintf (stderr, "hivex_node_add_child: allocated new nk-record for child at 0x%zx\n", node);
-  struct ntreg_nk_record *nk = (struct ntreg_nk_record *) (h->addr + node);
-  nk->flags = htole16 (0x0020); /* key is ASCII. */
-  nk->parent = htole32 (parent - 0x1000);
-  nk->subkey_lf = htole32 (0xffffffff);
-  nk->subkey_lf_volatile = htole32 (0xffffffff);
-  nk->vallist = htole32 (0xffffffff);
-  nk->classname = htole32 (0xffffffff);
-  nk->name_len = htole16 (strlen (name));
-  strcpy (nk->name, name);
-  /* Inherit parent sk. */
-  struct ntreg_nk_record *parent_nk =
-    (struct ntreg_nk_record *) (h->addr + parent);
-  size_t parent_sk_offset = le32toh (parent_nk->sk);
-  parent_sk_offset += 0x1000;
-  if (!IS_VALID_BLOCK (h, parent_sk_offset) ||
-      !BLOCK_ID_EQ (h, parent_sk_offset, "sk")) {
-    if (h->msglvl >= 2)
-      fprintf (stderr, "hivex_node_add_child: returning EFAULT because parent sk is not a valid block (%zu)\n",
-               parent_sk_offset);
-    errno = EFAULT;
-    return 0;
-  }
-  struct ntreg_sk_record *sk =
-    (struct ntreg_sk_record *) (h->addr + parent_sk_offset);
-  sk->refcount = htole32 (le32toh (sk->refcount) + 1);
-  nk->sk = htole32 (parent_sk_offset - 0x1000);
-  /* Inherit parent timestamp. */
-  memcpy (nk->timestamp, parent_nk->timestamp, sizeof (parent_nk->timestamp));
-  /* What I found out the hard way (not documented anywhere): the
-   * subkeys in lh-records must be kept sorted.  If you just add a
-   * subkey in a non-sorted position (eg. just add it at the end) then
-   * Windows won't see the subkey _and_ Windows will corrupt the hive
-   * itself when it modifies or saves it.
-   *
-   * So use get_children() to get a list of intermediate
-   * lf/lh-records.  get_children() returns these in reading order
-   * (which is sorted), so we look for the lf/lh-records in sequence
-   * until we find the key name just after the one we are inserting,
-   * and we insert the subkey just before it.
-   *
-   * The only other case is the no-subkeys case, where we have to
-   * create a brand new lh-record.
-   */
-  hive_node_h *unused;
-  size_t *blocks;
-  if (get_children (h, parent, &unused, &blocks, 0) == -1)
-    return 0;
-  free (unused);
-  size_t i, j;
-  size_t nr_subkeys_in_parent_nk = le32toh (parent_nk->nr_subkeys);
-  if (nr_subkeys_in_parent_nk == 0) { /* No subkeys case. */
-    /* Free up any existing intermediate blocks. */
-    for (i = 0; blocks[i] != 0; ++i)
-      mark_block_unused (h, blocks[i]);
-    size_t lh_offs = new_lh_record (h, name, node);
-    if (lh_offs == 0) {
-      free (blocks);
-      return 0;
-    }
-    if (h->msglvl >= 2)
-      fprintf (stderr, "hivex_node_add_child: no keys, allocated new lh-record at 0x%zx\n", lh_offs);
-    parent_nk->subkey_lf = htole32 (lh_offs - 0x1000);
-  }
-  else {                        /* Insert subkeys case. */
-    size_t old_offs = 0, new_offs = 0;
-    struct ntreg_lf_record *old_lf = NULL;
-    /* Find lf/lh key name just after the one we are inserting. */
-    for (i = 0; blocks[i] != 0; ++i) {
-      if (BLOCK_ID_EQ (h, blocks[i], "lf") ||
-          BLOCK_ID_EQ (h, blocks[i], "lh")) {
-        old_offs = blocks[i];
-        old_lf = (struct ntreg_lf_record *) (h->addr + old_offs);
-        for (j = 0; j < le16toh (old_lf->nr_keys); ++j) {
-          hive_node_h nk_offs = le32toh (old_lf->keys[j].offset);
-          nk_offs += 0x1000;
-          if (compare_name_with_nk_name (h, name, nk_offs) < 0)
-            goto insert_it;
-        }
-      }
-    }
-    /* Insert it at the end.
-     * old_offs points to the last lf record, set j.
-     */
-    assert (old_offs != 0);   /* should never happen if nr_subkeys > 0 */
-    j = le16toh (old_lf->nr_keys);
-    /* Insert it. */
-  insert_it:
-    if (h->msglvl >= 2)
-      fprintf (stderr, "hivex_node_add_child: insert key in existing lh-record at 0x%zx, posn %zu\n", old_offs, j);
-    new_offs = insert_lf_record (h, old_offs, j, name, node);
-    if (new_offs == 0) {
-      free (blocks);
-      return 0;
-    }
-    if (h->msglvl >= 2)
-      fprintf (stderr, "hivex_node_add_child: new lh-record at 0x%zx\n",
-               new_offs);
-    /* If the lf/lh-record was directly referenced by the parent nk,
-     * then update the parent nk.
-     */
-    if (le32toh (parent_nk->subkey_lf) + 0x1000 == old_offs)
-      parent_nk->subkey_lf = htole32 (new_offs - 0x1000);
-    /* Else we have to look for the intermediate ri-record and update
-     * that in-place.
-     */
-    else {
-      for (i = 0; blocks[i] != 0; ++i) {
-        if (BLOCK_ID_EQ (h, blocks[i], "ri")) {
-          struct ntreg_ri_record *ri =
-            (struct ntreg_ri_record *) (h->addr + blocks[i]);
-          for (j = 0; j < le16toh (ri->nr_offsets); ++j)
-            if (le32toh (ri->offset[j] + 0x1000) == old_offs) {
-              ri->offset[j] = htole32 (new_offs - 0x1000);
-              goto found_it;
-            }
-        }
-      }
-      /* Not found ..  This is an internal error. */
-      if (h->msglvl >= 2)
-        fprintf (stderr, "hivex_node_add_child: returning ENOTSUP because could not find ri->lf link\n");
-      errno = ENOTSUP;
-      free (blocks);
-      return 0;
-    found_it:
-      ;
-    }
-  }
-  free (blocks);
-  /* Update nr_subkeys in parent nk. */
-  nr_subkeys_in_parent_nk++;
-  parent_nk->nr_subkeys = htole32 (nr_subkeys_in_parent_nk);
-  /* Update max_subkey_name_len in parent nk. */
-  uint16_t max = le16toh (parent_nk->max_subkey_name_len);
-  if (max < strlen (name) * 2)  /* *2 because "recoded" in UTF16-LE. */
-    parent_nk->max_subkey_name_len = htole16 (strlen (name) * 2);
-  return node;
-/* Decrement the refcount of an sk-record, and if it reaches zero,
- * unlink it from the chain and delete it.
- */
-static int
-delete_sk (hive_h *h, size_t sk_offset)
-  if (!IS_VALID_BLOCK (h, sk_offset) || !BLOCK_ID_EQ (h, sk_offset, "sk")) {
-    if (h->msglvl >= 2)
-      fprintf (stderr, "delete_sk: not an sk record: 0x%zx\n", sk_offset);
-    errno = EFAULT;
-    return -1;
-  }
-  struct ntreg_sk_record *sk = (struct ntreg_sk_record *) (h->addr + sk_offset);
-  if (sk->refcount == 0) {
-    if (h->msglvl >= 2)
-      fprintf (stderr, "delete_sk: sk record already has refcount 0: 0x%zx\n",
-               sk_offset);
-    errno = EINVAL;
-    return -1;
-  }
-  sk->refcount--;
-  if (sk->refcount == 0) {
-    size_t sk_prev_offset = sk->sk_prev;
-    sk_prev_offset += 0x1000;
-    size_t sk_next_offset = sk->sk_next;
-    sk_next_offset += 0x1000;
-    /* Update sk_prev/sk_next SKs, unless they both point back to this
-     * cell in which case we are deleting the last SK.
-     */
-    if (sk_prev_offset != sk_offset && sk_next_offset != sk_offset) {
-      struct ntreg_sk_record *sk_prev =
-        (struct ntreg_sk_record *) (h->addr + sk_prev_offset);
-      struct ntreg_sk_record *sk_next =
-        (struct ntreg_sk_record *) (h->addr + sk_next_offset);
-      sk_prev->sk_next = htole32 (sk_next_offset - 0x1000);
-      sk_next->sk_prev = htole32 (sk_prev_offset - 0x1000);
-    }
-    /* Refcount is zero so really delete this block. */
-    mark_block_unused (h, sk_offset);
-  }
-  return 0;
-/* Callback from hivex_node_delete_child which is called to delete a
- * node AFTER its subnodes have been visited.  The subnodes have been
- * deleted but we still have to delete any lf/lh/li/ri records and the
- * value list block and values, followed by deleting the node itself.
- */
-static int
-delete_node (hive_h *h, void *opaque, hive_node_h node, const char *name)
-  /* Get the intermediate blocks.  The subkeys have already been
-   * deleted by this point, so tell get_children() not to check for
-   * validity of the nk-records.
-   */
-  hive_node_h *unused;
-  size_t *blocks;
-  if (get_children (h, node, &unused, &blocks, GET_CHILDREN_NO_CHECK_NK) == -1)
-    return -1;
-  free (unused);
-  /* We don't care what's in these intermediate blocks, so we can just
-   * delete them unconditionally.
-   */
-  size_t i;
-  for (i = 0; blocks[i] != 0; ++i)
-    mark_block_unused (h, blocks[i]);
-  free (blocks);
-  /* Delete the values in the node. */
-  if (delete_values (h, node) == -1)
-    return -1;
-  struct ntreg_nk_record *nk = (struct ntreg_nk_record *) (h->addr + node);
-  /* If the NK references an SK, delete it. */
-  size_t sk_offs = le32toh (nk->sk);
-  if (sk_offs != 0xffffffff) {
-    sk_offs += 0x1000;
-    if (delete_sk (h, sk_offs) == -1)
-      return -1;
-    nk->sk = htole32 (0xffffffff);
-  }
-  /* If the NK references a classname, delete it. */
-  size_t cl_offs = le32toh (nk->classname);
-  if (cl_offs != 0xffffffff) {
-    cl_offs += 0x1000;
-    mark_block_unused (h, cl_offs);
-    nk->classname = htole32 (0xffffffff);
-  }
-  /* Delete the node itself. */
-  mark_block_unused (h, node);
-  return 0;
-hivex_node_delete_child (hive_h *h, hive_node_h node)
-  if (!h->writable) {
-    errno = EROFS;
-    return -1;
-  }
-  if (!IS_VALID_BLOCK (h, node) || !BLOCK_ID_EQ (h, node, "nk")) {
-    errno = EINVAL;
-    return -1;
-  }
-  if (node == hivex_root (h)) {
-    if (h->msglvl >= 2)
-      fprintf (stderr, "hivex_node_delete_child: cannot delete root node\n");
-    errno = EINVAL;
-    return -1;
-  }
-  hive_node_h parent = hivex_node_parent (h, node);
-  if (parent == 0)
-    return -1;
-  /* Delete node and all its children and values recursively. */
-  static const struct hivex_visitor visitor = { .node_end = delete_node };
-  if (hivex_visit_node (h, node, &visitor, sizeof visitor, NULL, 0) == -1)
-    return -1;
-  /* Delete the link from parent to child.  We need to find the lf/lh
-   * record which contains the offset and remove the offset from that
-   * record, then decrement the element count in that record, and
-   * decrement the overall number of subkeys stored in the parent
-   * node.
-   */
-  hive_node_h *unused;
-  size_t *blocks;
-  if (get_children (h, parent, &unused, &blocks, GET_CHILDREN_NO_CHECK_NK)== -1)
-    return -1;
-  free (unused);
-  size_t i, j;
-  for (i = 0; blocks[i] != 0; ++i) {
-    struct ntreg_hbin_block *block =
-      (struct ntreg_hbin_block *) (h->addr + blocks[i]);
-    if (block->id[0] == 'l' && (block->id[1] == 'f' || block->id[1] == 'h')) {
-      struct ntreg_lf_record *lf = (struct ntreg_lf_record *) block;
-      size_t nr_subkeys_in_lf = le16toh (lf->nr_keys);
-      for (j = 0; j < nr_subkeys_in_lf; ++j)
-        if (le32toh (lf->keys[j].offset) + 0x1000 == node) {
-          for (; j < nr_subkeys_in_lf - 1; ++j)
-            memcpy (&lf->keys[j], &lf->keys[j+1], sizeof (lf->keys[j]));
-          lf->nr_keys = htole16 (nr_subkeys_in_lf - 1);
-          goto found;
-        }
-    }
-  }
-  if (h->msglvl >= 2)
-    fprintf (stderr, "hivex_node_delete_child: could not find parent to child link\n");
-  errno = ENOTSUP;
-  return -1;
- found:;
-  struct ntreg_nk_record *nk = (struct ntreg_nk_record *) (h->addr + parent);
-  size_t nr_subkeys_in_nk = le32toh (nk->nr_subkeys);
-  nk->nr_subkeys = htole32 (nr_subkeys_in_nk - 1);
-  if (h->msglvl >= 2)
-    fprintf (stderr, "hivex_node_delete_child: updating nr_subkeys in parent 0x%zx to %zu\n",
-             parent, nr_subkeys_in_nk);
-  return 0;
-hivex_node_set_values (hive_h *h, hive_node_h node,
-                       size_t nr_values, const hive_set_value *values,
-                       int flags)
-  if (!h->writable) {
-    errno = EROFS;
-    return -1;
-  }
-  if (!IS_VALID_BLOCK (h, node) || !BLOCK_ID_EQ (h, node, "nk")) {
-    errno = EINVAL;
-    return -1;
-  }
-  /* Delete all existing values. */
-  if (delete_values (h, node) == -1)
-    return -1;
-  if (nr_values == 0)
-    return 0;
-  /* Allocate value list node.  Value lists have no id field. */
-  static const char nul_id[2] = { 0, 0 };
-  size_t seg_len =
-    sizeof (struct ntreg_value_list) + (nr_values - 1) * sizeof (uint32_t);
-  size_t vallist_offs = allocate_block (h, seg_len, nul_id);
-  if (vallist_offs == 0)
-    return -1;
-  struct ntreg_nk_record *nk = (struct ntreg_nk_record *) (h->addr + node);
-  nk->nr_values = htole32 (nr_values);
-  nk->vallist = htole32 (vallist_offs - 0x1000);
-  struct ntreg_value_list *vallist =
-    (struct ntreg_value_list *) (h->addr + vallist_offs);
-  size_t i;
-  for (i = 0; i < nr_values; ++i) {
-    /* Allocate vk record to store this (key, value) pair. */
-    static const char vk_id[2] = { 'v', 'k' };
-    seg_len = sizeof (struct ntreg_vk_record) + strlen (values[i].key);
-    size_t vk_offs = allocate_block (h, seg_len, vk_id);
-    if (vk_offs == 0)
-      return -1;
-    vallist->offset[i] = htole32 (vk_offs - 0x1000);
-    struct ntreg_vk_record *vk = (struct ntreg_vk_record *) (h->addr + vk_offs);
-    size_t name_len = strlen (values[i].key);
-    vk->name_len = htole16 (name_len);
-    strcpy (vk->name, values[i].key);
-    vk->data_type = htole32 (values[i].t);
-    uint32_t len = values[i].len;
-    if (len <= 4)               /* store it inline => set MSB flag */
-      len |= 0x80000000;
-    vk->data_len = htole32 (len);
-    vk->flags = name_len == 0 ? 0 : 1;
-    if (values[i].len <= 4)     /* store it inline */
-      memcpy (&vk->data_offset, values[i].value, values[i].len);
-    else {
-      size_t offs = allocate_block (h, values[i].len + 4, nul_id);
-      if (offs == 0)
-        return -1;
-      memcpy (h->addr + offs + 4, values[i].value, values[i].len);
-      vk->data_offset = htole32 (offs - 0x1000);
-    }
-    if (name_len * 2 > le32toh (nk->max_vk_name_len))
-      /* * 2 for UTF16-LE "reencoding" */
-      nk->max_vk_name_len = htole32 (name_len * 2);
-    if (values[i].len > le32toh (nk->max_vk_data_len))
-      nk->max_vk_data_len = htole32 (values[i].len);
-  }
-  return 0;
diff --git a/hivex/hivex.h b/hivex/hivex.h
deleted file mode 100644 (file)
index f4ce834..0000000
+++ /dev/null
@@ -1,131 +0,0 @@
-/* hivex - Windows Registry "hive" extraction library.
- * Copyright (C) 2009 Red Hat Inc.
- * Derived from code by Petter Nordahl-Hagen under a compatible license:
- *   Copyright (c) 1997-2007 Petter Nordahl-Hagen.
- * Derived from code by Markus Stephany under a compatible license:
- *   Copyright (c)2000-2004, Markus Stephany.
- *
- * This library is free software; you can redistribute it and/or
- * modify it under the terms of the GNU Lesser General Public
- * License as published by the Free Software Foundation;
- * version 2.1 of the License.
- *
- * This library is distributed in the hope that it will be useful,
- * but WITHOUT ANY WARRANTY; without even the implied warranty of
- * Lesser General Public License for more details.
- *
- * See file LICENSE for the full license.
- */
-#ifndef HIVEX_H_
-#define HIVEX_H_
-#ifdef __cplusplus
-extern "C" {
-/* NOTE: This API is documented in the man page hivex(3). */
-typedef struct hive_h hive_h;
-typedef size_t hive_node_h;
-typedef size_t hive_value_h;
-enum hive_type {
-  /* Just a key without a value. */
-  hive_t_none = 0,
-  /* A UTF-16 Windows string. */
-  hive_t_string = 1,
-  /* A UTF-16 Windows string that contains %env% (environment variable
-   * substitutions).
-   */
-  hive_t_expand_string = 2,
-  /* A blob of binary. */
-  hive_t_binary = 3,
-  /* Two ways to encode DWORDs (32 bit words).  The first is little-endian. */
-  hive_t_dword = 4,
-  hive_t_dword_be = 5,
-  /* Symbolic link, we think to another part of the registry tree. */
-  hive_t_link = 6,
-  /* Multiple UTF-16 Windows strings, each separated by zero byte.  See:
-   * http://blogs.msdn.com/oldnewthing/archive/2009/10/08/9904646.aspx
-   */
-  hive_t_multiple_strings = 7,
-  /* These three are unknown. */
-  hive_t_resource_list = 8,
-  hive_t_full_resource_description = 9,
-  hive_t_resource_requirements_list = 10,
-  /* A QWORD (64 bit word).  This is stored in the file little-endian. */
-  hive_t_qword = 11
-typedef enum hive_type hive_type;
-/* Bitmask of flags passed to hivex_open. */
-#define HIVEX_OPEN_VERBOSE      1
-#define HIVEX_OPEN_DEBUG        2
-#define HIVEX_OPEN_WRITE        4
-extern hive_h *hivex_open (const char *filename, int flags);
-extern int hivex_close (hive_h *h);
-extern hive_node_h hivex_root (hive_h *h);
-extern char *hivex_node_name (hive_h *h, hive_node_h node);
-extern hive_node_h *hivex_node_children (hive_h *h, hive_node_h node);
-extern hive_node_h hivex_node_get_child (hive_h *h, hive_node_h node, const char *name);
-extern hive_node_h hivex_node_parent (hive_h *h, hive_node_h node);
-extern hive_value_h *hivex_node_values (hive_h *h, hive_node_h node);
-extern hive_value_h hivex_node_get_value (hive_h *h, hive_node_h node, const char *key);
-extern char *hivex_value_key (hive_h *h, hive_value_h value);
-extern int hivex_value_type (hive_h *h, hive_value_h value, hive_type *t, size_t *len);
-extern char *hivex_value_value (hive_h *h, hive_value_h value, hive_type *t, size_t *len);
-extern char *hivex_value_string (hive_h *h, hive_value_h value);
-extern char **hivex_value_multiple_strings (hive_h *h, hive_value_h value);
-extern int32_t hivex_value_dword (hive_h *h, hive_value_h value);
-extern int64_t hivex_value_qword (hive_h *h, hive_value_h value);
-struct hivex_visitor {
-  int (*node_start) (hive_h *, void *opaque, hive_node_h, const char *name);
-  int (*node_end) (hive_h *, void *opaque, hive_node_h, const char *name);
-  int (*value_string) (hive_h *, void *opaque, hive_node_h, hive_value_h, hive_type t, size_t len, const char *key, const char *str);
-  int (*value_multiple_strings) (hive_h *, void *opaque, hive_node_h, hive_value_h, hive_type t, size_t len, const char *key, char **argv);
-  int (*value_string_invalid_utf16) (hive_h *, void *opaque, hive_node_h, hive_value_h, hive_type t, size_t len, const char *key, const char *str);
-  int (*value_dword) (hive_h *, void *opaque, hive_node_h, hive_value_h, hive_type t, size_t len, const char *key, int32_t);
-  int (*value_qword) (hive_h *, void *opaque, hive_node_h, hive_value_h, hive_type t, size_t len, const char *key, int64_t);
-  int (*value_binary) (hive_h *, void *opaque, hive_node_h, hive_value_h, hive_type t, size_t len, const char *key, const char *value);
-  int (*value_none) (hive_h *, void *opaque, hive_node_h, hive_value_h, hive_type t, size_t len, const char *key, const char *value);
-  int (*value_other) (hive_h *, void *opaque, hive_node_h, hive_value_h, hive_type t, size_t len, const char *key, const char *value);
-  int (*value_any) (hive_h *, void *opaque, hive_node_h, hive_value_h, hive_type t, size_t len, const char *key, const char *value);
-extern int hivex_visit (hive_h *h, const struct hivex_visitor *visitor, size_t len, void *opaque, int flags);
-extern int hivex_visit_node (hive_h *h, hive_node_h node, const struct hivex_visitor *visitor, size_t len, void *opaque, int flags);
-extern int hivex_commit (hive_h *h, const char *filename, int flags);
-extern hive_node_h hivex_node_add_child (hive_h *h, hive_node_h parent, const char *name);
-extern int hivex_node_delete_child (hive_h *h, hive_node_h node);
-struct hive_set_value {
-  char *key;
-  hive_type t;
-  size_t len;
-  char *value;
-typedef struct hive_set_value hive_set_value;
-extern int hivex_node_set_values (hive_h *h, hive_node_h node, size_t nr_values, const hive_set_value *values, int flags);
-#ifdef __cplusplus
-#endif /* HIVEX_H_ */
diff --git a/hivex/hivex.pod b/hivex/hivex.pod
deleted file mode 100644 (file)
index 275eb42..0000000
+++ /dev/null
@@ -1,655 +0,0 @@
-=encoding utf8
-=head1 NAME
-hivex - Windows Registry "hive" extraction library
-=head1 SYNOPSIS
- hive_h *hivex_open (const char *filename, int flags);
- int hivex_close (hive_h *h);
-libhivex is a library for extracting the contents of Windows Registry
-"hive" files.  It is designed to be secure against buggy or malicious
-registry files.
-Unlike many other tools in this area, it doesn't use the textual .REG
-format for output, because parsing that is as much trouble as parsing
-the original binary format.  Instead it makes the file available
-through a C API, or there is a separate program to export the hive as
-XML (see L<hivexml(1)>), or to get individual keys (see
-=over 4
-=item hive_h *hivex_open (const char *filename, int flags);
-Opens the hive named C<filename> for reading.
-Flags is an ORed list of the open flags (or C<0> if you don't
-want to pass any flags).  These flags are defined:
-=over 4
-Verbose messages.
-Very verbose messages, suitable for debugging problems in the library
-This is also selected if the C<HIVEX_DEBUG> environment variable
-is set to 1.
-Open the hive for writing.  If omitted, the hive is read-only.
-C<hivex_open> returns a hive handle.  On error this returns NULL and
-sets C<errno> to indicate the error.
-=item int hivex_close (hive_h *h);
-Close a hive handle and free all associated resources.
-Note that any uncommitted writes are I<not> committed by this call,
-but instead are lost.  See L</WRITING TO HIVE FILES>.
-Returns 0 on success.  On error this returns -1 and sets errno.
-=over 4
-=item hive_node_h
-This is a node handle, an integer but opaque outside the library.
-Valid node handles cannot be 0.  The library returns 0 in some
-situations to indicate an error.
-=item hive_node_h hivex_root (hive_h *h);
-Return root node of the hive.  All valid registries must contain
-a root node.
-On error this returns 0 and sets errno.
-=item char *hivex_node_name (hive_h *h, hive_node_h node);
-Return the name of the node.  The name is reencoded as UTF-8
-and returned as a C string.
-The string should be freed by the caller when it is no longer needed.
-Note that the name of the root node is a dummy, such as
-C<$$$PROTO.HIV> (other names are possible: it seems to depend on the
-tool or program that created the hive in the first place).  You can
-only know the "real" name of the root node by knowing which registry
-file this hive originally comes from, which is knowledge that is
-outside the scope of this library.
-On error this returns NULL and sets errno.
-=item hive_node_h *hivex_node_children (hive_h *h, hive_node_h node);
-Return a 0-terminated array of nodes which are the subkeys
-(children) of C<node>.
-The array should be freed by the caller when it is no longer needed.
-On error this returns NULL and sets errno.
-=item hive_node_h hivex_node_get_child (hive_h *h, hive_node_h node, const char *name);
-Return the child of node with the name C<name>, if it exists.
-The name is matched case insensitively.
-If the child node does not exist, this returns 0 without
-setting errno.
-On error this returns 0 and sets errno.
-=item hive_node_h hivex_node_parent (hive_h *h, hive_node_h node);
-Return the parent of C<node>.
-On error this returns 0 and sets errno.
-The parent pointer of the root node in registry files that we
-have examined seems to be invalid, and so this function will
-return an error if called on the root node.
-The enum below describes the possible types for the value(s)
-stored at each node.
- enum hive_type {
-   hive_t_none = 0,
-   hive_t_string = 1,
-   hive_t_expand_string = 2,
-   hive_t_binary = 3,
-   hive_t_dword = 4,
-   hive_t_dword_be = 5,
-   hive_t_link = 6,
-   hive_t_multiple_strings = 7,
-   hive_t_resource_list = 8,
-   hive_t_full_resource_description = 9,
-   hive_t_resource_requirements_list = 10,
-   hive_t_qword = 11
- };
-=over 4
-=item hive_value_h
-This is a value handle, an integer but opaque outside the library.
-Valid value handles cannot be 0.  The library returns 0 in some
-situations to indicate an error.
-=item hive_value_h *hivex_node_values (hive_h *h, hive_node_h node);
-Return the 0-terminated array of (key, value) pairs attached to
-this node.
-The array should be freed by the caller when it is no longer needed.
-On error this returns NULL and sets errno.
-=item hive_value_h hivex_node_get_value (hive_h *h, hive_node_h node, const char *key);
-Return the value attached to this node which has the name C<key>,
-if it exists.
-The key name is matched case insensitively.
-Note that to get the default key, you should pass the empty
-string C<""> here.  The default key is often written C<"@">, but
-inside hives that has no meaning and won't give you the
-default key.
-If no such key exists, this returns 0 and does not set errno.
-On error this returns 0 and sets errno.
-=item char *hivex_value_key (hive_h *h, hive_value_h value);
-Return the key (name) of a (key, value) pair.  The name
-is reencoded as UTF-8 and returned as a C string.
-The string should be freed by the caller when it is no longer needed.
-Note that this function can return a zero-length string.  In the
-context of Windows Registries, this means that this value is the
-default key for this node in the tree.  This is usually written
-as C<"@">.
-On error this returns NULL and sets errno.
-=item int hivex_value_type (hive_h *h, hive_value_h value, hive_type *t, size_t *len);
-Return the data type and length of the value in this (key, value)
-pair.  See also C<hivex_value_value> which returns all this
-information, and the value itself.  Also, C<hivex_value_*> functions
-below which can be used to return the value in a more useful form when
-you know the type in advance.
-Returns 0 on success.  On error this returns -1 and sets errno.
-=item char *hivex_value_value (hive_h *h, hive_value_h value, hive_type *t, size_t *len);
-Return the value of this (key, value) pair.  The value should
-be interpreted according to its type (see C<enum hive_type>).
-The value is returned in an array of bytes of length C<len>.
-The value should be freed by the caller when it is no longer needed.
-On error this returns NULL and sets errno.
-=item char *hivex_value_string (hive_h *h, hive_value_h value);
-If this value is a string, return the string reencoded as UTF-8
-(as a C string).  This only works for values which have type
-C<hive_t_string>, C<hive_t_expand_string> or C<hive_t_link>.
-The string should be freed by the caller when it is no longer needed.
-On error this returns NULL and sets errno.
-=item char **hivex_value_multiple_strings (hive_h *h, hive_value_h value);
-If this value is a multiple-string, return the strings reencoded
-as UTF-8 (as a NULL-terminated array of C strings).  This only
-works for values which have type C<hive_t_multiple_strings>.
-The string array and each string in it should be freed by the
-caller when they are no longer needed.
-On error this returns NULL and sets errno.
-=item int32_t hivex_value_dword (hive_h *h, hive_value_h value);
-If this value is a DWORD (Windows int32), return it.  This only works
-for values which have type C<hive_t_dword> or C<hive_t_dword_be>.
-=item int64_t hivex_value_qword (hive_h *h, hive_value_h value);
-If this value is a QWORD (Windows int64), return it.  This only
-works for values which have type C<hive_t_qword>.
-The visitor pattern is useful if you want to visit all nodes
-in the tree or all nodes below a certain point in the tree.
-First you set up your own C<struct hivex_visitor> with your
-callback functions.
-Each of these callback functions should return 0 on success or -1
-on error.  If any callback returns -1, then the entire visit
-terminates immediately.  If you don't need a callback function at
-all, set the function pointer to NULL.
- struct hivex_visitor {
-   int (*node_start) (hive_h *, void *opaque, hive_node_h, const char *name);
-   int (*node_end) (hive_h *, void *opaque, hive_node_h, const char *name);
-   int (*value_string) (hive_h *, void *opaque, hive_node_h, hive_value_h,
-         hive_type t, size_t len, const char *key, const char *str);
-   int (*value_multiple_strings) (hive_h *, void *opaque, hive_node_h,
-         hive_value_h, hive_type t, size_t len, const char *key, char **argv);
-   int (*value_string_invalid_utf16) (hive_h *, void *opaque, hive_node_h,
-         hive_value_h, hive_type t, size_t len, const char *key,
-         const char *str);
-   int (*value_dword) (hive_h *, void *opaque, hive_node_h, hive_value_h,
-         hive_type t, size_t len, const char *key, int32_t);
-   int (*value_qword) (hive_h *, void *opaque, hive_node_h, hive_value_h,
-         hive_type t, size_t len, const char *key, int64_t);
-   int (*value_binary) (hive_h *, void *opaque, hive_node_h, hive_value_h,
-         hive_type t, size_t len, const char *key, const char *value);
-   int (*value_none) (hive_h *, void *opaque, hive_node_h, hive_value_h,
-         hive_type t, size_t len, const char *key, const char *value);
-   int (*value_other) (hive_h *, void *opaque, hive_node_h, hive_value_h,
-         hive_type t, size_t len, const char *key, const char *value);
-   /* If value_any callback is not NULL, then the other value_*
-    * callbacks are not used, and value_any is called on all values.
-    */
-   int (*value_any) (hive_h *, void *opaque, hive_node_h, hive_value_h,
-         hive_type t, size_t len, const char *key, const char *value);
- };
-=over 4
-=item int hivex_visit (hive_h *h, const struct hivex_visitor *visitor, size_t len, void *opaque, int flags);
-Visit all the nodes recursively in the hive C<h>.
-C<visitor> should be a C<hivex_visitor> structure with callback
-fields filled in as required (unwanted callbacks can be set to
-NULL).  C<len> must be the length of the 'visitor' struct (you
-should pass C<sizeof (struct hivex_visitor)> for this).
-This returns 0 if the whole recursive visit was completed
-successfully.  On error this returns -1.  If one of the callback
-functions returned an error than we don't touch errno.  If the
-error was generated internally then we set errno.
-You can skip bad registry entries by setting C<flag> to
-C<HIVEX_VISIT_SKIP_BAD>.  If this flag is not set, then a bad registry
-causes the function to return an error immediately.
-This function is robust if the registry contains cycles or
-pointers which are invalid or outside the registry.  It detects
-these cases and returns an error.
-=item int hivex_visit_node (hive_h *h, hive_node_h node, const struct hivex_visitor *visitor, size_t len, void *opaque);
-Same as C<hivex_visit> but instead of starting out at the root, this
-starts at C<node>.
-The hivex library supports making limited modifications to hive files.
-We have tried to implement this very conservatively in order to reduce
-the chance of corrupting your registry.  However you should be careful
-and take back-ups, since Microsoft has never documented the hive
-format, and so it is possible there are nuances in the
-reverse-engineered format that we do not understand.
-To be able to modify a hive, you must pass the C<HIVEX_OPEN_WRITE>
-flag to C<hivex_open>, otherwise any write operation will return with
-errno C<EROFS>.
-The write operations shown below do not modify the on-disk file
-immediately.  You must call C<hivex_commit> in order to write the
-changes to disk.  If you call C<hivex_close> without committing then
-any writes are discarded.
-Hive files internally consist of a "memory dump" of binary blocks
-(like the C heap), and some of these blocks can be unused.  The hivex
-library never reuses these unused blocks.  Instead, to ensure
-robustness in the face of the partially understood on-disk format,
-hivex only allocates new blocks after the end of the file, and makes
-minimal modifications to existing structures in the file to point to
-these new blocks.  This makes hivex slightly less disk-efficient than
-it could be, but disk is cheap, and registry modifications tend to be
-very small.
-When deleting nodes, it is possible that this library may leave
-unreachable live blocks in the hive.  This is because certain parts of
-the hive disk format such as security (sk) records and big data (db)
-records and classname fields are not well understood (and not
-documented at all) and we play it safe by not attempting to modify
-them.  Apart from wasting a little bit of disk space, it is not
-thought that unreachable blocks are a problem.
-=over 4
-=item int hivex_commit (hive_h *h, const char *filename, int flags);
-Commit (write) any changes which have been made.
-C<filename> is the new file to write.  If C<filename == NULL> then we
-overwrite the original file (ie. the file name that was passed to
-C<hivex_open>).  C<flags> is not used, always pass 0.
-Returns 0 on success.  On error this returns -1 and sets errno.
-Note this does not close the hive handle.  You can perform further
-operations on the hive after committing, including making more
-modifications.  If you no longer wish to use the hive, call
-C<hivex_close> after this.
-=item hive_node_h hivex_node_add_child (hive_h *h, hive_node_h parent, const char *name);
-Add a new child node named C<name> to the existing node C<parent>.
-The new child initially has no subnodes and contains no keys or
-values.  The sk-record (security descriptor) is inherited from
-the parent.
-The parent must not have an existing child called C<name>, so if you
-want to overwrite an existing child, call C<hivex_node_delete_child>
-Returns the node handle.  On error this returns 0 and sets errno.
-=item int hivex_node_delete_child (hive_h *h, hive_node_h node);
-Delete the node C<node>.  All values at the node and all subnodes are
-deleted (recursively).  The C<node> handle and the handles of all
-subnodes become invalid.  You cannot delete the root node.
-Returns 0 on success.  On error this returns -1 and sets errno.
-=item hive_set_value
-The typedef C<hive_set_value> is used in conjunction with the
-C<hivex_node_set_values> call described below.
- struct hive_set_value {
-   char *key;     /* key - a UTF-8 encoded ASCIIZ string */
-   hive_type t;   /* type of value field */
-   size_t len;    /* length of value field in bytes */
-   char *value;   /* value field */
- };
- typedef struct hive_set_value hive_set_value;
-To set the default value for a node, you have to pass C<key = "">.
-Note that the C<value> field is just treated as a list of bytes, and
-is stored directly in the hive.  The caller has to ensure correct
-encoding and endianness, for example converting dwords to little
-The correct type and encoding for values depends on the node and key
-in the registry, the version of Windows, and sometimes even changes
-between versions of Windows for the same key.  We don't document it
-here.  Often it's not documented at all.
-=item int hivex_node_set_values (hive_h *h, hive_node_h node, size_t nr_values, const hive_set_value *values, int flags);
-This call can be used to set all the (key, value) pairs stored in C<node>.
-C<node> is the node to modify.  C<values> is an array of (key, value)
-pairs.  There should be C<nr_values> elements in this array.  C<flags>
-is not used, always pass 0.
-Any existing values stored at the node are discarded, and their
-C<hive_value_h> handles become invalid.  Thus you can remove all
-values stored at C<node> by passing C<nr_values = 0>.
-Returns 0 on success.  On error this returns -1 and sets errno.
-Note that this library does not offer a way to modify just a single
-key at a node.  We don't implement a way to do this efficiently.
-=over 4
-=item *
-Changing the root node.
-=item *
-Creating a new hive file from scratch.  This is impossible at present
-because not all fields in the header are understood.
-=item *
-Modifying or deleting single values at a node.
-=item *
-Modifying security key (sk) records or classnames.
-Previously we did not understand these records.  However now they
-are well-understood and we could add support if it was required
-(but nothing much really uses them).
-Note: To understand the relationship between hives and the common
-Windows Registry keys (like C<HKEY_LOCAL_MACHINE>) please see the
-Wikipedia page on the Windows Registry.
-The Windows Registry is split across various binary files, each
-file being known as a "hive".  This library only handles a single
-hive file at a time.
-Hives are n-ary trees with a single root.  Each node in the tree
-has a name.
-Each node in the tree (including non-leaf nodes) may have an
-arbitrary list of (key, value) pairs attached to it.  It may
-be the case that one of these pairs has an empty key.  This
-is referred to as the default key for the node.
-The (key, value) pairs are the place where the useful data is
-stored in the registry.  The key is always a string (possibly the
-empty string for the default key).  The value is a typed object
-(eg. string, int32, binary, etc.).
-Although this library does not care about or deal with Windows reg
-files, it's useful to look at the relationship between the registry
-itself and reg files because they are so common.
-A reg file is a text representation of the registry, or part of the
-registry.  The actual registry hives that Windows uses are binary
-files.  There are a number of Windows and Linux tools that let you
-generate reg files, or merge reg files back into the registry hives.
-Notable amongst them is Microsoft's REGEDIT program (formerly known as
-A typical reg file will contain many sections looking like this:
- "@"="Generic Stack"
- "TileInfo"="prop:System.FileCount"
- "TilePath"=str(2):"%systemroot%\\system32"
- "ThumbnailCutoff"=dword:00000000
- "FriendlyTypeName"=hex(2):40,00,25,00,53,00,79,00,73,00,74,00,65,00,6d,00,52,00,6f,00,\
-  6f,00,74,00,25,00,5c,00,53,00,79,00,73,00,74,00,65,00,6d,00,\
-  33,00,32,00,5c,00,73,00,65,00,61,00,72,00,63,00,68,00,66,00,\
-  6f,00,6c,00,64,00,65,00,72,00,2e,00,64,00,6c,00,6c,00,2c,00,\
-  2d,00,39,00,30,00,32,00,38,00,00,00,d8
-Taking this one piece at a time:
-This is the path to this node in the registry tree.  The first part,
-C<HKEY_LOCAL_MACHINE\SOFTWARE> means that this comes from a hive
-(file) called C<SOFTWARE>.  C<\Classes\Stack> is the real path part,
-starting at the root node of the C<SOFTWARE> hive.
-Below the node name is a list of zero or more key-value pairs.  Any
-interior or leaf node in the registry may have key-value pairs
- "@"="Generic Stack"
-This is the "default key".  In reality (ie. inside the binary hive)
-the key string is the empty string.  In reg files this is written as
-C<@> but this has no meaning either in the hives themselves or in this
-library.  The value is a string (type 1 - see C<enum hive_type>
- "TileInfo"="prop:System.FileCount"
-This is a regular (key, value) pair, with the value being a type 1
-string.  Note that inside the binary file the string is likely to be
-UTF-16 encoded.  This library converts to and from UTF-8 strings
- "TilePath"=str(2):"%systemroot%\\system32"
-The value in this case has type 2 (expanded string) meaning that some
-%...% variables get expanded by Windows.  (This library doesn't know
-or care about variable expansion).
- "ThumbnailCutoff"=dword:00000000
-The value in this case is a dword (type 4).
- "FriendlyTypeName"=hex(2):40,00,....
-This value is an expanded string (type 2) represented in the reg file
-as a series of hex bytes.  In this case the string appears to be a
-UTF-16 string.
-Many functions in this library set errno to indicate errors.  These
-are the values of errno you may encounter (this list is not
-=over 4
-=item ENOTSUP
-Corrupt or unsupported Registry file format.
-=item ENOKEY
-Missing root key.
-=item EINVAL
-Passed an invalid argument to the function.
-=item EFAULT
-Followed a Registry pointer which goes outside
-the registry or outside a registry block.
-=item ELOOP
-Registry contains cycles.
-=item ERANGE
-Field in the registry out of range.
-=item EEXIST
-Registry key already exists.
-=item EROFS
-Tried to write to a registry which is not opened for writing.
-=over 4
-Setting HIVEX_DEBUG=1 will enable very verbose messages.  This is
-useful for debugging problems with the library itself.
-=head1 SEE ALSO
-=head1 AUTHORS
-Richard W.M. Jones (C<rjones at redhat dot com>)
-Copyright (C) 2009-2010 Red Hat Inc.
-Derived from code by Petter Nordahl-Hagen under a compatible license:
-Copyright (C) 1997-2007 Petter Nordahl-Hagen.
-Derived from code by Markus Stephany under a compatible license:
-Copyright (C) 2000-2004 Markus Stephany.
-This library is free software; you can redistribute it and/or
-modify it under the terms of the GNU Lesser General Public
-License as published by the Free Software Foundation;
-version 2.1 of the License.
-This library is distributed in the hope that it will be useful,
-but WITHOUT ANY WARRANTY; without even the implied warranty of
-Lesser General Public License for more details.
-See file LICENSE for the full license.
diff --git a/hivex/hivexget b/hivex/hivexget
deleted file mode 100755 (executable)
index f804d0d..0000000
+++ /dev/null
@@ -1,43 +0,0 @@
-#!/bin/bash -
-# Copyright (C) 2009-2010 Red Hat Inc.
-# This program is free software; you can redistribute it and/or modify
-# it under the terms of the GNU General Public License as published by
-# the Free Software Foundation; either version 2 of the License, or
-# (at your option) any later version.
-# This program is distributed in the hope that it will be useful,
-# but WITHOUT ANY WARRANTY; without even the implied warranty of
-# GNU General Public License for more details.
-# You should have received a copy of the GNU General Public License
-# along with this program; if not, write to the Free Software
-# Foundation, Inc., 675 Mass Ave, Cambridge, MA 02139, USA.
-set -e
-if [ $# -lt 2 -o $# -gt 3 ]; then
-    echo "hivexget hivefile path [key]"
-    exit 1
-if [ $# -eq 2 ]; then
-    hivexsh <<EOF
-load $1
-cd $2
-    key=$3
-    if [ "$key" = "" ]; then
-        key="@"
-    fi
-    hivexsh <<EOF
-load $1
-cd $2
-lsval $key
diff --git a/hivex/hivexget.pod b/hivex/hivexget.pod
deleted file mode 100644 (file)
index 4fbac13..0000000
+++ /dev/null
@@ -1,95 +0,0 @@
-=encoding utf8
-=head1 NAME
-hivexget - Get subkey from a Windows Registry binary "hive" file
-=head1 SYNOPSIS
- hivexget hivefile '\Path\To\SubKey'
- hivexget hivefile '\Path\To\SubKey' name
-I<Note:> This is a low-level tool.  For a more convenient way to
-navigate the Windows Registry in Windows virtual machines, see
-This program navigates through a Windows Registry binary "hive"
-file and extracts I<either> all the (key, value) data pairs
-stored in that subkey I<or> just the single named data item.
-In the first form:
- hivexget hivefile '\Path\To\SubKey'
-C<hivefile> is some Windows Registry binary hive, and C<\Path\To\Subkey>
-is a path within that hive.  I<NB> the path is relative to the top
-of this hive, and is I<not> the full path as you would use in Windows
-(eg. C<\HKEY_LOCAL_MACHINE> is not a valid path).
-If the subkey exists, then the output lists all data pairs under this
-subkey, in a format compatible with C<regedit> in Windows.
-In the second form:
- hivexget hivefile '\Path\To\SubKey' name
-C<hivefile> and path are as above.  C<name> is the name of the value
-of interest (use C<@> for the default value).
-The corresponding data item is printed "raw" (ie. no processing or
-escaping) except:
-=over 4
-=item 1
-If it's a string we will convert it from Windows UTF-16 to UTF-8, if
-this conversion is possible.  The string is printed with a single
-trailing newline.
-=item 2
-If it's a multiple-string value, each string is printed on a separate
-=item 3
-If it's a numeric value, it is printed as a decimal number.
-=head1 SEE ALSO
-=head1 AUTHORS
-Richard W.M. Jones (C<rjones at redhat dot com>)
-Copyright (C) 2009 Red Hat Inc.
-This program is free software; you can redistribute it and/or modify
-it under the terms of the GNU General Public License as published by
-the Free Software Foundation; either version 2 of the License, or
-(at your option) any later version.
-This program is distributed in the hope that it will be useful,
-but WITHOUT ANY WARRANTY; without even the implied warranty of
-GNU General Public License for more details.
-You should have received a copy of the GNU General Public License along
-with this program; if not, write to the Free Software Foundation, Inc.,
-51 Franklin Street, Fifth Floor, Boston, MA 02110-1301 USA.
diff --git a/hivex/hivexml.c b/hivex/hivexml.c
deleted file mode 100644 (file)
index 90cb22b..0000000
+++ /dev/null
@@ -1,345 +0,0 @@
-/* hivexml - Convert Windows Registry "hive" to XML file.
- * Copyright (C) 2009 Red Hat Inc.
- *
- * This program is free software; you can redistribute it and/or modify
- * it under the terms of the GNU General Public License as published by
- * the Free Software Foundation; either version 2 of the License, or
- * (at your option) any later version.
- *
- * This program is distributed in the hope that it will be useful,
- * but WITHOUT ANY WARRANTY; without even the implied warranty of
- * GNU General Public License for more details.
- *
- * You should have received a copy of the GNU General Public License along
- * with this program; if not, write to the Free Software Foundation, Inc.,
- * 51 Franklin Street, Fifth Floor, Boston, MA 02110-1301 USA.
- */
-#include <config.h>
-#include <stdio.h>
-#include <stdlib.h>
-#include <string.h>
-#include <stdint.h>
-#include <inttypes.h>
-#include <unistd.h>
-#include <errno.h>
-#include <libxml/xmlwriter.h>
-#include "hivex.h"
-#include "gettext.h"
-#define _(str) dgettext(PACKAGE, (str))
-//#define N_(str) dgettext(PACKAGE, (str))
-#define _(str) str
-//#define N_(str) str
-/* Callback functions. */
-static int node_start (hive_h *, void *, hive_node_h, const char *name);
-static int node_end (hive_h *, void *, hive_node_h, const char *name);
-static int value_string (hive_h *, void *, hive_node_h, hive_value_h, hive_type t, size_t len, const char *key, const char *str);
-static int value_multiple_strings (hive_h *, void *, hive_node_h, hive_value_h, hive_type t, size_t len, const char *key, char **argv);
-static int value_string_invalid_utf16 (hive_h *, void *, hive_node_h, hive_value_h, hive_type t, size_t len, const char *key, const char *str);
-static int value_dword (hive_h *, void *, hive_node_h, hive_value_h, hive_type t, size_t len, const char *key, int32_t);
-static int value_qword (hive_h *, void *, hive_node_h, hive_value_h, hive_type t, size_t len, const char *key, int64_t);
-static int value_binary (hive_h *, void *, hive_node_h, hive_value_h, hive_type t, size_t len, const char *key, const char *value);
-static int value_none (hive_h *, void *, hive_node_h, hive_value_h, hive_type t, size_t len, const char *key, const char *value);
-static int value_other (hive_h *, void *, hive_node_h, hive_value_h, hive_type t, size_t len, const char *key, const char *value);
-static struct hivex_visitor visitor = {
-  .node_start = node_start,
-  .node_end = node_end,
-  .value_string = value_string,
-  .value_multiple_strings = value_multiple_strings,
-  .value_string_invalid_utf16 = value_string_invalid_utf16,
-  .value_dword = value_dword,
-  .value_qword = value_qword,
-  .value_binary = value_binary,
-  .value_none = value_none,
-  .value_other = value_other
-#define XML_CHECK(proc, args)                                           \
-  do {                                                                  \
-    if ((proc args) == -1) {                                            \
-      fprintf (stderr, _("%s: failed to write XML document\n"), #proc); \
-      exit (EXIT_FAILURE);                                              \
-    }                                                                   \
-  } while (0)
-main (int argc, char *argv[])
-  setlocale (LC_ALL, "");
-  bindtextdomain (PACKAGE, LOCALEBASEDIR);
-  textdomain (PACKAGE);
-  int c;
-  int open_flags = 0;
-  int visit_flags = 0;
-  while ((c = getopt (argc, argv, "dk")) != EOF) {
-    switch (c) {
-    case 'd':
-      open_flags |= HIVEX_OPEN_DEBUG;
-      break;
-    case 'k':
-      visit_flags |= HIVEX_VISIT_SKIP_BAD;
-      break;
-    default:
-      fprintf (stderr, "hivexml [-dk] regfile > output.xml\n");
-      exit (EXIT_FAILURE);
-    }
-  }
-  if (optind + 1 != argc) {
-    fprintf (stderr, _("hivexml: missing name of input file\n"));
-    exit (EXIT_FAILURE);
-  }
-  hive_h *h = hivex_open (argv[optind], open_flags);
-  if (h == NULL) {
-    perror (argv[optind]);
-    exit (EXIT_FAILURE);
-  }
-  /* Note both this macro, and xmlTextWriterStartDocument leak memory.  There
-   * doesn't seem to be any way to recover that memory, but it's not a
-   * large amount.
-   */
-  xmlTextWriterPtr writer;
-  writer = xmlNewTextWriterFilename ("/dev/stdout", 0);
-  if (writer == NULL) {
-    fprintf (stderr, _("xmlNewTextWriterFilename: failed to create XML writer\n"));
-    exit (EXIT_FAILURE);
-  }
-  XML_CHECK (xmlTextWriterStartDocument, (writer, NULL, "utf-8", NULL));
-  XML_CHECK (xmlTextWriterStartElement, (writer, BAD_CAST "hive"));
-  if (hivex_visit (h, &visitor, sizeof visitor, writer, visit_flags) == -1) {
-    perror (argv[optind]);
-    exit (EXIT_FAILURE);
-  }
-  if (hivex_close (h) == -1) {
-    perror (argv[optind]);
-    exit (EXIT_FAILURE);
-  }
-  XML_CHECK (xmlTextWriterEndElement, (writer));
-  XML_CHECK (xmlTextWriterEndDocument, (writer));
-  xmlFreeTextWriter (writer);
-  exit (EXIT_SUCCESS);
-static int
-node_start (hive_h *h, void *writer_v, hive_node_h node, const char *name)
-  xmlTextWriterPtr writer = (xmlTextWriterPtr) writer_v;
-  XML_CHECK (xmlTextWriterStartElement, (writer, BAD_CAST "node"));
-  XML_CHECK (xmlTextWriterWriteAttribute, (writer, BAD_CAST "name", BAD_CAST name));
-  return 0;
-static int
-node_end (hive_h *h, void *writer_v, hive_node_h node, const char *name)
-  xmlTextWriterPtr writer = (xmlTextWriterPtr) writer_v;
-  XML_CHECK (xmlTextWriterEndElement, (writer));
-  return 0;
-static void
-start_value (xmlTextWriterPtr writer,
-             const char *key, const char *type, const char *encoding)
-  XML_CHECK (xmlTextWriterStartElement, (writer, BAD_CAST "value"));
-  XML_CHECK (xmlTextWriterWriteAttribute, (writer, BAD_CAST "type", BAD_CAST type));
-  if (encoding)
-    XML_CHECK (xmlTextWriterWriteAttribute, (writer, BAD_CAST "encoding", BAD_CAST encoding));
-  if (*key)
-    XML_CHECK (xmlTextWriterWriteAttribute, (writer, BAD_CAST "key", BAD_CAST key));
-  else                          /* default key */
-    XML_CHECK (xmlTextWriterWriteAttribute, (writer, BAD_CAST "default", BAD_CAST "1"));
-static void
-end_value (xmlTextWriterPtr writer)
-  XML_CHECK (xmlTextWriterEndElement, (writer));
-static int
-value_string (hive_h *h, void *writer_v, hive_node_h node, hive_value_h value,
-              hive_type t, size_t len, const char *key, const char *str)
-  xmlTextWriterPtr writer = (xmlTextWriterPtr) writer_v;
-  const char *type;
-  switch (t) {
-  case hive_t_string: type = "string"; break;
-  case hive_t_expand_string: type = "expand"; break;
-  case hive_t_link: type = "link"; break;
-  case hive_t_none:
-  case hive_t_binary:
-  case hive_t_dword:
-  case hive_t_dword_be:
-  case hive_t_multiple_strings:
-  case hive_t_resource_list:
-  case hive_t_full_resource_description:
-  case hive_t_resource_requirements_list:
-  case hive_t_qword:
-    abort ();                   /* internal error - should not happen */
-  default:
-    type = "unknown";
-  }
-  start_value (writer, key, type, NULL);
-  XML_CHECK (xmlTextWriterWriteString, (writer, BAD_CAST str));
-  end_value (writer);
-  return 0;
-static int
-value_multiple_strings (hive_h *h, void *writer_v, hive_node_h node,
-                        hive_value_h value, hive_type t, size_t len,
-                        const char *key, char **argv)
-  xmlTextWriterPtr writer = (xmlTextWriterPtr) writer_v;
-  start_value (writer, key, "string-list", NULL);
-  size_t i;
-  for (i = 0; argv[i] != NULL; ++i) {
-    XML_CHECK (xmlTextWriterStartElement, (writer, BAD_CAST "string"));
-    XML_CHECK (xmlTextWriterWriteString, (writer, BAD_CAST argv[i]));
-    XML_CHECK (xmlTextWriterEndElement, (writer));
-  }
-  end_value (writer);
-  return 0;
-static int
-value_string_invalid_utf16 (hive_h *h, void *writer_v, hive_node_h node,
-                            hive_value_h value, hive_type t, size_t len,
-                            const char *key,
-                            const char *str /* original data */)
-  xmlTextWriterPtr writer = (xmlTextWriterPtr) writer_v;
-  const char *type;
-  switch (t) {
-  case hive_t_string: type = "bad-string"; break;
-  case hive_t_expand_string: type = "bad-expand"; break;
-  case hive_t_link: type = "bad-link"; break;
-  case hive_t_multiple_strings: type = "bad-string-list"; break;
-  case hive_t_none:
-  case hive_t_binary:
-  case hive_t_dword:
-  case hive_t_dword_be:
-  case hive_t_resource_list:
-  case hive_t_full_resource_description:
-  case hive_t_resource_requirements_list:
-  case hive_t_qword:
-    abort ();                   /* internal error - should not happen */
-  default:
-    type = "unknown";
-  }
-  start_value (writer, key, type, "base64");
-  XML_CHECK (xmlTextWriterWriteBase64, (writer, str, 0, len));
-  end_value (writer);
-  return 0;
-static int
-value_dword (hive_h *h, void *writer_v, hive_node_h node, hive_value_h value,
-             hive_type t, size_t len, const char *key, int32_t v)
-  xmlTextWriterPtr writer = (xmlTextWriterPtr) writer_v;
-  start_value (writer, key, "int32", NULL);
-  XML_CHECK (xmlTextWriterWriteFormatString, (writer, "%" PRIi32, v));
-  end_value (writer);
-  return 0;
-static int
-value_qword (hive_h *h, void *writer_v, hive_node_h node, hive_value_h value,
-             hive_type t, size_t len, const char *key, int64_t v)
-  xmlTextWriterPtr writer = (xmlTextWriterPtr) writer_v;
-  start_value (writer, key, "int64", NULL);
-  XML_CHECK (xmlTextWriterWriteFormatString, (writer, "%" PRIi64, v));
-  end_value (writer);
-  return 0;
-static int
-value_binary (hive_h *h, void *writer_v, hive_node_h node, hive_value_h value,
-              hive_type t, size_t len, const char *key, const char *v)
-  xmlTextWriterPtr writer = (xmlTextWriterPtr) writer_v;
-  start_value (writer, key, "binary", "base64");
-  XML_CHECK (xmlTextWriterWriteBase64, (writer, v, 0, len));
-  end_value (writer);
-  return 0;
-static int
-value_none (hive_h *h, void *writer_v, hive_node_h node, hive_value_h value,
-            hive_type t, size_t len, const char *key, const char *v)
-  xmlTextWriterPtr writer = (xmlTextWriterPtr) writer_v;
-  start_value (writer, key, "none", "base64");
-  if (len > 0) XML_CHECK (xmlTextWriterWriteBase64, (writer, v, 0, len));
-  end_value (writer);
-  return 0;
-static int
-value_other (hive_h *h, void *writer_v, hive_node_h node, hive_value_h value,
-             hive_type t, size_t len, const char *key, const char *v)
-  xmlTextWriterPtr writer = (xmlTextWriterPtr) writer_v;
-  const char *type;
-  switch (t) {
-  case hive_t_none:
-  case hive_t_binary:
-  case hive_t_dword:
-  case hive_t_dword_be:
-  case hive_t_qword:
-  case hive_t_string:
-  case hive_t_expand_string:
-  case hive_t_link:
-  case hive_t_multiple_strings:
-    abort ();                   /* internal error - should not happen */
-  case hive_t_resource_list: type = "resource-list"; break;
-  case hive_t_full_resource_description: type = "resource-description"; break;
-  case hive_t_resource_requirements_list: type = "resource-requirements"; break;
-  default:
-    type = "unknown";
-  }
-  start_value (writer, key, type, "base64");
-  if (len > 0) XML_CHECK (xmlTextWriterWriteBase64, (writer, v, 0, len));
-  end_value (writer);
-  return 0;
diff --git a/hivex/hivexml.pod b/hivex/hivexml.pod
deleted file mode 100644 (file)
index d6a87b4..0000000
+++ /dev/null
@@ -1,65 +0,0 @@
-=encoding utf8
-=head1 NAME
-hivexml - Convert Windows Registry binary "hive" into XML
-=head1 SYNOPSIS
- hivexml [-dk] hivefile > output.xml
-This program converts a single Windows Registry binary "hive"
-file into a self-describing XML format.
-=head1 OPTIONS
-=over 4
-=item B<-d>
-Enable lots of debug messages.  If you find a Registry file
-that this program cannot parse, please enable this option and
-post the complete output I<and> the Registry file in your
-bug report.
-=item B<-k>
-Keep going even if we find errors in the Registry file.  This
-skips over any parts of the Registry that we cannot read.
-=head1 SEE ALSO
-=head1 AUTHORS
-Richard W.M. Jones (C<rjones at redhat dot com>)
-Copyright (C) 2009 Red Hat Inc.
-This program is free software; you can redistribute it and/or modify
-it under the terms of the GNU General Public License as published by
-the Free Software Foundation; either version 2 of the License, or
-(at your option) any later version.
-This program is distributed in the hope that it will be useful,
-but WITHOUT ANY WARRANTY; without even the implied warranty of
-GNU General Public License for more details.
-You should have received a copy of the GNU General Public License along
-with this program; if not, write to the Free Software Foundation, Inc.,
-51 Franklin Street, Fifth Floor, Boston, MA 02110-1301 USA.
diff --git a/hivex/hivexsh.c b/hivex/hivexsh.c
deleted file mode 100644 (file)
index 332b773..0000000
+++ /dev/null
@@ -1,1094 +0,0 @@
-/* hivexsh - Hive shell.
- * Copyright (C) 2009 Red Hat Inc.
- *
- * This program is free software; you can redistribute it and/or modify
- * it under the terms of the GNU General Public License as published by
- * the Free Software Foundation; either version 2 of the License, or
- * (at your option) any later version.
- *
- * This program is distributed in the hope that it will be useful,
- * but WITHOUT ANY WARRANTY; without even the implied warranty of
- * GNU General Public License for more details.
- *
- * You should have received a copy of the GNU General Public License along
- * with this program; if not, write to the Free Software Foundation, Inc.,
- * 51 Franklin Street, Fifth Floor, Boston, MA 02110-1301 USA.
- */
-#include <config.h>
-#include <stdio.h>
-#include <stdlib.h>
-#include <string.h>
-#include <stdint.h>
-#include <inttypes.h>
-#include <fcntl.h>
-#include <unistd.h>
-#include <assert.h>
-#include <errno.h>
-#include <readline/readline.h>
-#include <readline/history.h>
-#include "gettext.h"
-#define _(str) dgettext(PACKAGE, (str))
-//#define N_(str) dgettext(PACKAGE, (str))
-#define _(str) str
-//#define N_(str) str
-#define STREQ(a,b) (strcmp((a),(b)) == 0)
-#define STRCASEEQ(a,b) (strcasecmp((a),(b)) == 0)
-#define STRNEQ(a,b) (strcmp((a),(b)) != 0)
-//#define STRCASENEQ(a,b) (strcasecmp((a),(b)) != 0)
-//#define STREQLEN(a,b,n) (strncmp((a),(b),(n)) == 0)
-//#define STRCASEEQLEN(a,b,n) (strncasecmp((a),(b),(n)) == 0)
-//#define STRNEQLEN(a,b,n) (strncmp((a),(b),(n)) != 0)
-//#define STRCASENEQLEN(a,b,n) (strncasecmp((a),(b),(n)) != 0)
-#define STRPREFIX(a,b) (strncmp((a),(b),strlen((b))) == 0)
-#include "c-ctype.h"
-#include "xstrtol.h"
-#include "hivex.h"
-#include "byte_conversions.h"
-#define HIVEX_MAX_VALUES         1000
-static int quit = 0;
-static int is_tty;
-static hive_h *h = NULL;
-static char *prompt_string = NULL; /* Normal prompt string. */
-static char *loaded = NULL;     /* Basename of loaded file, if any. */
-static hive_node_h cwd;         /* Current node. */
-static int open_flags = 0;      /* Flags used when loading a hive file. */
-static void usage (void) __attribute__((noreturn));
-static void print_node_path (hive_node_h, FILE *);
-static void set_prompt_string (void);
-static void initialize_readline (void);
-static void cleanup_readline (void);
-static void add_history_line (const char *);
-static char *rl_gets (const char *prompt_string);
-static void sort_strings (char **strings, int len);
-static int get_xdigit (char c);
-static int dispatch (char *cmd, char *args);
-static int cmd_add (char *name);
-static int cmd_cd (char *path);
-static int cmd_close (char *path);
-static int cmd_commit (char *path);
-static int cmd_del (char *args);
-static int cmd_help (char *args);
-static int cmd_load (char *hivefile);
-static int cmd_ls (char *args);
-static int cmd_lsval (char *args);
-static int cmd_setval (char *args);
-static void
-usage (void)
-  fprintf (stderr, "hivexsh [-dfw] [hivefile]\n");
-  exit (EXIT_FAILURE);
-main (int argc, char *argv[])
-  setlocale (LC_ALL, "");
-  bindtextdomain (PACKAGE, LOCALEBASEDIR);
-  textdomain (PACKAGE);
-  int c;
-  const char *filename = NULL;
-  set_prompt_string ();
-  while ((c = getopt (argc, argv, "dfw")) != EOF) {
-    switch (c) {
-    case 'd':
-      open_flags |= HIVEX_OPEN_DEBUG;
-      break;
-    case 'f':
-      filename = optarg;
-      break;
-    case 'w':
-      open_flags |= HIVEX_OPEN_WRITE;
-      break;
-    default:
-      usage ();
-    }
-  }
-  if (optind < argc) {
-    if (optind + 1 != argc)
-      usage ();
-    if (cmd_load (argv[optind]) == -1)
-      exit (EXIT_FAILURE);
-  }
-  /* -f filename parameter */
-  if (filename) {
-    close (0);
-    if (open (filename, O_RDONLY) == -1) {
-      perror (filename);
-      exit (EXIT_FAILURE);
-    }
-  }
-  /* Main loop. */
-  is_tty = isatty (0);
-  initialize_readline ();
-  if (is_tty)
-    printf (_(
-"Welcome to hivexsh, the hivex interactive shell for examining\n"
-"Windows Registry binary hive files.\n"
-"Type: 'help' for help summary\n"
-"      'quit' to quit the shell\n"
-  while (!quit) {
-    char *buf = rl_gets (prompt_string);
-    if (!buf) {
-      quit = 1;
-      if (is_tty)
-        printf ("\n");
-      break;
-    }
-    while (*buf && c_isspace (*buf))
-      buf++;
-    /* Ignore blank line. */
-    if (!*buf) continue;
-    /* If the next character is '#' then this is a comment. */
-    if (*buf == '#') continue;
-    /* Parsing is very simple - much simpler than guestfish.  This is
-     * because Registry keys often contain spaces, and we don't want
-     * to bother with quoting.  Therefore here we just split at the
-     * first whitespace into "cmd<whitespace>arg(s)".  We let the
-     * command decide how to deal with arg(s), if at all.
-     */
-    size_t len = strcspn (buf, " \t");
-    if (len == 0) continue;
-    char *cmd = buf;
-    char *args;
-    if (buf[len] == '\0') {
-      /* This is mostly safe.  Although the cmd_* functions do sometimes
-       * modify args, then shouldn't do so when args is "".
-       */
-      args = (char *) "";
-      goto got_command;
-    }
-    buf[len] = '\0';
-    args = buf + len + 1 + strspn (&buf[len+1], " \t");
-    len = strlen (args);
-    while (len > 0 && c_isspace (args[len-1])) {
-      args[len-1] = '\0';
-      len--;
-    }
-  got_command:
-    /*printf ("command: '%s'  args: '%s'\n", cmd, args)*/;
-    int r = dispatch (cmd, args);
-    if (!is_tty && r == -1)
-      exit (EXIT_FAILURE);
-  }
-  cleanup_readline ();
-  free (prompt_string);
-  free (loaded);
-  if (h) hivex_close (h);
-  exit (0);
-/* Set the prompt string.  This is called whenever it could change, eg.
- * after loading a file or changing directory.
- */
-static void
-set_prompt_string (void)
-  free (prompt_string);
-  prompt_string = NULL;
-  FILE *fp;
-  char *ptr;
-  size_t size;
-  fp = open_memstream (&ptr, &size);
-  if (fp == NULL) {
-    perror ("open_memstream");
-    exit (EXIT_FAILURE);
-  }
-  if (h) {
-    assert (loaded != NULL);
-    assert (cwd != 0);
-    fputs (loaded, fp);
-    print_node_path (cwd, fp);
-  }
-  fprintf (fp, "> ");
-  fclose (fp);
-  prompt_string = ptr;
-/* Print the \full\path of a node. */
-static void
-print_node_path (hive_node_h node, FILE *fp)
-  hive_node_h root = hivex_root (h);
-  if (node == root) {
-    fputc ('\\', fp);
-    return;
-  }
-  hive_node_h parent = hivex_node_parent (h, node);
-  if (parent == 0) {
-    fprintf (stderr, _("hivexsh: error getting parent of node %zu\n"), node);
-    return;
-  }
-  print_node_path (parent, fp);
-  if (parent != root)
-    fputc ('\\', fp);
-  char *name = hivex_node_name (h, node);
-  if (name == NULL) {
-    fprintf (stderr, _("hivexsh: error getting node name of node %zx\n"), node);
-    return;
-  }
-  fputs (name, fp);
-  free (name);
-static char *line_read = NULL;
-static char *
-rl_gets (const char *prompt_string)
-  if (is_tty) {
-    if (line_read) {
-      free (line_read);
-      line_read = NULL;
-    }
-    line_read = readline (prompt_string);
-    if (line_read && *line_read)
-      add_history_line (line_read);
-    return line_read;
-  }
-#endif /* HAVE_LIBREADLINE */
-  static char buf[8192];
-  int len;
-  if (is_tty)
-    printf ("%s", prompt_string);
-  line_read = fgets (buf, sizeof buf, stdin);
-  if (line_read) {
-    len = strlen (line_read);
-    if (len > 0 && buf[len-1] == '\n') buf[len-1] = '\0';
-  }
-  return line_read;
-static char histfile[1024];
-static int nr_history_lines = 0;
-static void
-initialize_readline (void)
-  const char *home;
-  home = getenv ("HOME");
-  if (home) {
-    snprintf (histfile, sizeof histfile, "%s/.hivexsh", home);
-    using_history ();
-    (void) read_history (histfile);
-  }
-  rl_readline_name = "hivexsh";
-static void
-cleanup_readline (void)
-  int fd;
-  if (histfile[0] != '\0') {
-    fd = open (histfile, O_WRONLY|O_CREAT, 0644);
-    if (fd == -1) {
-      perror (histfile);
-      return;
-    }
-    close (fd);
-    (void) append_history (nr_history_lines, histfile);
-  }
-static void
-add_history_line (const char *line)
-  add_history (line);
-  nr_history_lines++;
-static int
-compare (const void *vp1, const void *vp2)
-  char * const *p1 = (char * const *) vp1;
-  char * const *p2 = (char * const *) vp2;
-  return strcasecmp (*p1, *p2);
-static void
-sort_strings (char **strings, int len)
-  qsort (strings, len, sizeof (char *), compare);
-static int
-get_xdigit (char c)
-  switch (c) {
-  case '0'...'9': return c - '0';
-  case 'a'...'f': return c - 'a' + 10;
-  case 'A'...'F': return c - 'A' + 10;
-  default: return -1;
-  }
-static int
-dispatch (char *cmd, char *args)
-  if (STRCASEEQ (cmd, "help"))
-    return cmd_help (args);
-  else if (STRCASEEQ (cmd, "load"))
-    return cmd_load (args);
-  else if (STRCASEEQ (cmd, "exit") ||
-           STRCASEEQ (cmd, "q") ||
-           STRCASEEQ (cmd, "quit")) {
-    quit = 1;
-    return 0;
-  }
-  /* If no hive file is loaded (!h) then only the small selection of
-   * commands above will work.
-   */
-  if (!h) {
-    fprintf (stderr, _("hivexsh: you must load a hive file first using 'load hivefile'\n"));
-    return -1;
-  }
-  if (STRCASEEQ (cmd, "add"))
-    return cmd_add (args);
-  else if (STRCASEEQ (cmd, "cd"))
-    return cmd_cd (args);
-  else if (STRCASEEQ (cmd, "close") || STRCASEEQ (cmd, "unload"))
-    return cmd_close (args);
-  else if (STRCASEEQ (cmd, "commit"))
-    return cmd_commit (args);
-  else if (STRCASEEQ (cmd, "del"))
-    return cmd_del (args);
-  else if (STRCASEEQ (cmd, "ls"))
-    return cmd_ls (args);
-  else if (STRCASEEQ (cmd, "lsval"))
-    return cmd_lsval (args);
-  else if (STRCASEEQ (cmd, "setval"))
-    return cmd_setval (args);
-  else {
-    fprintf (stderr, _("hivexsh: unknown command '%s', use 'help' for help summary\n"),
-             cmd);
-    return -1;
-  }
-static int
-cmd_load (char *hivefile)
-  if (STREQ (hivefile, "")) {
-    fprintf (stderr, _("hivexsh: load: no hive file name given to load\n"));
-    return -1;
-  }
-  if (h) hivex_close (h);
-  h = NULL;
-  free (loaded);
-  loaded = NULL;
-  cwd = 0;
-  h = hivex_open (hivefile, open_flags);
-  if (h == NULL) {
-    fprintf (stderr,
-             _(
-"hivexsh: failed to open hive file: %s: %m\n"
-"If you think this file is a valid Windows binary hive file (_not_\n"
-"a regedit *.reg file) then please run this command again using the\n"
-"hivexsh option '-d' and attach the complete output _and_ the hive file\n"
-"which fails into a bug report at https://bugzilla.redhat.com/\n"
-             hivefile);
-    return -1;
-  }
-  /* Get the basename of the file for the prompt. */
-  char *p = strrchr (hivefile, '/');
-  if (p)
-    loaded = strdup (p+1);
-  else
-    loaded = strdup (hivefile);
-  if (!loaded) {
-    perror ("strdup");
-    exit (EXIT_FAILURE);
-  }
-  cwd = hivex_root (h);
-  set_prompt_string ();
-  return 0;
-static int
-cmd_close (char *args)
-  if (STRNEQ (args, "")) {
-    fprintf (stderr, _("hivexsh: '%s' command should not be given arguments\n"),
-             "close");
-    return -1;
-  }
-  if (h) hivex_close (h);
-  h = NULL;
-  free (loaded);
-  loaded = NULL;
-  cwd = 0;
-  set_prompt_string ();
-  return 0;
-static int
-cmd_commit (char *path)
-  if (STREQ (path, ""))
-    path = NULL;
-  if (hivex_commit (h, path, 0) == -1) {
-    perror ("hivexsh: commit");
-    return -1;
-  }
-  return 0;
-static int
-cmd_cd (char *path)
-  if (STREQ (path, "")) {
-    print_node_path (cwd, stdout);
-    fputc ('\n', stdout);
-    return 0;
-  }
-  if (path[0] == '\\' && path[1] == '\\') {
-    fprintf (stderr, _("%s: %s: \\ characters in path are doubled - are you escaping the path parameter correctly?\n"), "hivexsh", path);
-    return -1;
-  }
-  hive_node_h new_cwd = cwd;
-  hive_node_h root = hivex_root (h);
-  if (path[0] == '\\') {
-    new_cwd = root;
-    path++;
-  }
-  while (path[0]) {
-    size_t len = strcspn (path, "\\");
-    if (len == 0) {
-      path++;
-      continue;
-    }
-    char *elem = path;
-    path = path[len] == '\0' ? &path[len] : &path[len+1];
-    elem[len] = '\0';
-    if (len == 1 && STREQ (elem, "."))
-      continue;
-    if (len == 2 && STREQ (elem, "..")) {
-      if (new_cwd != root)
-        new_cwd = hivex_node_parent (h, new_cwd);
-      continue;
-    }
-    errno = 0;
-    new_cwd = hivex_node_get_child (h, new_cwd, elem);
-    if (new_cwd == 0) {
-      if (errno)
-        perror ("hivexsh: cd");
-      else
-        fprintf (stderr, _("hivexsh: cd: subkey '%s' not found\n"),
-                 elem);
-      return -1;
-    }
-  }
-  if (new_cwd != cwd) {
-    cwd = new_cwd;
-    set_prompt_string ();
-  }
-  return 0;
-static int
-cmd_help (char *args)
-  printf (_(
-"Navigate through the hive's keys using the 'cd' command, as if it\n"
-"contained a filesystem, and use 'ls' to list the subkeys of the\n"
-"current key.  Full documentation is in the hivexsh(1) manual page.\n"));
-  return 0;
-static int
-cmd_ls (char *args)
-  if (STRNEQ (args, "")) {
-    fprintf (stderr, _("hivexsh: '%s' command should not be given arguments\n"),
-             "ls");
-    return -1;
-  }
-  /* Get the subkeys. */
-  hive_node_h *children = hivex_node_children (h, cwd);
-  if (children == NULL) {
-    perror ("ls");
-    return -1;
-  }
-  /* Get names for each subkey. */
-  size_t len;
-  for (len = 0; children[len] != 0; ++len)
-    ;
-  char **names = calloc (len, sizeof (char *));
-  if (names == NULL) {
-    perror ("malloc");
-    exit (EXIT_FAILURE);
-  }
-  int ret = -1;
-  size_t i;
-  for (i = 0; i < len; ++i) {
-    names[i] = hivex_node_name (h, children[i]);
-    if (names[i] == NULL) {
-      perror ("hivex_node_name");
-      goto error;
-    }
-  }
-  /* Sort the names. */
-  sort_strings (names, len);
-  for (i = 0; i < len; ++i)
-    printf ("%s\n", names[i]);
-  ret = 0;
- error:
-  free (children);
-  for (i = 0; i < len; ++i)
-    free (names[i]);
-  free (names);
-  return ret;
-static int
-cmd_lsval (char *key)
-  if (STRNEQ (key, "")) {
-    hive_value_h value;
-    errno = 0;
-    if (STREQ (key, "@"))       /* default key written as "@" */
-      value = hivex_node_get_value (h, cwd, "");
-    else
-      value = hivex_node_get_value (h, cwd, key);
-    if (value == 0) {
-      if (errno)
-        goto error;
-      /* else key not found */
-      fprintf (stderr, _("%s: %s: key not found\n"), "hivexsh", key);
-      return -1;
-    }
-    /* Print the value. */
-    hive_type t;
-    size_t len;
-    if (hivex_value_type (h, value, &t, &len) == -1)
-      goto error;
-    switch (t) {
-    case hive_t_string:
-    case hive_t_expand_string:
-    case hive_t_link: {
-      char *str = hivex_value_string (h, value);
-      if (!str)
-        goto error;
-      puts (str); /* note: this adds a single \n character */
-      free (str);
-      break;
-    }
-    case hive_t_dword:
-    case hive_t_dword_be: {
-      int32_t j = hivex_value_dword (h, value);
-      printf ("%" PRIi32 "\n", j);
-      break;
-    }
-    case hive_t_qword: {
-      int64_t j = hivex_value_qword (h, value);
-      printf ("%" PRIi64 "\n", j);
-      break;
-    }
-    case hive_t_multiple_strings: {
-      char **strs = hivex_value_multiple_strings (h, value);
-      if (!strs)
-        goto error;
-      size_t j;
-      for (j = 0; strs[j] != NULL; ++j) {
-        puts (strs[j]);
-        free (strs[j]);
-      }
-      free (strs);
-      break;
-    }
-    case hive_t_none:
-    case hive_t_binary:
-    case hive_t_resource_list:
-    case hive_t_full_resource_description:
-    case hive_t_resource_requirements_list:
-    default: {
-      char *data = hivex_value_value (h, value, &t, &len);
-      if (!data)
-        goto error;
-      if (fwrite (data, 1, len, stdout) != len)
-        goto error;
-      free (data);
-      break;
-    }
-    } /* switch */
-  } else {
-    /* No key specified, so print all keys in this node.  We do this
-     * in a format which looks like the output of regedit, although
-     * this isn't a particularly useful format.
-     */
-    hive_value_h *values;
-    values = hivex_node_values (h, cwd);
-    if (values == NULL)
-      goto error;
-    size_t i;
-    for (i = 0; values[i] != 0; ++i) {
-      char *key = hivex_value_key (h, values[i]);
-      if (!key) goto error;
-      if (*key) {
-        putchar ('"');
-        size_t j;
-        for (j = 0; key[j] != 0; ++j) {
-          if (key[j] == '"' || key[j] == '\\')
-            putchar ('\\');
-          putchar (key[j]);
-        }
-        putchar ('"');
-      } else
-        printf ("\"@\"");       /* default key in regedit files */
-      putchar ('=');
-      free (key);
-      hive_type t;
-      size_t len;
-      if (hivex_value_type (h, values[i], &t, &len) == -1)
-        goto error;
-      switch (t) {
-      case hive_t_string:
-      case hive_t_expand_string:
-      case hive_t_link: {
-        char *str = hivex_value_string (h, values[i]);
-        if (!str)
-          goto error;
-        if (t != hive_t_string)
-          printf ("str(%d):", t);
-        putchar ('"');
-        size_t j;
-        for (j = 0; str[j] != 0; ++j) {
-          if (str[j] == '"' || str[j] == '\\')
-            putchar ('\\');
-          putchar (str[j]);
-        }
-        putchar ('"');
-        free (str);
-        break;
-      }
-      case hive_t_dword:
-      case hive_t_dword_be: {
-        int32_t j = hivex_value_dword (h, values[i]);
-        printf ("dword:%08" PRIx32, j);
-        break;
-      }
-      case hive_t_qword: /* sic */
-      case hive_t_none:
-      case hive_t_binary:
-      case hive_t_multiple_strings:
-      case hive_t_resource_list:
-      case hive_t_full_resource_description:
-      case hive_t_resource_requirements_list:
-      default: {
-        unsigned char *data =
-          (unsigned char *) hivex_value_value (h, values[i], &t, &len);
-        if (!data)
-          goto error;
-        printf ("hex(%d):", t);
-        size_t j;
-        for (j = 0; j < len; ++j) {
-          if (j > 0)
-            putchar (',');
-          printf ("%02x", data[j]);
-        }
-        break;
-      }
-      } /* switch */
-      putchar ('\n');
-    } /* for */
-    free (values);
-  }
-  return 0;
- error:
-  perror ("hivexsh: lsval");
-  return -1;
-static int
-cmd_setval (char *nrvals_str)
-  strtol_error xerr;
-  /* Parse number of values. */
-  long nrvals;
-  xerr = xstrtol (nrvals_str, NULL, 0, &nrvals, "");
-  if (xerr != LONGINT_OK) {
-    fprintf (stderr, _("%s: %s: invalid integer parameter (%s returned %d)\n"),
-             "setval", "nrvals", "xstrtol", xerr);
-    return -1;
-  }
-  if (nrvals < 0 || nrvals > HIVEX_MAX_VALUES) {
-    fprintf (stderr, _("%s: %s: integer out of range\n"),
-             "setval", "nrvals");
-    return -1;
-  }
-  struct hive_set_value *values =
-    calloc (nrvals, sizeof (struct hive_set_value));
-  if (values == NULL) {
-    perror ("calloc");
-    exit (EXIT_FAILURE);
-  }
-  int ret = -1;
-  /* Read nrvals * 2 lines of input, nrvals * (key, value) pairs, as
-   * explained in the man page.
-   */
-  int i, j;
-  for (i = 0; i < nrvals; ++i) {
-    /* Read key. */
-    char *buf = rl_gets ("  key> ");
-    if (!buf) {
-      fprintf (stderr, _("hivexsh: setval: unexpected end of input\n"));
-      quit = 1;
-      goto error;
-    }
-    /* Note that buf will be overwritten by the next call to rl_gets. */
-    if (STREQ (buf, "@"))
-      values[i].key = strdup ("");
-    else
-      values[i].key = strdup (buf);
-    if (values[i].key == NULL) {
-      perror ("strdup");
-      exit (EXIT_FAILURE);
-    }
-    /* Read value. */
-    buf = rl_gets ("value> ");
-    if (!buf) {
-      fprintf (stderr, _("hivexsh: setval: unexpected end of input\n"));
-      quit = 1;
-      goto error;
-    }
-    if (STREQ (buf, "none")) {
-      values[i].t = hive_t_none;
-      values[i].len = 0;
-    }
-    else if (STRPREFIX (buf, "string:")) {
-      buf += 7;
-      values[i].t = hive_t_string;
-      int nr_chars = strlen (buf);
-      values[i].len = 2 * (nr_chars + 1);
-      values[i].value = malloc (values[i].len);
-      if (!values[i].value) {
-        perror ("malloc");
-        exit (EXIT_FAILURE);
-      }
-      for (j = 0; j <= /* sic */ nr_chars; ++j) {
-        if (buf[j] & 0x80) {
-          fprintf (stderr, _("hivexsh: string(utf16le): only 7 bit ASCII strings are supported for input\n"));
-          goto error;
-        }
-        values[i].value[2*j] = buf[j];
-        values[i].value[2*j+1] = '\0';
-      }
-    }
-    else if (STRPREFIX (buf, "expandstring:")) {
-      buf += 13;
-      values[i].t = hive_t_expand_string;
-      int nr_chars = strlen (buf);
-      values[i].len = 2 * (nr_chars + 1);
-      values[i].value = malloc (values[i].len);
-      if (!values[i].value) {
-        perror ("malloc");
-        exit (EXIT_FAILURE);
-      }
-      for (j = 0; j <= /* sic */ nr_chars; ++j) {
-        if (buf[j] & 0x80) {
-          fprintf (stderr, _("hivexsh: string(utf16le): only 7 bit ASCII strings are supported for input\n"));
-          goto error;
-        }
-        values[i].value[2*j] = buf[j];
-        values[i].value[2*j+1] = '\0';
-      }
-    }
-    else if (STRPREFIX (buf, "dword:")) {
-      buf += 6;
-      values[i].t = hive_t_dword;
-      values[i].len = 4;
-      values[i].value = malloc (4);
-      if (!values[i].value) {
-        perror ("malloc");
-        exit (EXIT_FAILURE);
-      }
-      long n;
-      xerr = xstrtol (buf, NULL, 0, &n, "");
-      if (xerr != LONGINT_OK) {
-        fprintf (stderr, _("%s: %s: invalid integer parameter (%s returned %d)\n"),
-                 "setval", "dword", "xstrtol", xerr);
-        goto error;
-      }
-      if (n < 0 || n > UINT32_MAX) {
-        fprintf (stderr, _("%s: %s: integer out of range\n"),
-                 "setval", "dword");
-        goto error;
-      }
-      uint32_t u32 = htole32 (n);
-      memcpy (values[i].value, &u32, 4);
-    }
-    else if (STRPREFIX (buf, "qword:")) {
-      buf += 6;
-      values[i].t = hive_t_qword;
-      values[i].len = 8;
-      values[i].value = malloc (8);
-      if (!values[i].value) {
-        perror ("malloc");
-        exit (EXIT_FAILURE);
-      }
-      long long n;
-      xerr = xstrtoll (buf, NULL, 0, &n, "");
-      if (xerr != LONGINT_OK) {
-        fprintf (stderr, _("%s: %s: invalid integer parameter (%s returned %d)\n"),
-                 "setval", "dword", "xstrtoll", xerr);
-        goto error;
-      }
-#if 0
-      if (n < 0 || n > UINT64_MAX) {
-        fprintf (stderr, _("%s: %s: integer out of range\n"),
-                 "setval", "dword");
-        goto error;
-      }
-      uint64_t u64 = htole64 (n);
-      memcpy (values[i].value, &u64, 4);
-    }
-    else if (STRPREFIX (buf, "hex:")) {
-      /* Read the type. */
-      buf += 4;
-      size_t len = strcspn (buf, ":");
-      char *nextbuf;
-      if (buf[len] == '\0')     /* "hex:t" */
-        nextbuf = &buf[len];
-      else {                    /* "hex:t:..." */
-        buf[len] = '\0';
-        nextbuf = &buf[len+1];
-      }
-      long t;
-      xerr = xstrtol (buf, NULL, 0, &t, "");
-      if (xerr != LONGINT_OK) {
-        fprintf (stderr, _("%s: %s: invalid integer parameter (%s returned %d)\n"),
-                 "setval", "hex", "xstrtol", xerr);
-        goto error;
-      }
-      if (t < 0 || t > UINT32_MAX) {
-        fprintf (stderr, _("%s: %s: integer out of range\n"),
-                 "setval", "hex");
-        goto error;
-      }
-      values[i].t = t;
-      /* Read the hex data. */
-      buf = nextbuf;
-      /* The allocation length is an overestimate, but it doesn't matter. */
-      values[i].value = malloc (1 + strlen (buf) / 2);
-      if (!values[i].value) {
-        perror ("malloc");
-        exit (EXIT_FAILURE);
-      }
-      values[i].len = 0;
-      while (*buf) {
-        int c = 0;
-        for (j = 0; *buf && j < 2; buf++) {
-          if (c_isxdigit (*buf)) { /* NB: ignore non-hex digits. */
-            c <<= 4;
-            c |= get_xdigit (*buf);
-            j++;
-          }
-        }
-        if (j == 2) values[i].value[values[i].len++] = c;
-        else if (j == 1) {
-          fprintf (stderr, _("hivexsh: setval: trailing garbage after hex string\n"));
-          goto error;
-        }
-      }
-    }
-    else {
-      fprintf (stderr,
-               _("hivexsh: setval: cannot parse value string, please refer to the man page hivexsh(1) for help: %s\n"),
-               buf);
-      goto error;
-    }
-  }
-  ret = hivex_node_set_values (h, cwd, nrvals, values, 0);
- error:
-  /* Free values array. */
-  for (i = 0; i < nrvals; ++i) {
-    free (values[i].key);
-    free (values[i].value);
-  }
-  free (values);
-  return ret;
-static int
-cmd_del (char *args)
-  if (STRNEQ (args, "")) {
-    fprintf (stderr, _("hivexsh: '%s' command should not be given arguments\n"),
-             "del");
-    return -1;
-  }
-  if (cwd == hivex_root (h)) {
-    fprintf (stderr, _("hivexsh: del: the root node cannot be deleted\n"));
-    return -1;
-  }
-  hive_node_h new_cwd = hivex_node_parent (h, cwd);
-  if (hivex_node_delete_child (h, cwd) == -1) {
-    perror ("hivexsh: del");
-    return -1;
-  }
-  cwd = new_cwd;
-  set_prompt_string ();
-  return 0;
-static int
-cmd_add (char *name)
-  hive_node_h node = hivex_node_add_child (h, cwd, name);
-  if (node == 0) {
-    perror ("hivexsh: add");
-    return -1;
-  }
-  return 0;
diff --git a/hivex/hivexsh.pod b/hivex/hivexsh.pod
deleted file mode 100644 (file)
index a31d9e0..0000000
+++ /dev/null
@@ -1,287 +0,0 @@
-=encoding utf8
-=head1 NAME
-hivexsh - Windows Registry hive shell
-=head1 SYNOPSIS
- hivexsh [-options] [hivefile]
-This program provides a simple shell for navigating Windows Registry
-'hive' files.  It uses the hivex library for access to these binary
-Firstly you will need to provide a hive file from a Windows operating
-system.  The hive files are usually located in
-C<C:\Windows\System32\Config> and have names like C<software>,
-C<system> etc (without any file extension).  For more information
-about hive files, read L<hivex(3)>.  For information about downloading
-files from virtual machines, read L<virt-cat(1)> and L<guestfish(1)>.
-You can provide the name of the hive file to examine on the command
-line.  For example:
- hivexsh software
-Or you can start C<hivexsh> without any arguments, and immediately use
-the C<load> command to load a hive:
- $ hivexsh
- Welcome to hivexsh, the hivex interactive shell for examining
- Windows Registry binary hive files.
- Type: 'help' for help with commands
-       'quit' to quit the shell
- > load software
- software\>
-Navigate through the hive's keys using the C<cd> command, as if it
-contained a filesystem, and use C<ls> to list the subkeys of the
-current key.  Other commands are listed below.
-=head1 OPTIONS
-=over 4
-=item B<-d>
-Enable lots of debug messages.  If you find a Registry file that this
-program cannot parse, please enable this option and post the complete
-output I<and> the Registry hive file in your bug report.
-=item B<-f> filename
-Read commands from C<filename> instead of stdin.  To write a hivexsh
-script, use:
- #!/usr/bin/hivexsh -f
-=item B<-w>
-If this option is given, then writes are allowed to the hive
-(see L</commit> command below, and the discussion of
-modifying hives in L<hivex(3)/WRITING TO HIVE FILES>).
-B<Important Note:> Even if you specify this option, nothing is written
-to a hive unless you call the L</commit> command.  If you exit the
-shell without committing, all changes will be discarded.
-If this option is not given, then write commands are disabled.
-=head1 COMMANDS
-=over 4
-=item B<add> name
-Add a subkey named C<name> below the current node.  The name may
-contain spaces and punctuation characters, and does not need to be
-The new key will have no subkeys and no values (see C<setval>).
-There must be no existing subkey called C<name>, or this command will
-fail.  To replace an existing subkey, delete it first like this:
- cd name
- del
-=item B<cd> path
-Change to the subkey C<path>.  Use Windows-style backslashes to
-separate path elements, and start with a backslash in order to start
-from the root of the hive.  For example:
- cd \Classes\*
-moves from the root node, to the C<Classes> node, to the C<*> node.
-If you were already at the root node, you could do this instead:
- cd Classes\*
-or even:
- cd Classes
- cd *
-Path elements (node names) are matched case insensitively, and
-characters like space, C<*>, and C<?> have I<no> special significance.
-C<cd ..> may be used to go to the parent directory.
-C<cd> without any arguments prints the current path.
-Be careful with C<cd \> since the readline library has an undocumented
-behaviour where it will think the final backslash is a continuation
-(it reads the next line of input and appends it).  Put a single space
-after the backslash.
-=item B<close> | B<unload>
-Close the currently loaded hive.
-If you modified the hive, all uncommitted writes are lost when you
-call this command (or if the shell exits).  You have to call C<commit>
-to write changes.
-=item B<commit> [newfile]
-Commit changes to the hive.  If the optional C<newfile> parameter is
-supplied, then the hive is written to that file, else the original
-file is overwritten.
-Note that you have to specify the C<-w> flag, otherwise no writes are
-=item B<del>
-Delete the current node and everything beneath it.  The current
-directory is moved up one level (as if you did C<cd ..>) after
-this command.
-You cannot delete the root node.
-=item B<exit> | B<quit>
-Exit the shell.
-=item B<load> hivefile
-Load the binary hive named C<hivefile>.  The currently loaded hive, if
-any, is closed.  The current directory is changed back to the root
-=item B<ls>
-List the subkeys of the current hive Registry key.  Note this command
-does not take any arguments.
-=item B<lsval> [key]
-List the (key, value) pairs of the current hive Registry key.  If no
-argument is given then all pairs are displayed.  If C<key> is given,
-then the value of the named key is displayed.  If C<@> is given, then
-the value of the default key is displayed.
-=item B<setval> nrvals
-This command replaces all (key, value) pairs at the current node with
-the values in subsequent input.  C<nrvals> is the number of values
-(ie. (key, value) pairs), and any existing values at this node are
-deleted.  So C<setval 0> just deletes any values at the current node.
-The command reads 2 * nrvals lines of input, with each pair of
-lines of input corresponding to a key and a value to add.
-For example, the following setval command replaces whatever is at the
-current node with two (key, value) pairs.  The default key is set to
-the UTF16-LE-encoded string "abcd".  The other value is named
-"ANumber" and is a little-endian DWORD 0x12345678.
- setval 2
- @
- string:abcd
- ANumber
- dword:12345678
-The first line of each pair is the key (the special key C<@> means
-the default key, but you can also use a blank line).
-The second line of each pair is the value, which has a special format
-C<type:value> with possible types summarized in the table below:
- none                 No data is stored, and the type is set to 0.
- string:abc           "abc" is stored as a UTF16-LE-encoded
-                      string (type 1).  Note that only 7 bit
-                      ASCII strings are supported as input.
- expandstring:...     Same as string but with type 2.
- dword:0x01234567     A DWORD (type 4) with the hex value
-                      0x01234567.  You can also use decimal
-                      or octal numbers here.
- qword:0x0123456789abcdef
-                      A QWORD (type 11) with the hex value
-                      0x0123456789abcdef.  You can also use
-                      decimal or octal numbers here.
- hex:<type>:<hexbytes>
- hex:1:41,00,42,00,43,00,44,00,00,00
-                      This is the generic way to enter any
-                      value.  <type> is the integer value type.
-                      <hexbytes> is a list of pairs of hex
-                      digits which are treated as bytes.
-                      (Any non-hex-digits here are ignored,
-                      so you can separate bytes with commas
-                      or spaces if you want).
-=head1 EXAMPLE
- $ guestfish --ro -i Windows7
- ><fs> download win:c:\windows\system32\config\software software
- ><fs> quit
- $ hivexsh software
- Welcome to hivexsh, the hivex interactive shell for examining
- Windows Registry binary hive files.
- Type: 'help' for help with commands
-       'quit' to quit the shell
- software\> ls
- ATI Technologies
- Classes
- Clients
- Intel
- Microsoft
- Policies
- RegisteredApplications
- Sonic
- Wow6432Node
- software\> quit
-=head1 SEE ALSO
-=head1 AUTHORS
-Richard W.M. Jones (C<rjones at redhat dot com>)
-Copyright (C) 2009-2010 Red Hat Inc.
-This program is free software; you can redistribute it and/or modify
-it under the terms of the GNU General Public License as published by
-the Free Software Foundation; either version 2 of the License, or
-(at your option) any later version.
-This program is distributed in the hope that it will be useful,
-but WITHOUT ANY WARRANTY; without even the implied warranty of
-GNU General Public License for more details.
-You should have received a copy of the GNU General Public License along
-with this program; if not, write to the Free Software Foundation, Inc.,
-51 Franklin Street, Fifth Floor, Boston, MA 02110-1301 USA.
diff --git a/hivex/t/Makefile.am b/hivex/t/Makefile.am
deleted file mode 100644 (file)
index 217d7ca..0000000
+++ /dev/null
@@ -1,18 +0,0 @@
-# libguestfs
-# Copyright (C) 2009 Red Hat Inc.
-# This program is free software; you can redistribute it and/or modify
-# it under the terms of the GNU General Public License as published by
-# the Free Software Foundation; either version 2 of the License, or
-# (at your option) any later version.
-# This program is distributed in the hope that it will be useful,
-# but WITHOUT ANY WARRANTY; without even the implied warranty of
-# GNU General Public License for more details.
-# You should have received a copy of the GNU General Public License
-# along with this program; if not, write to the Free Software
-# Foundation, Inc., 675 Mass Ave, Cambridge, MA 02139, USA.
-EXTRA_DIST = minimal
diff --git a/hivex/t/README b/hivex/t/README
deleted file mode 100644 (file)
index b7e297a..0000000
+++ /dev/null
@@ -1,9 +0,0 @@
-This directory contains tests for the hivex library.
-'minimal' is a valid registry containing a single root nk (with
-associated sk) which was created by chopping out everything possible
-from a Windows 2003 software hive and then doing lots of hand edits on
-the result.  There is no "source" for it as such, it is just a
-hand-crafted binary blob.
-- Richard W.M. Jones 2010-01-23.
diff --git a/hivex/t/minimal b/hivex/t/minimal
deleted file mode 100755 (executable)
index 3f4ee58..0000000
Binary files a/hivex/t/minimal and /dev/null differ
diff --git a/hivex/tools/Makefile.am b/hivex/tools/Makefile.am
deleted file mode 100644 (file)
index bd8e986..0000000
+++ /dev/null
@@ -1,56 +0,0 @@
-# libguestfs
-# Copyright (C) 2009 Red Hat Inc.
-# This program is free software; you can redistribute it and/or modify
-# it under the terms of the GNU General Public License as published by
-# the Free Software Foundation; either version 2 of the License, or
-# (at your option) any later version.
-# This program is distributed in the hope that it will be useful,
-# but WITHOUT ANY WARRANTY; without even the implied warranty of
-# GNU General Public License for more details.
-# You should have received a copy of the GNU General Public License
-# along with this program; if not, write to the Free Software
-# Foundation, Inc., 675 Mass Ave, Cambridge, MA 02139, USA.
-# OCaml Windows Registry visualizer.  This was used while reverse
-# engineering the hive format, and is not normally compiled.  If you
-# do with to compile it, you'll need ocaml-bitstring-devel and
-# ocaml-extlib-devel.  Also you'll need a collection of hive files
-# from Windows machines to experiment with.
-# We use '-w y' (disable unused variable warnings) because these
-# warnings aren't very reliable with heavily preprocessed code like
-# that produced by bitstring.
-       visualizer.ml \
-       visualizer_utils.ml \
-       visualizer_NT_time.ml \
-       clearheaderfields.ml \
-       fillemptyhbins.ml \
-       truncatefile.ml \
-       counter.mli \
-       counter.ml
-visualizer.opt: counter.mli counter.ml visualizer_utils.ml visualizer_NT_time.ml visualizer.ml
-       ocamlfind ocamlopt -w y \
-         -package bitstring,bitstring.syntax,extlib \
-         -syntax camlp4 -linkpkg $^ -o $@
-fillemptyhbins.opt: fillemptyhbins.ml
-       ocamlfind ocamlopt -w y \
-         -package bitstring,bitstring.syntax,extlib \
-         -syntax camlp4 -linkpkg $^ -o $@
-clearheaderfields.opt: visualizer_utils.ml clearheaderfields.ml
-       ocamlfind ocamlopt -w y \
-         -package bitstring,bitstring.syntax,extlib \
-         -syntax camlp4 -linkpkg $^ -o $@
-truncatefile.opt: visualizer_utils.ml truncatefile.ml
-       ocamlfind ocamlopt -w y \
-         -package bitstring,bitstring.syntax,extlib \
-         -syntax camlp4 -linkpkg $^ -o $@
diff --git a/hivex/tools/clearheaderfields.ml b/hivex/tools/clearheaderfields.ml
deleted file mode 100644 (file)
index d055553..0000000
+++ /dev/null
@@ -1,112 +0,0 @@
-(* Windows Registry reverse-engineering tool.
- * Copyright (C) 2010 Red Hat Inc.
- *
- * This program is free software; you can redistribute it and/or modify
- * it under the terms of the GNU General Public License as published by
- * the Free Software Foundation; either version 2 of the License, or
- * (at your option) any later version.
- *
- * This program is distributed in the hope that it will be useful,
- * but WITHOUT ANY WARRANTY; without even the implied warranty of
- * GNU General Public License for more details.
- *
- * You should have received a copy of the GNU General Public License along
- * with this program; if not, write to the Free Software Foundation, Inc.,
- * 51 Franklin Street, Fifth Floor, Boston, MA 02110-1301 USA.
- *)
-open Bitstring
-open ExtString
-open Printf
-open Visualizer_utils
-let () =
-  if Array.length Sys.argv <> 2 then (
-    eprintf "Error: missing argument.
-Usage: %s hivefile
-" Sys.executable_name;
-    exit 1
-  )
-let filename = Sys.argv.(1)
-(* Load the file. *)
-let bits = bitstring_of_file filename
-(* Split into header + data at the 4KB boundary. *)
-let header, data = takebits (4096 * 8) bits, dropbits (4096 * 8) bits
-(* Read the header fields. *)
-let seq, last_modified, major, minor, unknown1, unknown2,
-  root_key, end_pages,  unknown3, fname =
-  bitmatch header with
-  | { "regf" : 4*8 : string;
-      seq1 : 4*8 : littleendian;
-      seq2 : 4*8 : littleendian;
-      last_modified : 64 : bitstring;
-      major : 4*8 : littleendian;
-      minor : 4*8 : littleendian;
-      unknown1 : 4*8 : littleendian;
-      unknown2 : 4*8 : littleendian;
-      root_key : 4*8 : littleendian;
-      end_pages : 4*8 : littleendian;
-      unknown3 : 4*8 : littleendian;
-      fname : 64*8 : string;
-      unknownguid1 : 16*8 : bitstring;
-      unknownguid2 : 16*8 : bitstring;
-      unknown4 : 4*8 : littleendian;
-      unknownguid3 : 16*8 : bitstring;
-      unknown5 : 4*8 : string;
-      unknown6 : 340*8 : bitstring;
-      csum : 4*8
-        : littleendian, save_offset_to (crc_offset),
-          check (assert (crc_offset = 0x1fc * 8); true);
-      unknown7 : (0x1000-0x200)*8 : bitstring } ->
-      seq1, last_modified, major, minor, unknown1, unknown2,
-      root_key, end_pages, unknown3, fname
-  | {_} -> assert false
-(* Create a new header, but with unknown fields cleared.  Do it in
- * two parts, first creating everything up to the checksum, then
- * calculating the checksum and appending checksum and the final
- * field.
- *)
-let header =
-  let zeroguid = zeroes_bitstring (16*8) in
-  let before_csum =
-      "regf" : 4*8 : string;
-      seq : 4*8 : littleendian;
-      seq : 4*8 : littleendian;
-      last_modified : 64 : bitstring;
-      major : 4*8 : littleendian;
-      minor : 4*8 : littleendian;
-      unknown1 : 4*8 : littleendian;
-      unknown2 : 4*8 : littleendian;
-      root_key : 4*8 : littleendian;
-      end_pages : 4*8 : littleendian;
-      unknown3 : 4*8 : littleendian;
-      fname : 64*8 : string;
-      zeroguid : 16*8 : bitstring;
-      zeroguid : 16*8 : bitstring;
-      0_l : 4*8 : littleendian;
-      zeroguid : 16*8 : bitstring;
-      0_l : 4*8 : littleendian;
-      zeroes_bitstring (340*8) : 340*8 : bitstring
-    } in
-  assert (bitstring_length before_csum = 0x1fc * 8);
-  let csum = bitstring_fold_left_int32_le Int32.logxor 0_l before_csum in
-  let csum_and_after =
-      csum : 4*8 : littleendian;
-      zeroes_bitstring ((0x1000-0x200)*8) : (0x1000-0x200)*8 : bitstring
-    } in
-  let new_header = concat [before_csum; csum_and_after] in
-  assert (bitstring_length header = bitstring_length new_header);
-  new_header
-(* Write it. *)
-let () =
-  let file = concat [header; data] in
-  bitstring_to_file file filename
diff --git a/hivex/tools/counter.ml b/hivex/tools/counter.ml
deleted file mode 100644 (file)
index 2e44c65..0000000
+++ /dev/null
@@ -1,86 +0,0 @@
-(* Basic counting module.
-   Copyright (C) 2006 Merjis Ltd.
-   This library is free software; you can redistribute it and/or
-   modify it under the terms of the GNU Lesser General Public
-   License as published by the Free Software Foundation; either
-   version 2 of the License, or (at your option) any later version.
-   This library is distributed in the hope that it will be useful,
-   but WITHOUT ANY WARRANTY; without even the implied warranty of
-   Lesser General Public License for more details.
-   You should have received a copy of the GNU Lesser General Public
-   License along with this library; if not, write to the Free Software
-   Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA 02110-1301 USA
-type 'a t = ('a, int ref) Hashtbl.t
-let create () =
-  Hashtbl.create 13
-let get_ref counter thing =
-  try
-    Hashtbl.find counter thing
-  with
-    Not_found ->
-      let r = ref 0 in
-      Hashtbl.add counter thing r;
-      r
-let incr counter thing =
-  let r = get_ref counter thing in
-  incr r
-let decr counter thing =
-  let r = get_ref counter thing in
-  decr r
-let add counter thing n =
-  let r = get_ref counter thing in
-  r := !r + n
-let sub counter thing n =
-  let r = get_ref counter thing in
-  r := !r - n
-let set counter thing n =
-  let r = get_ref counter thing in
-  r := n
-(* Don't use get_ref, to avoid unnecessarily creating 'ref 0's. *)
-let get counter thing =
-  try
-    !(Hashtbl.find counter thing)
-  with
-    Not_found -> 0
-(* This is a common pair of operations, worth optimising. *)
-let incr_get counter thing =
-  let r = get_ref counter thing in
-  Pervasives.incr r;
-  !r
-let zero = Hashtbl.remove
-let read counter =
-  let counts =
-    Hashtbl.fold (
-      fun thing r xs ->
-       let r = !r in
-       if r <> 0 then (r, thing) :: xs
-       else xs
-    ) counter [] in
-  List.sort (fun (a, _) (b, _) -> compare (b : int) (a : int)) counts
-let length = Hashtbl.length
-let total counter =
-  let total = ref 0 in
-  Hashtbl.iter (fun _ r -> total := !total + !r) counter;
-  !total
-let clear = Hashtbl.clear
diff --git a/hivex/tools/counter.mli b/hivex/tools/counter.mli
deleted file mode 100644 (file)
index 87610b5..0000000
+++ /dev/null
@@ -1,69 +0,0 @@
-(** Basic counting module.
-    Copyright (C) 2006 Merjis Ltd.
-    This library is free software; you can redistribute it and/or
-    modify it under the terms of the GNU Lesser General Public
-    License as published by the Free Software Foundation; either
-    version 2 of the License, or (at your option) any later version.
-    This library is distributed in the hope that it will be useful,
-    but WITHOUT ANY WARRANTY; without even the implied warranty of
-    Lesser General Public License for more details.
-    You should have received a copy of the GNU Lesser General Public
-    License along with this library; if not, write to the Free Software
-    Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA 02110-1301 USA
-type 'a t
-(** Count items of type ['a]. *)
-val create : unit -> 'a t
-(** Create a new counter. *)
-val incr : 'a t -> 'a -> unit
-(** [incr counter thing] adds one to the count of [thing]s in [counter]. *)
-val decr : 'a t -> 'a -> unit
-(** [decr counter thing] subtracts one to the count of [thing]s in [counter]. *)
-val add : 'a t -> 'a -> int -> unit
-(** [add counter thing n] adds [n] to the count of [thing]s in [counter]. *)
-val sub : 'a t -> 'a -> int -> unit
-(** [sub counter thing n] subtracts [n] to the count of [thing]s in [counter]. *)
-val set : 'a t -> 'a -> int -> unit
-(** [set counter thing n] sets the count of [thing]s to [n]. *)
-val get : 'a t -> 'a -> int
-(** [get counter thing] returns the count of [thing]s.   (Returns 0 for
-  * [thing]s which have not been added.
-  *)
-val incr_get : 'a t -> 'a -> int
-(** Faster form of {!Counter.incr} followed by {!Counter.get}. *)
-val zero : 'a t -> 'a -> unit
-(** [zero counter thing] sets the count of [thing]s to 0.
-  * See also {!Counter.clear}.
-  *)
-val read : 'a t -> (int * 'a) list
-(** [read counter] reads the frequency of each thing.  They are sorted
-  * with the thing appearing most frequently first.  Only things occurring
-  * non-zero times are returned.
-  *)
-val length : 'a t -> int
-(** Return the number of distinct things. See also {!Counter.total} *)
-val total : 'a t -> int
-(** Return the number of things counted (the total number of counts).
-  * See also {!Counter.length}
-  *)
-val clear : 'a t -> unit
-(** [clear counter] zeroes all counts. *)
diff --git a/hivex/tools/fillemptyhbins.ml b/hivex/tools/fillemptyhbins.ml
deleted file mode 100644 (file)
index 14eae96..0000000
+++ /dev/null
@@ -1,74 +0,0 @@
-(* Windows Registry reverse-engineering tool.
- * Copyright (C) 2010 Red Hat Inc.
- *
- * This program is free software; you can redistribute it and/or modify
- * it under the terms of the GNU General Public License as published by
- * the Free Software Foundation; either version 2 of the License, or
- * (at your option) any later version.
- *
- * This program is distributed in the hope that it will be useful,
- * but WITHOUT ANY WARRANTY; without even the implied warranty of
- * GNU General Public License for more details.
- *
- * You should have received a copy of the GNU General Public License along
- * with this program; if not, write to the Free Software Foundation, Inc.,
- * 51 Franklin Street, Fifth Floor, Boston, MA 02110-1301 USA.
- *)
-open Bitstring
-open ExtString
-open Printf
-let () =
-  if Array.length Sys.argv <> 3 then (
-    eprintf "Error: missing argument.
-Usage: %s hivefile startoffset
-" Sys.executable_name;
-    exit 1
-  )
-let filename = Sys.argv.(1)
-let offset = int_of_string Sys.argv.(2)
-(* Load the file. *)
-let bits = bitstring_of_file filename
-(* Split into header + data at the 4KB boundary. *)
-let header, data = takebits (4096 * 8) bits, dropbits (4096 * 8) bits
-(* Overwrite everything after @offset, so ... *)
-let nrpages = (bitstring_length data / 8 - offset) / 4096
-let data = takebits (offset * 8) data
-(* Create the empty pages.  They're not all the same because each
- * page contains its own page_offset.
- *)
-let pages =
-  let noblock =
-    let seg_len = 4096 - 32 in
-    let zeroes = zeroes_bitstring ((seg_len - 4) * 8) in
-      Int32.of_int seg_len : 4*8 : littleendian;
-      zeroes : (seg_len - 4) * 8 : bitstring
-    } in
-  let zeroes = zeroes_bitstring (20*8) in
-  let rec loop page_offset i =
-    if i < nrpages then (
-      let page =
-        BITSTRING {
-          "hbin" : 4*8 : string;
-          Int32.of_int page_offset : 4*8 : littleendian;
-          4096_l : 4*8 : littleendian; (* page length *)
-          zeroes : 20*8 : bitstring;
-          noblock : (4096 - 32) * 8 : bitstring
-        } in
-      page :: loop (page_offset + 4096) (i+1)
-    ) else []
-  in
-  loop offset 0
-(* Write it. *)
-let () =
-  let file = concat (header :: data :: pages) in
-  bitstring_to_file file filename
diff --git a/hivex/tools/truncatefile.ml b/hivex/tools/truncatefile.ml
deleted file mode 100644 (file)
index b519f7a..0000000
+++ /dev/null
@@ -1,112 +0,0 @@
-(* Windows Registry reverse-engineering tool.
- * Copyright (C) 2010 Red Hat Inc.
- *
- * This program is free software; you can redistribute it and/or modify
- * it under the terms of the GNU General Public License as published by
- * the Free Software Foundation; either version 2 of the License, or
- * (at your option) any later version.
- *
- * This program is distributed in the hope that it will be useful,
- * but WITHOUT ANY WARRANTY; without even the implied warranty of
- * GNU General Public License for more details.
- *
- * You should have received a copy of the GNU General Public License along
- * with this program; if not, write to the Free Software Foundation, Inc.,
- * 51 Franklin Street, Fifth Floor, Boston, MA 02110-1301 USA.
- *)
-open Bitstring
-open ExtString
-open Printf
-open Visualizer_utils
-let () =
-  if Array.length Sys.argv <> 3 then (
-    eprintf "Error: missing argument.
-Usage: %s hivefile endpages
-" Sys.executable_name;
-    exit 1
-  )
-let filename = Sys.argv.(1)
-let new_end_pages = int_of_string Sys.argv.(2)
-(* Load the file. *)
-let bits = bitstring_of_file filename
-(* Split into header + data at the 4KB boundary. *)
-let header, data = takebits (4096 * 8) bits, dropbits (4096 * 8) bits
-(* Truncate the file data. *)
-let data = takebits (new_end_pages * 8) data
-(* Read the header fields. *)
-let seq, last_modified, major, minor, unknown1, unknown2,
-  root_key, end_pages,  unknown3, fname =
-  bitmatch header with
-  | { "regf" : 4*8 : string;
-      seq1 : 4*8 : littleendian;
-      seq2 : 4*8 : littleendian;
-      last_modified : 64 : bitstring;
-      major : 4*8 : littleendian;
-      minor : 4*8 : littleendian;
-      unknown1 : 4*8 : littleendian;
-      unknown2 : 4*8 : littleendian;
-      root_key : 4*8 : littleendian;
-      end_pages : 4*8 : littleendian;
-      unknown3 : 4*8 : littleendian;
-      fname : 64*8 : string;
-      unknownguid1 : 16*8 : bitstring;
-      unknownguid2 : 16*8 : bitstring;
-      unknown4 : 4*8 : littleendian;
-      unknownguid3 : 16*8 : bitstring;
-      unknown5 : 4*8 : string;
-      unknown6 : 340*8 : bitstring;
-      csum : 4*8
-        : littleendian, save_offset_to (crc_offset),
-          check (assert (crc_offset = 0x1fc * 8); true);
-      unknown7 : (0x1000-0x200)*8 : bitstring } ->
-      seq1, last_modified, major, minor, unknown1, unknown2,
-      root_key, end_pages, unknown3, fname
-  | {_} -> assert false
-(* Create a new header, with endpages updated. *)
-let header =
-  let zeroguid = zeroes_bitstring (16*8) in
-  let before_csum =
-      "regf" : 4*8 : string;
-      seq : 4*8 : littleendian;
-      seq : 4*8 : littleendian;
-      last_modified : 64 : bitstring;
-      major : 4*8 : littleendian;
-      minor : 4*8 : littleendian;
-      unknown1 : 4*8 : littleendian;
-      unknown2 : 4*8 : littleendian;
-      root_key : 4*8 : littleendian;
-      Int32.of_int new_end_pages : 4*8 : littleendian;
-      unknown3 : 4*8 : littleendian;
-      fname : 64*8 : string;
-      zeroguid : 16*8 : bitstring;
-      zeroguid : 16*8 : bitstring;
-      0_l : 4*8 : littleendian;
-      zeroguid : 16*8 : bitstring;
-      0_l : 4*8 : littleendian;
-      zeroes_bitstring (340*8) : 340*8 : bitstring
-    } in
-  assert (bitstring_length before_csum = 0x1fc * 8);
-  let csum = bitstring_fold_left_int32_le Int32.logxor 0_l before_csum in
-  let csum_and_after =
-      csum : 4*8 : littleendian;
-      zeroes_bitstring ((0x1000-0x200)*8) : (0x1000-0x200)*8 : bitstring
-    } in
-  let new_header = concat [before_csum; csum_and_after] in
-  assert (bitstring_length header = bitstring_length new_header);
-  new_header
-(* Write it. *)
-let () =
-  let file = concat [header; data] in
-  bitstring_to_file file filename
diff --git a/hivex/tools/visualizer.ml b/hivex/tools/visualizer.ml
deleted file mode 100644 (file)
index 5b7ac79..0000000
+++ /dev/null
@@ -1,984 +0,0 @@
-(* Windows Registry reverse-engineering tool.
- * Copyright (C) 2010 Red Hat Inc.
- *
- * This program is free software; you can redistribute it and/or modify
- * it under the terms of the GNU General Public License as published by
- * the Free Software Foundation; either version 2 of the License, or
- * (at your option) any later version.
- *
- * This program is distributed in the hope that it will be useful,
- * but WITHOUT ANY WARRANTY; without even the implied warranty of
- * GNU General Public License for more details.
- *
- * You should have received a copy of the GNU General Public License along
- * with this program; if not, write to the Free Software Foundation, Inc.,
- * 51 Franklin Street, Fifth Floor, Boston, MA 02110-1301 USA.
- *
- * For existing information on the registry format, please refer
- * to the following documents.  Note they are both incomplete
- * and inaccurate in some respects.
- *
- * http://www.sentinelchicken.com/data/TheWindowsNTRegistryFileFormat.pdf
- * http://pogostick.net/~pnh/ntpasswd/WinReg.txt
- *)
-open Bitstring
-open ExtString
-open Printf
-open Visualizer_utils
-open Visualizer_NT_time
-let () =
-  if Array.length Sys.argv <> 2 then (
-    eprintf "Error: missing argument.
-Usage: %s hivefile > out
-  'hivefile' is the input hive file from a Windows machine
-  'out' is an output file where we will write all the keys,
-    values etc for extended debugging purposes.
-Errors, inconsistencies and unexpected fields in the hive file
-are written to stderr.
-" Sys.executable_name;
-    exit 1
-  )
-let filename = Sys.argv.(1)
-let basename = Filename.basename filename
-(* Load the file. *)
-let bits = bitstring_of_file filename
-(* Split into header + data at the 4KB boundary. *)
-let header, data = takebits (4096 * 8) bits, dropbits (4096 * 8) bits
-(* Define a persistent pattern which matches the header fields.  By
- * using persistent patterns, we can reuse them later in the
- * program.
- *)
-let bitmatch header_fields =
-  { "regf" : 4*8 : string;
-    seq1 : 4*8 : littleendian;
-    seq2 : 4*8 : littleendian;
-    last_modified : 64
-      : littleendian, bind (nt_to_time_t last_modified);
-    major : 4*8 : littleendian;
-    minor : 4*8 : littleendian;
-    (* "Type".  Contains 0. *)
-    unknown1 : 4*8 : littleendian;
-    (* "Format".  Contains 1. *)
-    unknown2 : 4*8 : littleendian;
-    root_key : 4*8
-      : littleendian, bind (get_offset root_key);
-    end_pages : 4*8
-      : littleendian, bind (get_offset end_pages);
-    (* "Cluster".  Contains 1. *)
-    unknown3 : 4*8 : littleendian;
-    filename : 64*8 : string;
-    (* All three GUIDs here confirmed in Windows 7 registries.  In
-     * Windows <= 2003 these GUID fields seem to contain junk.
-     * 
-     * If you write zeroes to the GUID fields, load and unload in Win7
-     * REGEDIT, then Windows 7 writes some random GUIDs.
-     * 
-     * Also (on Win7) unknownguid1 == unknownguid2.  unknownguid3 is
-     * different.
-     *)
-    unknownguid1 : 16*8 : bitstring;
-    unknownguid2 : 16*8 : bitstring;
-    (* Wrote zero to unknown4, loaded and unloaded it in Win7 REGEDIT,
-     * and it still contained zero.  In existing registries it seems to
-     * contain random junk.
-     *)
-    unknown4 : 4*8 : littleendian;
-    unknownguid3 : 16*8 : bitstring;
-    (* If you write zero to unknown5, load and unload it in REGEDIT,
-     * Windows 7 puts the string "rmtm" here.  Existing registries also
-     * seen containing this string.  However on older Windows it can
-     * be all zeroes.
-     *)
-    unknown5 : 4*8 : string;
-    (* This seems to contain junk from other parts of the registry.  I
-     * wrote zeroes here, loaded and unloaded it in Win7 REGEDIT, and
-     * it still contained zeroes.
-     *)
-    unknown6 : 340*8 : bitstring;
-    csum : 4*8
-      : littleendian, save_offset_to (crc_offset),
-    check (assert (crc_offset = 0x1fc * 8); true);
-    unknown7 : (0x1000-0x200)*8 : bitstring }
-let fprintf_header chan bits =
-  bitmatch bits with
-  | { :header_fields } ->
-      fprintf chan
-        "HD %6ld %6ld %s %ld.%ld %08lx %08lx %s %s %08lx %s %s %s %08lx %s %s %s %08lx %s\n"
-        seq1 seq2 (print_time last_modified) major minor
-        unknown1 unknown2
-        (print_offset root_key) (print_offset end_pages)
-        unknown3 (print_utf16 filename)
-        (print_guid unknownguid1) (print_guid unknownguid2)
-        unknown4 (print_guid unknownguid3) unknown5
-        (print_bitstring unknown6)
-        csum (print_bitstring unknown7)
-(* Parse the header and check it. *)
-let root_key, end_pages =
-  bitmatch header with
-  |  { :header_fields } ->
-       fprintf_header stdout header;
-       if major <> 1_l then
-         eprintf "HD hive file major <> 1 (major.minor = %ld.%ld)\n"
-           major minor;
-       if seq1 <> seq2 then
-         eprintf "HD hive file sequence numbers should match (%ld <> %ld)\n"
-           seq1 seq2;
-       if unknown1 <> 0_l then
-         eprintf "HD unknown1 field <> 0 (%08lx)\n" unknown1;
-       if unknown2 <> 1_l then
-         eprintf "HD unknown2 field <> 1 (%08lx)\n" unknown2;
-       if unknown3 <> 1_l then
-         eprintf "HD unknown3 field <> 1 (%08lx)\n" unknown3;
-       if not (equals unknownguid1 unknownguid2) then
-         eprintf "HD unknownguid1 <> unknownguid2 (%s, %s)\n"
-           (print_guid unknownguid1) (print_guid unknownguid2);
-       (* We think this is junk.
-       if unknown4 <> 0_l then
-         eprintf "HD unknown4 field <> 0 (%08lx)\n" unknown4;
-       *)
-       if unknown5 <> "rmtm" && unknown5 <> "\000\000\000\000" then
-         eprintf "HD unknown5 field <> \"rmtm\" & <> zeroes (%s)\n" unknown5;
-       (* We think this is junk.
-       if not (is_zero_bitstring unknown6) then
-         eprintf "HD unknown6 area is not zero (%s)\n"
-           (print_bitstring unknown6);
-       *)
-       if not (is_zero_bitstring unknown7) then
-         eprintf "HD unknown7 area is not zero (%s)\n"
-           (print_bitstring unknown7);
-       root_key, end_pages
-  | {_} ->
-      failwithf "%s: this doesn't look like a registry hive file\n" basename
-(* Define persistent patterns to match page and block fields. *)
-let bitmatch page_fields =
-  { "hbin" : 4*8 : string;
-    page_offset : 4*8
-      : littleendian, bind (get_offset page_offset);
-    page_size : 4*8
-      : littleendian, check (Int32.rem page_size 4096_l = 0_l),
-        bind (Int32.to_int page_size);
-    (* In the first hbin in the file these fields contain something.
-     * In subsequent hbins these fields are all zero.
-     *
-     * From existing hives (first hbin only):
-     *
-     * unknown1     unknown2                               unknown5
-     * 00 00 00 00  00 00 00 00  9C 77 3B 02  6A 7D CA 01  00 00 00 00
-     * 00 00 00 00  00 00 00 00  50 3A 15 07  B5 9B CA 01  00 00 00 00
-     * 00 00 00 00  00 00 00 00  57 86 90 D4  9A 58 CA 01  00 00 00 00
-     * 00 00 00 00  00 00 00 00  52 3F 90 9D  CF 7C CA 01  00 00 00 00
-     * 00 00 00 00  00 00 00 00  E8 86 C1 17  BD 06 CA 01  00 00 00 00
-     * 00 00 00 00  00 00 00 00  4A 77 CE 7A  CF 7C CA 01  00 00 00 00
-     * 00 00 00 00  00 00 00 00  E4 EA 23 FF  69 7D CA 01  00 00 00 00
-     * 00 00 00 00  00 00 00 00  50 13 BA 8D  A2 9A CA 01  00 00 00 00
-     * 00 00 00 00  00 00 00 00  0E 07 93 13  BD 06 CA 01  00 00 00 00
-     * 00 00 00 00  00 00 00 00  9D 55 D0 B3  99 58 CA 01  00 00 00 00
-     * 00 00 00 00  00 00 00 00  46 AC FF 8B  CF 7C CA 01  00 00 00 00
-     * 00 00 00 00  00 00 00 00  80 29 2D 02  6A 7D CA 01  00 00 00 00
-     * 00 00 00 00  00 00 00 00  90 8D 36 07  B5 9B CA 01  00 00 00 00
-     * 00 00 00 00  00 00 00 00  5C 9B 8B B8  6A 06 CA 01  00 00 00 00
-     * 00 00 00 00  00 00 00 00  85 9F BB 99  9A 58 CA 01  00 00 00 00
-     * 00 00 00 00  00 00 00 00  BE 3D 21 02  6A 7D CA 01  00 00 00 00
-     * 00 00 00 00  00 00 00 00  70 53 09 07  B5 9B CA 01  00 00 00 00
-     * 00 00 00 00  00 00 00 00  5B 62 42 B6  9A 58 CA 01  00 00 00 00
-     * 01 00 00 00  00 00 00 00  B2 46 9B 9E  CF 7C CA 01  00 00 00 00
-     * 01 00 00 00  00 00 00 00  CA 88 EE 1A  BD 06 CA 01  00 00 00 00
-     *
-     * From the above we worked out that fields 3 and 4 are an NT
-     * timestamp, which seems to be "last modified" (when REGEDIT
-     * unloads a hive it updates this timestamp even if nothing
-     * has been changed).
-     *)
-    unknown1 : 4*8 : littleendian;  (* usually zero, occasionally 1 *)
-    unknown2 : 4*8 : littleendian;  (* always zero? *)
-    last_modified : 64
-      : littleendian,
-        bind (if page_offset = 0 then nt_to_time_t last_modified
-              else (
-                assert (last_modified = 0_L);
-                0.
-              )
-             );
-    (* The "B.D." document said this field contains the page size, but
-     * this is not true.  This misinformation has been copied to the
-     * sentinelchicken documentation too.
-     *)
-    unknown5 : 4*8 : littleendian;  (* always zero? *)
-    (* Now the blocks in this page follow. *)
-    blocks : (page_size - 32) * 8 : bitstring;
-    rest : -1 : bitstring }
-let fprintf_page chan bits =
-  bitmatch bits with
-  | { :page_fields } ->
-      fprintf chan "HB %s %08x %08lx %08lx %s %08lx\n"
-        (print_offset page_offset)
-        page_size unknown1 unknown2
-        (if page_offset = 0 then print_time last_modified
-         else string_of_float last_modified) unknown5
-let bitmatch block_fields =
-  { seg_len : 4*8
-      : littleendian, bind (Int32.to_int seg_len);
-    block_data : (abs seg_len - 4) * 8 : bitstring;
-    rest : -1 : bitstring }
-let fprintf_block chan block_offset bits =
-  bitmatch bits with
-  | { :block_fields } ->
-      fprintf chan "BL %s %s %d\n"
-        (print_offset block_offset)
-        (if seg_len < 0 then "used" else "free")
-        (if seg_len < 0 then -seg_len else seg_len)
-(* Iterate over the pages and blocks.  In the process we will examine
- * each page (hbin) header.  Also we will build block_list which is a
- * list of (block offset, length, used flag, data).
- *)
-let block_list = ref []
-let () =
-  let rec loop_over_pages data data_offset =
-    if data_offset < end_pages then (
-      bitmatch data with
-      | { rest : -1 : bitstring } when bitstring_length rest = 0 -> ()
-      | { :page_fields } ->
-          fprintf_page stdout data;
-          assert (page_offset = data_offset);
-          if data_offset = 0 then (     (* first hbin only *)
-            if unknown1 <> 0_l then
-              eprintf "HB %s unknown1 field <> 0 (%08lx)\n"
-                (print_offset page_offset) unknown1;
-            if unknown2 <> 0_l then
-              eprintf "HB %s unknown2 field <> 0 (%08lx)\n"
-                (print_offset page_offset) unknown2;
-            if unknown5 <> 0_l then
-              eprintf "HB %s unknown5 field <> 0 (%08lx)\n"
-                (print_offset page_offset) unknown5
-          ) else (                      (* subsequent hbins *)
-            if unknown1 <> 0_l || unknown2 <> 0_l || unknown5 <> 0_l then
-                eprintf "HB %s unknown fields <> 0 (%08lx %08lx %08lx)\n"
-                  (print_offset page_offset)
-                  unknown1 unknown2 unknown5;
-            if last_modified <> 0. then
-                eprintf "HB %s last_modified <> 0. (%g)\n"
-                  (print_offset page_offset) last_modified
-          );
-          (* Loop over the blocks in this page. *)
-          loop_over_blocks blocks (data_offset + 32);
-          (* Loop over rest of the pages. *)
-          loop_over_pages rest (data_offset + page_size)
-      | {_} ->
-          failwithf "%s: invalid hbin at offset %s\n"
-            basename (print_offset data_offset)
-    ) else (
-      (* Reached the end of the official hbins in this file, BUT the
-       * file can be larger than this and might contain stuff.  What
-       * does it contain after the hbins?  We think just junk, but
-       * we're not sure.
-       *)
-      if not (is_zero_bitstring data) then (
-        eprintf "Junk in file after end of pages:\n";
-        let rec loop data data_offset =
-          bitmatch data with
-          | { rest : -1 : bitstring } when bitstring_length rest = 0 -> ()
-          | { :page_fields } ->
-              eprintf "\tjunk hbin %s 0x%08x\n"
-                (print_offset data_offset) page_size;
-              loop rest (data_offset + page_size);
-          | { _ } ->
-              eprintf "\tother junk %s %s\n"
-                (print_offset data_offset) (print_bitstring data)
-        in
-        loop data data_offset
-      )
-    )
-  and loop_over_blocks blocks block_offset =
-    bitmatch blocks with
-    | { rest : -1 : bitstring } when bitstring_length rest = 0 -> ()
-    | { :block_fields } ->
-        assert (block_offset mod 8 = 0);
-        fprintf_block stdout block_offset blocks;
-        let used, seg_len =
-          if seg_len < 0 then true, -seg_len else false, seg_len in
-        let block = block_offset, (seg_len, used, block_data) in
-        block_list := block :: !block_list;
-        (* Loop over the rest of the blocks in this page. *)
-        loop_over_blocks rest (block_offset + seg_len)
-    | {_} ->
-        failwithf "%s: invalid block near offset %s\n"
-          basename (print_offset block_offset)
-  in
-  loop_over_pages data 0
-(* Turn the block_list into a map so we can quickly look up a block
- * from its offset.
- *)
-let block_list = !block_list
-let block_map =
-  List.fold_left (
-    fun map (block_offset, block) -> IntMap.add block_offset block map
-  ) IntMap.empty block_list
-let lookup fn offset =
-  try
-    let (_, used, _) as block = IntMap.find offset block_map in
-    if not used then
-      failwithf "%s: %s: lookup: free block %s referenced from hive tree"
-        basename fn (print_offset offset);
-    block
-  with Not_found ->
-    failwithf "%s: %s: lookup: unknown block %s referenced from hive tree"
-      basename fn (print_offset offset)
-(* Use this to mark blocks that we've visited.  If the hive contains
- * no unreferenced blocks, then by the end this should just contain
- * free blocks.
- *)
-let mark_visited, is_not_visited, unvisited_blocks =
-  let v = ref block_map in
-  let mark_visited offset = v := IntMap.remove offset !v
-  and is_not_visited offset = IntMap.mem offset !v
-  and unvisited_blocks () = !v in
-  mark_visited, is_not_visited, unvisited_blocks
-(* Define persistent patterns to match nk-records, vk-records and
- * sk-records, which are the record types that we especially want to
- * analyze later.  Other blocks types (eg. value lists, lf-records)
- * have no "spare space" so everything is known about them and we don't
- * store these.
- *)
-let bitmatch nk_fields =
-  { "nk" : 2*8 : string;
-    (* Flags stored in the file as a little endian word, hence the
-     * unusual ordering:
-     *)
-    virtmirrored : 1;
-    predefinedhandle : 1; keynameascii : 1; symlinkkey : 1;
-    cannotbedeleted : 1; isroot : 1; ismountpoint : 1; isvolatile : 1;
-    unknownflag8000 : 1; unknownflag4000 : 1;
-    unknownflag2000 : 1; unknownflag1000 : 1;
-    unknownflag0800 : 1; unknownflag0400 : 1;
-    virtualstore : 1; virttarget : 1;
-    timestamp : 64 : littleendian, bind (nt_to_time_t timestamp);
-    unknown1 : 4*8 : littleendian;
-    parent : 4*8 : littleendian, bind (get_offset parent);
-    nr_subkeys : 4*8 : littleendian, bind (Int32.to_int nr_subkeys);
-    nr_subkeys_vol : 4*8;
-    subkeys : 4*8 : littleendian, bind (get_offset subkeys);
-    subkeys_vol : 4*8;
-    nr_values : 4*8 : littleendian, bind (Int32.to_int nr_values);
-    vallist : 4*8 : littleendian, bind (get_offset vallist);
-    sk : 4*8 : littleendian, bind (get_offset sk);
-    classname : 4*8 : littleendian, bind (get_offset classname);
-    (* sentinelchicken.com says this is a single 32 bit field
-     * containing maximum number of bytes in a subkey name, however
-     * that does not seem to be correct.  We think it is several
-     * fields, the first being the maximum number of bytes in the
-     * UTF16-LE encoded version of the subkey names, (since subkey
-     * names are usually ASCII, that would be max length of names * 2).
-     * This is a historical maximum, so it can be greater than the
-     * current maximum name field.
-     * 
-     * The remaining fields are often non-zero, but the purpose is
-     * unknown.
-     * 
-     * In the hives we examined the other fields had values as
-     * follows:
-     *   userflags: 0, 2, 0xa, 0xe
-     *   virtcontrolflags: 0, 1
-     *   debug: always 0
-     *)
-    max_subkey_name_len : 2*8 : littleendian;
-    unknown2_userflags : 4;
-    unknown2_virtcontrolflags : 4;
-    unknown2_debug : 8;
-    (* sentinelchicken.com says: maximum subkey CLASSNAME length,
-     * however that does not seem to be correct.  In hives I looked
-     * at, it has value 0, 0xc, 0x10, 0x18, 0x1a, 0x28.
-     *)
-    unknown3 : 4*8 : littleendian;
-    (* sentinelchicken.com says: maximum number of bytes in a value
-     * name, however that does not seem to be correct.  We think it is
-     * the maximum number of bytes in the UTF16-LE encoded version of
-     * the value names (since value names are usually ASCII, that would
-     * be max length of names * 2).  This is a historical maximum, so
-     * it can be greater than the current maximum name field.
-     *)
-    max_vk_name_len : 4*8 : littleendian, bind (Int32.to_int max_vk_name_len);
-    (* sentinelchicken.com says: maximum value data size, and this
-     * agrees with my observations.  It is the largest data size (not
-     * seg_len, but vk.data_len) for any value in this key.  We think
-     * that this field is a historical max, so eg if a maximally sized
-     * value is deleted then this field is not reduced.  Certainly
-     * max_vk_data_len >= the measured maximum in all the hives that we
-     * have observed.
-     *)
-    max_vk_data_len : 4*8 : littleendian, bind (Int32.to_int max_vk_data_len);
-    unknown6 : 4*8 : littleendian;
-    name_len : 2*8 : littleendian;
-    classname_len : 2*8 : littleendian;
-    name : name_len * 8 : string }
-let fprintf_nk chan nk =
-  let (_, _, bits) = lookup "fprintf_nk" nk in
-  bitmatch bits with
-  | { :nk_fields } ->
-      fprintf chan
-        "NK %s %s%s%s%s%s%s%s%s%s%s%s%s%s%s%s%s %s %08lx %s %d %ld %s %08lx %d %s %s %s %d %x %x %x %08lx %d %d %08lx %d %d %s\n"
-        (print_offset nk)
-        (if unknownflag8000 then "8" else ".")
-        (if unknownflag4000 then "4" else ".")
-        (if unknownflag2000 then "2" else ".")
-        (if unknownflag1000 then "1" else ".")
-        (if unknownflag0800 then "8" else ".")
-        (if unknownflag0400 then "4" else ".")
-        (if virtualstore then "s" else ".")
-        (if virttarget then "t" else ".")
-        (if virtmirrored then "m" else ".")
-        (if predefinedhandle then "P" else ".")
-        (if keynameascii then "A" else ".")
-        (if symlinkkey then "S" else ".")
-        (if cannotbedeleted then "N" else ".")
-        (if isroot then "R" else ".")
-        (if ismountpoint then "M" else ".")
-        (if isvolatile then "V" else ".")
-        (print_time timestamp)
-        unknown1 (print_offset parent) nr_subkeys nr_subkeys_vol
-        (print_offset subkeys) subkeys_vol
-        nr_values (print_offset vallist)
-        (print_offset sk) (print_offset classname)
-        max_subkey_name_len
-        unknown2_userflags unknown2_virtcontrolflags unknown2_debug
-        unknown3 max_vk_name_len max_vk_data_len unknown6
-        name_len classname_len name
-type data_t = Inline of bitstring | Offset of int
-let bitmatch vk_fields =
-  { "vk" : 2*8 : string;
-    name_len : 2*8 : littleendian;
-    (* Top bit set means that the data is stored inline.  In that case
-     * the data length must be <= 4.  The length can also be 0 (or
-     * 0x80000000) if the data type is NONE.
-     *)
-    data_len : 4*8
-      : littleendian, bind (
-        let is_inline = Int32.logand data_len 0x8000_0000_l = 0x8000_0000_l in
-        let data_len = Int32.to_int (Int32.logand data_len 0x7fff_ffff_l) in
-        if is_inline then assert (data_len <= 4) else assert (data_len > 4);
-        is_inline, data_len
-      );
-    (* The data itself depends on the type field.
-     *
-     * For REG_SZ type, the data always seems to be NUL-terminated, which
-     * means because these strings are often UTF-16LE, that the string will
-     * end with \0\0 bytes.  The termination bytes are included in data_len.
-     *
-     * For REG_MULTI_SZ, see
-     * http://blogs.msdn.com/oldnewthing/archive/2009/10/08/9904646.aspx
-     *)
-    data : 4*8
-      : bitstring, bind (
-        let is_inline, data_len = data_len in
-        if is_inline then
-          Inline (takebits (data_len*8) data)
-        else (
-          let offset =
-            bitmatch data with { offset : 4*8 : littleendian } -> offset in
-          let offset = get_offset offset in
-          Offset offset
-        )
-      );
-    t : 4*8 : littleendian, bind (Int32.to_int t);
-    (* Flags, stored as a little-endian word: *)
-    unknown1 : 7;
-    nameisascii : 1;  (* Clear for default [zero-length] name, always set
-                       * otherwise in registries that we found.  Perhaps this
-                       * is really "nameisdefault" flag?
-                       *)
-    unknown2 : 8;
-    (* Unknown field, usually contains something. *)
-    unknown3 : 2*8 : littleendian;
-    name : name_len * 8 : string }
-let fprintf_vk chan vk =
-  let (_, _, bits) = lookup "fprintf_vk" vk in
-  bitmatch bits with
-  | { :vk_fields } ->
-      let real_data =
-        match data with
-        | Inline data -> data
-        | Offset offset ->
-            let (_, _, bits) = lookup "fprintf_vk (data)" offset in
-            bits in
-      let is_inline, data_len = data_len in
-      fprintf chan "VK %s %s %s %d %s%s %s %08x %s %08x %08x\n"
-        (print_offset vk)
-        name (if is_inline then "inline" else "-") data_len
-        (match data with
-         | Inline _ -> ""
-         | Offset offset -> "["^print_offset offset^"]")
-        (print_bitstring real_data)
-        (print_vk_type t)
-        unknown1 (if nameisascii then "A" else "L")
-        unknown2 unknown3
-let bitmatch sk_fields =
-  { "sk" : 2*8 : string;
-    unknown1 : 2*8 : littleendian;
-    sk_next : 4*8 : littleendian, bind (get_offset sk_next);
-    sk_prev : 4*8 : littleendian, bind (get_offset sk_prev);
-    refcount : 4*8 : littleendian, bind (Int32.to_int refcount);
-    sec_len : 4*8 : littleendian, bind (Int32.to_int sec_len);
-    sec_desc : sec_len * 8 : bitstring }
-let fprintf_sk chan sk =
-  let (_, _, bits) = lookup "fprintf_sk" sk in
-  bitmatch bits with
-  | { :sk_fields } ->
-      fprintf chan "SK %s %04x %s %s %d %d\n"
-        (print_offset sk) unknown1
-        (print_offset sk_next) (print_offset sk_prev)
-        refcount sec_len
-        (* print_bitstring sec_desc -- suppress this *)
-(* Store lists of records we encounter (lists of offsets). *)
-let nk_records = ref []
-and vk_records = ref []
-and sk_records = ref []
-(* Functions to visit each block, starting at the root.  Each block
- * that we visit is printed.
- *)
-let rec visit_nk ?(nk_is_root = false) nk =
-  let (_, _, bits) = lookup "visit_nk" nk in
-  mark_visited nk;
-  (bitmatch bits with
-   | { :nk_fields } ->
-       fprintf_nk stdout nk;
-       nk_records := nk :: !nk_records;
-       (* Check the isroot flag is only set on the root node. *)
-       assert (isroot = nk_is_root);
-       if unknownflag8000 then
-         eprintf "NK %s unknownflag8000 is set\n" (print_offset nk);
-       if unknownflag4000 then
-         eprintf "NK %s unknownflag4000 is set\n" (print_offset nk);
-       if unknownflag2000 then
-         eprintf "NK %s unknownflag2000 is set\n" (print_offset nk);
-       if unknownflag1000 then
-         eprintf "NK %s unknownflag1000 is set\n" (print_offset nk);
-       if unknownflag0800 then
-         eprintf "NK %s unknownflag0800 is set\n" (print_offset nk);
-       if unknownflag0400 then
-         eprintf "NK %s unknownflag0400 is set\n" (print_offset nk);
-       if unknown1 <> 0_l then
-         eprintf "NK %s unknown1 <> 0 (%08lx)\n" (print_offset nk) unknown1;
-       if unknown2_userflags <> 0 then
-         eprintf "NK %s unknown2_userflags <> 0 (%x)\n"
-           (print_offset nk) unknown2_userflags;
-       if unknown2_virtcontrolflags <> 0 then
-         eprintf "NK %s unknown2_virtcontrolflags <> 0 (%x)\n"
-           (print_offset nk) unknown2_virtcontrolflags;
-       if unknown2_debug <> 0 then
-         eprintf "NK %s unknown2_debug <> 0 (%x)\n"
-           (print_offset nk) unknown2_debug;
-       if unknown3 <> 0_l then
-         eprintf "NK %s unknown3 <> 0 (%08lx)\n" (print_offset nk) unknown3;
-       if unknown6 <> 0_l then
-         eprintf "NK %s unknown6 <> 0 (%08lx)\n" (print_offset nk) unknown6;
-       (* -- common, assume it's not an error
-       if classname = -1 then
-         eprintf "NK %s has no classname\n" (print_offset nk);
-       if classname_len = 0 then
-         eprintf "NK %s has zero-length classname\n" (print_offset nk);
-       *)
-       if sk = -1 then
-         eprintf "NK %s has no sk-record\n" (print_offset nk);
-       if name_len = 0 then
-         eprintf "NK %s has zero-length name\n" (print_offset nk);
-       (* Visit the values first at this node. *)
-       let max_data_len, max_name_len =
-         if vallist <> -1 then
-           visit_vallist nr_values vallist
-         else
-           0, 0 in
-       if max_vk_data_len < max_data_len then
-         eprintf "NK %s nk.max_vk_data_len (%d) < actual max data_len (%d)\n"
-           (print_offset nk) max_vk_data_len max_data_len;
-       if max_vk_name_len < max_name_len * 2 then
-         eprintf "NK %s nk.max_vk_name_len (%d) < actual max name_len * 2 (%d)\n"
-           (print_offset nk) max_vk_name_len (max_name_len * 2);
-       (* Visit the subkeys of this node. *)
-       if subkeys <> -1 then (
-         let counted, max_name_len, _ = visit_subkeys subkeys in
-         if counted <> nr_subkeys then
-           failwithf "%s: incorrect count of subkeys (%d, counted %d) in subkey list at %s\n"
-             basename nr_subkeys counted (print_offset subkeys);
-         if max_subkey_name_len < max_name_len * 2 then
-           eprintf "NK %s nk.max_subkey_name_len (%d) < actual max name_len * 2 (%d)\n"
-             (print_offset nk) max_subkey_name_len (max_name_len * 2);
-       );
-       (* Visit the sk-record and classname. *)
-       if sk <> -1 then
-         visit_sk sk;
-       if classname <> -1 then
-         visit_classname classname classname_len;
-   | {_} ->
-       failwithf "%s: invalid nk block at offset %s\n"
-         basename (print_offset nk)
-  )
-and visit_vallist nr_values vallist =
-  let (seg_len, _, bits) = lookup "visit_vallist" vallist in
-  mark_visited vallist;
-  printf "VL %s %d %d\n" (print_offset vallist) nr_values seg_len;
-  visit_values_in_vallist nr_values vallist bits
-and visit_values_in_vallist nr_values vallist bits =
-  if nr_values > 0 then (
-    bitmatch bits with
-    | { rest : -1 : bitstring } when bitstring_length rest = 0 ->
-        assert (nr_values = 0);
-        0, 0
-    | { value : 4*8 : littleendian, bind (get_offset value);
-        rest : -1 : bitstring } ->
-        let data_len, name_len = visit_vk value in
-        let max_data_len, max_name_len =
-          visit_values_in_vallist (nr_values-1) vallist rest in
-        max max_data_len data_len, max max_name_len name_len
-    | {_} ->
-        failwithf "%s: invalid offset in value list at %s\n"
-          basename (print_offset vallist)
-  ) else 0, 0
-and visit_vk vk =
-  let (_, _, bits) = lookup "visit_vk" vk in
-  mark_visited vk;
-  (bitmatch bits with
-   | { :vk_fields } ->
-       fprintf_vk stdout vk;
-       let is_inline, data_len = data_len in
-       if unknown1 <> 0 then
-         eprintf "VK %s unknown1 flags set (%02x)\n"
-           (print_offset vk) unknown1;
-       if unknown2 <> 0 then
-         eprintf "VK %s unknown2 flags set (%02x)\n"
-           (print_offset vk) unknown2;
-       if unknown3 <> 0 then
-         eprintf "VK %s unknown3 flags set (%04x)\n"
-           (print_offset vk) unknown3;
-       (* Note this is common for default [ie. zero-length] key names. *)
-       if not nameisascii && name_len > 0 then
-         eprintf "VK %s has non-ASCII name flag set (name is %s)\n"
-           (print_offset vk) (print_binary_string name);
-       vk_records := vk :: !vk_records;
-       (match data with
-        | Inline data -> ()
-        | Offset offset ->
-            let _ = lookup "visit_vk (data)" offset in
-            mark_visited offset
-       );
-       data_len, name_len
-   | {_} ->
-       failwithf "%s: invalid vk block at offset %s\n"
-         basename (print_offset vk)
-  )
-(* Visits subkeys, recursing through intermediate lf/lh/ri structures,
- * and returns the number of subkeys actually seen.
- *)
-and visit_subkeys subkeys =
-  let (_, _, bits) = lookup "visit_subkeys" subkeys in
-  mark_visited subkeys;
-  (bitmatch bits with
-   | { "lf" : 2*8 : string;
-       len : 2*8 : littleendian; (* number of subkeys of this node *)
-       rest : len*8*8 : bitstring } ->
-       printf "LF %s %d\n" (print_offset subkeys) len;
-       visit_subkeys_in_lf_list false subkeys len rest
-   | { "lh" : 2*8 : string;
-       len : 2*8 : littleendian; (* number of subkeys of this node *)
-       rest : len*8*8 : bitstring } ->
-       printf "LF %s %d\n" (print_offset subkeys) len;
-       visit_subkeys_in_lf_list true subkeys len rest
-   | { "ri" : 2*8 : string;
-       len : 2*8 : littleendian;
-       rest : len*4*8 : bitstring } ->
-       printf "RI %s %d\n" (print_offset subkeys) len;
-       visit_subkeys_in_ri_list subkeys len rest
-   (* In theory you can have an li-record here, but we've never
-    * seen one.
-    *)
-   | { "nk" : 2*8 : string } ->
-       visit_nk subkeys;
-       let name, name_len = name_of_nk subkeys in
-       1, name_len, name
-   | {_} ->
-       failwithf "%s: invalid subkey node found at %s\n"
-         basename (print_offset subkeys)
-  )
-and visit_subkeys_in_lf_list newstyle_hash subkeys_top len bits =
-  if len > 0 then (
-    bitmatch bits with
-    | { rest : -1 : bitstring } when bitstring_length rest = 0 ->
-        assert (len = 0);
-        0, 0, ""
-    | { offset : 4*8 : littleendian, bind (get_offset offset);
-        hash : 4*8 : bitstring;
-        rest : -1 : bitstring } ->
-        let c1, name_len1, name = visit_subkeys offset in
-        check_hash offset newstyle_hash hash name;
-        let c2, name_len2, _ =
-          visit_subkeys_in_lf_list newstyle_hash subkeys_top (len-1) rest in
-        c1 + c2, max name_len1 name_len2, ""
-    | {_} ->
-        failwithf "%s: invalid subkey in lf/lh list at %s\n"
-          basename (print_offset subkeys_top)
-  ) else 0, 0, ""
-and visit_subkeys_in_ri_list subkeys_top len bits =
-  if len > 0 then (
-    bitmatch bits with
-    | { rest : -1 : bitstring } when bitstring_length rest = 0 ->
-        assert (len = 0);
-        0, 0, ""
-    | { offset : 4*8 : littleendian, bind (get_offset offset);
-        rest : -1 : bitstring } ->
-        let c1, name_len1, _ = visit_subkeys offset in
-        let c2, name_len2, _ =
-          visit_subkeys_in_ri_list subkeys_top (len-1) rest in
-        c1 + c2, max name_len1 name_len2, ""
-    | {_} ->
-        failwithf "%s: invalid subkey in ri list at %s\n"
-          basename (print_offset subkeys_top)
-  ) else 0, 0, ""
-and check_hash offset newstyle_hash hash name =
-  if not newstyle_hash then (
-    (* Old-style lf record hash the first four bytes of the name
-     * as the has.
-     *)
-    let len = String.length name in
-    let name_bits =
-      if len >= 4 then
-        bitstring_of_string (String.sub name 0 4)
-      else (
-        let zeroes = zeroes_bitstring ((4-len)*8) in
-        concat [bitstring_of_string name; zeroes]
-      ) in
-    if not (equals hash name_bits) then
-      eprintf "LF incorrect hash for name %s, expected %s, actual %s\n"
-        name (print_bitstring name_bits) (print_bitstring hash)
-  ) else (
-    (* New-style lh record has a proper hash. *)
-    let actual = bitmatch hash with { hash : 4*8 : littleendian } -> hash in
-    let h = ref 0_l in
-    String.iter (
-      fun c ->
-        h := Int32.mul !h 37_l;
-        h := Int32.add !h (Int32.of_int (Char.code (Char.uppercase c)))
-    ) name;
-    if actual <> !h then
-      eprintf "LH incorrect hash for name %s, expected 0x%08lx, actual 0x%08lx\n"
-        name !h actual
-  )
-and name_of_nk nk =
-  let (_, _, bits) = lookup "name_of_nk" nk in
-  bitmatch bits with
-  | { :nk_fields } -> name, name_len
-and visit_sk sk =
-  let (_, _, bits) = lookup "visit_sk" sk in
-  if is_not_visited sk then (
-    mark_visited sk;
-    (bitmatch bits with
-     | { :sk_fields } ->
-         fprintf_sk stdout sk;
-         if unknown1 <> 0 then
-           eprintf "SK %s unknown1 <> 0 (%04x)\n" (print_offset sk) unknown1;
-         sk_records := sk :: !sk_records
-     | {_} ->
-         failwithf "%s: invalid sk-record at %s\n"
-           basename (print_offset sk)
-    )
-  )
-and visit_classname classname classname_len =
-  let (seg_len, _, bits) = lookup "visit_classname" classname in
-  mark_visited classname;
-  assert (seg_len >= classname_len);
-  printf "CL %s %s\n" (print_offset classname) (print_bitstring bits)
-let () =
-  visit_nk ~nk_is_root:true root_key
-(* These are immutable now. *)
-let nk_records = !nk_records
-let vk_records = !vk_records
-let sk_records = !sk_records
-(* So we can rapidly tell what is an nk/vk/sk offset. *)
-let nk_set =
-  List.fold_left (fun set offs -> IntSet.add offs set) IntSet.empty nk_records
-let vk_set =
-  List.fold_left (fun set offs -> IntSet.add offs set) IntSet.empty vk_records
-let sk_set =
-  List.fold_left (fun set offs -> IntSet.add offs set) IntSet.empty sk_records
-(* Now after visiting all the blocks, are there any used blocks which
- * are unvisited?  If there are any then that would indicate either (a)
- * that the hive contains unreferenced blocks, or (b) that there are
- * referenced blocks that we did not visit because we don't have a full
- * understanding of the hive format.
- *
- * Windows 7 registries often contain a few of these -- not clear
- * how serious they are, but don't fail here.
- *)
-let () =
-  let unvisited = unvisited_blocks () in
-  IntMap.iter (
-    fun offset block ->
-      match block with
-      | (_, false, _) -> () (* ignore unused blocks *)
-      | (seg_len, true, _) ->
-          eprintf "used block %s (length %d) is not referenced\n"
-            (print_offset offset) seg_len
-  ) unvisited
-(* Check the SKs are:
- * (a) linked into a single circular list through the sk_prev/sk_next
- * pointers
- * (b) refcounts are correct
- *)
-let () =
-  if List.length sk_records > 0 then (
-    let sk0 = List.hd sk_records in (* start at any arbitrary sk *)
-    (* This loop follows the chain of sk pointers until we arrive
-     * back at the original, checking prev/next are consistent.
-     *)
-    let rec loop visited prevsk sk =
-      if sk <> sk0 then (
-        if not (IntSet.mem sk sk_set) then
-          eprintf "SK %s not an sk-record (faulty sk_next somewhere)\n"
-            (print_offset sk)
-        else (
-          let _, _, bits = lookup "loop sk circular list" sk in
-          bitmatch bits with
-          | { :sk_fields } ->
-              if sk_prev <> prevsk then
-                eprintf "SK %s sk_prev != previous sk (%s, %s)\n"
-                  (print_offset sk)
-                  (print_offset sk_prev) (print_offset prevsk);
-              if IntSet.mem sk visited then
-                eprintf "SK %s already visited (bad circular list)\n"
-                  (print_offset sk);
-              let visited = IntSet.add sk visited in
-              loop visited sk sk_next
-        )
-      )
-    in
-    let _, _, bits = lookup "start sk circular list" sk0 in
-    (bitmatch bits with
-     | { :sk_fields } ->
-         loop IntSet.empty sk_prev sk0
-    );
-    (* For every nk-record, if it references an sk-record count that,
-     * then check this matches the refcounts in the sk-records
-     * themselves.
-     *)
-    let refcounts = Counter.create () in
-    List.iter (
-      fun nk ->
-        let _, _, bits = lookup "sk refcounter (nk)" nk in
-        (bitmatch bits with
-         | { :nk_fields } ->
-             Counter.incr refcounts sk
-        )
-    ) nk_records;
-    List.iter (
-      fun sk ->
-        let _, _, bits = lookup "sk refcounter (sk)" sk in
-        (bitmatch bits with
-         | { :sk_fields } ->
-             let actual = Counter.get refcounts sk in
-             if actual <> refcount then
-               eprintf "SK %s incorrect refcount (actual %d, in file %d)\n"
-                 (print_offset sk) actual refcount
-        )
-    ) sk_records
-  )
diff --git a/hivex/tools/visualizer_NT_time.ml b/hivex/tools/visualizer_NT_time.ml
deleted file mode 100644 (file)
index a752112..0000000
+++ /dev/null
@@ -1,30 +0,0 @@
-(* Windows Registry reverse-engineering tool.
- * Copyright (C) 2010 Red Hat Inc.
- *
- * This program is free software; you can redistribute it and/or modify
- * it under the terms of the GNU General Public License as published by
- * the Free Software Foundation; either version 2 of the License, or
- * (at your option) any later version.
- *
- * This program is distributed in the hope that it will be useful,
- * but WITHOUT ANY WARRANTY; without even the implied warranty of
- * GNU General Public License for more details.
- *
- * You should have received a copy of the GNU General Public License along
- * with this program; if not, write to the Free Software Foundation, Inc.,
- * 51 Franklin Street, Fifth Floor, Boston, MA 02110-1301 USA.
- *
- * For existing information on the registry format, please refer
- * to the following documents.  Note they are both incomplete
- * and inaccurate in some respects.
- *)
-(* Convert an NT file timestamp to time_t.  See:
- * http://blogs.msdn.com/oldnewthing/archive/2003/09/05/54806.aspx
- * http://support.microsoft.com/kb/167296
- *)
-let nt_to_time_t t =
-  let t = Int64.sub t 116444736000000000L in
-  let t = Int64.div t 10000000L in
-  Int64.to_float t
diff --git a/hivex/tools/visualizer_utils.ml b/hivex/tools/visualizer_utils.ml
deleted file mode 100644 (file)
index 2f0d6b7..0000000
+++ /dev/null
@@ -1,163 +0,0 @@
-(* Windows Registry reverse-engineering tool.
- * Copyright (C) 2010 Red Hat Inc.
- *
- * This program is free software; you can redistribute it and/or modify
- * it under the terms of the GNU General Public License as published by
- * the Free Software Foundation; either version 2 of the License, or
- * (at your option) any later version.
- *
- * This program is distributed in the hope that it will be useful,
- * but WITHOUT ANY WARRANTY; without even the implied warranty of
- * GNU General Public License for more details.
- *
- * You should have received a copy of the GNU General Public License along
- * with this program; if not, write to the Free Software Foundation, Inc.,
- * 51 Franklin Street, Fifth Floor, Boston, MA 02110-1301 USA.
- *
- * For existing information on the registry format, please refer
- * to the following documents.  Note they are both incomplete
- * and inaccurate in some respects.
- *)
-open ExtString
-open Printf
-let failwithf fs = ksprintf failwith fs
-(* Useful function to convert unknown bitstring fragments into
- * printable strings.
- *)
-let rec print_bitstring bits =
-  let str = Bitstring.string_of_bitstring bits in
-  print_binary_string str
-and print_binary_string str =
-  let rec printable = function
-    | '\x00' -> "\\0" | '\x01' -> "\\1" | '\x02' -> "\\2" | '\x03' -> "\\3"
-    | '\x04' -> "\\4" | '\x05' -> "\\5" | '\x06' -> "\\6" | '\x07' -> "\\7"
-    | ('\x08'..'\x31' as c)
-    | ('\x7f'..'\xff' as c) -> sprintf "\\x%02x" (Char.code c)
-    | ('\x32'..'\x7e' as c) -> String.make 1 c
-  and repeat str = function
-    | n when n <= 0 -> ""
-    | n -> str ^ repeat str (n-1)
-  in
-  let chars = String.explode str in
-  let rec loop acc = function
-    | [] -> List.rev acc
-    | x :: xs ->
-        let rec loop2 i = function
-          | y :: ys when x = y -> loop2 (i+1) ys
-          | ys -> i, ys
-        in
-        let count, ys = loop2 1 xs in
-        let acc = (count, x) :: acc in
-        loop acc ys
-  in
-  let frags = loop [] chars in
-  let frags =
-    List.map (function
-              | (nr, x) when nr <= 4 -> repeat (printable x) nr
-              | (nr, x) -> sprintf "%s<%d times>" (printable x) nr
-             ) frags in
-  "\"" ^ String.concat "" frags ^ "\""
-(* Convert an offset from the file to an offset.  The only special
- * thing is that 0xffffffff in the file is used as a kind of "NULL
- * pointer".  We map these null values to -1.
- *)
-let get_offset = function
-  | 0xffffffff_l -> -1
-  | i -> Int32.to_int i
-(* Print an offset. *)
-let print_offset = function
-  | -1 -> "NULL"
-  | i -> sprintf "@%08x" i
-(* Print time. *)
-let print_time t =
-  let tm = Unix.gmtime t in
-  sprintf "%04d-%02d-%02d %02d:%02d:%02d"
-    (tm.Unix.tm_year + 1900) (tm.Unix.tm_mon + 1) tm.Unix.tm_mday
-    tm.Unix.tm_hour tm.Unix.tm_min tm.Unix.tm_sec
-(* Print UTF16LE. *)
-let print_utf16 str =
-  let n = String.length str in
-  if n land 1 <> 0 then
-    print_binary_string str
-  else (
-    let rec loop i =
-      if i < n-1 then (
-        let c1 = Char.code (str.[i]) in
-        let c2 = Char.code (str.[i+1]) in
-        if c1 <> 0 || c2 <> 0 then (
-          (* Well, this doesn't print non-7bit-ASCII ... *)
-          let c =
-            if c2 = 0 then String.make 1 (Char.chr c1)
-            else sprintf "\\u%04d" (c2 * 256 + c1) in
-          c :: loop (i+2)
-        ) else []
-      ) else []
-    in
-    let frags = loop 0 in
-    "L\"" ^ String.concat "" frags ^ "\""
-  )
-(* A map of int -> anything. *)
-module IntMap = Map.Make (struct type t = int let compare = compare end)
-(* A set of ints. *)
-module IntSet = Set.Make (struct type t = int let compare = compare end)
-(* Print registry vk-record type field. *)
-let print_vk_type = function
-  | 0 -> "NONE"
-  | 1 -> "SZ"
-  | 2 -> "EXPAND_SZ"
-  | 3 -> "BINARY"
-  | 4 -> "DWORD"
-  | 5 -> "DWORD_BIG_ENDIAN"
-  | 6 -> "LINK"
-  | 7 -> "MULTI_SZ"
-  | 8 -> "RESOURCE_LiST"
-  | 11 -> "QWORD"
-  | i -> sprintf "UNKNOWN_VK_TYPE_%d" i
-(* XXX We should write a more efficient version of this and
- * push it into the bitstring library.
- *)
-let is_zero_bitstring bits =
-  let len = Bitstring.bitstring_length bits in
-  let zeroes = Bitstring.zeroes_bitstring len in
-  0 = Bitstring.compare bits zeroes
-let is_zero_guid = is_zero_bitstring
-(* http://msdn.microsoft.com/en-us/library/aa373931(VS.85).aspx
- * Endianness of GUIDs is not clear from the MSDN documentation,
- * so this is just a guess.
- *)
-let print_guid bits =
-  bitmatch bits with
-  | { data1 : 4*8 : littleendian;
-      data2 : 2*8 : littleendian;
-      data3 : 2*8 : littleendian;
-      data4_1 : 2*8 : littleendian;
-      data4_2 : 6*8 : littleendian } ->
-      sprintf "%08lX-%04X-%04X-%04X-%012LX" data1 data2 data3 data4_1 data4_2
-  | { _ } ->
-      assert false
-(* Fold over little-endian 32-bit integers in a bitstring. *)
-let rec bitstring_fold_left_int32_le f a bits =
-  bitmatch bits with
-  | { i : 4*8 : littleendian;
-      rest : -1 : bitstring } ->
-      bitstring_fold_left_int32_le f (f a i) rest
-  | { rest : -1 : bitstring } when Bitstring.bitstring_length rest = 0 -> a
-  | { _ } ->
-      invalid_arg "bitstring_fold_left_int32_le: length not a multiple of 32 bits"
index c6dbd03..9102106 100644 (file)
@@ -80,9 +80,6 @@ fish/tilde.c
index 514db03..2e608c6 100644 (file)
@@ -450,10 +450,10 @@ Where we can help is in resolving the case insensitivity of paths.
 For this, call C<guestfs_case_sensitive_path>.
 Libguestfs also provides some help for decoding Windows Registry
-"hive" files, through the library C<libhivex> which is part of
-libguestfs.  You have to locate and download the hive file(s)
-yourself, and then pass them to C<libhivex> functions.  See also the
-programs L<hivexml(1)>, L<hivexget(1)> and L<virt-win-reg(1)> for more
+"hive" files, through the library C<hivex> which is part of the
+libguestfs project.  You have to locate and download the hive file(s)
+yourself, and then pass them to C<hivex> functions.  See also the
+programs L<hivexml(1)>, L<hivexsh(1)> and L<virt-win-reg(1)> for more
 help on this issue.
index eb55d18..cb3dca8 100755 (executable)
@@ -48,7 +48,6 @@ while(-l $path) {
 # Get the absolute path of the parent directory
 $path = abs_path(dirname($path).'/..');
-$ENV{PATH}            = $path.'/hivex:'.$ENV{PATH};
 $ENV{LD_LIBRARY_PATH} = $path.'/src/.libs';
 $ENV{LIBGUESTFS_PATH} = $path.'/appliance';
 $ENV{PERL5LIB}        = $path.'/perl/blib/lib:'.$path.'/perl/blib/arch';