hivex(3): Fix link to CSS.
[hivex.git] / lib / hivex.c
1 /* hivex - Windows Registry "hive" extraction library.
2  * Copyright (C) 2009-2011 Red Hat Inc.
3  * Derived from code by Petter Nordahl-Hagen under a compatible license:
4  *   Copyright (c) 1997-2007 Petter Nordahl-Hagen.
5  * Derived from code by Markus Stephany under a compatible license:
6  *   Copyright (c) 2000-2004, Markus Stephany.
7  *
8  * This library is free software; you can redistribute it and/or
9  * modify it under the terms of the GNU Lesser General Public
10  * License as published by the Free Software Foundation;
11  * version 2.1 of the License.
12  *
13  * This library is distributed in the hope that it will be useful,
14  * but WITHOUT ANY WARRANTY; without even the implied warranty of
15  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
16  * Lesser General Public License for more details.
17  *
18  * See file LICENSE for the full license.
19  */
20
21 #include <config.h>
22
23 #include <stdio.h>
24 #include <stdlib.h>
25 #include <stdint.h>
26 #include <stddef.h>
27 #include <inttypes.h>
28 #include <string.h>
29 #include <fcntl.h>
30 #include <unistd.h>
31 #include <errno.h>
32 #include <iconv.h>
33 #include <sys/mman.h>
34 #include <sys/stat.h>
35 #include <assert.h>
36
37 #include "c-ctype.h"
38 #include "full-read.h"
39 #include "full-write.h"
40
41 #define STREQ(a,b) (strcmp((a),(b)) == 0)
42 #define STRCASEEQ(a,b) (strcasecmp((a),(b)) == 0)
43 //#define STRNEQ(a,b) (strcmp((a),(b)) != 0)
44 //#define STRCASENEQ(a,b) (strcasecmp((a),(b)) != 0)
45 #define STREQLEN(a,b,n) (strncmp((a),(b),(n)) == 0)
46 //#define STRCASEEQLEN(a,b,n) (strncasecmp((a),(b),(n)) == 0)
47 //#define STRNEQLEN(a,b,n) (strncmp((a),(b),(n)) != 0)
48 //#define STRCASENEQLEN(a,b,n) (strncasecmp((a),(b),(n)) != 0)
49 #define STRPREFIX(a,b) (strncmp((a),(b),strlen((b))) == 0)
50
51 #include "hivex.h"
52 #include "byte_conversions.h"
53
54 /* These limits are in place to stop really stupid stuff and/or exploits. */
55 #define HIVEX_MAX_SUBKEYS       15000
56 #define HIVEX_MAX_VALUES        10000
57 #define HIVEX_MAX_VALUE_LEN   1000000
58 #define HIVEX_MAX_ALLOCATION  1000000
59
60 static char *windows_utf16_to_utf8 (/* const */ char *input, size_t len);
61 static size_t utf16_string_len_in_bytes_max (const char *str, size_t len);
62
63 struct hive_h {
64   char *filename;
65   int fd;
66   size_t size;
67   int msglvl;
68   int writable;
69
70   /* Registry file, memory mapped if read-only, or malloc'd if writing. */
71   union {
72     char *addr;
73     struct ntreg_header *hdr;
74   };
75
76   /* Use a bitmap to store which file offsets are valid (point to a
77    * used block).  We only need to store 1 bit per 32 bits of the file
78    * (because blocks are 4-byte aligned).  We found that the average
79    * block size in a registry file is ~50 bytes.  So roughly 1 in 12
80    * bits in the bitmap will be set, making it likely a more efficient
81    * structure than a hash table.
82    */
83   char *bitmap;
84 #define BITMAP_SET(bitmap,off) (bitmap[(off)>>5] |= 1 << (((off)>>2)&7))
85 #define BITMAP_CLR(bitmap,off) (bitmap[(off)>>5] &= ~ (1 << (((off)>>2)&7)))
86 #define BITMAP_TST(bitmap,off) (bitmap[(off)>>5] & (1 << (((off)>>2)&7)))
87 #define IS_VALID_BLOCK(h,off)               \
88   (((off) & 3) == 0 &&                      \
89    (off) >= 0x1000 &&                       \
90    (off) < (h)->size &&                     \
91    BITMAP_TST((h)->bitmap,(off)))
92
93   /* Fields from the header, extracted from little-endianness hell. */
94   size_t rootoffs;              /* Root key offset (always an nk-block). */
95   size_t endpages;              /* Offset of end of pages. */
96   int64_t last_modified;        /* mtime of base block. */
97
98   /* For writing. */
99   size_t endblocks;             /* Offset to next block allocation (0
100                                    if not allocated anything yet). */
101 };
102
103 /* NB. All fields are little endian. */
104 struct ntreg_header {
105   char magic[4];                /* "regf" */
106   uint32_t sequence1;
107   uint32_t sequence2;
108   int64_t last_modified;
109   uint32_t major_ver;           /* 1 */
110   uint32_t minor_ver;           /* 3 */
111   uint32_t unknown5;            /* 0 */
112   uint32_t unknown6;            /* 1 */
113   uint32_t offset;              /* offset of root key record - 4KB */
114   uint32_t blocks;              /* pointer AFTER last hbin in file - 4KB */
115   uint32_t unknown7;            /* 1 */
116   /* 0x30 */
117   char name[64];                /* original file name of hive */
118   char unknown_guid1[16];
119   char unknown_guid2[16];
120   /* 0x90 */
121   uint32_t unknown8;
122   char unknown_guid3[16];
123   uint32_t unknown9;
124   /* 0xa8 */
125   char unknown10[340];
126   /* 0x1fc */
127   uint32_t csum;                /* checksum: xor of dwords 0-0x1fb. */
128   /* 0x200 */
129   char unknown11[3528];
130   /* 0xfc8 */
131   char unknown_guid4[16];
132   char unknown_guid5[16];
133   char unknown_guid6[16];
134   uint32_t unknown12;
135   uint32_t unknown13;
136   /* 0x1000 */
137 } __attribute__((__packed__));
138
139 struct ntreg_hbin_page {
140   char magic[4];                /* "hbin" */
141   uint32_t offset_first;        /* offset from 1st block */
142   uint32_t page_size;           /* size of this page (multiple of 4KB) */
143   char unknown[20];
144   /* Linked list of blocks follows here. */
145 } __attribute__((__packed__));
146
147 struct ntreg_hbin_block {
148   int32_t seg_len;              /* length of this block (-ve for used block) */
149   char id[2];                   /* the block type (eg. "nk" for nk record) */
150   /* Block data follows here. */
151 } __attribute__((__packed__));
152
153 #define BLOCK_ID_EQ(h,offs,eqid) \
154   (STREQLEN (((struct ntreg_hbin_block *)((h)->addr + (offs)))->id, (eqid), 2))
155
156 static size_t
157 block_len (hive_h *h, size_t blkoff, int *used)
158 {
159   struct ntreg_hbin_block *block;
160   block = (struct ntreg_hbin_block *) (h->addr + blkoff);
161
162   int32_t len = le32toh (block->seg_len);
163   if (len < 0) {
164     if (used) *used = 1;
165     len = -len;
166   } else {
167     if (used) *used = 0;
168   }
169
170   return (size_t) len;
171 }
172
173 struct ntreg_nk_record {
174   int32_t seg_len;              /* length (always -ve because used) */
175   char id[2];                   /* "nk" */
176   uint16_t flags;
177   int64_t timestamp;
178   uint32_t unknown1;
179   uint32_t parent;              /* offset of owner/parent */
180   uint32_t nr_subkeys;          /* number of subkeys */
181   uint32_t nr_subkeys_volatile;
182   uint32_t subkey_lf;           /* lf record containing list of subkeys */
183   uint32_t subkey_lf_volatile;
184   uint32_t nr_values;           /* number of values */
185   uint32_t vallist;             /* value-list record */
186   uint32_t sk;                  /* offset of sk-record */
187   uint32_t classname;           /* offset of classname record */
188   uint16_t max_subkey_name_len; /* maximum length of a subkey name in bytes
189                                    if the subkey was reencoded as UTF-16LE */
190   uint16_t unknown2;
191   uint32_t unknown3;
192   uint32_t max_vk_name_len;     /* maximum length of any vk name in bytes
193                                    if the name was reencoded as UTF-16LE */
194   uint32_t max_vk_data_len;     /* maximum length of any vk data in bytes */
195   uint32_t unknown6;
196   uint16_t name_len;            /* length of name */
197   uint16_t classname_len;       /* length of classname */
198   char name[1];                 /* name follows here */
199 } __attribute__((__packed__));
200
201 struct ntreg_lf_record {
202   int32_t seg_len;
203   char id[2];                   /* "lf"|"lh" */
204   uint16_t nr_keys;             /* number of keys in this record */
205   struct {
206     uint32_t offset;            /* offset of nk-record for this subkey */
207     char hash[4];               /* hash of subkey name */
208   } keys[1];
209 } __attribute__((__packed__));
210
211 struct ntreg_ri_record {
212   int32_t seg_len;
213   char id[2];                   /* "ri" */
214   uint16_t nr_offsets;          /* number of pointers to lh records */
215   uint32_t offset[1];           /* list of pointers to lh records */
216 } __attribute__((__packed__));
217
218 /* This has no ID header. */
219 struct ntreg_value_list {
220   int32_t seg_len;
221   uint32_t offset[1];           /* list of pointers to vk records */
222 } __attribute__((__packed__));
223
224 struct ntreg_vk_record {
225   int32_t seg_len;              /* length (always -ve because used) */
226   char id[2];                   /* "vk" */
227   uint16_t name_len;            /* length of name */
228   /* length of the data:
229    * If data_len is <= 4, then it's stored inline.
230    * Top bit is set to indicate inline.
231    */
232   uint32_t data_len;
233   uint32_t data_offset;         /* pointer to the data (or data if inline) */
234   uint32_t data_type;           /* type of the data */
235   uint16_t flags;               /* bit 0 set => key name ASCII,
236                                    bit 0 clr => key name UTF-16.
237                                    Only seen ASCII here in the wild.
238                                    NB: this is CLEAR for default key. */
239   uint16_t unknown2;
240   char name[1];                 /* key name follows here */
241 } __attribute__((__packed__));
242
243 struct ntreg_sk_record {
244   int32_t seg_len;              /* length (always -ve because used) */
245   char id[2];                   /* "sk" */
246   uint16_t unknown1;
247   uint32_t sk_next;             /* linked into a circular list */
248   uint32_t sk_prev;
249   uint32_t refcount;            /* reference count */
250   uint32_t sec_len;             /* length of security info */
251   char sec_desc[1];             /* security info follows */
252 } __attribute__((__packed__));
253
254 static uint32_t
255 header_checksum (const hive_h *h)
256 {
257   uint32_t *daddr = (uint32_t *) h->addr;
258   size_t i;
259   uint32_t sum = 0;
260
261   for (i = 0; i < 0x1fc / 4; ++i) {
262     sum ^= le32toh (*daddr);
263     daddr++;
264   }
265
266   return sum;
267 }
268
269 #define HIVEX_OPEN_MSGLVL_MASK (HIVEX_OPEN_VERBOSE|HIVEX_OPEN_DEBUG)
270
271 hive_h *
272 hivex_open (const char *filename, int flags)
273 {
274   hive_h *h = NULL;
275
276   assert (sizeof (struct ntreg_header) == 0x1000);
277   assert (offsetof (struct ntreg_header, csum) == 0x1fc);
278
279   h = calloc (1, sizeof *h);
280   if (h == NULL)
281     goto error;
282
283   h->msglvl = flags & HIVEX_OPEN_MSGLVL_MASK;
284
285   const char *debug = getenv ("HIVEX_DEBUG");
286   if (debug && STREQ (debug, "1"))
287     h->msglvl = 2;
288
289   if (h->msglvl >= 2)
290     fprintf (stderr, "hivex_open: created handle %p\n", h);
291
292   h->writable = !!(flags & HIVEX_OPEN_WRITE);
293   h->filename = strdup (filename);
294   if (h->filename == NULL)
295     goto error;
296
297   h->fd = open (filename, O_RDONLY | O_CLOEXEC);
298   if (h->fd == -1)
299     goto error;
300
301   struct stat statbuf;
302   if (fstat (h->fd, &statbuf) == -1)
303     goto error;
304
305   h->size = statbuf.st_size;
306
307   if (!h->writable) {
308     h->addr = mmap (NULL, h->size, PROT_READ, MAP_SHARED, h->fd, 0);
309     if (h->addr == MAP_FAILED)
310       goto error;
311
312     if (h->msglvl >= 2)
313       fprintf (stderr, "hivex_open: mapped file at %p\n", h->addr);
314   } else {
315     h->addr = malloc (h->size);
316     if (h->addr == NULL)
317       goto error;
318
319     if (full_read (h->fd, h->addr, h->size) < h->size)
320       goto error;
321
322     /* We don't need the file descriptor along this path, since we
323      * have read all the data.
324      */
325     if (close (h->fd) == -1)
326       goto error;
327     h->fd = -1;
328   }
329
330   /* Check header. */
331   if (h->hdr->magic[0] != 'r' ||
332       h->hdr->magic[1] != 'e' ||
333       h->hdr->magic[2] != 'g' ||
334       h->hdr->magic[3] != 'f') {
335     fprintf (stderr, "hivex: %s: not a Windows NT Registry hive file\n",
336              filename);
337     errno = ENOTSUP;
338     goto error;
339   }
340
341   /* Check major version. */
342   uint32_t major_ver = le32toh (h->hdr->major_ver);
343   if (major_ver != 1) {
344     fprintf (stderr,
345              "hivex: %s: hive file major version %" PRIu32 " (expected 1)\n",
346              filename, major_ver);
347     errno = ENOTSUP;
348     goto error;
349   }
350
351   h->bitmap = calloc (1 + h->size / 32, 1);
352   if (h->bitmap == NULL)
353     goto error;
354
355   /* Header checksum. */
356   uint32_t sum = header_checksum (h);
357   if (sum != le32toh (h->hdr->csum)) {
358     fprintf (stderr, "hivex: %s: bad checksum in hive header\n", filename);
359     errno = EINVAL;
360     goto error;
361   }
362
363   /* Last modified time. */
364   h->last_modified = le64toh ((int64_t) h->hdr->last_modified);
365
366   if (h->msglvl >= 2) {
367     char *name = windows_utf16_to_utf8 (h->hdr->name, 64);
368
369     fprintf (stderr,
370              "hivex_open: header fields:\n"
371              "  file version             %" PRIu32 ".%" PRIu32 "\n"
372              "  sequence nos             %" PRIu32 " %" PRIu32 "\n"
373              "    (sequences nos should match if hive was synched at shutdown)\n"
374              "  last modified            %" PRIu64 "\n"
375              "    (Windows filetime, x 100 ns since 1601-01-01)\n"
376              "  original file name       %s\n"
377              "    (only 32 chars are stored, name is probably truncated)\n"
378              "  root offset              0x%x + 0x1000\n"
379              "  end of last page         0x%x + 0x1000 (total file size 0x%zx)\n"
380              "  checksum                 0x%x (calculated 0x%x)\n",
381              major_ver, le32toh (h->hdr->minor_ver),
382              le32toh (h->hdr->sequence1), le32toh (h->hdr->sequence2),
383              h->last_modified,
384              name ? name : "(conversion failed)",
385              le32toh (h->hdr->offset),
386              le32toh (h->hdr->blocks), h->size,
387              le32toh (h->hdr->csum), sum);
388     free (name);
389   }
390
391   h->rootoffs = le32toh (h->hdr->offset) + 0x1000;
392   h->endpages = le32toh (h->hdr->blocks) + 0x1000;
393
394   if (h->msglvl >= 2)
395     fprintf (stderr, "hivex_open: root offset = 0x%zx\n", h->rootoffs);
396
397   /* We'll set this flag when we see a block with the root offset (ie.
398    * the root block).
399    */
400   int seen_root_block = 0, bad_root_block = 0;
401
402   /* Collect some stats. */
403   size_t pages = 0;           /* Number of hbin pages read. */
404   size_t smallest_page = SIZE_MAX, largest_page = 0;
405   size_t blocks = 0;          /* Total number of blocks found. */
406   size_t smallest_block = SIZE_MAX, largest_block = 0, blocks_bytes = 0;
407   size_t used_blocks = 0;     /* Total number of used blocks found. */
408   size_t used_size = 0;       /* Total size (bytes) of used blocks. */
409
410   /* Read the pages and blocks.  The aim here is to be robust against
411    * corrupt or malicious registries.  So we make sure the loops
412    * always make forward progress.  We add the address of each block
413    * we read to a hash table so pointers will only reference the start
414    * of valid blocks.
415    */
416   size_t off;
417   struct ntreg_hbin_page *page;
418   for (off = 0x1000; off < h->size; off += le32toh (page->page_size)) {
419     if (off >= h->endpages)
420       break;
421
422     page = (struct ntreg_hbin_page *) (h->addr + off);
423     if (page->magic[0] != 'h' ||
424         page->magic[1] != 'b' ||
425         page->magic[2] != 'i' ||
426         page->magic[3] != 'n') {
427       fprintf (stderr, "hivex: %s: trailing garbage at end of file "
428                "(at 0x%zx, after %zu pages)\n",
429                filename, off, pages);
430       errno = ENOTSUP;
431       goto error;
432     }
433
434     size_t page_size = le32toh (page->page_size);
435     if (h->msglvl >= 2)
436       fprintf (stderr, "hivex_open: page at 0x%zx, size %zu\n", off, page_size);
437     pages++;
438     if (page_size < smallest_page) smallest_page = page_size;
439     if (page_size > largest_page) largest_page = page_size;
440
441     if (page_size <= sizeof (struct ntreg_hbin_page) ||
442         (page_size & 0x0fff) != 0) {
443       fprintf (stderr, "hivex: %s: page size %zu at 0x%zx, bad registry\n",
444                filename, page_size, off);
445       errno = ENOTSUP;
446       goto error;
447     }
448
449     /* Read the blocks in this page. */
450     size_t blkoff;
451     struct ntreg_hbin_block *block;
452     size_t seg_len;
453     for (blkoff = off + 0x20;
454          blkoff < off + page_size;
455          blkoff += seg_len) {
456       blocks++;
457
458       int is_root = blkoff == h->rootoffs;
459       if (is_root)
460         seen_root_block = 1;
461
462       block = (struct ntreg_hbin_block *) (h->addr + blkoff);
463       int used;
464       seg_len = block_len (h, blkoff, &used);
465       if (seg_len <= 4 || (seg_len & 3) != 0) {
466         fprintf (stderr, "hivex: %s: block size %" PRIu32 " at 0x%zx,"
467                  " bad registry\n",
468                  filename, le32toh (block->seg_len), blkoff);
469         errno = ENOTSUP;
470         goto error;
471       }
472
473       if (h->msglvl >= 2)
474         fprintf (stderr, "hivex_open: %s block id %d,%d at 0x%zx size %zu%s\n",
475                  used ? "used" : "free", block->id[0], block->id[1], blkoff,
476                  seg_len, is_root ? " (root)" : "");
477
478       blocks_bytes += seg_len;
479       if (seg_len < smallest_block) smallest_block = seg_len;
480       if (seg_len > largest_block) largest_block = seg_len;
481
482       if (is_root && !used)
483         bad_root_block = 1;
484
485       if (used) {
486         used_blocks++;
487         used_size += seg_len;
488
489         /* Root block must be an nk-block. */
490         if (is_root && (block->id[0] != 'n' || block->id[1] != 'k'))
491           bad_root_block = 1;
492
493         /* Note this blkoff is a valid address. */
494         BITMAP_SET (h->bitmap, blkoff);
495       }
496     }
497   }
498
499   if (!seen_root_block) {
500     fprintf (stderr, "hivex: %s: no root block found\n", filename);
501     errno = ENOTSUP;
502     goto error;
503   }
504
505   if (bad_root_block) {
506     fprintf (stderr, "hivex: %s: bad root block (free or not nk)\n", filename);
507     errno = ENOTSUP;
508     goto error;
509   }
510
511   if (h->msglvl >= 1)
512     fprintf (stderr,
513              "hivex_open: successfully read Windows Registry hive file:\n"
514              "  pages:          %zu [sml: %zu, lge: %zu]\n"
515              "  blocks:         %zu [sml: %zu, avg: %zu, lge: %zu]\n"
516              "  blocks used:    %zu\n"
517              "  bytes used:     %zu\n",
518              pages, smallest_page, largest_page,
519              blocks, smallest_block, blocks_bytes / blocks, largest_block,
520              used_blocks, used_size);
521
522   return h;
523
524  error:;
525   int err = errno;
526   if (h) {
527     free (h->bitmap);
528     if (h->addr && h->size && h->addr != MAP_FAILED) {
529       if (!h->writable)
530         munmap (h->addr, h->size);
531       else
532         free (h->addr);
533     }
534     if (h->fd >= 0)
535       close (h->fd);
536     free (h->filename);
537     free (h);
538   }
539   errno = err;
540   return NULL;
541 }
542
543 int
544 hivex_close (hive_h *h)
545 {
546   int r;
547
548   if (h->msglvl >= 1)
549     fprintf (stderr, "hivex_close\n");
550
551   free (h->bitmap);
552   if (!h->writable)
553     munmap (h->addr, h->size);
554   else
555     free (h->addr);
556   if (h->fd >= 0)
557     r = close (h->fd);
558   else
559     r = 0;
560   free (h->filename);
561   free (h);
562
563   return r;
564 }
565
566 /*----------------------------------------------------------------------
567  * Reading.
568  */
569
570 hive_node_h
571 hivex_root (hive_h *h)
572 {
573   hive_node_h ret = h->rootoffs;
574   if (!IS_VALID_BLOCK (h, ret)) {
575     errno = HIVEX_NO_KEY;
576     return 0;
577   }
578   return ret;
579 }
580
581 char *
582 hivex_node_name (hive_h *h, hive_node_h node)
583 {
584   if (!IS_VALID_BLOCK (h, node) || !BLOCK_ID_EQ (h, node, "nk")) {
585     errno = EINVAL;
586     return NULL;
587   }
588
589   struct ntreg_nk_record *nk = (struct ntreg_nk_record *) (h->addr + node);
590
591   /* AFAIK the node name is always plain ASCII, so no conversion
592    * to UTF-8 is necessary.  However we do need to nul-terminate
593    * the string.
594    */
595
596   /* nk->name_len is unsigned, 16 bit, so this is safe ...  However
597    * we have to make sure the length doesn't exceed the block length.
598    */
599   size_t len = le16toh (nk->name_len);
600   size_t seg_len = block_len (h, node, NULL);
601   if (sizeof (struct ntreg_nk_record) + len - 1 > seg_len) {
602     if (h->msglvl >= 2)
603       fprintf (stderr, "hivex_node_name: returning EFAULT because node name"
604                " is too long (%zu, %zu)\n",
605               len, seg_len);
606     errno = EFAULT;
607     return NULL;
608   }
609
610   char *ret = malloc (len + 1);
611   if (ret == NULL)
612     return NULL;
613   memcpy (ret, nk->name, len);
614   ret[len] = '\0';
615   return ret;
616 }
617
618 static int64_t
619 timestamp_check (hive_h *h, hive_node_h node, int64_t timestamp)
620 {
621   if (timestamp < 0) {
622     if (h->msglvl >= 2)
623       fprintf (stderr, "hivex: timestamp_check: "
624                "negative time reported at %z: %" PRIi64 "\n", node, timestamp);
625     errno = EINVAL;
626     return -1;
627   }
628
629   return timestamp;
630 }
631
632 int64_t
633 hivex_last_modified (hive_h *h)
634 {
635   return timestamp_check (h, 0, h->last_modified);
636 }
637
638 int64_t
639 hivex_node_timestamp (hive_h *h, hive_node_h node)
640 {
641   int64_t ret;
642
643   if (!IS_VALID_BLOCK (h, node) || !BLOCK_ID_EQ (h, node, "nk")) {
644     errno = EINVAL;
645     return -1;
646   }
647
648   struct ntreg_nk_record *nk = (struct ntreg_nk_record *) (h->addr + node);
649
650   ret = le64toh (nk->timestamp);
651   return timestamp_check (h, node, ret);
652 }
653
654 #if 0
655 /* I think the documentation for the sk and classname fields in the nk
656  * record is wrong, or else the offset field is in the wrong place.
657  * Otherwise this makes no sense.  Disabled this for now -- it's not
658  * useful for reading the registry anyway.
659  */
660
661 hive_security_h
662 hivex_node_security (hive_h *h, hive_node_h node)
663 {
664   if (!IS_VALID_BLOCK (h, node) || !BLOCK_ID_EQ (h, node, "nk")) {
665     errno = EINVAL;
666     return 0;
667   }
668
669   struct ntreg_nk_record *nk = (struct ntreg_nk_record *) (h->addr + node);
670
671   hive_node_h ret = le32toh (nk->sk);
672   ret += 0x1000;
673   if (!IS_VALID_BLOCK (h, ret)) {
674     errno = EFAULT;
675     return 0;
676   }
677   return ret;
678 }
679
680 hive_classname_h
681 hivex_node_classname (hive_h *h, hive_node_h node)
682 {
683   if (!IS_VALID_BLOCK (h, node) || !BLOCK_ID_EQ (h, node, "nk")) {
684     errno = EINVAL;
685     return 0;
686   }
687
688   struct ntreg_nk_record *nk = (struct ntreg_nk_record *) (h->addr + node);
689
690   hive_node_h ret = le32toh (nk->classname);
691   ret += 0x1000;
692   if (!IS_VALID_BLOCK (h, ret)) {
693     errno = EFAULT;
694     return 0;
695   }
696   return ret;
697 }
698 #endif
699
700 /* Structure for returning 0-terminated lists of offsets (nodes,
701  * values, etc).
702  */
703 struct offset_list {
704   size_t *offsets;
705   size_t len;
706   size_t alloc;
707 };
708
709 static void
710 init_offset_list (struct offset_list *list)
711 {
712   list->len = 0;
713   list->alloc = 0;
714   list->offsets = NULL;
715 }
716
717 #define INIT_OFFSET_LIST(name) \
718   struct offset_list name; \
719   init_offset_list (&name)
720
721 /* Preallocates the offset_list, but doesn't make the contents longer. */
722 static int
723 grow_offset_list (struct offset_list *list, size_t alloc)
724 {
725   assert (alloc >= list->len);
726   size_t *p = realloc (list->offsets, alloc * sizeof (size_t));
727   if (p == NULL)
728     return -1;
729   list->offsets = p;
730   list->alloc = alloc;
731   return 0;
732 }
733
734 static int
735 add_to_offset_list (struct offset_list *list, size_t offset)
736 {
737   if (list->len >= list->alloc) {
738     if (grow_offset_list (list, list->alloc ? list->alloc * 2 : 4) == -1)
739       return -1;
740   }
741   list->offsets[list->len] = offset;
742   list->len++;
743   return 0;
744 }
745
746 static void
747 free_offset_list (struct offset_list *list)
748 {
749   free (list->offsets);
750 }
751
752 static size_t *
753 return_offset_list (struct offset_list *list)
754 {
755   if (add_to_offset_list (list, 0) == -1)
756     return NULL;
757   return list->offsets;         /* caller frees */
758 }
759
760 /* Iterate over children, returning child nodes and intermediate blocks. */
761 #define GET_CHILDREN_NO_CHECK_NK 1
762
763 static int
764 get_children (hive_h *h, hive_node_h node,
765               hive_node_h **children_ret, size_t **blocks_ret,
766               int flags)
767 {
768   if (!IS_VALID_BLOCK (h, node) || !BLOCK_ID_EQ (h, node, "nk")) {
769     errno = EINVAL;
770     return -1;
771   }
772
773   struct ntreg_nk_record *nk = (struct ntreg_nk_record *) (h->addr + node);
774
775   size_t nr_subkeys_in_nk = le32toh (nk->nr_subkeys);
776
777   INIT_OFFSET_LIST (children);
778   INIT_OFFSET_LIST (blocks);
779
780   /* Deal with the common "no subkeys" case quickly. */
781   if (nr_subkeys_in_nk == 0)
782     goto ok;
783
784   /* Arbitrarily limit the number of subkeys we will ever deal with. */
785   if (nr_subkeys_in_nk > HIVEX_MAX_SUBKEYS) {
786     if (h->msglvl >= 2)
787       fprintf (stderr, "hivex: get_children: returning ERANGE because "
788                "nr_subkeys_in_nk > HIVEX_MAX_SUBKEYS (%zu > %d)\n",
789                nr_subkeys_in_nk, HIVEX_MAX_SUBKEYS);
790     errno = ERANGE;
791     goto error;
792   }
793
794   /* Preallocate space for the children. */
795   if (grow_offset_list (&children, nr_subkeys_in_nk) == -1)
796     goto error;
797
798   /* The subkey_lf field can point either to an lf-record, which is
799    * the common case, or if there are lots of subkeys, to an
800    * ri-record.
801    */
802   size_t subkey_lf = le32toh (nk->subkey_lf);
803   subkey_lf += 0x1000;
804   if (!IS_VALID_BLOCK (h, subkey_lf)) {
805     if (h->msglvl >= 2)
806       fprintf (stderr, "hivex_node_children: returning EFAULT"
807                " because subkey_lf is not a valid block (0x%zx)\n",
808                subkey_lf);
809     errno = EFAULT;
810     goto error;
811   }
812
813   if (add_to_offset_list (&blocks, subkey_lf) == -1)
814     goto error;
815
816   struct ntreg_hbin_block *block =
817     (struct ntreg_hbin_block *) (h->addr + subkey_lf);
818
819   /* Points to lf-record?  (Note, also "lh" but that is basically the
820    * same as "lf" as far as we are concerned here).
821    */
822   if (block->id[0] == 'l' && (block->id[1] == 'f' || block->id[1] == 'h')) {
823     struct ntreg_lf_record *lf = (struct ntreg_lf_record *) block;
824
825     /* Check number of subkeys in the nk-record matches number of subkeys
826      * in the lf-record.
827      */
828     size_t nr_subkeys_in_lf = le16toh (lf->nr_keys);
829
830     if (h->msglvl >= 2)
831       fprintf (stderr, "hivex_node_children: nr_subkeys_in_nk = %zu,"
832                " nr_subkeys_in_lf = %zu\n",
833                nr_subkeys_in_nk, nr_subkeys_in_lf);
834
835     if (nr_subkeys_in_nk != nr_subkeys_in_lf) {
836       errno = ENOTSUP;
837       goto error;
838     }
839
840     size_t len = block_len (h, subkey_lf, NULL);
841     if (8 + nr_subkeys_in_lf * 8 > len) {
842       if (h->msglvl >= 2)
843         fprintf (stderr, "hivex_node_children: returning EFAULT"
844                  " because too many subkeys (%zu, %zu)\n",
845                  nr_subkeys_in_lf, len);
846       errno = EFAULT;
847       goto error;
848     }
849
850     size_t i;
851     for (i = 0; i < nr_subkeys_in_lf; ++i) {
852       hive_node_h subkey = le32toh (lf->keys[i].offset);
853       subkey += 0x1000;
854       if (!(flags & GET_CHILDREN_NO_CHECK_NK)) {
855         if (!IS_VALID_BLOCK (h, subkey)) {
856           if (h->msglvl >= 2)
857             fprintf (stderr, "hivex_node_children: returning EFAULT"
858                      " because subkey is not a valid block (0x%zx)\n",
859                      subkey);
860           errno = EFAULT;
861           goto error;
862         }
863       }
864       if (add_to_offset_list (&children, subkey) == -1)
865         goto error;
866     }
867     goto ok;
868   }
869   /* Points to ri-record? */
870   else if (block->id[0] == 'r' && block->id[1] == 'i') {
871     struct ntreg_ri_record *ri = (struct ntreg_ri_record *) block;
872
873     size_t nr_offsets = le16toh (ri->nr_offsets);
874
875     /* Count total number of children. */
876     size_t i, count = 0;
877     for (i = 0; i < nr_offsets; ++i) {
878       hive_node_h offset = le32toh (ri->offset[i]);
879       offset += 0x1000;
880       if (!IS_VALID_BLOCK (h, offset)) {
881         if (h->msglvl >= 2)
882           fprintf (stderr, "hivex_node_children: returning EFAULT"
883                    " because ri-offset is not a valid block (0x%zx)\n",
884                    offset);
885         errno = EFAULT;
886         goto error;
887       }
888       if (!BLOCK_ID_EQ (h, offset, "lf") && !BLOCK_ID_EQ (h, offset, "lh")) {
889         if (h->msglvl >= 2)
890           fprintf (stderr, "get_children: returning ENOTSUP"
891                    " because ri-record offset does not point to lf/lh (0x%zx)\n",
892                    offset);
893         errno = ENOTSUP;
894         goto error;
895       }
896
897       if (add_to_offset_list (&blocks, offset) == -1)
898         goto error;
899
900       struct ntreg_lf_record *lf =
901         (struct ntreg_lf_record *) (h->addr + offset);
902
903       count += le16toh (lf->nr_keys);
904     }
905
906     if (h->msglvl >= 2)
907       fprintf (stderr, "hivex_node_children: nr_subkeys_in_nk = %zu,"
908                " counted = %zu\n",
909                nr_subkeys_in_nk, count);
910
911     if (nr_subkeys_in_nk != count) {
912       errno = ENOTSUP;
913       goto error;
914     }
915
916     /* Copy list of children.  Note nr_subkeys_in_nk is limited to
917      * something reasonable above.
918      */
919     for (i = 0; i < nr_offsets; ++i) {
920       hive_node_h offset = le32toh (ri->offset[i]);
921       offset += 0x1000;
922       if (!IS_VALID_BLOCK (h, offset)) {
923         if (h->msglvl >= 2)
924           fprintf (stderr, "hivex_node_children: returning EFAULT"
925                    " because ri-offset is not a valid block (0x%zx)\n",
926                    offset);
927         errno = EFAULT;
928         goto error;
929       }
930       if (!BLOCK_ID_EQ (h, offset, "lf") && !BLOCK_ID_EQ (h, offset, "lh")) {
931         if (h->msglvl >= 2)
932           fprintf (stderr, "get_children: returning ENOTSUP"
933                    " because ri-record offset does not point to lf/lh (0x%zx)\n",
934                    offset);
935         errno = ENOTSUP;
936         goto error;
937       }
938
939       struct ntreg_lf_record *lf =
940         (struct ntreg_lf_record *) (h->addr + offset);
941
942       size_t j;
943       for (j = 0; j < le16toh (lf->nr_keys); ++j) {
944         hive_node_h subkey = le32toh (lf->keys[j].offset);
945         subkey += 0x1000;
946         if (!(flags & GET_CHILDREN_NO_CHECK_NK)) {
947           if (!IS_VALID_BLOCK (h, subkey)) {
948             if (h->msglvl >= 2)
949               fprintf (stderr, "hivex_node_children: returning EFAULT"
950                        " because indirect subkey is not a valid block (0x%zx)\n",
951                        subkey);
952             errno = EFAULT;
953             goto error;
954           }
955         }
956         if (add_to_offset_list (&children, subkey) == -1)
957           goto error;
958       }
959     }
960     goto ok;
961   }
962   /* else not supported, set errno and fall through */
963   if (h->msglvl >= 2)
964     fprintf (stderr, "get_children: returning ENOTSUP"
965              " because subkey block is not lf/lh/ri (0x%zx, %d, %d)\n",
966              subkey_lf, block->id[0], block->id[1]);
967   errno = ENOTSUP;
968  error:
969   free_offset_list (&children);
970   free_offset_list (&blocks);
971   return -1;
972
973  ok:
974   *children_ret = return_offset_list (&children);
975   *blocks_ret = return_offset_list (&blocks);
976   if (!*children_ret || !*blocks_ret)
977     goto error;
978   return 0;
979 }
980
981 hive_node_h *
982 hivex_node_children (hive_h *h, hive_node_h node)
983 {
984   hive_node_h *children;
985   size_t *blocks;
986
987   if (get_children (h, node, &children, &blocks, 0) == -1)
988     return NULL;
989
990   free (blocks);
991   return children;
992 }
993
994 /* Very inefficient, but at least having a separate API call
995  * allows us to make it more efficient in future.
996  */
997 hive_node_h
998 hivex_node_get_child (hive_h *h, hive_node_h node, const char *nname)
999 {
1000   hive_node_h *children = NULL;
1001   char *name = NULL;
1002   hive_node_h ret = 0;
1003
1004   children = hivex_node_children (h, node);
1005   if (!children) goto error;
1006
1007   size_t i;
1008   for (i = 0; children[i] != 0; ++i) {
1009     name = hivex_node_name (h, children[i]);
1010     if (!name) goto error;
1011     if (STRCASEEQ (name, nname)) {
1012       ret = children[i];
1013       break;
1014     }
1015     free (name); name = NULL;
1016   }
1017
1018  error:
1019   free (children);
1020   free (name);
1021   return ret;
1022 }
1023
1024 hive_node_h
1025 hivex_node_parent (hive_h *h, hive_node_h node)
1026 {
1027   if (!IS_VALID_BLOCK (h, node) || !BLOCK_ID_EQ (h, node, "nk")) {
1028     errno = EINVAL;
1029     return 0;
1030   }
1031
1032   struct ntreg_nk_record *nk = (struct ntreg_nk_record *) (h->addr + node);
1033
1034   hive_node_h ret = le32toh (nk->parent);
1035   ret += 0x1000;
1036   if (!IS_VALID_BLOCK (h, ret)) {
1037     if (h->msglvl >= 2)
1038       fprintf (stderr, "hivex_node_parent: returning EFAULT"
1039                " because parent is not a valid block (0x%zx)\n",
1040               ret);
1041     errno = EFAULT;
1042     return 0;
1043   }
1044   return ret;
1045 }
1046
1047 static int
1048 get_values (hive_h *h, hive_node_h node,
1049             hive_value_h **values_ret, size_t **blocks_ret)
1050 {
1051   if (!IS_VALID_BLOCK (h, node) || !BLOCK_ID_EQ (h, node, "nk")) {
1052     errno = EINVAL;
1053     return -1;
1054   }
1055
1056   struct ntreg_nk_record *nk = (struct ntreg_nk_record *) (h->addr + node);
1057
1058   size_t nr_values = le32toh (nk->nr_values);
1059
1060   if (h->msglvl >= 2)
1061     fprintf (stderr, "hivex_node_values: nr_values = %zu\n", nr_values);
1062
1063   INIT_OFFSET_LIST (values);
1064   INIT_OFFSET_LIST (blocks);
1065
1066   /* Deal with the common "no values" case quickly. */
1067   if (nr_values == 0)
1068     goto ok;
1069
1070   /* Arbitrarily limit the number of values we will ever deal with. */
1071   if (nr_values > HIVEX_MAX_VALUES) {
1072     if (h->msglvl >= 2)
1073       fprintf (stderr, "hivex: get_values: returning ERANGE"
1074                " because nr_values > HIVEX_MAX_VALUES (%zu > %d)\n",
1075                nr_values, HIVEX_MAX_VALUES);
1076     errno = ERANGE;
1077     goto error;
1078   }
1079
1080   /* Preallocate space for the values. */
1081   if (grow_offset_list (&values, nr_values) == -1)
1082     goto error;
1083
1084   /* Get the value list and check it looks reasonable. */
1085   size_t vlist_offset = le32toh (nk->vallist);
1086   vlist_offset += 0x1000;
1087   if (!IS_VALID_BLOCK (h, vlist_offset)) {
1088     if (h->msglvl >= 2)
1089       fprintf (stderr, "hivex_node_values: returning EFAULT"
1090                " because value list is not a valid block (0x%zx)\n",
1091                vlist_offset);
1092     errno = EFAULT;
1093     goto error;
1094   }
1095
1096   if (add_to_offset_list (&blocks, vlist_offset) == -1)
1097     goto error;
1098
1099   struct ntreg_value_list *vlist =
1100     (struct ntreg_value_list *) (h->addr + vlist_offset);
1101
1102   size_t len = block_len (h, vlist_offset, NULL);
1103   if (4 + nr_values * 4 > len) {
1104     if (h->msglvl >= 2)
1105       fprintf (stderr, "hivex_node_values: returning EFAULT"
1106                " because value list is too long (%zu, %zu)\n",
1107                nr_values, len);
1108     errno = EFAULT;
1109     goto error;
1110   }
1111
1112   size_t i;
1113   for (i = 0; i < nr_values; ++i) {
1114     hive_node_h value = le32toh (vlist->offset[i]);
1115     value += 0x1000;
1116     if (!IS_VALID_BLOCK (h, value)) {
1117       if (h->msglvl >= 2)
1118         fprintf (stderr, "hivex_node_values: returning EFAULT"
1119                  " because value is not a valid block (0x%zx)\n",
1120                  value);
1121       errno = EFAULT;
1122       goto error;
1123     }
1124     if (add_to_offset_list (&values, value) == -1)
1125       goto error;
1126   }
1127
1128  ok:
1129   *values_ret = return_offset_list (&values);
1130   *blocks_ret = return_offset_list (&blocks);
1131   if (!*values_ret || !*blocks_ret)
1132     goto error;
1133   return 0;
1134
1135  error:
1136   free_offset_list (&values);
1137   free_offset_list (&blocks);
1138   return -1;
1139 }
1140
1141 hive_value_h *
1142 hivex_node_values (hive_h *h, hive_node_h node)
1143 {
1144   hive_value_h *values;
1145   size_t *blocks;
1146
1147   if (get_values (h, node, &values, &blocks) == -1)
1148     return NULL;
1149
1150   free (blocks);
1151   return values;
1152 }
1153
1154 /* Very inefficient, but at least having a separate API call
1155  * allows us to make it more efficient in future.
1156  */
1157 hive_value_h
1158 hivex_node_get_value (hive_h *h, hive_node_h node, const char *key)
1159 {
1160   hive_value_h *values = NULL;
1161   char *name = NULL;
1162   hive_value_h ret = 0;
1163
1164   values = hivex_node_values (h, node);
1165   if (!values) goto error;
1166
1167   size_t i;
1168   for (i = 0; values[i] != 0; ++i) {
1169     name = hivex_value_key (h, values[i]);
1170     if (!name) goto error;
1171     if (STRCASEEQ (name, key)) {
1172       ret = values[i];
1173       break;
1174     }
1175     free (name); name = NULL;
1176   }
1177
1178  error:
1179   free (values);
1180   free (name);
1181   return ret;
1182 }
1183
1184 char *
1185 hivex_value_key (hive_h *h, hive_value_h value)
1186 {
1187   if (!IS_VALID_BLOCK (h, value) || !BLOCK_ID_EQ (h, value, "vk")) {
1188     errno = EINVAL;
1189     return 0;
1190   }
1191
1192   struct ntreg_vk_record *vk = (struct ntreg_vk_record *) (h->addr + value);
1193
1194   /* AFAIK the key is always plain ASCII, so no conversion to UTF-8 is
1195    * necessary.  However we do need to nul-terminate the string.
1196    */
1197
1198   /* vk->name_len is unsigned, 16 bit, so this is safe ...  However
1199    * we have to make sure the length doesn't exceed the block length.
1200    */
1201   size_t len = le16toh (vk->name_len);
1202   size_t seg_len = block_len (h, value, NULL);
1203   if (sizeof (struct ntreg_vk_record) + len - 1 > seg_len) {
1204     if (h->msglvl >= 2)
1205       fprintf (stderr, "hivex_value_key: returning EFAULT"
1206                " because key length is too long (%zu, %zu)\n",
1207                len, seg_len);
1208     errno = EFAULT;
1209     return NULL;
1210   }
1211
1212   char *ret = malloc (len + 1);
1213   if (ret == NULL)
1214     return NULL;
1215   memcpy (ret, vk->name, len);
1216   ret[len] = '\0';
1217   return ret;
1218 }
1219
1220 int
1221 hivex_value_type (hive_h *h, hive_value_h value, hive_type *t, size_t *len)
1222 {
1223   if (!IS_VALID_BLOCK (h, value) || !BLOCK_ID_EQ (h, value, "vk")) {
1224     errno = EINVAL;
1225     return -1;
1226   }
1227
1228   struct ntreg_vk_record *vk = (struct ntreg_vk_record *) (h->addr + value);
1229
1230   if (t)
1231     *t = le32toh (vk->data_type);
1232
1233   if (len) {
1234     *len = le32toh (vk->data_len);
1235     *len &= 0x7fffffff;         /* top bit indicates if data is stored inline */
1236   }
1237
1238   return 0;
1239 }
1240
1241 char *
1242 hivex_value_value (hive_h *h, hive_value_h value,
1243                    hive_type *t_rtn, size_t *len_rtn)
1244 {
1245   if (!IS_VALID_BLOCK (h, value) || !BLOCK_ID_EQ (h, value, "vk")) {
1246     errno = EINVAL;
1247     return NULL;
1248   }
1249
1250   struct ntreg_vk_record *vk = (struct ntreg_vk_record *) (h->addr + value);
1251
1252   hive_type t;
1253   size_t len;
1254   int is_inline;
1255
1256   t = le32toh (vk->data_type);
1257
1258   len = le32toh (vk->data_len);
1259   is_inline = !!(len & 0x80000000);
1260   len &= 0x7fffffff;
1261
1262   if (h->msglvl >= 2)
1263     fprintf (stderr, "hivex_value_value: value=0x%zx, t=%d, len=%zu, inline=%d\n",
1264              value, t, len, is_inline);
1265
1266   if (t_rtn)
1267     *t_rtn = t;
1268   if (len_rtn)
1269     *len_rtn = len;
1270
1271   if (is_inline && len > 4) {
1272     errno = ENOTSUP;
1273     return NULL;
1274   }
1275
1276   /* Arbitrarily limit the length that we will read. */
1277   if (len > HIVEX_MAX_VALUE_LEN) {
1278     if (h->msglvl >= 2)
1279       fprintf (stderr, "hivex_value_value: returning ERANGE because data "
1280                "length > HIVEX_MAX_VALUE_LEN (%zu > %d)\n",
1281                len, HIVEX_MAX_SUBKEYS);
1282     errno = ERANGE;
1283     return NULL;
1284   }
1285
1286   char *ret = malloc (len);
1287   if (ret == NULL)
1288     return NULL;
1289
1290   if (is_inline) {
1291     memcpy (ret, (char *) &vk->data_offset, len);
1292     return ret;
1293   }
1294
1295   size_t data_offset = le32toh (vk->data_offset);
1296   data_offset += 0x1000;
1297   if (!IS_VALID_BLOCK (h, data_offset)) {
1298     if (h->msglvl >= 2)
1299       fprintf (stderr, "hivex_value_value: returning EFAULT because data "
1300                "offset is not a valid block (0x%zx)\n",
1301                data_offset);
1302     errno = EFAULT;
1303     free (ret);
1304     return NULL;
1305   }
1306
1307   /* Check that the declared size isn't larger than the block its in.
1308    *
1309    * XXX Some apparently valid registries are seen to have this,
1310    * so turn this into a warning and substitute the smaller length
1311    * instead.
1312    */
1313   size_t blen = block_len (h, data_offset, NULL);
1314   if (len > blen - 4 /* subtract 4 for block header */) {
1315     if (h->msglvl >= 2)
1316       fprintf (stderr, "hivex_value_value: warning: declared data length "
1317                "is longer than the block it is in "
1318                "(data 0x%zx, data len %zu, block len %zu)\n",
1319                data_offset, len, blen);
1320     len = blen - 4;
1321
1322     /* Return the smaller length to the caller too. */
1323     if (len_rtn)
1324       *len_rtn = len;
1325   }
1326
1327   char *data = h->addr + data_offset + 4;
1328   memcpy (ret, data, len);
1329   return ret;
1330 }
1331
1332 static char *
1333 windows_utf16_to_utf8 (/* const */ char *input, size_t len)
1334 {
1335   iconv_t ic = iconv_open ("UTF-8", "UTF-16");
1336   if (ic == (iconv_t) -1)
1337     return NULL;
1338
1339   /* iconv(3) has an insane interface ... */
1340
1341   /* Mostly UTF-8 will be smaller, so this is a good initial guess. */
1342   size_t outalloc = len;
1343
1344  again:;
1345   size_t inlen = len;
1346   size_t outlen = outalloc;
1347   char *out = malloc (outlen + 1);
1348   if (out == NULL) {
1349     int err = errno;
1350     iconv_close (ic);
1351     errno = err;
1352     return NULL;
1353   }
1354   char *inp = input;
1355   char *outp = out;
1356
1357   size_t r = iconv (ic, &inp, &inlen, &outp, &outlen);
1358   if (r == (size_t) -1) {
1359     if (errno == E2BIG) {
1360       int err = errno;
1361       size_t prev = outalloc;
1362       /* Try again with a larger output buffer. */
1363       free (out);
1364       outalloc *= 2;
1365       if (outalloc < prev) {
1366         iconv_close (ic);
1367         errno = err;
1368         return NULL;
1369       }
1370       goto again;
1371     }
1372     else {
1373       /* Else some conversion failure, eg. EILSEQ, EINVAL. */
1374       int err = errno;
1375       iconv_close (ic);
1376       free (out);
1377       errno = err;
1378       return NULL;
1379     }
1380   }
1381
1382   *outp = '\0';
1383   iconv_close (ic);
1384
1385   return out;
1386 }
1387
1388 char *
1389 hivex_value_string (hive_h *h, hive_value_h value)
1390 {
1391   hive_type t;
1392   size_t len;
1393   char *data = hivex_value_value (h, value, &t, &len);
1394
1395   if (data == NULL)
1396     return NULL;
1397
1398   if (t != hive_t_string && t != hive_t_expand_string && t != hive_t_link) {
1399     free (data);
1400     errno = EINVAL;
1401     return NULL;
1402   }
1403
1404   /* Deal with the case where Windows has allocated a large buffer
1405    * full of random junk, and only the first few bytes of the buffer
1406    * contain a genuine UTF-16 string.
1407    *
1408    * In this case, iconv would try to process the junk bytes as UTF-16
1409    * and inevitably find an illegal sequence (EILSEQ).  Instead, stop
1410    * after we find the first \0\0.
1411    *
1412    * (Found by Hilko Bengen in a fresh Windows XP SOFTWARE hive).
1413    */
1414   size_t slen = utf16_string_len_in_bytes_max (data, len);
1415   if (slen < len)
1416     len = slen;
1417
1418   char *ret = windows_utf16_to_utf8 (data, len);
1419   free (data);
1420   if (ret == NULL)
1421     return NULL;
1422
1423   return ret;
1424 }
1425
1426 static void
1427 free_strings (char **argv)
1428 {
1429   if (argv) {
1430     size_t i;
1431
1432     for (i = 0; argv[i] != NULL; ++i)
1433       free (argv[i]);
1434     free (argv);
1435   }
1436 }
1437
1438 /* Get the length of a UTF-16 format string.  Handle the string as
1439  * pairs of bytes, looking for the first \0\0 pair.  Only read up to
1440  * 'len' maximum bytes.
1441  */
1442 static size_t
1443 utf16_string_len_in_bytes_max (const char *str, size_t len)
1444 {
1445   size_t ret = 0;
1446
1447   while (len >= 2 && (str[0] || str[1])) {
1448     str += 2;
1449     ret += 2;
1450     len -= 2;
1451   }
1452
1453   return ret;
1454 }
1455
1456 /* http://blogs.msdn.com/oldnewthing/archive/2009/10/08/9904646.aspx */
1457 char **
1458 hivex_value_multiple_strings (hive_h *h, hive_value_h value)
1459 {
1460   hive_type t;
1461   size_t len;
1462   char *data = hivex_value_value (h, value, &t, &len);
1463
1464   if (data == NULL)
1465     return NULL;
1466
1467   if (t != hive_t_multiple_strings) {
1468     free (data);
1469     errno = EINVAL;
1470     return NULL;
1471   }
1472
1473   size_t nr_strings = 0;
1474   char **ret = malloc ((1 + nr_strings) * sizeof (char *));
1475   if (ret == NULL) {
1476     free (data);
1477     return NULL;
1478   }
1479   ret[0] = NULL;
1480
1481   char *p = data;
1482   size_t plen;
1483
1484   while (p < data + len &&
1485          (plen = utf16_string_len_in_bytes_max (p, data + len - p)) > 0) {
1486     nr_strings++;
1487     char **ret2 = realloc (ret, (1 + nr_strings) * sizeof (char *));
1488     if (ret2 == NULL) {
1489       free_strings (ret);
1490       free (data);
1491       return NULL;
1492     }
1493     ret = ret2;
1494
1495     ret[nr_strings-1] = windows_utf16_to_utf8 (p, plen);
1496     ret[nr_strings] = NULL;
1497     if (ret[nr_strings-1] == NULL) {
1498       free_strings (ret);
1499       free (data);
1500       return NULL;
1501     }
1502
1503     p += plen + 2 /* skip over UTF-16 \0\0 at the end of this string */;
1504   }
1505
1506   free (data);
1507   return ret;
1508 }
1509
1510 int32_t
1511 hivex_value_dword (hive_h *h, hive_value_h value)
1512 {
1513   hive_type t;
1514   size_t len;
1515   char *data = hivex_value_value (h, value, &t, &len);
1516
1517   if (data == NULL)
1518     return -1;
1519
1520   if ((t != hive_t_dword && t != hive_t_dword_be) || len != 4) {
1521     free (data);
1522     errno = EINVAL;
1523     return -1;
1524   }
1525
1526   int32_t ret = *(int32_t*)data;
1527   free (data);
1528   if (t == hive_t_dword)        /* little endian */
1529     ret = le32toh (ret);
1530   else
1531     ret = be32toh (ret);
1532
1533   return ret;
1534 }
1535
1536 int64_t
1537 hivex_value_qword (hive_h *h, hive_value_h value)
1538 {
1539   hive_type t;
1540   size_t len;
1541   char *data = hivex_value_value (h, value, &t, &len);
1542
1543   if (data == NULL)
1544     return -1;
1545
1546   if (t != hive_t_qword || len != 8) {
1547     free (data);
1548     errno = EINVAL;
1549     return -1;
1550   }
1551
1552   int64_t ret = *(int64_t*)data;
1553   free (data);
1554   ret = le64toh (ret);          /* always little endian */
1555
1556   return ret;
1557 }
1558
1559 /*----------------------------------------------------------------------
1560  * Visiting.
1561  */
1562
1563 int
1564 hivex_visit (hive_h *h, const struct hivex_visitor *visitor, size_t len,
1565              void *opaque, int flags)
1566 {
1567   return hivex_visit_node (h, hivex_root (h), visitor, len, opaque, flags);
1568 }
1569
1570 static int hivex__visit_node (hive_h *h, hive_node_h node,
1571                               const struct hivex_visitor *vtor,
1572                               char *unvisited, void *opaque, int flags);
1573
1574 int
1575 hivex_visit_node (hive_h *h, hive_node_h node,
1576                   const struct hivex_visitor *visitor, size_t len, void *opaque,
1577                   int flags)
1578 {
1579   struct hivex_visitor vtor;
1580   memset (&vtor, 0, sizeof vtor);
1581
1582   /* Note that len might be larger *or smaller* than the expected size. */
1583   size_t copysize = len <= sizeof vtor ? len : sizeof vtor;
1584   memcpy (&vtor, visitor, copysize);
1585
1586   /* This bitmap records unvisited nodes, so we don't loop if the
1587    * registry contains cycles.
1588    */
1589   char *unvisited = malloc (1 + h->size / 32);
1590   if (unvisited == NULL)
1591     return -1;
1592   memcpy (unvisited, h->bitmap, 1 + h->size / 32);
1593
1594   int r = hivex__visit_node (h, node, &vtor, unvisited, opaque, flags);
1595   free (unvisited);
1596   return r;
1597 }
1598
1599 static int
1600 hivex__visit_node (hive_h *h, hive_node_h node,
1601                    const struct hivex_visitor *vtor, char *unvisited,
1602                    void *opaque, int flags)
1603 {
1604   int skip_bad = flags & HIVEX_VISIT_SKIP_BAD;
1605   char *name = NULL;
1606   hive_value_h *values = NULL;
1607   hive_node_h *children = NULL;
1608   char *key = NULL;
1609   char *str = NULL;
1610   char **strs = NULL;
1611   int i;
1612
1613   /* Return -1 on all callback errors.  However on internal errors,
1614    * check if skip_bad is set and suppress those errors if so.
1615    */
1616   int ret = -1;
1617
1618   if (!BITMAP_TST (unvisited, node)) {
1619     if (h->msglvl >= 2)
1620       fprintf (stderr, "hivex__visit_node: contains cycle:"
1621                " visited node 0x%zx already\n",
1622                node);
1623
1624     errno = ELOOP;
1625     return skip_bad ? 0 : -1;
1626   }
1627   BITMAP_CLR (unvisited, node);
1628
1629   name = hivex_node_name (h, node);
1630   if (!name) return skip_bad ? 0 : -1;
1631   if (vtor->node_start && vtor->node_start (h, opaque, node, name) == -1)
1632     goto error;
1633
1634   values = hivex_node_values (h, node);
1635   if (!values) {
1636     ret = skip_bad ? 0 : -1;
1637     goto error;
1638   }
1639
1640   for (i = 0; values[i] != 0; ++i) {
1641     hive_type t;
1642     size_t len;
1643
1644     if (hivex_value_type (h, values[i], &t, &len) == -1) {
1645       ret = skip_bad ? 0 : -1;
1646       goto error;
1647     }
1648
1649     key = hivex_value_key (h, values[i]);
1650     if (key == NULL) {
1651       ret = skip_bad ? 0 : -1;
1652       goto error;
1653     }
1654
1655     if (vtor->value_any) {
1656       str = hivex_value_value (h, values[i], &t, &len);
1657       if (str == NULL) {
1658         ret = skip_bad ? 0 : -1;
1659         goto error;
1660       }
1661       if (vtor->value_any (h, opaque, node, values[i], t, len, key, str) == -1)
1662         goto error;
1663       free (str); str = NULL;
1664     }
1665     else {
1666       switch (t) {
1667       case hive_t_none:
1668         str = hivex_value_value (h, values[i], &t, &len);
1669         if (str == NULL) {
1670           ret = skip_bad ? 0 : -1;
1671           goto error;
1672         }
1673         if (t != hive_t_none) {
1674           ret = skip_bad ? 0 : -1;
1675           goto error;
1676         }
1677         if (vtor->value_none &&
1678             vtor->value_none (h, opaque, node, values[i], t, len, key, str) == -1)
1679           goto error;
1680         free (str); str = NULL;
1681         break;
1682
1683       case hive_t_string:
1684       case hive_t_expand_string:
1685       case hive_t_link:
1686         str = hivex_value_string (h, values[i]);
1687         if (str == NULL) {
1688           if (errno != EILSEQ && errno != EINVAL) {
1689             ret = skip_bad ? 0 : -1;
1690             goto error;
1691           }
1692           if (vtor->value_string_invalid_utf16) {
1693             str = hivex_value_value (h, values[i], &t, &len);
1694             if (vtor->value_string_invalid_utf16 (h, opaque, node, values[i],
1695                                                   t, len, key, str) == -1)
1696               goto error;
1697             free (str); str = NULL;
1698           }
1699           break;
1700         }
1701         if (vtor->value_string &&
1702             vtor->value_string (h, opaque, node, values[i],
1703                                 t, len, key, str) == -1)
1704           goto error;
1705         free (str); str = NULL;
1706         break;
1707
1708       case hive_t_dword:
1709       case hive_t_dword_be: {
1710         int32_t i32 = hivex_value_dword (h, values[i]);
1711         if (vtor->value_dword &&
1712             vtor->value_dword (h, opaque, node, values[i],
1713                                t, len, key, i32) == -1)
1714           goto error;
1715         break;
1716       }
1717
1718       case hive_t_qword: {
1719         int64_t i64 = hivex_value_qword (h, values[i]);
1720         if (vtor->value_qword &&
1721             vtor->value_qword (h, opaque, node, values[i],
1722                                t, len, key, i64) == -1)
1723           goto error;
1724         break;
1725       }
1726
1727       case hive_t_binary:
1728         str = hivex_value_value (h, values[i], &t, &len);
1729         if (str == NULL) {
1730           ret = skip_bad ? 0 : -1;
1731           goto error;
1732         }
1733         if (t != hive_t_binary) {
1734           ret = skip_bad ? 0 : -1;
1735           goto error;
1736         }
1737         if (vtor->value_binary &&
1738             vtor->value_binary (h, opaque, node, values[i],
1739                                 t, len, key, str) == -1)
1740           goto error;
1741         free (str); str = NULL;
1742         break;
1743
1744       case hive_t_multiple_strings:
1745         strs = hivex_value_multiple_strings (h, values[i]);
1746         if (strs == NULL) {
1747           if (errno != EILSEQ && errno != EINVAL) {
1748             ret = skip_bad ? 0 : -1;
1749             goto error;
1750           }
1751           if (vtor->value_string_invalid_utf16) {
1752             str = hivex_value_value (h, values[i], &t, &len);
1753             if (vtor->value_string_invalid_utf16 (h, opaque, node, values[i],
1754                                                   t, len, key, str) == -1)
1755               goto error;
1756             free (str); str = NULL;
1757           }
1758           break;
1759         }
1760         if (vtor->value_multiple_strings &&
1761             vtor->value_multiple_strings (h, opaque, node, values[i],
1762                                           t, len, key, strs) == -1)
1763           goto error;
1764         free_strings (strs); strs = NULL;
1765         break;
1766
1767       case hive_t_resource_list:
1768       case hive_t_full_resource_description:
1769       case hive_t_resource_requirements_list:
1770       default:
1771         str = hivex_value_value (h, values[i], &t, &len);
1772         if (str == NULL) {
1773           ret = skip_bad ? 0 : -1;
1774           goto error;
1775         }
1776         if (vtor->value_other &&
1777             vtor->value_other (h, opaque, node, values[i],
1778                                t, len, key, str) == -1)
1779           goto error;
1780         free (str); str = NULL;
1781         break;
1782       }
1783     }
1784
1785     free (key); key = NULL;
1786   }
1787
1788   children = hivex_node_children (h, node);
1789   if (children == NULL) {
1790     ret = skip_bad ? 0 : -1;
1791     goto error;
1792   }
1793
1794   for (i = 0; children[i] != 0; ++i) {
1795     if (h->msglvl >= 2)
1796       fprintf (stderr, "hivex__visit_node: %s: visiting subkey %d (0x%zx)\n",
1797                name, i, children[i]);
1798
1799     if (hivex__visit_node (h, children[i], vtor, unvisited, opaque, flags) == -1)
1800       goto error;
1801   }
1802
1803   if (vtor->node_end && vtor->node_end (h, opaque, node, name) == -1)
1804     goto error;
1805
1806   ret = 0;
1807
1808  error:
1809   free (name);
1810   free (values);
1811   free (children);
1812   free (key);
1813   free (str);
1814   free_strings (strs);
1815   return ret;
1816 }
1817
1818 /*----------------------------------------------------------------------
1819  * Writing.
1820  */
1821
1822 /* Allocate an hbin (page), extending the malloc'd space if necessary,
1823  * and updating the hive handle fields (but NOT the hive disk header
1824  * -- the hive disk header is updated when we commit).  This function
1825  * also extends the bitmap if necessary.
1826  *
1827  * 'allocation_hint' is the size of the block allocation we would like
1828  * to make.  Normally registry blocks are very small (avg 50 bytes)
1829  * and are contained in standard-sized pages (4KB), but the registry
1830  * can support blocks which are larger than a standard page, in which
1831  * case it creates a page of 8KB, 12KB etc.
1832  *
1833  * Returns:
1834  * > 0 : offset of first usable byte of new page (after page header)
1835  * 0   : error (errno set)
1836  */
1837 static size_t
1838 allocate_page (hive_h *h, size_t allocation_hint)
1839 {
1840   /* In almost all cases this will be 1. */
1841   size_t nr_4k_pages =
1842     1 + (allocation_hint + sizeof (struct ntreg_hbin_page) - 1) / 4096;
1843   assert (nr_4k_pages >= 1);
1844
1845   /* 'extend' is the number of bytes to extend the file by.  Note that
1846    * hives found in the wild often contain slack between 'endpages'
1847    * and the actual end of the file, so we don't always need to make
1848    * the file larger.
1849    */
1850   ssize_t extend = h->endpages + nr_4k_pages * 4096 - h->size;
1851
1852   if (h->msglvl >= 2) {
1853     fprintf (stderr, "allocate_page: current endpages = 0x%zx,"
1854              " current size = 0x%zx\n",
1855              h->endpages, h->size);
1856     fprintf (stderr, "allocate_page: extending file by %zd bytes"
1857              " (<= 0 if no extension)\n",
1858              extend);
1859   }
1860
1861   if (extend > 0) {
1862     size_t oldsize = h->size;
1863     size_t newsize = h->size + extend;
1864     char *newaddr = realloc (h->addr, newsize);
1865     if (newaddr == NULL)
1866       return 0;
1867
1868     size_t oldbitmapsize = 1 + oldsize / 32;
1869     size_t newbitmapsize = 1 + newsize / 32;
1870     char *newbitmap = realloc (h->bitmap, newbitmapsize);
1871     if (newbitmap == NULL) {
1872       free (newaddr);
1873       return 0;
1874     }
1875
1876     h->addr = newaddr;
1877     h->size = newsize;
1878     h->bitmap = newbitmap;
1879
1880     memset (h->addr + oldsize, 0, newsize - oldsize);
1881     memset (h->bitmap + oldbitmapsize, 0, newbitmapsize - oldbitmapsize);
1882   }
1883
1884   size_t offset = h->endpages;
1885   h->endpages += nr_4k_pages * 4096;
1886
1887   if (h->msglvl >= 2)
1888     fprintf (stderr, "allocate_page: new endpages = 0x%zx, new size = 0x%zx\n",
1889              h->endpages, h->size);
1890
1891   /* Write the hbin header. */
1892   struct ntreg_hbin_page *page =
1893     (struct ntreg_hbin_page *) (h->addr + offset);
1894   page->magic[0] = 'h';
1895   page->magic[1] = 'b';
1896   page->magic[2] = 'i';
1897   page->magic[3] = 'n';
1898   page->offset_first = htole32 (offset - 0x1000);
1899   page->page_size = htole32 (nr_4k_pages * 4096);
1900   memset (page->unknown, 0, sizeof (page->unknown));
1901
1902   if (h->msglvl >= 2)
1903     fprintf (stderr, "allocate_page: new page at 0x%zx\n", offset);
1904
1905   /* Offset of first usable byte after the header. */
1906   return offset + sizeof (struct ntreg_hbin_page);
1907 }
1908
1909 /* Allocate a single block, first allocating an hbin (page) at the end
1910  * of the current file if necessary.  NB. To keep the implementation
1911  * simple and more likely to be correct, we do not reuse existing free
1912  * blocks.
1913  *
1914  * seg_len is the size of the block (this INCLUDES the block header).
1915  * The header of the block is initialized to -seg_len (negative to
1916  * indicate used).  id[2] is the block ID (type), eg. "nk" for nk-
1917  * record.  The block bitmap is updated to show this block as valid.
1918  * The rest of the contents of the block will be zero.
1919  *
1920  * **NB** Because allocate_block may reallocate the memory, all
1921  * pointers into the memory become potentially invalid.  I really
1922  * love writing in C, can't you tell?
1923  *
1924  * Returns:
1925  * > 0 : offset of new block
1926  * 0   : error (errno set)
1927  */
1928 static size_t
1929 allocate_block (hive_h *h, size_t seg_len, const char id[2])
1930 {
1931   if (!h->writable) {
1932     errno = EROFS;
1933     return 0;
1934   }
1935
1936   if (seg_len < 4) {
1937     /* The caller probably forgot to include the header.  Note that
1938      * value lists have no ID field, so seg_len == 4 would be possible
1939      * for them, albeit unusual.
1940      */
1941     if (h->msglvl >= 2)
1942       fprintf (stderr, "allocate_block: refusing too small allocation (%zu),"
1943                " returning ERANGE\n", seg_len);
1944     errno = ERANGE;
1945     return 0;
1946   }
1947
1948   /* Refuse really large allocations. */
1949   if (seg_len > HIVEX_MAX_ALLOCATION) {
1950     if (h->msglvl >= 2)
1951       fprintf (stderr, "allocate_block: refusing large allocation (%zu),"
1952                " returning ERANGE\n", seg_len);
1953     errno = ERANGE;
1954     return 0;
1955   }
1956
1957   /* Round up allocation to multiple of 8 bytes.  All blocks must be
1958    * on an 8 byte boundary.
1959    */
1960   seg_len = (seg_len + 7) & ~7;
1961
1962   /* Allocate a new page if necessary. */
1963   if (h->endblocks == 0 || h->endblocks + seg_len > h->endpages) {
1964     size_t newendblocks = allocate_page (h, seg_len);
1965     if (newendblocks == 0)
1966       return 0;
1967     h->endblocks = newendblocks;
1968   }
1969
1970   size_t offset = h->endblocks;
1971
1972   if (h->msglvl >= 2)
1973     fprintf (stderr, "allocate_block: new block at 0x%zx, size %zu\n",
1974              offset, seg_len);
1975
1976   struct ntreg_hbin_block *blockhdr =
1977     (struct ntreg_hbin_block *) (h->addr + offset);
1978
1979   memset (blockhdr, 0, seg_len);
1980
1981   blockhdr->seg_len = htole32 (- (int32_t) seg_len);
1982   if (id[0] && id[1] && seg_len >= sizeof (struct ntreg_hbin_block)) {
1983     blockhdr->id[0] = id[0];
1984     blockhdr->id[1] = id[1];
1985   }
1986
1987   BITMAP_SET (h->bitmap, offset);
1988
1989   h->endblocks += seg_len;
1990
1991   /* If there is space after the last block in the last page, then we
1992    * have to put a dummy free block header here to mark the rest of
1993    * the page as free.
1994    */
1995   ssize_t rem = h->endpages - h->endblocks;
1996   if (rem > 0) {
1997     if (h->msglvl >= 2)
1998       fprintf (stderr, "allocate_block: marking remainder of page free"
1999                " starting at 0x%zx, size %zd\n", h->endblocks, rem);
2000
2001     assert (rem >= 4);
2002
2003     blockhdr = (struct ntreg_hbin_block *) (h->addr + h->endblocks);
2004     blockhdr->seg_len = htole32 ((int32_t) rem);
2005   }
2006
2007   return offset;
2008 }
2009
2010 /* 'offset' must point to a valid, used block.  This function marks
2011  * the block unused (by updating the seg_len field) and invalidates
2012  * the bitmap.  It does NOT do this recursively, so to avoid creating
2013  * unreachable used blocks, callers may have to recurse over the hive
2014  * structures.  Also callers must ensure there are no references to
2015  * this block from other parts of the hive.
2016  */
2017 static void
2018 mark_block_unused (hive_h *h, size_t offset)
2019 {
2020   assert (h->writable);
2021   assert (IS_VALID_BLOCK (h, offset));
2022
2023   if (h->msglvl >= 2)
2024     fprintf (stderr, "mark_block_unused: marking 0x%zx unused\n", offset);
2025
2026   struct ntreg_hbin_block *blockhdr =
2027     (struct ntreg_hbin_block *) (h->addr + offset);
2028
2029   size_t seg_len = block_len (h, offset, NULL);
2030   blockhdr->seg_len = htole32 (seg_len);
2031
2032   BITMAP_CLR (h->bitmap, offset);
2033 }
2034
2035 /* Delete all existing values at this node. */
2036 static int
2037 delete_values (hive_h *h, hive_node_h node)
2038 {
2039   assert (h->writable);
2040
2041   hive_value_h *values;
2042   size_t *blocks;
2043   if (get_values (h, node, &values, &blocks) == -1)
2044     return -1;
2045
2046   size_t i;
2047   for (i = 0; blocks[i] != 0; ++i)
2048     mark_block_unused (h, blocks[i]);
2049
2050   free (blocks);
2051
2052   for (i = 0; values[i] != 0; ++i) {
2053     struct ntreg_vk_record *vk =
2054       (struct ntreg_vk_record *) (h->addr + values[i]);
2055
2056     size_t len;
2057     int is_inline;
2058     len = le32toh (vk->data_len);
2059     is_inline = !!(len & 0x80000000); /* top bit indicates is inline */
2060     len &= 0x7fffffff;
2061
2062     if (!is_inline) {           /* non-inline, so remove data block */
2063       size_t data_offset = le32toh (vk->data_offset);
2064       data_offset += 0x1000;
2065       mark_block_unused (h, data_offset);
2066     }
2067
2068     /* remove vk record */
2069     mark_block_unused (h, values[i]);
2070   }
2071
2072   free (values);
2073
2074   struct ntreg_nk_record *nk = (struct ntreg_nk_record *) (h->addr + node);
2075   nk->nr_values = htole32 (0);
2076   nk->vallist = htole32 (0xffffffff);
2077
2078   return 0;
2079 }
2080
2081 int
2082 hivex_commit (hive_h *h, const char *filename, int flags)
2083 {
2084   if (flags != 0) {
2085     errno = EINVAL;
2086     return -1;
2087   }
2088
2089   if (!h->writable) {
2090     errno = EROFS;
2091     return -1;
2092   }
2093
2094   filename = filename ? : h->filename;
2095   int fd = open (filename, O_WRONLY|O_CREAT|O_TRUNC|O_NOCTTY, 0666);
2096   if (fd == -1)
2097     return -1;
2098
2099   /* Update the header fields. */
2100   uint32_t sequence = le32toh (h->hdr->sequence1);
2101   sequence++;
2102   h->hdr->sequence1 = htole32 (sequence);
2103   h->hdr->sequence2 = htole32 (sequence);
2104   /* XXX Ought to update h->hdr->last_modified. */
2105   h->hdr->blocks = htole32 (h->endpages - 0x1000);
2106
2107   /* Recompute header checksum. */
2108   uint32_t sum = header_checksum (h);
2109   h->hdr->csum = htole32 (sum);
2110
2111   if (h->msglvl >= 2)
2112     fprintf (stderr, "hivex_commit: new header checksum: 0x%x\n", sum);
2113
2114   if (full_write (fd, h->addr, h->size) != h->size) {
2115     int err = errno;
2116     close (fd);
2117     errno = err;
2118     return -1;
2119   }
2120
2121   if (close (fd) == -1)
2122     return -1;
2123
2124   return 0;
2125 }
2126
2127 /* Calculate the hash for a lf or lh record offset.
2128  */
2129 static void
2130 calc_hash (const char *type, const char *name, char *ret)
2131 {
2132   size_t len = strlen (name);
2133
2134   if (STRPREFIX (type, "lf"))
2135     /* Old-style, not used in current registries. */
2136     memcpy (ret, name, len < 4 ? len : 4);
2137   else {
2138     /* New-style for lh-records. */
2139     size_t i, c;
2140     uint32_t h = 0;
2141     for (i = 0; i < len; ++i) {
2142       c = c_toupper (name[i]);
2143       h *= 37;
2144       h += c;
2145     }
2146     *((uint32_t *) ret) = htole32 (h);
2147   }
2148 }
2149
2150 /* Create a completely new lh-record containing just the single node. */
2151 static size_t
2152 new_lh_record (hive_h *h, const char *name, hive_node_h node)
2153 {
2154   static const char id[2] = { 'l', 'h' };
2155   size_t seg_len = sizeof (struct ntreg_lf_record);
2156   size_t offset = allocate_block (h, seg_len, id);
2157   if (offset == 0)
2158     return 0;
2159
2160   struct ntreg_lf_record *lh = (struct ntreg_lf_record *) (h->addr + offset);
2161   lh->nr_keys = htole16 (1);
2162   lh->keys[0].offset = htole32 (node - 0x1000);
2163   calc_hash ("lh", name, lh->keys[0].hash);
2164
2165   return offset;
2166 }
2167
2168 /* Insert node into existing lf/lh-record at position.
2169  * This allocates a new record and marks the old one as unused.
2170  */
2171 static size_t
2172 insert_lf_record (hive_h *h, size_t old_offs, size_t posn,
2173                   const char *name, hive_node_h node)
2174 {
2175   assert (IS_VALID_BLOCK (h, old_offs));
2176
2177   /* Work around C stupidity.
2178    * http://www.redhat.com/archives/libguestfs/2010-February/msg00056.html
2179    */
2180   int test = BLOCK_ID_EQ (h, old_offs, "lf") || BLOCK_ID_EQ (h, old_offs, "lh");
2181   assert (test);
2182
2183   struct ntreg_lf_record *old_lf =
2184     (struct ntreg_lf_record *) (h->addr + old_offs);
2185   size_t nr_keys = le16toh (old_lf->nr_keys);
2186
2187   nr_keys++; /* in new record ... */
2188
2189   size_t seg_len = sizeof (struct ntreg_lf_record) + (nr_keys-1) * 8;
2190
2191   /* Copy the old_lf->id in case it moves during allocate_block. */
2192   char id[2];
2193   memcpy (id, old_lf->id, sizeof id);
2194
2195   size_t new_offs = allocate_block (h, seg_len, id);
2196   if (new_offs == 0)
2197     return 0;
2198
2199   /* old_lf could have been invalidated by allocate_block. */
2200   old_lf = (struct ntreg_lf_record *) (h->addr + old_offs);
2201
2202   struct ntreg_lf_record *new_lf =
2203     (struct ntreg_lf_record *) (h->addr + new_offs);
2204   new_lf->nr_keys = htole16 (nr_keys);
2205
2206   /* Copy the keys until we reach posn, insert the new key there, then
2207    * copy the remaining keys.
2208    */
2209   size_t i;
2210   for (i = 0; i < posn; ++i)
2211     new_lf->keys[i] = old_lf->keys[i];
2212
2213   new_lf->keys[i].offset = htole32 (node - 0x1000);
2214   calc_hash (new_lf->id, name, new_lf->keys[i].hash);
2215
2216   for (i = posn+1; i < nr_keys; ++i)
2217     new_lf->keys[i] = old_lf->keys[i-1];
2218
2219   /* Old block is unused, return new block. */
2220   mark_block_unused (h, old_offs);
2221   return new_offs;
2222 }
2223
2224 /* Compare name with name in nk-record. */
2225 static int
2226 compare_name_with_nk_name (hive_h *h, const char *name, hive_node_h nk_offs)
2227 {
2228   assert (IS_VALID_BLOCK (h, nk_offs));
2229   assert (BLOCK_ID_EQ (h, nk_offs, "nk"));
2230
2231   /* Name in nk is not necessarily nul-terminated. */
2232   char *nname = hivex_node_name (h, nk_offs);
2233
2234   /* Unfortunately we don't have a way to return errors here. */
2235   if (!nname) {
2236     perror ("compare_name_with_nk_name");
2237     return 0;
2238   }
2239
2240   int r = strcasecmp (name, nname);
2241   free (nname);
2242
2243   return r;
2244 }
2245
2246 hive_node_h
2247 hivex_node_add_child (hive_h *h, hive_node_h parent, const char *name)
2248 {
2249   if (!h->writable) {
2250     errno = EROFS;
2251     return 0;
2252   }
2253
2254   if (!IS_VALID_BLOCK (h, parent) || !BLOCK_ID_EQ (h, parent, "nk")) {
2255     errno = EINVAL;
2256     return 0;
2257   }
2258
2259   if (name == NULL || strlen (name) == 0) {
2260     errno = EINVAL;
2261     return 0;
2262   }
2263
2264   if (hivex_node_get_child (h, parent, name) != 0) {
2265     errno = EEXIST;
2266     return 0;
2267   }
2268
2269   /* Create the new nk-record. */
2270   static const char nk_id[2] = { 'n', 'k' };
2271   size_t seg_len = sizeof (struct ntreg_nk_record) + strlen (name);
2272   hive_node_h node = allocate_block (h, seg_len, nk_id);
2273   if (node == 0)
2274     return 0;
2275
2276   if (h->msglvl >= 2)
2277     fprintf (stderr, "hivex_node_add_child: allocated new nk-record"
2278              " for child at 0x%zx\n", node);
2279
2280   struct ntreg_nk_record *nk = (struct ntreg_nk_record *) (h->addr + node);
2281   nk->flags = htole16 (0x0020); /* key is ASCII. */
2282   nk->parent = htole32 (parent - 0x1000);
2283   nk->subkey_lf = htole32 (0xffffffff);
2284   nk->subkey_lf_volatile = htole32 (0xffffffff);
2285   nk->vallist = htole32 (0xffffffff);
2286   nk->classname = htole32 (0xffffffff);
2287   nk->name_len = htole16 (strlen (name));
2288   strcpy (nk->name, name);
2289
2290   /* Inherit parent sk. */
2291   struct ntreg_nk_record *parent_nk =
2292     (struct ntreg_nk_record *) (h->addr + parent);
2293   size_t parent_sk_offset = le32toh (parent_nk->sk);
2294   parent_sk_offset += 0x1000;
2295   if (!IS_VALID_BLOCK (h, parent_sk_offset) ||
2296       !BLOCK_ID_EQ (h, parent_sk_offset, "sk")) {
2297     if (h->msglvl >= 2)
2298       fprintf (stderr, "hivex_node_add_child: returning EFAULT"
2299                " because parent sk is not a valid block (%zu)\n",
2300                parent_sk_offset);
2301     errno = EFAULT;
2302     return 0;
2303   }
2304   struct ntreg_sk_record *sk =
2305     (struct ntreg_sk_record *) (h->addr + parent_sk_offset);
2306   sk->refcount = htole32 (le32toh (sk->refcount) + 1);
2307   nk->sk = htole32 (parent_sk_offset - 0x1000);
2308
2309   /* Inherit parent timestamp. */
2310   nk->timestamp = parent_nk->timestamp;
2311
2312   /* What I found out the hard way (not documented anywhere): the
2313    * subkeys in lh-records must be kept sorted.  If you just add a
2314    * subkey in a non-sorted position (eg. just add it at the end) then
2315    * Windows won't see the subkey _and_ Windows will corrupt the hive
2316    * itself when it modifies or saves it.
2317    *
2318    * So use get_children() to get a list of intermediate
2319    * lf/lh-records.  get_children() returns these in reading order
2320    * (which is sorted), so we look for the lf/lh-records in sequence
2321    * until we find the key name just after the one we are inserting,
2322    * and we insert the subkey just before it.
2323    *
2324    * The only other case is the no-subkeys case, where we have to
2325    * create a brand new lh-record.
2326    */
2327   hive_node_h *unused;
2328   size_t *blocks;
2329
2330   if (get_children (h, parent, &unused, &blocks, 0) == -1)
2331     return 0;
2332   free (unused);
2333
2334   size_t i, j;
2335   size_t nr_subkeys_in_parent_nk = le32toh (parent_nk->nr_subkeys);
2336   if (nr_subkeys_in_parent_nk == 0) { /* No subkeys case. */
2337     /* Free up any existing intermediate blocks. */
2338     for (i = 0; blocks[i] != 0; ++i)
2339       mark_block_unused (h, blocks[i]);
2340     size_t lh_offs = new_lh_record (h, name, node);
2341     if (lh_offs == 0) {
2342       free (blocks);
2343       return 0;
2344     }
2345
2346     /* Recalculate pointers that could have been invalidated by
2347      * previous call to allocate_block (via new_lh_record).
2348      */
2349     nk = (struct ntreg_nk_record *) (h->addr + node);
2350     parent_nk = (struct ntreg_nk_record *) (h->addr + parent);
2351
2352     if (h->msglvl >= 2)
2353       fprintf (stderr, "hivex_node_add_child: no keys, allocated new"
2354                " lh-record at 0x%zx\n", lh_offs);
2355
2356     parent_nk->subkey_lf = htole32 (lh_offs - 0x1000);
2357   }
2358   else {                        /* Insert subkeys case. */
2359     size_t old_offs = 0, new_offs = 0;
2360     struct ntreg_lf_record *old_lf = NULL;
2361
2362     /* Find lf/lh key name just after the one we are inserting. */
2363     for (i = 0; blocks[i] != 0; ++i) {
2364       if (BLOCK_ID_EQ (h, blocks[i], "lf") ||
2365           BLOCK_ID_EQ (h, blocks[i], "lh")) {
2366         old_offs = blocks[i];
2367         old_lf = (struct ntreg_lf_record *) (h->addr + old_offs);
2368         for (j = 0; j < le16toh (old_lf->nr_keys); ++j) {
2369           hive_node_h nk_offs = le32toh (old_lf->keys[j].offset);
2370           nk_offs += 0x1000;
2371           if (compare_name_with_nk_name (h, name, nk_offs) < 0)
2372             goto insert_it;
2373         }
2374       }
2375     }
2376
2377     /* Insert it at the end.
2378      * old_offs points to the last lf record, set j.
2379      */
2380     assert (old_offs != 0);   /* should never happen if nr_subkeys > 0 */
2381     j = le16toh (old_lf->nr_keys);
2382
2383     /* Insert it. */
2384   insert_it:
2385     if (h->msglvl >= 2)
2386       fprintf (stderr, "hivex_node_add_child: insert key in existing"
2387                " lh-record at 0x%zx, posn %zu\n", old_offs, j);
2388
2389     new_offs = insert_lf_record (h, old_offs, j, name, node);
2390     if (new_offs == 0) {
2391       free (blocks);
2392       return 0;
2393     }
2394
2395     /* Recalculate pointers that could have been invalidated by
2396      * previous call to allocate_block (via insert_lf_record).
2397      */
2398     nk = (struct ntreg_nk_record *) (h->addr + node);
2399     parent_nk = (struct ntreg_nk_record *) (h->addr + parent);
2400
2401     if (h->msglvl >= 2)
2402       fprintf (stderr, "hivex_node_add_child: new lh-record at 0x%zx\n",
2403                new_offs);
2404
2405     /* If the lf/lh-record was directly referenced by the parent nk,
2406      * then update the parent nk.
2407      */
2408     if (le32toh (parent_nk->subkey_lf) + 0x1000 == old_offs)
2409       parent_nk->subkey_lf = htole32 (new_offs - 0x1000);
2410     /* Else we have to look for the intermediate ri-record and update
2411      * that in-place.
2412      */
2413     else {
2414       for (i = 0; blocks[i] != 0; ++i) {
2415         if (BLOCK_ID_EQ (h, blocks[i], "ri")) {
2416           struct ntreg_ri_record *ri =
2417             (struct ntreg_ri_record *) (h->addr + blocks[i]);
2418           for (j = 0; j < le16toh (ri->nr_offsets); ++j)
2419             if (le32toh (ri->offset[j] + 0x1000) == old_offs) {
2420               ri->offset[j] = htole32 (new_offs - 0x1000);
2421               goto found_it;
2422             }
2423         }
2424       }
2425
2426       /* Not found ..  This is an internal error. */
2427       if (h->msglvl >= 2)
2428         fprintf (stderr, "hivex_node_add_child: returning ENOTSUP"
2429                  " because could not find ri->lf link\n");
2430       errno = ENOTSUP;
2431       free (blocks);
2432       return 0;
2433
2434     found_it:
2435       ;
2436     }
2437   }
2438
2439   free (blocks);
2440
2441   /* Update nr_subkeys in parent nk. */
2442   nr_subkeys_in_parent_nk++;
2443   parent_nk->nr_subkeys = htole32 (nr_subkeys_in_parent_nk);
2444
2445   /* Update max_subkey_name_len in parent nk. */
2446   uint16_t max = le16toh (parent_nk->max_subkey_name_len);
2447   if (max < strlen (name) * 2)  /* *2 because "recoded" in UTF16-LE. */
2448     parent_nk->max_subkey_name_len = htole16 (strlen (name) * 2);
2449
2450   return node;
2451 }
2452
2453 /* Decrement the refcount of an sk-record, and if it reaches zero,
2454  * unlink it from the chain and delete it.
2455  */
2456 static int
2457 delete_sk (hive_h *h, size_t sk_offset)
2458 {
2459   if (!IS_VALID_BLOCK (h, sk_offset) || !BLOCK_ID_EQ (h, sk_offset, "sk")) {
2460     if (h->msglvl >= 2)
2461       fprintf (stderr, "delete_sk: not an sk record: 0x%zx\n", sk_offset);
2462     errno = EFAULT;
2463     return -1;
2464   }
2465
2466   struct ntreg_sk_record *sk = (struct ntreg_sk_record *) (h->addr + sk_offset);
2467
2468   if (sk->refcount == 0) {
2469     if (h->msglvl >= 2)
2470       fprintf (stderr, "delete_sk: sk record already has refcount 0: 0x%zx\n",
2471                sk_offset);
2472     errno = EINVAL;
2473     return -1;
2474   }
2475
2476   sk->refcount--;
2477
2478   if (sk->refcount == 0) {
2479     size_t sk_prev_offset = sk->sk_prev;
2480     sk_prev_offset += 0x1000;
2481
2482     size_t sk_next_offset = sk->sk_next;
2483     sk_next_offset += 0x1000;
2484
2485     /* Update sk_prev/sk_next SKs, unless they both point back to this
2486      * cell in which case we are deleting the last SK.
2487      */
2488     if (sk_prev_offset != sk_offset && sk_next_offset != sk_offset) {
2489       struct ntreg_sk_record *sk_prev =
2490         (struct ntreg_sk_record *) (h->addr + sk_prev_offset);
2491       struct ntreg_sk_record *sk_next =
2492         (struct ntreg_sk_record *) (h->addr + sk_next_offset);
2493
2494       sk_prev->sk_next = htole32 (sk_next_offset - 0x1000);
2495       sk_next->sk_prev = htole32 (sk_prev_offset - 0x1000);
2496     }
2497
2498     /* Refcount is zero so really delete this block. */
2499     mark_block_unused (h, sk_offset);
2500   }
2501
2502   return 0;
2503 }
2504
2505 /* Callback from hivex_node_delete_child which is called to delete a
2506  * node AFTER its subnodes have been visited.  The subnodes have been
2507  * deleted but we still have to delete any lf/lh/li/ri records and the
2508  * value list block and values, followed by deleting the node itself.
2509  */
2510 static int
2511 delete_node (hive_h *h, void *opaque, hive_node_h node, const char *name)
2512 {
2513   /* Get the intermediate blocks.  The subkeys have already been
2514    * deleted by this point, so tell get_children() not to check for
2515    * validity of the nk-records.
2516    */
2517   hive_node_h *unused;
2518   size_t *blocks;
2519   if (get_children (h, node, &unused, &blocks, GET_CHILDREN_NO_CHECK_NK) == -1)
2520     return -1;
2521   free (unused);
2522
2523   /* We don't care what's in these intermediate blocks, so we can just
2524    * delete them unconditionally.
2525    */
2526   size_t i;
2527   for (i = 0; blocks[i] != 0; ++i)
2528     mark_block_unused (h, blocks[i]);
2529
2530   free (blocks);
2531
2532   /* Delete the values in the node. */
2533   if (delete_values (h, node) == -1)
2534     return -1;
2535
2536   struct ntreg_nk_record *nk = (struct ntreg_nk_record *) (h->addr + node);
2537
2538   /* If the NK references an SK, delete it. */
2539   size_t sk_offs = le32toh (nk->sk);
2540   if (sk_offs != 0xffffffff) {
2541     sk_offs += 0x1000;
2542     if (delete_sk (h, sk_offs) == -1)
2543       return -1;
2544     nk->sk = htole32 (0xffffffff);
2545   }
2546
2547   /* If the NK references a classname, delete it. */
2548   size_t cl_offs = le32toh (nk->classname);
2549   if (cl_offs != 0xffffffff) {
2550     cl_offs += 0x1000;
2551     mark_block_unused (h, cl_offs);
2552     nk->classname = htole32 (0xffffffff);
2553   }
2554
2555   /* Delete the node itself. */
2556   mark_block_unused (h, node);
2557
2558   return 0;
2559 }
2560
2561 int
2562 hivex_node_delete_child (hive_h *h, hive_node_h node)
2563 {
2564   if (!h->writable) {
2565     errno = EROFS;
2566     return -1;
2567   }
2568
2569   if (!IS_VALID_BLOCK (h, node) || !BLOCK_ID_EQ (h, node, "nk")) {
2570     errno = EINVAL;
2571     return -1;
2572   }
2573
2574   if (node == hivex_root (h)) {
2575     if (h->msglvl >= 2)
2576       fprintf (stderr, "hivex_node_delete_child: cannot delete root node\n");
2577     errno = EINVAL;
2578     return -1;
2579   }
2580
2581   hive_node_h parent = hivex_node_parent (h, node);
2582   if (parent == 0)
2583     return -1;
2584
2585   /* Delete node and all its children and values recursively. */
2586   static const struct hivex_visitor visitor = { .node_end = delete_node };
2587   if (hivex_visit_node (h, node, &visitor, sizeof visitor, NULL, 0) == -1)
2588     return -1;
2589
2590   /* Delete the link from parent to child.  We need to find the lf/lh
2591    * record which contains the offset and remove the offset from that
2592    * record, then decrement the element count in that record, and
2593    * decrement the overall number of subkeys stored in the parent
2594    * node.
2595    */
2596   hive_node_h *unused;
2597   size_t *blocks;
2598   if (get_children (h, parent, &unused, &blocks, GET_CHILDREN_NO_CHECK_NK)== -1)
2599     return -1;
2600   free (unused);
2601
2602   size_t i, j;
2603   for (i = 0; blocks[i] != 0; ++i) {
2604     struct ntreg_hbin_block *block =
2605       (struct ntreg_hbin_block *) (h->addr + blocks[i]);
2606
2607     if (block->id[0] == 'l' && (block->id[1] == 'f' || block->id[1] == 'h')) {
2608       struct ntreg_lf_record *lf = (struct ntreg_lf_record *) block;
2609
2610       size_t nr_subkeys_in_lf = le16toh (lf->nr_keys);
2611
2612       for (j = 0; j < nr_subkeys_in_lf; ++j)
2613         if (le32toh (lf->keys[j].offset) + 0x1000 == node) {
2614           for (; j < nr_subkeys_in_lf - 1; ++j)
2615             memcpy (&lf->keys[j], &lf->keys[j+1], sizeof (lf->keys[j]));
2616           lf->nr_keys = htole16 (nr_subkeys_in_lf - 1);
2617           goto found;
2618         }
2619     }
2620   }
2621   if (h->msglvl >= 2)
2622     fprintf (stderr, "hivex_node_delete_child: could not find parent"
2623              " to child link\n");
2624   errno = ENOTSUP;
2625   return -1;
2626
2627  found:;
2628   struct ntreg_nk_record *nk = (struct ntreg_nk_record *) (h->addr + parent);
2629   size_t nr_subkeys_in_nk = le32toh (nk->nr_subkeys);
2630   nk->nr_subkeys = htole32 (nr_subkeys_in_nk - 1);
2631
2632   if (h->msglvl >= 2)
2633     fprintf (stderr, "hivex_node_delete_child: updating nr_subkeys"
2634              " in parent 0x%zx to %zu\n", parent, nr_subkeys_in_nk);
2635
2636   return 0;
2637 }
2638
2639 int
2640 hivex_node_set_values (hive_h *h, hive_node_h node,
2641                        size_t nr_values, const hive_set_value *values,
2642                        int flags)
2643 {
2644   if (!h->writable) {
2645     errno = EROFS;
2646     return -1;
2647   }
2648
2649   if (!IS_VALID_BLOCK (h, node) || !BLOCK_ID_EQ (h, node, "nk")) {
2650     errno = EINVAL;
2651     return -1;
2652   }
2653
2654   /* Delete all existing values. */
2655   if (delete_values (h, node) == -1)
2656     return -1;
2657
2658   if (nr_values == 0)
2659     return 0;
2660
2661   /* Allocate value list node.  Value lists have no id field. */
2662   static const char nul_id[2] = { 0, 0 };
2663   size_t seg_len =
2664     sizeof (struct ntreg_value_list) + (nr_values - 1) * sizeof (uint32_t);
2665   size_t vallist_offs = allocate_block (h, seg_len, nul_id);
2666   if (vallist_offs == 0)
2667     return -1;
2668
2669   struct ntreg_nk_record *nk = (struct ntreg_nk_record *) (h->addr + node);
2670   nk->nr_values = htole32 (nr_values);
2671   nk->vallist = htole32 (vallist_offs - 0x1000);
2672
2673   struct ntreg_value_list *vallist =
2674     (struct ntreg_value_list *) (h->addr + vallist_offs);
2675
2676   size_t i;
2677   for (i = 0; i < nr_values; ++i) {
2678     /* Allocate vk record to store this (key, value) pair. */
2679     static const char vk_id[2] = { 'v', 'k' };
2680     seg_len = sizeof (struct ntreg_vk_record) + strlen (values[i].key);
2681     size_t vk_offs = allocate_block (h, seg_len, vk_id);
2682     if (vk_offs == 0)
2683       return -1;
2684
2685     /* Recalculate pointers that could have been invalidated by
2686      * previous call to allocate_block.
2687      */
2688     nk = (struct ntreg_nk_record *) (h->addr + node);
2689     vallist = (struct ntreg_value_list *) (h->addr + vallist_offs);
2690
2691     vallist->offset[i] = htole32 (vk_offs - 0x1000);
2692
2693     struct ntreg_vk_record *vk = (struct ntreg_vk_record *) (h->addr + vk_offs);
2694     size_t name_len = strlen (values[i].key);
2695     vk->name_len = htole16 (name_len);
2696     strcpy (vk->name, values[i].key);
2697     vk->data_type = htole32 (values[i].t);
2698     uint32_t len = values[i].len;
2699     if (len <= 4)               /* store it inline => set MSB flag */
2700       len |= 0x80000000;
2701     vk->data_len = htole32 (len);
2702     vk->flags = name_len == 0 ? 0 : 1;
2703
2704     if (values[i].len <= 4)     /* store it inline */
2705       memcpy (&vk->data_offset, values[i].value, values[i].len);
2706     else {
2707       size_t offs = allocate_block (h, values[i].len + 4, nul_id);
2708       if (offs == 0)
2709         return -1;
2710
2711       /* Recalculate pointers that could have been invalidated by
2712        * previous call to allocate_block.
2713        */
2714       nk = (struct ntreg_nk_record *) (h->addr + node);
2715       vallist = (struct ntreg_value_list *) (h->addr + vallist_offs);
2716       vk = (struct ntreg_vk_record *) (h->addr + vk_offs);
2717
2718       memcpy (h->addr + offs + 4, values[i].value, values[i].len);
2719       vk->data_offset = htole32 (offs - 0x1000);
2720     }
2721
2722     if (name_len * 2 > le32toh (nk->max_vk_name_len))
2723       /* * 2 for UTF16-LE "reencoding" */
2724       nk->max_vk_name_len = htole32 (name_len * 2);
2725     if (values[i].len > le32toh (nk->max_vk_data_len))
2726       nk->max_vk_data_len = htole32 (values[i].len);
2727   }
2728
2729   return 0;
2730 }
2731
2732 int
2733 hivex_node_set_value (hive_h *h, hive_node_h node,
2734                       const hive_set_value *val, int flags)
2735 {
2736   hive_value_h *prev_values = hivex_node_values (h, node);
2737   if (prev_values == NULL)
2738     return -1;
2739
2740   int retval = -1;
2741
2742   size_t nr_values = 0;
2743   for (hive_value_h *itr = prev_values; *itr != 0; ++itr)
2744     ++nr_values;
2745
2746   hive_set_value *values = malloc ((nr_values + 1) * (sizeof (hive_set_value)));
2747   if (values == NULL)
2748     goto leave_prev_values;
2749
2750   int alloc_ct = 0;
2751   int idx_of_val = -1;
2752   hive_value_h *prev_val;
2753   for (prev_val = prev_values; *prev_val != 0; ++prev_val) {
2754     size_t len;
2755     hive_type t;
2756
2757     hive_set_value *value = &values[prev_val - prev_values];
2758
2759     char *valval = hivex_value_value (h, *prev_val, &t, &len);
2760     if (valval == NULL) goto leave_partial;
2761
2762     ++alloc_ct;
2763     value->value = valval;
2764     value->t = t;
2765     value->len = len;
2766
2767     char *valkey = hivex_value_key (h, *prev_val);
2768     if (valkey == NULL) goto leave_partial;
2769
2770     ++alloc_ct;
2771     value->key = valkey;
2772
2773     if (STRCASEEQ (valkey, val->key))
2774       idx_of_val = prev_val - prev_values;
2775   }
2776
2777   if (idx_of_val > -1) {
2778     free (values[idx_of_val].key);
2779     free (values[idx_of_val].value);
2780   } else {
2781     idx_of_val = nr_values;
2782     ++nr_values;
2783   }
2784
2785   hive_set_value *value = &values[idx_of_val];
2786   *value = (hive_set_value){
2787     .key = strdup (val->key),
2788     .value = malloc (val->len),
2789     .len = val->len,
2790     .t = val->t
2791   };
2792
2793   if (value->key == NULL || value->value == NULL) goto leave_partial;
2794   memcpy (value->value, val->value, val->len);
2795
2796   retval = hivex_node_set_values (h, node, nr_values, values, 0);
2797
2798  leave_partial:
2799   for (int i = 0; i < alloc_ct; i += 2) {
2800     free (values[i / 2].value);
2801     if (i + 1 < alloc_ct && values[i / 2].key != NULL)
2802       free (values[i / 2].key);
2803   }
2804   free (values);
2805
2806  leave_prev_values:
2807   free (prev_values);
2808   return retval;
2809 }