Add documentation for SELinux configuration.
[libguestfs.git] / guestfs.pod
1 =encoding utf8
2
3 =head1 NAME
4
5 guestfs - Library for accessing and modifying virtual machine images
6
7 =head1 SYNOPSIS
8
9  #include <guestfs.h>
10
11  guestfs_h *handle = guestfs_create ();
12  guestfs_add_drive (handle, "guest.img");
13  guestfs_launch (handle);
14  guestfs_wait_ready (handle);
15  guestfs_mount (handle, "/dev/sda1", "/");
16  guestfs_touch (handle, "/hello");
17  guestfs_sync (handle);
18  guestfs_close (handle);
19
20 =head1 DESCRIPTION
21
22 Libguestfs is a library for accessing and modifying guest disk images.
23 Amongst the things this is good for: making batch configuration
24 changes to guests, getting disk used/free statistics (see also:
25 virt-df), migrating between virtualization systems (see also:
26 virt-p2v), performing partial backups, performing partial guest
27 clones, cloning guests and changing registry/UUID/hostname info, and
28 much else besides.
29
30 Libguestfs uses Linux kernel and qemu code, and can access any type of
31 guest filesystem that Linux and qemu can, including but not limited
32 to: ext2/3/4, btrfs, FAT and NTFS, LVM, many different disk partition
33 schemes, qcow, qcow2, vmdk.
34
35 Libguestfs provides ways to enumerate guest storage (eg. partitions,
36 LVs, what filesystem is in each LV, etc.).  It can also run commands
37 in the context of the guest.  Also you can access filesystems over FTP.
38
39 Libguestfs is a library that can be linked with C and C++ management
40 programs (or management programs written in OCaml, Perl, Python, Ruby, Java
41 or Haskell).  You can also use it from shell scripts or the command line.
42
43 You don't need to be root to use libguestfs, although obviously you do
44 need enough permissions to access the disk images.
45
46 =head1 CONNECTION MANAGEMENT
47
48 If you are using the high-level API, then you should call the
49 functions in the following order:
50
51  guestfs_h *handle = guestfs_create ();
52
53  guestfs_add_drive (handle, "guest.img");
54  /* call guestfs_add_drive additional times if the guest has
55   * multiple disks
56   */
57
58  guestfs_launch (handle);
59  guestfs_wait_ready (handle);
60
61  /* now you can examine what partitions, LVs etc are available
62   * you have to mount / at least
63   */
64  guestfs_mount (handle, "/dev/sda1", "/");
65
66  /* now you can perform actions on the guest disk image */
67  guestfs_touch (handle, "/hello");
68
69  /* you only need to call guestfs_sync if you have made
70   * changes to the guest image
71   */
72  guestfs_sync (handle);
73
74  guestfs_close (handle);
75
76 C<guestfs_wait_ready> and all of the actions including C<guestfs_sync>
77 are blocking calls.  You can use the low-level event API to do
78 non-blocking operations instead.
79
80 All functions that return integers, return C<-1> on error.  See
81 section L</ERROR HANDLING> below for how to handle errors.
82
83 =head2 guestfs_h *
84
85 C<guestfs_h> is the opaque type representing a connection handle.
86 Create a handle by calling C<guestfs_create>.  Call C<guestfs_close>
87 to free the handle and release all resources used.
88
89 For information on using multiple handles and threads, see the section
90 L</MULTIPLE HANDLES AND MULTIPLE THREADS> below.
91
92 =head2 guestfs_create
93
94  guestfs_h *guestfs_create (void);
95
96 Create a connection handle.
97
98 You have to call C<guestfs_add_drive> on the handle at least once.
99
100 This function returns a non-NULL pointer to a handle on success or
101 NULL on error.
102
103 After configuring the handle, you have to call C<guestfs_launch> and
104 C<guestfs_wait_ready>.
105
106 You may also want to configure error handling for the handle.  See
107 L</ERROR HANDLING> section below.
108
109 =head2 guestfs_close
110
111  void guestfs_close (guestfs_h *handle);
112
113 This closes the connection handle and frees up all resources used.
114
115 =head1 ERROR HANDLING
116
117 The convention in all functions that return C<int> is that they return
118 C<-1> to indicate an error.  You can get additional information on
119 errors by calling C<guestfs_last_error> and/or by setting up an error
120 handler with C<guestfs_set_error_handler>.
121
122 The default error handler prints the information string to C<stderr>.
123
124 Out of memory errors are handled differently.  The default action is
125 to call L<abort(3)>.  If this is undesirable, then you can set a
126 handler using C<guestfs_set_out_of_memory_handler>.
127
128 =head2 guestfs_last_error
129
130  const char *guestfs_last_error (guestfs_h *handle);
131
132 This returns the last error message that happened on C<handle>.  If
133 there has not been an error since the handle was created, then this
134 returns C<NULL>.
135
136 The lifetime of the returned string is until the next error occurs, or
137 C<guestfs_close> is called.
138
139 The error string is not localized (ie. is always in English), because
140 this makes searching for error messages in search engines give the
141 largest number of results.
142
143 =head2 guestfs_set_error_handler
144
145  typedef void (*guestfs_error_handler_cb) (guestfs_h *handle,
146                                            void *data,
147                                            const char *msg);
148  void guestfs_set_error_handler (guestfs_h *handle,
149                                  guestfs_error_handler_cb cb,
150                                  void *data);
151
152 The callback C<cb> will be called if there is an error.  The
153 parameters passed to the callback are an opaque data pointer and the
154 error message string.
155
156 Note that the message string C<msg> is freed as soon as the callback
157 function returns, so if you want to stash it somewhere you must make
158 your own copy.
159
160 The default handler prints messages on C<stderr>.
161
162 If you set C<cb> to C<NULL> then I<no> handler is called.
163
164 =head2 guestfs_get_error_handler
165
166  guestfs_error_handler_cb guestfs_get_error_handler (guestfs_h *handle,
167                                                      void **data_rtn);
168
169 Returns the current error handler callback.
170
171 =head2 guestfs_set_out_of_memory_handler
172
173  typedef void (*guestfs_abort_cb) (void);
174  int guestfs_set_out_of_memory_handler (guestfs_h *handle,
175                                         guestfs_abort_cb);
176
177 The callback C<cb> will be called if there is an out of memory
178 situation.  I<Note this callback must not return>.
179
180 The default is to call L<abort(3)>.
181
182 You cannot set C<cb> to C<NULL>.  You can't ignore out of memory
183 situations.
184
185 =head2 guestfs_get_out_of_memory_handler
186
187  guestfs_abort_fn guestfs_get_out_of_memory_handler (guestfs_h *handle);
188
189 This returns the current out of memory handler.
190
191 =head1 PATH
192
193 Libguestfs needs a kernel and initrd.img, which it finds by looking
194 along an internal path.
195
196 By default it looks for these in the directory C<$libdir/guestfs>
197 (eg. C</usr/local/lib/guestfs> or C</usr/lib64/guestfs>).
198
199 Use C<guestfs_set_path> or set the environment variable
200 C<LIBGUESTFS_PATH> to change the directories that libguestfs will
201 search in.  The value is a colon-separated list of paths.  The current
202 directory is I<not> searched unless the path contains an empty element
203 or C<.>.  For example C<LIBGUESTFS_PATH=:/usr/lib/guestfs> would
204 search the current directory and then C</usr/lib/guestfs>.
205
206 =head1 API OVERVIEW
207
208 This section provides additional documentation for groups of API
209 calls, which may not be obvious from reading about the individual
210 calls below.
211
212 =head2 LVM2
213
214 Libguestfs provides access to a large part of the LVM2 API.  It won't
215 make much sense unless you familiarize yourself with the concepts of
216 physical volumes, volume groups and logical volumes.
217
218 This author strongly recommends reading the LVM HOWTO, online at
219 L<http://tldp.org/HOWTO/LVM-HOWTO/>.
220
221 =head2 PARTITIONING
222
223 To create MBR-style (ie. normal PC) partitions use one of the
224 C<guestfs_sfdisk*> variants.  These calls use the external
225 L<sfdisk(8)> command.
226
227 The simplest call is:
228
229  char *lines[] = { ",", NULL };
230  guestfs_sfdiskM (g, "/dev/sda", lines);
231
232 This will create a single partition on C</dev/sda> called
233 C</dev/sda1> covering the whole disk.
234
235 In general MBR partitions are both unnecessarily complicated and
236 depend on archaic details, namely the Cylinder-Head-Sector (CHS)
237 geometry of the disk.  C<guestfs_sfdiskM> allows you to specify sizes
238 in megabytes instead of cylinders, which is a small win.
239 C<guestfs_sfdiskM> will choose the nearest cylinder to approximate the
240 requested size.  There's a lot of crazy stuff to do with IDE and
241 virtio disks having different, incompatible CHS geometries, that you
242 probably don't want to know about.  My advice: make a single partition
243 to cover the whole disk, then use LVM on top.
244
245 In future we aim to provide access to libparted.
246
247 =head2 UPLOADING
248
249 For small, single files, use C<guestfs_write_file>.  In some versions
250 of libguestfs there was a bug which limited this call to text files
251 (not containing ASCII NUL characters).
252
253 To upload a single file, use C<guestfs_upload>.  This call has no
254 limits on file content or size (even files larger than 4 GB).
255
256 To upload multiple files, see C<guestfs_tar_in> and C<guestfs_tgz_in>.
257
258 However the fastest way to upload I<large numbers of arbitrary files>
259 is to turn them into a squashfs or CD ISO (see L<mksquashfs(8)> and
260 L<mkisofs(8)>), then attach this using C<guestfs_add_drive_ro>.  If
261 you add the drive in a predictable way (eg. adding it last after all
262 other drives) then you can get the device name from
263 C<guestfs_list_devices> and mount it directly using
264 C<guestfs_mount_ro>.  Note that squashfs images are sometimes
265 non-portable between kernel versions, and they don't support labels or
266 UUIDs.  If you want to pre-build an image or you need to mount it
267 using a label or UUID, use an ISO image instead.
268
269 =head2 DOWNLOADING
270
271 Use C<guestfs_cat> to download small, text only files.  This call
272 is limited to files which are less than 2 MB and which cannot contain
273 any ASCII NUL (C<\0>) characters.  However it has a very simple
274 to use API.
275
276 C<guestfs_read_file> can be used to read files which contain
277 arbitrary 8 bit data, since it returns a (pointer, size) pair.
278 However it is still limited to "small" files, less than 2 MB.
279
280 C<guestfs_download> can be used to download any file, with no
281 limits on content or size (even files larger than 4 GB).
282
283 To download multiple files, see C<guestfs_tar_out> and
284 C<guestfs_tgz_out>.
285
286 =head2 RUNNING COMMANDS
287
288 Although libguestfs is a primarily an API for manipulating files
289 inside guest images, we also provide some limited facilities for
290 running commands inside guests.
291
292 There are many limitations to this:
293
294 =over 4
295
296 =item *
297
298 The kernel version that the command runs under will be different
299 from what it expects.
300
301 =item *
302
303 If the command needs to communicate with daemons, then most likely
304 they won't be running.
305
306 =item *
307
308 The command will be running in limited memory.
309
310 =item *
311
312 Only supports Linux guests (not Windows, BSD, etc).
313
314 =item *
315
316 Architecture limitations (eg. won't work for a PPC guest on
317 an X86 host).
318
319 =item *
320
321 For SELinux guests, you may need to enable SELinux and load policy
322 first.  See L</SELINUX> in this manpage.
323
324 =back
325
326 The two main API calls to run commands are C<guestfs_command> and
327 C<guestfs_sh> (there are also variations).
328
329 The difference is that C<guestfs_sh> runs commands using the shell, so
330 any shell globs, redirections, etc will work.
331
332 =head2 LISTING FILES
333
334 C<guestfs_ll> is just designed for humans to read (mainly when using
335 the L<guestfish(1)>-equivalent command C<ll>).
336
337 C<guestfs_ls> is a quick way to get a list of files in a directory
338 from programs.
339
340 C<guestfs_readdir> is a programmatic way to get a list of files in a
341 directory, plus additional information about each one.
342
343 C<guestfs_find> can be used to recursively list files.
344
345 =head2 SELINUX
346
347 We support SELinux guests.  To ensure that labeling happens correctly
348 in SELinux guests, you need to enable SELinux and load the guest's
349 policy:
350
351 =over 4
352
353 =item 1.
354
355 Before launching, do:
356
357  guestfs_set_selinux (g, 1);
358
359 =item 2.
360
361 After mounting the guest's filesystem(s), load the policy.  This
362 is best done by running the L<load_policy(8)> command in the
363 guest itself:
364
365  guestfs_sh (g, "/usr/sbin/load_policy");
366
367 (Older versions of C<load_policy> require you to specify the
368 name of the policy file).
369
370 =back
371
372 This will work for running commands and editing existing files.
373
374 When new files are created, you may need to label them explicitly,
375 for example by running the external command
376 C<restorecon pathname>.
377
378 =head1 HIGH-LEVEL API ACTIONS
379
380 =head2 ABI GUARANTEE
381
382 We guarantee the libguestfs ABI (binary interface), for public,
383 high-level actions as outlined in this section.  Although we will
384 deprecate some actions, for example if they get replaced by newer
385 calls, we will keep the old actions forever.  This allows you the
386 developer to program in confidence against libguestfs.
387
388 @ACTIONS@
389
390 =head1 STRUCTURES
391
392 @STRUCTS@
393
394 =head1 STATE MACHINE AND LOW-LEVEL EVENT API
395
396 Internally, libguestfs is implemented by running a virtual machine
397 using L<qemu(1)>.  QEmu runs as a child process of the main program,
398 and most of this discussion won't make sense unless you understand
399 that the complexity is dealing with the (asynchronous) actions of the
400 child process.
401
402                             child process
403   ___________________       _________________________
404  /                   \     /                         \
405  | main program      |     | qemu +-----------------+|
406  |                   |     |      | Linux kernel    ||
407  +-------------------+     |      +-----------------+|
408  | libguestfs     <-------------->| guestfsd        ||
409  |                   |     |      +-----------------+|
410  \___________________/     \_________________________/
411
412 The diagram above shows libguestfs communicating with the guestfsd
413 daemon running inside the qemu child process.  There are several
414 points of failure here: qemu can fail to start, the virtual machine
415 inside qemu can fail to boot, guestfsd can fail to start or not
416 establish communication, any component can start successfully but fail
417 asynchronously later, and so on.
418
419 =head2 STATE MACHINE
420
421 libguestfs uses a state machine to model the child process:
422
423                          |
424                     guestfs_create
425                          |
426                          |
427                      ____V_____
428                     /          \
429                     |  CONFIG  |
430                     \__________/
431                      ^ ^   ^  \
432                     /  |    \  \ guestfs_launch
433                    /   |    _\__V______
434                   /    |   /           \
435                  /     |   | LAUNCHING |
436                 /      |   \___________/
437                /       |       /
438               /        |  guestfs_wait_ready
439              /         |     /
440     ______  /        __|____V
441    /      \ ------> /        \
442    | BUSY |         | READY  |
443    \______/ <------ \________/
444
445 The normal transitions are (1) CONFIG (when the handle is created, but
446 there is no child process), (2) LAUNCHING (when the child process is
447 booting up), (3) alternating between READY and BUSY as commands are
448 issued to, and carried out by, the child process.
449
450 The guest may be killed by C<guestfs_kill_subprocess>, or may die
451 asynchronously at any time (eg. due to some internal error), and that
452 causes the state to transition back to CONFIG.
453
454 Configuration commands for qemu such as C<guestfs_add_drive> can only
455 be issued when in the CONFIG state.
456
457 The high-level API offers two calls that go from CONFIG through
458 LAUNCHING to READY.  C<guestfs_launch> is a non-blocking call that
459 starts up the child process, immediately moving from CONFIG to
460 LAUNCHING.  C<guestfs_wait_ready> blocks until the child process is
461 READY to accept commands (or until some failure or timeout).  The
462 low-level event API described below provides a non-blocking way to
463 replace C<guestfs_wait_ready>.
464
465 High-level API actions such as C<guestfs_mount> can only be issued
466 when in the READY state.  These high-level API calls block waiting for
467 the command to be carried out (ie. the state to transition to BUSY and
468 then back to READY).  But using the low-level event API, you get
469 non-blocking versions.  (But you can still only carry out one
470 operation per handle at a time - that is a limitation of the
471 communications protocol we use).
472
473 Finally, the child process sends asynchronous messages back to the
474 main program, such as kernel log messages.  Mostly these are ignored
475 by the high-level API, but using the low-level event API you can
476 register to receive these messages.
477
478 =head2 SETTING CALLBACKS TO HANDLE EVENTS
479
480 The child process generates events in some situations.  Current events
481 include: receiving a reply message after some action, receiving a log
482 message, the child process exits, &c.
483
484 Use the C<guestfs_set_*_callback> functions to set a callback for
485 different types of events.
486
487 Only I<one callback of each type> can be registered for each handle.
488 Calling C<guestfs_set_*_callback> again overwrites the previous
489 callback of that type.  Cancel all callbacks of this type by calling
490 this function with C<cb> set to C<NULL>.
491
492 =head2 NON-BLOCKING ACTIONS
493
494 XXX This section was documented in previous versions but never
495 implemented in a way which matched the documentation.  For now I have
496 removed the documentation, pending a working implementation.  See also
497 C<src/guestfs-actions.c> in the source.
498
499
500 =head2 guestfs_set_send_callback
501
502  typedef void (*guestfs_send_cb) (guestfs_h *g, void *opaque);
503  void guestfs_set_send_callback (guestfs_h *handle,
504                                  guestfs_send_cb cb,
505                                  void *opaque);
506
507 The callback function C<cb> will be called whenever a message
508 which is queued for sending, has been sent.
509
510 =head2 guestfs_set_reply_callback
511
512  typedef void (*guestfs_reply_cb) (guestfs_h *g, void *opaque, XDR *xdr);
513  void guestfs_set_reply_callback (guestfs_h *handle,
514                                   guestfs_reply_cb cb,
515                                   void *opaque);
516
517 The callback function C<cb> will be called whenever a reply is
518 received from the child process.  (This corresponds to a transition
519 from the BUSY state to the READY state).
520
521 Note that the C<xdr> that you get in the callback is in C<XDR_DECODE>
522 mode, and you need to consume it before you return from the callback
523 function (since it gets destroyed after).
524
525 =head2 guestfs_set_log_message_callback
526
527  typedef void (*guestfs_log_message_cb) (guestfs_h *g, void *opaque,
528                                          char *buf, int len);
529  void guestfs_set_log_message_callback (guestfs_h *handle,
530                                         guestfs_log_message_cb cb,
531                                         void *opaque);
532
533 The callback function C<cb> will be called whenever qemu or the guest
534 writes anything to the console.
535
536 Use this function to capture kernel messages and similar.
537
538 Normally there is no log message handler, and log messages are just
539 discarded.
540
541 =head2 guestfs_set_subprocess_quit_callback
542
543  typedef void (*guestfs_subprocess_quit_cb) (guestfs_h *g, void *opaque);
544  void guestfs_set_subprocess_quit_callback (guestfs_h *handle,
545                                             guestfs_subprocess_quit_cb cb,
546                                             void *opaque);
547
548 The callback function C<cb> will be called when the child process
549 quits, either asynchronously or if killed by
550 C<guestfs_kill_subprocess>.  (This corresponds to a transition from
551 any state to the CONFIG state).
552
553 =head2 guestfs_set_launch_done_callback
554
555  typedef void (*guestfs_launch_done_cb) (guestfs_h *g, void *opaque);
556  void guestfs_set_launch_done_callback (guestfs_h *handle,
557                                         guestfs_ready_cb cb,
558                                         void *opaque);
559
560 The callback function C<cb> will be called when the child process
561 becomes ready first time after it has been launched.  (This
562 corresponds to a transition from LAUNCHING to the READY state).
563
564 You can use this instead of C<guestfs_wait_ready> to implement a
565 non-blocking wait for the child process to finish booting up.
566
567 =head2 EVENT MAIN LOOP
568
569 To use the low-level event API and/or to use handles from multiple
570 threads, you have to provide an event "main loop".  You can write your
571 own, but if you don't want to write one, two types are provided for
572 you:
573
574 =over 4
575
576 =item libguestfs-select
577
578 A simple main loop that is implemented using L<select(2)>.
579
580 This is the default main loop for new guestfs handles, unless you
581 call C<guestfs_set_main_loop> after a handle is created.
582
583 =item libguestfs-glib
584
585 An implementation which can be used with GLib and GTK+ programs.  You
586 can use this to write graphical (GTK+) programs which use libguestfs
587 without hanging during long or slow operations.
588
589 =back
590
591 =head2 MULTIPLE HANDLES AND MULTIPLE THREADS
592
593 The support for multiple handles and multiple threads is modelled
594 after glib (although doesn't require glib, if you use the select-based
595 main loop).
596
597 L<http://library.gnome.org/devel/glib/unstable/glib-The-Main-Event-Loop.html>
598
599 You will need to create one main loop for each thread that wants to
600 use libguestfs.  Each guestfs handle should be confined to one thread.
601 If you try to pass guestfs handles between threads, you will get
602 undefined results.
603
604 If you only want to use guestfs handles from one thread in your
605 program, but your program has other threads doing other things, then
606 you don't need to do anything special.
607
608 =head2 SINGLE THREAD CASE
609
610 In the single thread case, there is a single select-based main loop
611 created for you.  All guestfs handles will use this main loop to
612 execute high level API actions.
613
614 =head2 MULTIPLE THREADS CASE
615
616 In the multiple threads case, you will need to create a main loop for
617 each thread that wants to use libguestfs.
618
619 To create main loops for other threads, use
620 C<guestfs_create_main_loop> or C<guestfs_glib_create_main_loop>.
621
622 Then you will need to attach each handle to the thread-specific main
623 loop by calling:
624
625  handle = guestfs_create ();
626  guestfs_set_main_loop (handle, main_loop_of_current_thread);
627
628 =head2 guestfs_set_main_loop
629
630  void guestfs_set_main_loop (guestfs_h *handle,
631                              guestfs_main_loop *main_loop);
632
633 Sets the main loop used by high level API actions for this handle.  By
634 default, the select-based main loop is used (see
635 C<guestfs_get_default_main_loop>).
636
637 You only need to use this in multi-threaded programs, where multiple
638 threads want to use libguestfs.  Create a main loop for each thread,
639 then call this function.
640
641 You cannot pass guestfs handles between threads.
642
643 =head2 guestfs_get_main_loop
644
645  guestfs_main_loop *guestfs_get_main_loop (guestfs_h *handle);
646
647 Return the main loop used by C<handle>.
648
649 =head2 guestfs_get_default_main_loop
650
651  guestfs_main_loop *guestfs_get_default_main_loop (void);
652
653 Return the default select-based main loop.
654
655 =head2 guestfs_create_main_loop
656
657  guestfs_main_loop *guestfs_create_main_loop (void);
658
659 This creates a select-based main loop.  You should create one main
660 loop for each additional thread that needs to use libguestfs.
661
662 =head2 guestfs_free_main_loop
663
664  void guestfs_free_main_loop (guestfs_main_loop *);
665
666 Free the select-based main loop which was previously allocated with
667 C<guestfs_create_main_loop>.
668
669 =head2 WRITING A CUSTOM MAIN LOOP
670
671 This isn't documented.  Please see the libguestfs-select and
672 libguestfs-glib implementations.
673
674 =head1 BLOCK DEVICE NAMING
675
676 In the kernel there is now quite a profusion of schemata for naming
677 block devices (in this context, by I<block device> I mean a physical
678 or virtual hard drive).  The original Linux IDE driver used names
679 starting with C</dev/hd*>.  SCSI devices have historically used a
680 different naming scheme, C</dev/sd*>.  When the Linux kernel I<libata>
681 driver became a popular replacement for the old IDE driver
682 (particularly for SATA devices) those devices also used the
683 C</dev/sd*> scheme.  Additionally we now have virtual machines with
684 paravirtualized drivers.  This has created several different naming
685 systems, such as C</dev/vd*> for virtio disks and C</dev/xvd*> for Xen
686 PV disks.
687
688 As discussed above, libguestfs uses a qemu appliance running an
689 embedded Linux kernel to access block devices.  We can run a variety
690 of appliances based on a variety of Linux kernels.
691
692 This causes a problem for libguestfs because many API calls use device
693 or partition names.  Working scripts and the recipe (example) scripts
694 that we make available over the internet could fail if the naming
695 scheme changes.
696
697 Therefore libguestfs defines C</dev/sd*> as the I<standard naming
698 scheme>.  Internally C</dev/sd*> names are translated, if necessary,
699 to other names as required.  For example, under RHEL 5 which uses the
700 C</dev/hd*> scheme, any device parameter C</dev/sda2> is translated to
701 C</dev/hda2> transparently.
702
703 Note that this I<only> applies to parameters.  The
704 C<guestfs_list_devices>, C<guestfs_list_partitions> and similar calls
705 return the true names of the devices and partitions as known to the
706 appliance.
707
708 =head2 ALGORITHM FOR BLOCK DEVICE NAME TRANSLATION
709
710 Usually this translation is transparent.  However in some (very rare)
711 cases you may need to know the exact algorithm.  Such cases include
712 where you use C<guestfs_config> to add a mixture of virtio and IDE
713 devices to the qemu-based appliance, so have a mixture of C</dev/sd*>
714 and C</dev/vd*> devices.
715
716 The algorithm is applied only to I<parameters> which are known to be
717 either device or partition names.  Return values from functions such
718 as C<guestfs_list_devices> are never changed.
719
720 =over 4
721
722 =item *
723
724 Is the string a parameter which is a device or partition name?
725
726 =item *
727
728 Does the string begin with C</dev/sd>?
729
730 =item *
731
732 Does the named device exist?  If so, we use that device.
733 However if I<not> then we continue with this algorithm.
734
735 =item *
736
737 Replace initial C</dev/sd> string with C</dev/hd>.
738
739 For example, change C</dev/sda2> to C</dev/hda2>.
740
741 If that named device exists, use it.  If not, continue.
742
743 =item *
744
745 Replace initial C</dev/sd> string with C</dev/vd>.
746
747 If that named device exists, use it.  If not, return an error.
748
749 =back
750
751 =head2 PORTABILITY CONCERNS
752
753 Although the standard naming scheme and automatic translation is
754 useful for simple programs and guestfish scripts, for larger programs
755 it is best not to rely on this mechanism.
756
757 Where possible for maximum future portability programs using
758 libguestfs should use these future-proof techniques:
759
760 =over 4
761
762 =item *
763
764 Use C<guestfs_list_devices> or C<guestfs_list_partitions> to list
765 actual device names, and then use those names directly.
766
767 Since those device names exist by definition, they will never be
768 translated.
769
770 =item *
771
772 Use higher level ways to identify filesystems, such as LVM names,
773 UUIDs and filesystem labels.
774
775 =back
776
777 =head1 INTERNALS
778
779 =head2 COMMUNICATION PROTOCOL
780
781 Don't rely on using this protocol directly.  This section documents
782 how it currently works, but it may change at any time.
783
784 The protocol used to talk between the library and the daemon running
785 inside the qemu virtual machine is a simple RPC mechanism built on top
786 of XDR (RFC 1014, RFC 1832, RFC 4506).
787
788 The detailed format of structures is in C<src/guestfs_protocol.x>
789 (note: this file is automatically generated).
790
791 There are two broad cases, ordinary functions that don't have any
792 C<FileIn> and C<FileOut> parameters, which are handled with very
793 simple request/reply messages.  Then there are functions that have any
794 C<FileIn> or C<FileOut> parameters, which use the same request and
795 reply messages, but they may also be followed by files sent using a
796 chunked encoding.
797
798 =head3 ORDINARY FUNCTIONS (NO FILEIN/FILEOUT PARAMS)
799
800 For ordinary functions, the request message is:
801
802  total length (header + arguments,
803       but not including the length word itself)
804  struct guestfs_message_header (encoded as XDR)
805  struct guestfs_<foo>_args (encoded as XDR)
806
807 The total length field allows the daemon to allocate a fixed size
808 buffer into which it slurps the rest of the message.  As a result, the
809 total length is limited to C<GUESTFS_MESSAGE_MAX> bytes (currently
810 4MB), which means the effective size of any request is limited to
811 somewhere under this size.
812
813 Note also that many functions don't take any arguments, in which case
814 the C<guestfs_I<foo>_args> is completely omitted.
815
816 The header contains the procedure number (C<guestfs_proc>) which is
817 how the receiver knows what type of args structure to expect, or none
818 at all.
819
820 The reply message for ordinary functions is:
821
822  total length (header + ret,
823       but not including the length word itself)
824  struct guestfs_message_header (encoded as XDR)
825  struct guestfs_<foo>_ret (encoded as XDR)
826
827 As above the C<guestfs_I<foo>_ret> structure may be completely omitted
828 for functions that return no formal return values.
829
830 As above the total length of the reply is limited to
831 C<GUESTFS_MESSAGE_MAX>.
832
833 In the case of an error, a flag is set in the header, and the reply
834 message is slightly changed:
835
836  total length (header + error,
837       but not including the length word itself)
838  struct guestfs_message_header (encoded as XDR)
839  struct guestfs_message_error (encoded as XDR)
840
841 The C<guestfs_message_error> structure contains the error message as a
842 string.
843
844 =head3 FUNCTIONS THAT HAVE FILEIN PARAMETERS
845
846 A C<FileIn> parameter indicates that we transfer a file I<into> the
847 guest.  The normal request message is sent (see above).  However this
848 is followed by a sequence of file chunks.
849
850  total length (header + arguments,
851       but not including the length word itself,
852       and not including the chunks)
853  struct guestfs_message_header (encoded as XDR)
854  struct guestfs_<foo>_args (encoded as XDR)
855  sequence of chunks for FileIn param #0
856  sequence of chunks for FileIn param #1 etc.
857
858 The "sequence of chunks" is:
859
860  length of chunk (not including length word itself)
861  struct guestfs_chunk (encoded as XDR)
862  length of chunk
863  struct guestfs_chunk (encoded as XDR)
864    ...
865  length of chunk
866  struct guestfs_chunk (with data.data_len == 0)
867
868 The final chunk has the C<data_len> field set to zero.  Additionally a
869 flag is set in the final chunk to indicate either successful
870 completion or early cancellation.
871
872 At time of writing there are no functions that have more than one
873 FileIn parameter.  However this is (theoretically) supported, by
874 sending the sequence of chunks for each FileIn parameter one after
875 another (from left to right).
876
877 Both the library (sender) I<and> the daemon (receiver) may cancel the
878 transfer.  The library does this by sending a chunk with a special
879 flag set to indicate cancellation.  When the daemon sees this, it
880 cancels the whole RPC, does I<not> send any reply, and goes back to
881 reading the next request.
882
883 The daemon may also cancel.  It does this by writing a special word
884 C<GUESTFS_CANCEL_FLAG> to the socket.  The library listens for this
885 during the transfer, and if it gets it, it will cancel the transfer
886 (it sends a cancel chunk).  The special word is chosen so that even if
887 cancellation happens right at the end of the transfer (after the
888 library has finished writing and has started listening for the reply),
889 the "spurious" cancel flag will not be confused with the reply
890 message.
891
892 This protocol allows the transfer of arbitrary sized files (no 32 bit
893 limit), and also files where the size is not known in advance
894 (eg. from pipes or sockets).  However the chunks are rather small
895 (C<GUESTFS_MAX_CHUNK_SIZE>), so that neither the library nor the
896 daemon need to keep much in memory.
897
898 =head3 FUNCTIONS THAT HAVE FILEOUT PARAMETERS
899
900 The protocol for FileOut parameters is exactly the same as for FileIn
901 parameters, but with the roles of daemon and library reversed.
902
903  total length (header + ret,
904       but not including the length word itself,
905       and not including the chunks)
906  struct guestfs_message_header (encoded as XDR)
907  struct guestfs_<foo>_ret (encoded as XDR)
908  sequence of chunks for FileOut param #0
909  sequence of chunks for FileOut param #1 etc.
910
911 =head3 INITIAL MESSAGE
912
913 Because the underlying channel (QEmu -net channel) doesn't have any
914 sort of connection control, when the daemon launches it sends an
915 initial word (C<GUESTFS_LAUNCH_FLAG>) which indicates that the guest
916 and daemon is alive.  This is what C<guestfs_wait_ready> waits for.
917
918 =head1 QEMU WRAPPERS
919
920 If you want to compile your own qemu, run qemu from a non-standard
921 location, or pass extra arguments to qemu, then you can write a
922 shell-script wrapper around qemu.
923
924 There is one important rule to remember: you I<must C<exec qemu>> as
925 the last command in the shell script (so that qemu replaces the shell
926 and becomes the direct child of the libguestfs-using program).  If you
927 don't do this, then the qemu process won't be cleaned up correctly.
928
929 Here is an example of a wrapper, where I have built my own copy of
930 qemu from source:
931
932  #!/bin/sh -
933  qemudir=/home/rjones/d/qemu
934  exec $qemudir/x86_64-softmmu/qemu-system-x86_64 -L $qemudir/pc-bios "$@"
935
936 Save this script as C</tmp/qemu.wrapper> (or wherever), C<chmod +x>,
937 and then use it by setting the LIBGUESTFS_QEMU environment variable.
938 For example:
939
940  LIBGUESTFS_QEMU=/tmp/qemu.wrapper guestfish
941
942 Note that libguestfs also calls qemu with the -help and -version
943 options in order to determine features.
944
945 =head1 ENVIRONMENT VARIABLES
946
947 =over 4
948
949 =item LIBGUESTFS_APPEND
950
951 Pass additional options to the guest kernel.
952
953 =item LIBGUESTFS_DEBUG
954
955 Set C<LIBGUESTFS_DEBUG=1> to enable verbose messages.  This
956 has the same effect as calling C<guestfs_set_verbose (handle, 1)>.
957
958 =item LIBGUESTFS_MEMSIZE
959
960 Set the memory allocated to the qemu process, in megabytes.  For
961 example:
962
963  LIBGUESTFS_MEMSIZE=700
964
965 =item LIBGUESTFS_PATH
966
967 Set the path that libguestfs uses to search for kernel and initrd.img.
968 See the discussion of paths in section PATH above.
969
970 =item LIBGUESTFS_QEMU
971
972 Set the default qemu binary that libguestfs uses.  If not set, then
973 the qemu which was found at compile time by the configure script is
974 used.
975
976 See also L</QEMU WRAPPERS> above.
977
978 =item TMPDIR
979
980 Location of temporary directory, defaults to C</tmp>.
981
982 If libguestfs was compiled to use the supermin appliance then each
983 handle will require rather a large amount of space in this directory
984 for short periods of time (~ 80 MB).  You can use C<$TMPDIR> to
985 configure another directory to use in case C</tmp> is not large
986 enough.
987
988 =back
989
990 =head1 SEE ALSO
991
992 L<guestfish(1)>,
993 L<qemu(1)>,
994 L<febootstrap(1)>,
995 L<http://libguestfs.org/>.
996
997 Tools with a similar purpose:
998 L<fdisk(8)>,
999 L<parted(8)>,
1000 L<kpartx(8)>,
1001 L<lvm(8)>,
1002 L<disktype(1)>.
1003
1004 =head1 BUGS
1005
1006 To get a list of bugs against libguestfs use this link:
1007
1008 L<https://bugzilla.redhat.com/buglist.cgi?component=libguestfs&product=Virtualization+Tools>
1009
1010 To report a new bug against libguestfs use this link:
1011
1012 L<https://bugzilla.redhat.com/enter_bug.cgi?component=libguestfs&product=Virtualization+Tools>
1013
1014 When reporting a bug, please check:
1015
1016 =over 4
1017
1018 =item *
1019
1020 That the bug hasn't been reported already.
1021
1022 =item *
1023
1024 That you are testing a recent version.
1025
1026 =item *
1027
1028 Describe the bug accurately, and give a way to reproduce it.
1029
1030 =item *
1031
1032 Run libguestfs-test-tool and paste the B<complete, unedited>
1033 output into the bug report.
1034
1035 =back
1036
1037 =head1 AUTHORS
1038
1039 Richard W.M. Jones (C<rjones at redhat dot com>)
1040
1041 =head1 COPYRIGHT
1042
1043 Copyright (C) 2009 Red Hat Inc.
1044 L<http://libguestfs.org/>
1045
1046 This library is free software; you can redistribute it and/or
1047 modify it under the terms of the GNU Lesser General Public
1048 License as published by the Free Software Foundation; either
1049 version 2 of the License, or (at your option) any later version.
1050
1051 This library is distributed in the hope that it will be useful,
1052 but WITHOUT ANY WARRANTY; without even the implied warranty of
1053 MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
1054 Lesser General Public License for more details.
1055
1056 You should have received a copy of the GNU Lesser General Public
1057 License along with this library; if not, write to the Free Software
1058 Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA 02110-1301 USA