Implement url_exists, file_contains_string, url_contains_string.
[goaljobs.git] / goaljobs.mli
1 (* goaljobs
2  * Copyright (C) 2013 Red Hat Inc.
3  *
4  * This program is free software; you can redistribute it and/or modify
5  * it under the terms of the GNU General Public License as published by
6  * the Free Software Foundation; either version 2 of the License, or
7  * (at your option) any later version.
8  *
9  * This program is distributed in the hope that it will be useful,
10  * but WITHOUT ANY WARRANTY; without even the implied warranty of
11  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
12  * GNU General Public License for more details.
13  *
14  * You should have received a copy of the GNU General Public License along
15  * with this program; if not, write to the Free Software Foundation, Inc.,
16  * 51 Franklin Street, Fifth Floor, Boston, MA 02110-1301 USA.
17  *)
18
19 (** {1 Goaljobs library of useful helper functions.} *)
20
21 (** {2 Targets and requires}
22
23     These are used to write goals.
24
25     Normally you write a goal with one or more [target]s and
26     zero or more [require]s, as the examples below should make
27     clear.
28
29     In the first example, there are two targets: that [o_file] (object)
30     exists, and that it is newer than [c_file] (source).  The rule
31     meets that target by running the C compiler ([cc]) which, if it
32     succeeds, will ensure that the object file exists and is newer
33     than the source file.
34
35     {v
36     let goal compiled c_file =
37         let o_file = change_file_extension "o" c_file in
38         target (more_recent [o_file] [c_file]);
39
40         sh "cc -c %s -o %s" c_file o_file
41     }
42
43     In the second example, the rule requires that several files
44     have been compiled ([require (compiled ...)]
45     before it can link the final program:
46
47     {v
48     let goal built program source =
49         target (more_recent [program] [source]);
50
51         require (compiled source);
52
53         let object = change_file_extension "o" source in
54         sh "cc %s -o %s" object program
55     }
56
57 *)
58
59 val target : bool -> unit
60   (** [target] {i condition} defines the target condition that {b will}
61       be met once the current rule has run.
62
63       Goaljobs is much more flexible than [make].  In [make] only a
64       single type of target is possible.  The following are roughly
65       equivalent:
66
67       {v
68       foo.o: foo.c
69         ...
70
71       let goal compiled () =
72         target (more_recent ["foo.o"] ["foo.c"]);
73         requires (file_exists "foo.c");
74         ...
75       }
76
77       Targets in goaljobs can be any arbitrary expression, and you
78       can have any number of different targets.
79
80       Almost every rule should have one or more targets, which should
81       accurately state the outcome once the rule has been run.
82
83       If you have more than one [target]s then it's as if they have
84       been ORed together ({b not} ANDed which you might expect).
85       You can make this explicit by using a single target and [&&]
86       or [||] between the expressions.  See also {!target_all}
87       and {!target_exists}.
88
89       Normally you put the target(s) early on in the rule, before any
90       running code and before any [require]s.  This is not a
91       hard-and-fast rule and it is not enforced, but doing it will
92       ensure the rule runs most efficiently since if the target is met
93       already then the rest of the rule doesn't run. *)
94
95 val target_all : bool list -> unit
96   (** [target_all [t1; t2; ...]] is the same as writing
97       [target (t1 && t2 && ...)] *)
98
99 val target_exists : bool list -> unit
100   (** [target_exists [t1; t2; ...]] is the same as writing
101       [target (t1 || t2 || ...)] *)
102
103 val require : unit -> unit
104   (** [require] {!goal} defines the requirements of this rule, that
105       is, other goals that have to be met before this rule is able to run.
106
107       In terms of [make], [require]s are roughly equivalent to the
108       right hand side after the [:], but in goaljobs the requirements
109       can be much richer than simply "that file must exist".
110
111       Some very simple rules don't need any [require]s.  Unlike with [make],
112       the requirements of a rule can be placed anywhere within the
113       rule, as long as you put them before they are needed. *)
114
115 (** {2 File and URL testing}
116
117     Various functions to test the existence of files, URLs.
118 *)
119
120 val file_exists : string -> bool
121   (** Return true if the named file exists.
122
123       This function also exists as a goal.  Writing:
124       {v require (file_exists "somefile");}
125       will die unless ["somefile"] exists. *)
126
127 val file_newer_than : string -> string -> bool
128   (** [file_newer_than file_a file_b] returns true if [file_a] is
129       newer than [file_b].  Note that if [file_a] does not exist, it
130       returns false.  If [file_b] does not exist, it is an error.
131
132       There is also a goal version of this function. *)
133
134 val more_recent : string list -> string list -> bool
135   (** [more_recent objects sources] expresses the [make] relationship:
136
137       {v object(s) ...: source(s) ...}
138
139       in a convenient way:
140
141       {v
142       let goal built objects sources =
143         target (more_recent objects sources);
144         ... code to rebuild ...
145       }
146
147       It is roughly equivalent to checking that all the object files
148       exist and are newer than all of the source files.
149
150       Note that both parameters are lists (since in [make] you can
151       have a list of source files and a list of object files).  If you
152       don't want a list, pass a single-element list containing the
153       single the object/source file.
154
155       There is also a goal version of this function. *)
156
157 val url_exists : string -> bool
158   (** The URL is tested to see if it exists.
159
160       There is also a goal version of this function. *)
161
162 val file_contains_string : string -> string -> bool
163   (** [file_contains_string filename str] checks if the named file
164       contains the given substring [str].
165
166       There is also a goal version of this function. *)
167
168 val url_contains_string : string -> string -> bool
169   (** [url_contains_string url str] downloads the URL and checks
170       whether the content contains the given substring [str].
171
172       There is also a goal version of this function. *)
173
174
175 (** {2 Shell}
176
177     Call out to the Unix shell.  [/bin/sh] is used unless you set
178     {!shell} to some other value.  Note that the environment variable
179     [SHELL] is {i not} used.
180
181     {!sh}, {!shout}, {!shlines} work like [printf].  ie. You can
182     substitute variables using [%s], [%d] and so on.  For example:
183
184     {v
185       sh "rsync foo-%s.tar.gz example.com:/html/" version
186     }
187
188     Each invocation of {!sh} (etc) is a single shell (this is slightly
189     different from how [make] works).  For example:
190
191     {v
192       sh "
193         package=foo-%s
194         tarball=$package.tar.gz
195         cp $HOME/$tarball .
196         tar zxf $tarball
197         cd $package
198         ./configure
199         make
200      " version
201     }
202
203     The shell error mode is set such that if any single command
204     returns an error then the {!sh} function as a whole exits with
205     an error.  Write:
206     {v command ||: }
207     to ignore the result of a command.
208
209     Each shell runs in a new temporary directory.  The temporary directory
210     and all its contents is deleted after the shell exits.  If you
211     want to save any data, [cd] somewhere.  For example you could start
212     the command sequence with:
213     {v cd $HOME/data/ }
214 *)
215
216 val sh : ('a, unit, string, unit) format4 -> 'a
217   (** Run the command(s). *)
218
219 val shout : ('a, unit, string, string) format4 -> 'a
220   (** Run the command(s).
221
222       Anything printed on stdout is returned as a string.
223       The trailing [\n] character, if any, is not returned. *)
224
225 val shlines : ('a, unit, string, string list) format4 -> 'a
226   (** Run the command(s).
227
228       Any lines printed to stdout is returned as a list of strings.
229       Trailing [\n] characters are not returned. *)
230
231 (*
232 val shell : string ref
233   (** Set this variable to override the default shell ([/bin/sh]). *)
234 *)
235
236 (** {2 String functions}
237
238     Most string functions are provided by the OCaml standard
239     library (see the module [String]).  For convenience some
240     extra functions are provided here. *)
241
242 (*
243 val replace_substring : string -> string -> string -> string
244   (** [replace_substring patt repl string] replaces all occurrences
245       of [patt] with [repl] in [string]. *)
246 *)
247
248 val change_file_extension : string -> string -> string
249   (** [change_file_extension ext filename] changes the file extension
250       of [filename] to [.ext].  For example
251       [change_file_extension "o" "main.c"] returns ["main.o"].
252       If the original filename has no extension, this function
253       adds the extension. *)
254
255 (*
256 val filter_file_extension : string -> string list -> string
257   (** [filter_file_extension ext filenames] returns only those
258       filenames in the list which have the given file extension.
259       For example [filter_file_extension "o" ["foo.c"; "bar.o"]]
260       would return [["bar.o"]] (a single element list). *)
261 *)
262
263 (** {2 Memory (persistent key/value storage)
264
265     "The Memory" is key/value storage which persists across goaljobs
266     sessions.  It is stored in the file [$HOME/.goaljobs-memory]
267     (which is a binary file, but you can delete it if you want).
268
269     The Memory is locked during accesses, so it is safe to read
270     or write it from multiple parallel goaljobs sessions.
271
272     Keys and values are strings.  The keys should be globally
273     unique, so it is suggested you use some application-specific
274     prefix.  eg: "myapp-key"
275
276     A common pattern is:
277
278     {v
279     let goal tested version =
280         let key = "myapp-tested-" ^ version in
281         target (memory_exists key);
282
283         ... some work to test version ...
284
285         memory_set key "1"
286     }
287
288     Note in that example the value ["1"] is arbitrary.  You just
289     want to store {i any} value so that a later call to {!memory_exists}
290     will succeed.
291 *)
292
293 val memory_exists : string -> bool
294   (** [memory_exists key] checks that the named [key] exists in
295       the Memory.  It doesn't matter what value it has.
296
297       This is also available as a goal, so you can write
298       [requires (memory_exists key)] *)
299
300 val memory_set : string -> string -> unit
301   (** Set [key] to [value] in the Memory. *)
302
303 val memory_get : string -> string option
304   (** Return the current value of [key] in the Memory.  Returns [None]
305       if the key has never been set or was deleted. *)
306
307 val memory_delete : string -> unit
308   (** Delete the [key].  If the key doesn't exist, has no effect. *)
309
310 (** {2 Publishing goals}
311
312     To "publish" a goal means it's available on the command line
313     for users to use directly.
314
315     Goals that have zero arguments are {b automatically published}.
316     So for example:
317
318     {v
319     let goal clean () = sh "rm *~"
320     }
321
322     can be used on the command line:
323
324     {v ./script clean }
325
326     The special goal called [all] (if it exists) is run implicitly
327     unless the user specifies another goal.  Unlike [make], there is
328     nothing special about the first rule in the file.
329
330     You can also publish goals, especially ones which take a non-zero
331     number of parameters, by calling {!publish}.
332 *)
333
334 val publish : string -> (string list -> unit) -> unit
335   (** Publish the named goal.
336
337       Use this function as in this example:
338
339       {v
340       let goal compiled program sources =
341         ... stuff for building the program from sources ...
342
343       let () = publish "compiled" (
344         fun args ->
345           let program = List.hd args in
346           let sources = List.tl args in
347           require (compiled program sources)
348       )
349       }
350
351       This could be used as follows:
352
353       {v ./script compiled program main.c utils.c }
354
355       You will notice you have to write a bit of OCaml code to
356       map the string arguments from the command line on to the
357       goal arguments.  In the example it means taking the first
358       string argument as the program name, and the rest of the
359       string arguments as the source filenames.  This is also
360       the place to perform string to int conversion, checks, and
361       so on (remember that OCaml is strongly typed). *)
362
363 (**/**)
364
365 (* Goal versions of some common functions.  You are using these
366  * versions when you write something like:
367  *   require (file_exists "foo");
368  * They work the same way as the regular function, except they die
369  * if the predicate returns false.
370  *)
371 val goal_file_exists : string -> unit
372 val goal_file_newer_than : string -> string -> unit
373 val goal_more_recent : string list -> string list -> unit
374 val goal_url_exists : string -> unit
375 val goal_file_contains_string : string -> string -> unit
376 val goal_url_contains_string : string -> string -> unit
377 val goal_memory_exists : string -> unit
378
379 (* A single call to this function is added by the 'goaljobs' script.
380  * It is responsible for parsing the command line and so on.
381  *)
382 val init : unit -> unit
383
384 (* Export this so the macros can catch these exceptions. *)
385 type goal_result_t = Goal_OK | Goal_failed of string
386 exception Goal_result of goal_result_t