]> git.sur5r.net Git - bacula/docs/blob - docs/manuals/en/main/fileset.tex
cc7e43b111cf05359829ddaa0b48e4e928867e42
[bacula/docs] / docs / manuals / en / main / fileset.tex
1 -%
2 %%
3
4 \section{The FileSet Resource}
5 \label{FileSetResource}
6 \index[general]{Resource!FileSet}
7 \index[general]{FileSet Resource}
8
9 The FileSet resource defines what files are to be included or excluded in a
10 backup job.  A {\bf FileSet} resource is required for each backup Job.  It
11 consists of a list of files or directories to be included, a list of files
12 or directories to be excluded and the various backup options such as
13 compression, encryption, and signatures that are to be applied to each
14 file.
15
16 Any change to the list of the included files will cause Bacula to
17 automatically create a new FileSet (defined by the name and an MD5 checksum
18 of the Include/Exclude contents).  Each time a new FileSet is created,
19 Bacula will ensure that the next backup is always a Full save.
20
21 Bacula is designed to handle most character sets of the world,
22 US ASCII, German, French, Chinese, ...  However, it does this by
23 encoding everything in UTF-8, and it expects all configuration files
24 (including those read on Win32 machines) to be in UTF-8 format.
25 UTF-8 is typically the default on Linux machines, but not on all
26 Unix machines, nor on Windows, so you must take some care to ensure
27 that your locale is set properly before starting Bacula.  
28 On most modern Win32 machines, you can edit the conf files with {\bf
29 notebook} and choose output encoding UTF-8.
30
31 To ensure that Bacula configuration files can be correctly read including
32 foreign characters the {bf LANG} environment variable
33 must end in {\bf .UTF-8}. An full example is {\bf en\_US.UTF-8}. The
34 exact syntax may vary a bit from OS to OS, and exactly how you define
35 it will also vary.
36
37 Bacula assumes that all filenames are in UTF-8 format on Linux and
38 Unix machines. On Win32 they are in Unicode (UTF-16), and will
39 be automatically converted to UTF-8 format.
40
41
42 \begin{description}
43
44 \item [FileSet]
45 \index[dir]{FileSet}
46 \index[dir]{Directive!FileSet}
47 Start of the FileSet resource. One {\bf FileSet}  resource must be
48 defined for each Backup job.
49
50 \item [Name = \lt{}name\gt{}]
51 \index[dir]{Name}
52 \index[dir]{Directive!Name}
53    The name of the FileSet resource.  This directive is required. 
54
55 \item [Ignore FileSet Changes = \lt{}yes\vb{}no\gt{}]
56 \index[dir]{Ignore FileSet Changes}
57 \index[dir]{Directive!Ignore FileSet Changes}
58    Normally, if you modify the FileSet Include or Exclude lists,
59    the next backup will be forced to a Full so that Bacula can
60    guarantee that any additions or deletions are properly saved.
61
62    We strongly recommend against setting this directive to yes, 
63    since doing so may cause you to have an incomplete set of backups.
64
65    If this directive is set to {\bf yes}, any changes you make to the
66    FileSet Include or Exclude lists, will not force a Full during 
67    subsequent backups.
68
69    The default is {\bf no}, in which case, if you change the Include or
70    Exclude, Bacula will force a Full backup to ensure that everything is
71    properly backed up.
72
73 \item [Enable VSS = \lt{}yes\vb{}no\gt{}]
74 \index[dir]{Enable VSS}
75 \index[dir]{Directive!Enable VSS}
76   If this directive is set to {\bf yes} the File daemon will be notified
77   that the user wants to use a Volume Shadow Copy Service (VSS) backup
78   for this job. The default is {\bf yes}. This directive is effective
79   only for VSS enabled Win32 File daemons. It permits a consistent copy
80   of open files to be made for cooperating writer applications, and for
81   applications that are not VSS away, Bacula can at least copy open files.
82   The Volume Shadow Copy will only be done on Windows drives where the
83   drive (e.g. C:, D:, ...) is explicitly mentioned in a {\bf File}
84   directive.
85   For more information, please see the
86   \ilink{Windows}{VSS} chapter of this manual.
87
88
89 \item [Include \{ Options \{\lt{}file-options\gt{}\} ...;
90    \lt{}file-list\gt{} \} ]
91 \index[dir]{Include \{ [ Options \{\lt{}file-options\gt{}\} ...]
92    \lt{}file-list\gt{} \}  }
93 \index[dir]{Directive!Include}
94
95 \item [Options \{ \lt{}file-options\gt{} \} ]
96 \index[dir]{Options  \{ \lt{}file-options\gt{} \}  }
97
98 \item [Exclude \{ \lt{}file-list\gt{} \}]
99 \index[dir]{Exclude \{ \lt{}file-list\gt{} \} }
100 \index[dir]{Directive!Exclude}
101
102
103 \end{description}
104
105 The Include resource must contain a list of directories and/or files to be
106 processed in the backup job.  Normally, all files found in all
107 subdirectories of any directory in the Include File list will be backed up.
108 Note, see below for the definition of \lt{}file-list\gt{}.
109 The Include resource may also contain one or more Options resources that
110 specify options such as compression to be applied to all or any subset of
111 the files found when processing the file-list for backup. Please see
112 below for more details concerning Options resources.
113
114 There can be any number of {\bf Include} resources within the FileSet, each
115 having its own list of directories or files to be backed up and the backup
116 options defined by one or more Options resources.  The {\bf file-list}
117 consists of one file or directory name per line.  Directory names should be
118 specified without a trailing slash with Unix path notation.
119
120 Windows users, please take note to specify directories (even c:/...) in
121 Unix path notation. If you use Windows conventions, you will most likely
122 not be able to restore your files due to the fact that the Windows
123 path separator was defined as an escape character long before Windows
124 existed, and Bacula adheres to that convention (i.e. \\  means the next character
125 appears as itself).
126
127 You should always specify a full path for every directory and file that you
128 list in the FileSet.  In addition, on Windows machines, you should {\bf
129 always} prefix the directory or filename with the drive specification
130 (e.g.  {\bf c:/xxx}) using Unix directory name separators
131 (forward slash).  The drive letter itself can be upper or lower case (e.g.
132 c:/xxx or C:/xxx).
133
134 Bacula's default for processing directories is to recursively descend in
135 the directory saving all files and subdirectories.  Bacula will not by
136 default cross filesystems (or mount points in Unix parlance).  This means
137 that if you specify the root partition (e.g.  {\bf /}), Bacula will save
138 only the root partition and not any of the other mounted filesystems.
139 Similarly on Windows systems, you must explicitly specify each of the
140 drives you want saved (e.g.
141 {\bf c:/} and {\bf d:/} ...). In addition, at least for Windows systems, you
142 will most likely want to enclose each specification within double quotes
143 particularly if the directory (or file) name contains spaces. The {\bf df}
144 command on Unix systems will show you which mount points you must specify to
145 save everything. See below for an example. 
146
147 Take special care not to include a directory twice or Bacula will backup
148 the same files two times wasting a lot of space on your archive device.
149 Including a directory twice is very easy to do.  For example:
150
151 \footnotesize
152 \begin{verbatim}
153   Include {
154     Options { compression=GZIP }
155     File = /
156     File = /usr
157   }
158 \end{verbatim}
159 \normalsize
160
161 on a Unix system where /usr is a subdirectory (rather than a mounted
162 filesystem) will cause /usr to be backed up twice.
163
164 Please take note of the following items in the FileSet syntax: 
165
166 \begin{enumerate}
167 \item There is no equal sign (=) after the Include and before the opening
168    brace (\{). The same is true for the Exclude. 
169 \item Each directory (or filename) to be included or excluded is preceded by a {\bf File
170    =}.  Previously they were simply listed on separate lines. 
171 \item The options that previously appeared on the Include line now must be
172    specified within their own Options resource.
173 \item The Exclude resource does not accept Options. 
174 \item When using wild-cards or regular expressions, directory names are
175    always terminated with a slash (/) and filenames have no trailing slash.
176 \end{enumerate}
177
178 The Options resource is optional, but when specified, it will contain a
179 list of {\bf keyword=value} options to be applied to the file-list.
180 See below for the definition of file-list.    
181 Multiple Options resources may be specified one after another.  As the
182 files are found in the specified directories, the Options will applied to
183 the filenames to determine if and how the file should be backed up.  The
184 wildcard and regular expression pattern matching parts of the
185 Options resources are checked in the order they are specified in the
186 FileSet until the first one that matches. Once one matches, the
187 compression and other flags within the Options specification will
188 apply to the pattern matched.
189
190 A key point is that in the absence of an Option or no other Option is
191 matched, every file is accepted for backing up. This means that if
192 you want to exclude something, you must explicitly specify an Option
193 with an {\bf exclude = yes} and some pattern matching.
194
195 Once Bacula determines that the Options resource matches the file under
196 consideration, that file will be saved without looking at any other Options
197 resources that may be present.  This means that any wild cards must appear
198 before an Options resource without wild cards.
199
200 If for some reason, Bacula checks all the Options resources to a file under
201 consideration for backup, but there are no matches (generally because of wild
202 cards that don't match), Bacula as a default will then backup the file.  This
203 is quite logical if you consider the case of no Options clause is specified,
204 where you want everything to be backed up, and it is important to keep in mind
205 when excluding as mentioned above.
206
207 However, one additional point is that in the case that no match was found,
208 Bacula will use the options found in the last Options resource.  As a
209 consequence, if you want a particular set of "default" options, you should put
210 them in an Options resource after any other Options.
211
212 It is a good idea to put all your wild-card and regex expressions inside
213 double quotes to prevent conf file scanning problems.
214
215 This is perhaps a bit overwhelming, so there are a number of examples included 
216 below to illustrate how this works.
217
218 You find yourself using a lot of Regex statements, which will cost quite a lot
219 of CPU time, we recommend you simplify them if you can, or better yet
220 convert them to Wild statements which are much more efficient.
221
222 The directives within an Options resource may be one of the following: 
223
224 \begin{description}
225
226 \item [compression=GZIP]
227 \index[dir]{compression}
228 \index[dir]{Directive!compression}
229    All files saved will be software compressed using the GNU ZIP
230    compression format.  The compression is done on a file by file basis by
231    the File daemon.  If there is a problem reading the tape in a single
232    record of a file, it will at most affect that file and none of the other
233    files on the tape.  Normally this option is {\bf not} needed if you have
234    a modern tape drive as the drive will do its own compression.  In fact,
235    if you specify software compression at the same time you have hardware
236    compression turned on, your files may actually take more space on the
237    volume.
238
239    Software compression is very important if you are writing your Volumes
240    to a file, and it can also be helpful if you have a fast computer but a
241    slow network, otherwise it is generally better to rely your tape drive's
242    hardware compression.  As noted above, it is not generally a good idea
243    to do both software and hardware compression.
244
245    Specifying {\bf GZIP} uses the default compression level 6 (i.e.  {\bf
246    GZIP} is identical to {\bf GZIP6}).  If you want a different compression
247    level (1 through 9), you can specify it by appending the level number
248    with no intervening spaces to {\bf GZIP}.  Thus {\bf compression=GZIP1}
249    would give minimum compression but the fastest algorithm, and {\bf
250    compression=GZIP9} would give the highest level of compression, but
251    requires more computation.  According to the GZIP documentation,
252    compression levels greater than six generally give very little extra
253    compression and are rather CPU intensive.
254
255    You can overwrite this option per Storage resource with
256    \ilink{AllowCompression}{AllowCompression} option.
257
258 \item [compression=LZO]
259 \index[dir]{compression}
260 \index[dir]{Directive!compression}
261    All files saved will be software compressed using the LZO
262    compression format. The compression is done on a file by file basis by
263    the File daemon. Everything else about GZIP is true for LZO.
264
265    LZO provides much faster compression and decompression speed but lower
266    compression ratio than GZIP. If your CPU is fast enough you should be able
267    to compress your data without making the backup duration longer.
268
269    Note that bacula only use one compression level LZO1X-1 specified by LZO.
270
271    You can overwrite this option per Storage resource with
272    \ilink{AllowCompression}{AllowCompression} option.
273
274 \item [signature=SHA1]
275 \index[dir]{signature}
276 \index[dir]{SHA1}
277 \index[dir]{Directive!signature}
278    An SHA1 signature will be computed for all The SHA1 algorithm is
279    purported to be some what slower than the MD5 algorithm, but at the same
280    time is significantly better from a cryptographic point of view (i.e.
281    much fewer collisions, much lower probability of being hacked.) It adds
282    four more bytes than the MD5 signature.  We strongly recommend that
283    either this option or MD5 be specified as a default for all files.
284    Note, only one of the two options MD5 or SHA1 can be computed for any
285    file.
286
287 \item [signature=MD5]
288 \index[dir]{signature}
289 \index[dir]{MD5}
290 \index[dir]{Directive!signature}
291    An MD5 signature will be computed for all files saved.  Adding this
292    option generates about 5\% extra overhead for each file saved.  In
293    addition to the additional CPU time, the MD5 signature adds 16 more
294    bytes per file to your catalog.  We strongly recommend that this option
295    or the SHA1 option be specified as a default for all files.
296
297
298 \item[basejob=\lt{}options\gt{}] 
299 \index[dir]{basejob}
300 \index[dir]{Directive!basejob}
301
302 The options letters specified are used when running a {\bf Backup Level=Full}
303 with BaseJobs. The options letters are the same than in the \textbf{verify=}
304 option below.
305
306 \item[accurate=\lt{}options\gt{}] 
307 \index[dir]{accurate}
308 \index[dir]{Directive!accurate}
309    The options letters specified are used  when running a {\bf Backup
310    Level=Incremental/Differential} in Accurate mode. The options
311    letters are the same than in the \textbf{verify=} option below.  
312
313 \item [verify=\lt{}options\gt{}]
314 \index[dir]{verify}
315 \index[dir]{Directive!verify}
316    The options letters specified are used  when running a {\bf Verify
317    Level=Catalog} as well as the  {\bf DiskToCatalog} level job. The options
318    letters may be any  combination of the following:  
319
320       \begin{description}
321
322       \item {\bf i}
323       compare the inodes  
324
325       \item {\bf p}
326       compare the permission bits  
327
328       \item {\bf n}
329       compare the number of links  
330
331       \item {\bf u}
332       compare the user id  
333
334       \item {\bf g}
335       compare the group id  
336
337       \item {\bf s}
338       compare the size  
339
340       \item {\bf a}
341       compare the access time  
342
343       \item {\bf m}
344       compare the modification time (st\_mtime)  
345
346       \item {\bf c}
347       compare the change time (st\_ctime)  
348
349       \item {\bf d}
350       report file size decreases  
351
352       \item {\bf 5}
353       compare the MD5 signature  
354
355       \item {\bf 1}
356       compare the SHA1 signature  
357       \end{description}
358
359    A useful set of general options on the {\bf Level=Catalog}  or {\bf
360    Level=DiskToCatalog}  verify is {\bf pins5} i.e. compare permission bits,
361    inodes, number  of links, size, and MD5 changes. 
362
363 \item [onefs=yes\vb{}no]
364 \index[dir]{onefs}
365 \index[dir]{Directive!onefs}
366    If set to {\bf yes} (the default), {\bf Bacula} will remain on a single
367    file system.  That is it will not backup file systems that are mounted
368    on a subdirectory.  If you are using a *nix system, you may not even be
369    aware that there are several different filesystems as they are often
370    automatically mounted by the OS (e.g.  /dev, /net, /sys, /proc, ...).
371    With Bacula 1.38.0 or later, it will inform you when it decides not to
372    traverse into another filesystem.  This can be very useful if you forgot
373    to backup a particular partition.  An example of the informational
374    message in the job report is:
375
376 \footnotesize
377 \begin{verbatim}
378 rufus-fd: /misc is a different filesystem. Will not descend from / into /misc
379 rufus-fd: /net is a different filesystem. Will not descend from / into /net
380 rufus-fd: /var/lib/nfs/rpc_pipefs is a different filesystem. Will not descend from /var/lib/nfs into /var/lib/nfs/rpc_pipefs
381 rufus-fd: /selinux is a different filesystem. Will not descend from / into /selinux
382 rufus-fd: /sys is a different filesystem. Will not descend from / into /sys
383 rufus-fd: /dev is a different filesystem. Will not descend from / into /dev
384 rufus-fd: /home is a different filesystem. Will not descend from / into /home
385 \end{verbatim}
386 \normalsize
387
388    Note: in previous versions of Bacula, the above message was of the form: 
389
390 \footnotesize
391 \begin{verbatim}
392 Filesystem change prohibited. Will not descend into /misc
393 \end{verbatim}
394 \normalsize
395
396    If you wish to backup multiple filesystems, you can  explicitly
397    list each filesystem you want saved.  Otherwise, if you set the onefs option
398    to {\bf no}, Bacula will backup  all mounted file systems (i.e. traverse mount
399    points) that  are found within the {\bf FileSet}. Thus if  you have NFS or
400    Samba file systems mounted on a directory listed  in your FileSet, they will
401    also be backed up. Normally, it is  preferable to set {\bf onefs=yes} and to
402    explicitly name  each filesystem you want backed up. Explicitly naming  the
403    filesystems you want backed up avoids the possibility  of getting into a
404    infinite loop recursing filesystems.  Another possibility is to 
405    use {\bf onefs=no} and to set {\bf fstype=ext2, ...}.             
406    See the example below for more details. 
407
408    If you think that Bacula should be backing up a particular directory
409    and it is not, and you have {\bf onefs=no} set, before you complain,
410    please do:
411
412 \footnotesize
413 \begin{verbatim}
414   stat /
415   stat <filesystem>
416 \end{verbatim}
417 \normalsize
418
419 where you replace {\bf filesystem} with the one in question.  If the 
420 {\bf Device:} number is different for / and for your filesystem, then they
421 are on different filesystems.  E.g.
422 \footnotesize
423 \begin{verbatim}
424 stat /
425   File: `/'
426   Size: 4096            Blocks: 16         IO Block: 4096   directory
427 Device: 302h/770d       Inode: 2           Links: 26
428 Access: (0755/drwxr-xr-x)  Uid: (    0/    root)   Gid: (    0/    root)
429 Access: 2005-11-10 12:28:01.000000000 +0100
430 Modify: 2005-09-27 17:52:32.000000000 +0200
431 Change: 2005-09-27 17:52:32.000000000 +0200
432
433 stat /net
434   File: `/home'
435   Size: 4096            Blocks: 16         IO Block: 4096   directory
436 Device: 308h/776d       Inode: 2           Links: 7
437 Access: (0755/drwxr-xr-x)  Uid: (    0/    root)   Gid: (    0/    root)
438 Access: 2005-11-10 12:28:02.000000000 +0100
439 Modify: 2005-11-06 12:36:48.000000000 +0100
440 Change: 2005-11-06 12:36:48.000000000 +0100
441 \end{verbatim}
442 \normalsize
443
444    Also be aware that even if you include {\bf /home} in your list
445    of files to backup, as you most likely should, you will get the
446    informational message that  "/home is a different filesystem" when 
447    Bacula is processing the {\bf /} directory.  This message does not
448    indicate an error. This message means that while examining the 
449    {\bf File =} referred to in the second part of the message, Bacula will 
450    not descend into the directory mentioned in the first part of the message.
451    However, it is possible that the separate filesystem will be backed up 
452    despite the message. For example, consider the following FileSet:
453
454 \footnotesize
455 \begin{verbatim}
456   File = /
457   File = /var
458 \end{verbatim}
459 \normalsize
460
461    where {\bf /var} is a separate filesystem.  In this example, you will get a
462    message saying that Bacula will not decend from {\bf /} into {\bf /var}.  But 
463    it is important to realise that Bacula will descend into {\bf /var} from the 
464    second File directive shown above.  In effect, the warning is bogus,
465    but it is supplied to alert you to possible omissions from your FileSet. In 
466    this example, {\bf /var} will be backed up.  If you changed the FileSet such 
467    that it did not specify {\bf /var}, then {\bf /var} will not be backed up.
468
469    
470 \item [honor nodump flag=\lt{}yes\vb{}no\gt{}]
471 \index[dir]{honornodumpflag}
472 \index[dir]{Directive!honornodumpflag}
473         If your file system supports the {\bf nodump} flag (e. g. most
474         BSD-derived systems) Bacula will honor the setting of the flag
475         when this option is set to {\bf yes}. Files having this flag set
476         will not be included in the backup and will not show up in the
477         catalog. For directories with the {\bf nodump} flag set recursion
478         is turned off and the directory will be listed in the catalog.
479         If the {\bf honor nodump flag} option is not defined
480         or set to {\bf no} every file and directory will be eligible for
481         backup.
482
483
484 \label{portable}
485 \item [portable=yes\vb{}no]
486 \index[dir]{portable}
487 \index[dir]{Directive!portable}
488    If set to {\bf yes} (default is {\bf no}), the Bacula File daemon will
489    backup Win32 files in a portable format, but not all Win32 file
490    attributes will be saved and restored.  By default, this option is set
491    to {\bf no}, which means that on Win32 systems, the data will be backed
492    up using Windows API calls and on WinNT/2K/XP, all the security and
493    ownership attributes will be properly backed up (and restored).  However
494    this format is not portable to other systems -- e.g.  Unix, Win95/98/Me.
495    When backing up Unix systems, this option is ignored, and unless you
496    have a specific need to have portable backups, we recommend accept the
497    default ({\bf no}) so that the maximum information concerning your files
498    is saved.
499
500 \item [recurse=yes\vb{}no]
501 \index[dir]{recurse}
502 \index[dir]{Directive!recurse}
503    If set to {\bf yes} (the default), Bacula will recurse (or descend) into
504    all subdirectories found unless the directory is explicitly excluded
505    using an {\bf exclude} definition.  If you set {\bf recurse=no}, Bacula
506    will save the subdirectory entries, but not descend into the
507    subdirectories, and thus will not save the files or directories
508    contained in the subdirectories.  Normally, you will want the default
509    ({\bf yes}).
510
511 \item [sparse=yes\vb{}no]
512 \index[dir]{sparse}
513 \index[dir]{Directive!sparse}
514    Enable special code that checks for sparse files such as created by
515    ndbm.  The default is {\bf no}, so no checks are made for sparse files.
516    You may specify {\bf sparse=yes} even on files that are not sparse file.
517    No harm will be done, but there will be a small additional overhead to
518    check for buffers of all zero, and a small additional amount of space on
519    the output archive will be used to save the seek address of each
520    non-zero record read.
521
522    {\bf Restrictions:} Bacula reads files in 32K buffers.  If the whole
523    buffer is zero, it will be treated as a sparse block and not written to
524    tape.  However, if any part of the buffer is non-zero, the whole buffer
525    will be written to tape, possibly including some disk sectors (generally
526    4098 bytes) that are all zero.  As a consequence, Bacula's detection of
527    sparse blocks is in 32K increments rather than the system block size.
528    If anyone considers this to be a real problem, please send in a request
529    for change with the reason.
530
531    If you are not familiar with sparse files, an example is say a file
532    where you wrote 512 bytes at address zero, then 512 bytes at address 1
533    million.  The operating system will allocate only two blocks, and the
534    empty space or hole will have nothing allocated.  However, when you read
535    the sparse file and read the addresses where nothing was written, the OS
536    will return all zeros as if the space were allocated, and if you backup
537    such a file, a lot of space will be used to write zeros to the volume.
538    Worse yet, when you restore the file, all the previously empty space
539    will now be allocated using much more disk space.  By turning on the
540    {\bf sparse} option, Bacula will specifically look for empty space in
541    the file, and any empty space will not be written to the Volume, nor
542    will it be restored.  The price to pay for this is that Bacula must
543    search each block it reads before writing it.  On a slow system, this
544    may be important.  If you suspect you have sparse files, you should
545    benchmark the difference or set sparse for only those files that are
546    really sparse.
547
548 \label{readfifo}
549 \item [readfifo=yes\vb{}no]
550 \index[dir]{readfifo}
551 \index[dir]{Directive!readfifo}
552    If enabled, tells the Client to read the data on a backup and write the
553    data on a restore to any FIFO (pipe) that is explicitly mentioned in the
554    FileSet.  In this case, you must have a program already running that
555    writes into the FIFO for a backup or reads from the FIFO on a restore.
556    This can be accomplished with the {\bf RunBeforeJob} directive.  If this
557    is not the case, Bacula will hang indefinitely on reading/writing the
558    FIFO. When this is not enabled (default), the Client simply saves the
559    directory entry for the FIFO.
560
561    Unfortunately, when Bacula runs a RunBeforeJob, it waits until that
562    script terminates, and if the script accesses the FIFO to write   
563    into the it, the Bacula job will block and everything will stall.
564    However, Vladimir Stavrinov as supplied tip that allows this feature   
565    to work correctly.  He simply adds the following to the beginning
566    of the RunBeforeJob script:
567
568 \begin{verbatim}
569    exec > /dev/null
570 \end{verbatim}
571
572 \item [noatime=yes\vb{}no]
573 \index[dir]{noatime}
574 \index[dir]{Directive!noatime}
575    If enabled, and if your Operating System supports the O\_NOATIME file
576    open flag, Bacula will open all files to be backed up with this option.
577    It makes it possible to read a file without updating the inode atime
578    (and also without the inode ctime update which happens if you try to set
579    the atime back to its previous value).  It also prevents a race
580    condition when two programs are reading the same file, but only one does
581    not want to change the atime.  It's most useful for backup programs and
582    file integrity checkers (and bacula can fit on both categories).
583
584    This option is particularly useful for sites where users are sensitive
585    to their MailBox file access time.  It replaces both the {\bf keepatime}
586    option without the inconveniences of that option (see below).
587
588    If your Operating System does not support this option, it will be
589    silently ignored by Bacula.
590
591
592 \item [mtimeonly=yes\vb{}no]
593 \index[dir]{mtimeonly}
594 \index[dir]{Directive!mtimeonly}
595    If enabled, tells the Client that the selection of files during
596    Incremental and Differential backups should based only on the st\_mtime
597    value in the stat() packet.  The default is {\bf no} which means that
598    the selection of files to be backed up will be based on both the
599    st\_mtime and the st\_ctime values.  In general, it is not recommended
600    to use this option.
601
602 \item [keepatime=yes\vb{}no]
603 \index[dir]{keepatime}
604 \index[dir]{Directive!keepatime}
605    The default is {\bf no}.  When enabled, Bacula will reset the st\_atime
606    (access time) field of files that it backs up to their value prior to
607    the backup.  This option is not generally recommended as there are very
608    few programs that use st\_atime, and the backup overhead is increased
609    because of the additional system call necessary to reset the times.
610    However, for some files, such as mailboxes, when Bacula backs up the
611    file, the user will notice that someone (Bacula) has accessed the
612    file. In this, case keepatime can be useful.
613    (I'm not sure this works on Win32).
614
615    Note, if you use this feature, when Bacula resets the access time, the
616    change time (st\_ctime) will automatically be modified by the system,
617    so on the next incremental job, the file will be backed up even if
618    it has not changed. As a consequence, you will probably also want
619    to use {\bf mtimeonly = yes} as well as keepatime (thanks to
620    Rudolf Cejka for this tip).
621
622 \item [checkfilechanges=yes\vb{}no]
623 \index[dir]{checkfilechanges}
624 \index[dir]{Directive!checkfilechanges}
625    On versions 2.0.4 or greater, 
626    if enabled, the Client will check size, age of each file after 
627    their backup to see if they have changed during backup. If time 
628    or size mismatch, an error will raise.
629
630 \begin{verbatim}
631  zog-fd: Client1.2007-03-31_09.46.21 Error: /tmp/test mtime changed during backup.
632 \end{verbatim}
633
634    In general, it is recommended to use this option.
635
636 \item [hardlinks=yes\vb{}no]
637 \index[dir]{hardlinks}
638 \index[dir]{Directive!hardlinks}
639    When enabled (default), this directive will cause hard links to be 
640    backed up. However, the File daemon keeps track of hard linked files and
641    will backup the data only once. The process of keeping track of the 
642    hard links can be quite expensive if you have lots of them (tens of
643    thousands or more). This doesn't occur on normal Unix systems, but if
644    you use a program like BackupPC, it can create hundreds of thousands, or
645    even millions of hard links. Backups become very long and the File daemon
646    will consume a lot of CPU power checking hard links.  In such a case,
647    set {\bf hardlinks=no} and hard links will not be backed up.  Note, using
648    this option will most likely backup more data and on a restore the file
649    system will not be restored identically to the original.
650
651 \item [wild=\lt{}string\gt{}]
652 \index[dir]{wild}
653 \index[dir]{Directive!wild}
654    Specifies a wild-card string to be applied to the filenames and
655    directory names.  Note, if {\bf Exclude} is not enabled, the wild-card
656    will select which files are to be included.  If {\bf Exclude=yes} is
657    specified, the wild-card will select which files are to be excluded.
658    Multiple wild-card directives may be specified, and they will be applied
659    in turn until the first one that matches.  Note, if you exclude a
660    directory, no files or directories below it will be matched.
661
662    You may want to test your expressions prior to running your
663    backup by using the bwild program. Please see the
664    \ilink{Utilities}{bwild} chapter of this manual for
665    more. You can also test your full FileSet definition by using
666    the \ilink{estimate}{estimate} command in the Console        
667    chapter of this manual.
668    It is recommended to enclose the string in double quotes.
669
670 \item [wilddir=\lt{}string\gt{}]
671 \index[dir]{wilddir}
672 \index[dir]{Directive!wilddir}
673    Specifies a wild-card string to be applied to directory names only.  No
674    filenames will be matched by this directive.  Note, if {\bf Exclude} is
675    not enabled, the wild-card will select directories to be
676    included.  If {\bf Exclude=yes} is specified, the wild-card will select
677    which directories are to be excluded.  Multiple wild-card directives may be
678    specified, and they will be applied in turn until the first one that
679    matches.  Note, if you exclude a directory, no files or directories
680    below it will be matched.
681
682    It is recommended to enclose the string in double quotes.
683
684    You may want to test your expressions prior to running your
685    backup by using the bwild program. Please see the
686    \ilink{Utilities}{bwild} chapter of this manual for
687    more. You can also test your full FileSet definition by using
688    the \ilink{estimate}{estimate} command in the Console        
689    chapter of this manual.
690    An example of excluding with the WildDir option on Win32 machines is    
691    presented below.
692
693 \item [wildfile=\lt{}string\gt{}]
694 \index[dir]{wildfile}
695 \index[dir]{Directive!wildfile}
696    Specifies a wild-card string to be applied to non-directories. That
697    is no directory entries will be matched by this directive.
698    However, note that the match is done against the full path and filename,
699    so your wild-card string must take into account that filenames
700    are preceded by the full path.
701    If {\bf Exclude}
702    is not enabled, the wild-card will select which files are to be
703    included.  If {\bf Exclude=yes} is specified, the wild-card will select
704    which files are to be excluded.  Multiple wild-card directives may be
705    specified, and they will be applied in turn until the first one that
706    matches.
707
708    It is recommended to enclose the string in double quotes.
709
710    You may want to test your expressions prior to running your
711    backup by using the bwild program. Please see the
712    \ilink{Utilities}{bwild} chapter of this manual for
713    more. You can also test your full FileSet definition by using
714    the \ilink{estimate}{estimate} command in the Console        
715    chapter of this manual.
716    An example of excluding with the WildFile option on Win32 machines is    
717    presented below.
718
719
720 \item [regex=\lt{}string\gt{}]
721 \index[dir]{regex}
722 \index[dir]{Directive!regex}
723    Specifies a POSIX extended regular expression to be applied to the
724    filenames and directory names, which include the full path.  If {\bf
725    Exclude} is not enabled, the regex will select which files are to be
726    included.  If {\bf Exclude=yes} is specified, the regex will select
727    which files are to be excluded.  Multiple regex directives may be
728    specified within an Options resource, and they will be applied in turn
729    until the first one that matches.  Note, if you exclude a directory, no
730    files or directories below it will be matched.
731
732    It is recommended to enclose the string in double quotes.
733
734    The regex libraries differ from one operating system to
735    another, and in addition, regular expressions are complicated,
736    so you may want to test your expressions prior to running your
737    backup by using the bregex program. Please see the
738    \ilink{Utilities}{bwild} chapter of this manual for
739    more. You can also test your full FileSet definition by using
740    the \ilink{estimate}{estimate} command in the Console        
741    chapter of this manual.
742
743    You find yourself using a lot of Regex statements, which will cost quite a lot
744    of CPU time, we recommend you simplify them if you can, or better yet
745    convert them to Wild statements which are much more efficient.
746
747
748 \item [regexfile=\lt{}string\gt{}]
749 \index[dir]{regexfile}
750 \index[dir]{Directive!regexfile}
751    Specifies a POSIX extended regular expression to be applied to
752    non-directories. No directories will be matched by this directive.  
753    However, note that the match is done against the full path and
754    filename, so your regex string must take into account that filenames
755    are preceded by the full path.
756    If {\bf Exclude} is not enabled, the regex will select which files are
757    to be included.  If {\bf Exclude=yes} is specified, the regex will
758    select which files are to be excluded.  Multiple regex directives may be
759    specified, and they will be applied in turn until the first one that
760    matches.
761
762    It is recommended to enclose the string in double quotes.
763
764    The regex libraries differ from one operating system to
765    another, and in addition, regular expressions are complicated,
766    so you may want to test your expressions prior to running your
767    backup by using the bregex program. Please see the
768    \ilink{Utilities}{bregex} chapter of this manual for
769    more.
770
771
772 \item [regexdir=\lt{}string\gt{}]
773 \index[dir]{regexdir}
774 \index[dir]{Directive!regexdir}
775    Specifies a POSIX extended regular expression to be applied to directory
776    names only.  No filenames will be matched by this directive.  Note, if
777    {\bf Exclude} is not enabled, the regex will select directories
778    files are to be included.  If {\bf Exclude=yes} is specified, the
779    regex will select which files are to be excluded.  Multiple
780    regex directives may be specified, and they will be applied in turn
781    until the first one that matches.  Note, if you exclude a directory, no
782    files or directories below it will be matched.
783
784    It is recommended to enclose the string in double quotes.
785
786    The regex libraries differ from one operating system to
787    another, and in addition, regular expressions are complicated,
788    so you may want to test your expressions prior to running your
789    backup by using the bregex program. Please see the
790    \ilink{Utilities}{bregex} chapter of this manual for
791    more.
792
793
794 \item [exclude=yes\vb{}no]
795 \index[dir]{exclude}
796 \index[dir]{Directive!exclude}
797    The default is {\bf no}.  When enabled, any files matched within the
798    Options will be excluded from the backup.
799
800 \label{ACLSupport}
801 \item [aclsupport=yes\vb{}no]
802 \index[dir]{aclsupport}
803 \index[dir]{Directive!aclsupport}
804    The default is {\bf no}.  If this option is set to yes, and you have the
805    POSIX {\bf libacl} installed on your system, Bacula will backup the file
806    and directory UNIX Access Control Lists (ACL) as defined in IEEE Std
807    1003.1e draft 17 and "POSIX.1e" (abandoned).  This feature is
808    available on UNIX only and depends on the ACL library.  Bacula is
809    automatically compiled with ACL support if the {\bf libacl} library is
810    installed on your system (shown in config.out).  While restoring the
811    files Bacula will try to restore the ACLs, if there is no ACL support
812    available on the system, Bacula restores the files and directories but
813    not the ACL information.  Please note, if you backup an EXT3 or XFS
814    filesystem with ACLs, then you restore them to a different filesystem
815    (perhaps reiserfs) that does not have ACLs, the ACLs will be ignored.
816
817 \item [ignore case=yes\vb{}no]
818 \index[dir]{ignore case}
819 \index[dir]{Directive!ignore case}
820    The default is {\bf no}.  On Windows systems, you will almost surely
821    want to set this to {\bf yes}.  When this directive is set to {\bf yes}
822    all the case of character will be ignored in wild-card and regex
823    comparisons.  That is an uppercase A will match a lowercase a.
824
825 \item [fstype=filesystem-type]
826 \index[dir]{fstype}
827 \index[dir]{Directive!fstype}
828    This option allows you to select files and directories by the
829    filesystem type.  The permitted filesystem-type names are:
830
831    ext2, jfs, ntfs, proc, reiserfs, xfs, usbdevfs, sysfs, smbfs,
832    iso9660.  For ext3 systems, use ext2.
833
834    You may have multiple Fstype directives, and thus permit matching
835    of multiple filesystem types within a single Options resource.  If
836    the type specified on the fstype directive does not match the
837    filesystem for a particular directive, that directory will not be
838    backed up.  This directive can be used to prevent backing up
839    non-local filesystems. Normally, when you use this directive, you
840    would also set {\bf onefs=no} so that Bacula will traverse filesystems.
841
842    This option is not implemented in Win32 systems.
843
844 \item [DriveType=Windows-drive-type]
845 \index[dir]{DriveType}
846 \index[dir]{Directive!DriveType}
847    This option is effective only on Windows machines and is
848    somewhat similar to the Unix/Linux {\bf fstype} described
849    above, except that it allows you to select what Windows
850    drive types you want to allow.  By default all drive
851    types are accepted.
852
853    The permitted drivetype names are:
854
855    removable, fixed, remote, cdrom, ramdisk
856
857    You may have multiple Driveype directives, and thus permit matching
858    of multiple drive types within a single Options resource.  If
859    the type specified on the drivetype directive does not match the
860    filesystem for a particular directive, that directory will not be
861    backed up.  This directive can be used to prevent backing up
862    non-local filesystems. Normally, when you use this directive, you
863    would also set {\bf onefs=no} so that Bacula will traverse filesystems.
864
865    This option is not implemented in Unix/Linux systems.
866
867
868 \item [hfsplussupport=yes\vb{}no]
869 \index[dir]{hfsplussupport}
870 \index[dir]{Directive!hfsplussupport}
871    This option allows you to turn on support for Mac OSX HFS plus 
872    finder information.
873
874 \item [strippath=\lt{}integer\gt{}]
875 \index[dir]{strippath}
876 \index[dir]{Directive!strippath}
877    This option will cause {\bf integer} paths to be stripped from
878    the front of the full path/filename being backed up. This can
879    be useful if you are migrating data from another vendor or if
880    you have taken a snapshot into some subdirectory.  This directive
881    can cause your filenames to be overlayed with regular backup data,
882    so should be used only by experts and with great care.
883 \end{description}
884
885 {\bf \lt{}file-list\gt{}} is a list of directory and/or filename names
886 specified with a {\bf File =} directive. To include names containing spaces,
887 enclose the name between double-quotes. Wild-cards are not interpreted
888 in file-lists. They can only be specified in Options resources.
889
890 There are a number of special cases when specifying directories and files in a
891 {\bf file-list}. They are: 
892
893 \begin{itemize}
894 \item Any name preceded by an at-sign (@) is assumed to be the  name of a
895    file, which contains a list of files each preceded by a "File =".  The
896    named file is read once when the configuration file is parsed during the
897    Director startup.  Note, that the file is read on the Director's machine
898    and not on the Client's.  In fact, the @filename can appear anywhere
899    within the conf file where a token would be read, and the contents of
900    the named file will be logically inserted in the place of the @filename.
901    What must be in the file depends on the location the @filename is
902    specified in the conf file.  For example:
903
904 \footnotesize
905 \begin{verbatim}
906 Include {
907   Options { compression=GZIP }
908   @/home/files/my-files
909 }
910 \end{verbatim}
911 \normalsize
912
913 \item Any name beginning with a vertical bar (\vb) is  assumed to be the name of
914    a program.  This program will be executed on the Director's machine at
915    the time the Job starts (not when the Director reads the configuration
916    file), and any output from that program will be assumed to be a list of
917    files or directories, one per line, to be included. Before submitting the 
918    specified command bacula will performe 
919    \ilink{character substitution}{character substitution}.
920
921    This allows you to have a job that, for example, includes all the local
922    partitions even if you change the partitioning by adding a disk.  The
923    examples below show you how to do this.  However, please note two
924    things: \\
925    1.  if you want the local filesystems, you probably should be
926    using the new {\bf fstype} directive, which was added in version 1.36.3 
927    and set {\bf onefs=no}.
928    \\
929
930    2.  the exact syntax of the command needed in the examples below is very
931    system dependent.  For example, on recent Linux systems, you may need to
932    add the -P option, on FreeBSD systems, the options will be different as
933    well.
934
935    In general, you will need to prefix your command or commands with a {\bf
936    sh -c} so that they are invoked by a shell.  This will not be the case
937    if you are invoking a script as in the second example below.  Also, you
938    must take care to escape (precede with a \textbackslash{}) wild-cards,
939    shell character, and to ensure that any spaces in your command are
940    escaped as well.  If you use a single quotes (') within a double quote
941    ("), Bacula will treat everything between the single quotes as one field
942    so it will not be necessary to escape the spaces.  In general, getting
943    all the quotes and escapes correct is a real pain as you can see by the
944    next example.  As a consequence, it is often easier to put everything in
945    a file and simply use the file name within Bacula.  In that case the
946    {\bf sh -c} will not be necessary providing the first line of the file
947    is {\bf \#!/bin/sh}.
948
949    As an  example: 
950
951 \footnotesize
952 \begin{verbatim}
953  
954 Include {
955    Options { signature = SHA1 }
956    File = "|sh -c 'df -l | grep \"^/dev/hd[ab]\" | grep -v \".*/tmp\" \
957       | awk \"{print \\$6}\"'"
958 }
959 \end{verbatim}
960 \normalsize
961
962    will produce a list of all the local partitions on a Red Hat Linux system.
963    Note, the above line was split, but should normally  be written on one line. 
964    Quoting is a real problem because you must quote for Bacula  which consists of
965    preceding every \textbackslash{} and every " with a \textbackslash{}, and 
966    you must also quote for the shell command. In the end, it is probably  easier
967    just to execute a small file with: 
968
969
970 \footnotesize
971 \begin{verbatim}
972 Include {
973   Options {
974     signature=MD5
975   }
976   File = "|my_partitions"
977 }
978 \end{verbatim}
979 \normalsize
980
981    where my\_partitions has: 
982
983 \footnotesize
984 \begin{verbatim}
985 #!/bin/sh
986 df -l | grep "^/dev/hd[ab]" | grep -v ".*/tmp" \
987       | awk "{print \$6}"
988 \end{verbatim}
989 \normalsize
990
991    If the vertical bar (\verb+|+) in front of my\_partitions is preceded by a
992    backslash as in \textbackslash{}\verb+|+, the program will be executed on the
993    Client's machine instead of on the Director's machine.
994    Please note that if the filename is given within quotes, you
995    will need to use two slashes.  An example, provided by John Donagher,
996    that backs up all the local UFS partitions on a remote system is:
997
998 \footnotesize
999 \begin{verbatim}
1000 FileSet {
1001   Name = "All local partitions"
1002   Include {
1003     Options { signature=SHA1; onefs=yes; }
1004     File = "\\|bash -c \"df -klF ufs | tail +2 | awk '{print \$6}'\""
1005   }
1006 }
1007 \end{verbatim}
1008 \normalsize
1009
1010    The above requires two backslash characters after the double quote (one
1011    preserves  the next one). If you are a Linux user, just change the {\bf ufs}
1012    to  {\bf ext3} (or your preferred filesystem type), and you will be in 
1013    business.  
1014
1015    If you know what filesystems you have mounted on your system, e.g. 
1016    for Red Hat Linux normally only ext2 and ext3, you can backup
1017    all local filesystems using something like:
1018
1019 \footnotesize
1020 \begin{verbatim}
1021  
1022 Include {
1023    Options { signature = SHA1; onfs=no; fstype=ext2 }
1024    File = /
1025 }
1026 \end{verbatim}
1027 \normalsize
1028
1029
1030 \item Any file-list item preceded by a less-than sign (\lt{})  will be taken
1031    to be a file. This file will be read on the Director's machine (see
1032    below for doing it on the Client machine) at the time
1033    the Job starts, and the  data will be assumed to be a list of directories or
1034    files,  one per line, to be included. The names should start in  column 1 and
1035    should not be quoted even if they contain  spaces. This feature allows you to
1036    modify the external  file and change what will be saved without stopping and 
1037    restarting Bacula as would be necessary if using the @  modifier noted above.
1038    For example: 
1039
1040 \footnotesize
1041 \begin{verbatim}
1042 Include {
1043   Options { signature = SHA1 }
1044   File = "</home/files/local-filelist"
1045 }
1046 \end{verbatim}
1047 \normalsize
1048
1049    If you precede the less-than sign (\lt{}) with a backslash as in
1050    \textbackslash{}\lt{}, the file-list will be read on the Client machine
1051    instead of on the Director's machine.  Please note that if the filename
1052    is given within quotes, you will need to use two slashes.
1053
1054 \footnotesize
1055 \begin{verbatim}
1056 Include {
1057   Options { signature = SHA1 }
1058   File = "\\</home/xxx/filelist-on-client"
1059 }
1060 \end{verbatim}
1061 \normalsize
1062
1063 \item If you explicitly specify a block device such as {\bf /dev/hda1},  then
1064    Bacula (starting with version 1.28) will assume that this  is a raw partition
1065    to be backed up. In this case, you are strongly  urged to specify a {\bf
1066    sparse=yes} include option, otherwise, you  will save the whole partition
1067    rather than just the actual data that  the partition contains. For example: 
1068
1069 \footnotesize
1070 \begin{verbatim}
1071 Include {
1072   Options { signature=MD5; sparse=yes }
1073   File = /dev/hd6
1074 }
1075 \end{verbatim}
1076 \normalsize
1077
1078    will backup the data in device /dev/hd6. Note, the {bf /dev/hd6} must be
1079    the raw partition itself. Bacula will not back it up as a raw device if
1080    you specify a symbolic link to a raw device such as my be created by the
1081    LVM Snapshot utilities.
1082
1083    Ludovic Strappazon has pointed out that this feature can be  used to backup a
1084    full Microsoft Windows disk. Simply boot into  the system using a Linux Rescue
1085    disk, then load a statically  linked Bacula as described in the 
1086    \ilink{ Disaster Recovery Using Bacula}{RescueChapter} chapter of
1087    this manual. Then  save the whole disk partition. In the case of a disaster,
1088    you  can then restore the desired partition by again booting with  the rescue
1089    disk and doing a restore of the partition. 
1090    \item If you explicitly specify a FIFO device name (created with mkfifo),  and
1091    you add the option {\bf readfifo=yes} as an option, Bacula  will read the FIFO
1092    and back its data up to the Volume. For  example: 
1093
1094 \footnotesize
1095 \begin{verbatim}
1096 Include {
1097   Options {
1098     signature=SHA1
1099     readfifo=yes
1100   }
1101   File = /home/abc/fifo
1102 }
1103 \end{verbatim}
1104 \normalsize
1105
1106    if {\bf /home/abc/fifo} is a fifo device, Bacula will open the fifo,
1107    read it, and store all data thus obtained on the Volume.  Please note,
1108    you must have a process on the system that is writing into the fifo, or
1109    Bacula will hang, and after one minute of waiting, Bacula will give up
1110    and go on to the next file.  The data read can be anything since Bacula
1111    treats it as a stream.
1112
1113    This feature can be an excellent way to do a "hot" backup of a very
1114    large database.  You can use the {\bf RunBeforeJob} to create the fifo
1115    and to start a program that dynamically reads your database and writes
1116    it to the fifo.  Bacula will then write it to the Volume.  Be sure to
1117    read the \ilink{readfifo section}{readfifo} that gives a
1118    tip to ensure that the RunBeforeJob does not block Bacula.
1119
1120    During the restore operation, the inverse is true, after Bacula creates
1121    the fifo if there was any data stored with it (no need to explicitly
1122    list it or add any options), that data will be written back to the fifo.
1123    As a consequence, if any such FIFOs exist in the fileset to be restored,
1124    you must ensure that there is a reader program or Bacula will block, and
1125    after one minute, Bacula will time out the write to the fifo and move on
1126    to the next file.
1127
1128 \item A file-list may not contain wild-cards. Use directives in the
1129    Options resource if you wish to specify wild-cards or regular expression
1130    matching.
1131
1132 \item
1133 \index[general]{IgnoreDir}
1134 The {\bf ExcludeDirContaining = \lt{}filename\gt{}} is a directive that
1135 can be added to the Include section of the FileSet resource.  If the specified
1136 filename ({\bf filename-string}) is found on the Client in any directory to be
1137 backed up, the whole directory will be ignored (not backed up).  For example:
1138
1139 \begin{verbatim}
1140   # List of files to be backed up
1141   FileSet {
1142     Name = "MyFileSet"
1143     Include {
1144       Options {
1145         signature = MD5
1146       }
1147       File = /home
1148       Exclude Dir Containing = .excludeme
1149     }
1150   }
1151 \end{verbatim}
1152
1153 But in /home, there may be hundreds of directories of users and some
1154 people want to indicate that they don't want to have certain
1155 directories backed up. For example, with the above FileSet, if
1156 the user or sysadmin creates a file named {\bf .excludeme} in 
1157 specific directories, such as
1158
1159 \begin{verbatim}
1160    /home/user/www/cache/.excludeme
1161    /home/user/temp/.excludeme
1162 \end{verbatim}
1163
1164 then Bacula will not backup the two directories named:
1165
1166 \begin{verbatim}
1167    /home/user/www/cache
1168    /home/user/temp
1169 \end{verbatim}
1170
1171 NOTE: subdirectories will not be backed up.  That is, the directive
1172 applies to the two directories in question and any children (be they
1173 files, directories, etc).
1174
1175 \end{itemize}
1176
1177 \section{FileSet Examples}
1178 \index[general]{Examples!FileSet }
1179 \index[general]{FileSet Examples}
1180
1181 The following is an example of a valid FileSet resource definition.  Note,
1182 the first Include pulls in the contents of the file {\bf /etc/backup.list}
1183 when Bacula is started (i.e.  the @), and that file must have each filename
1184 to be backed up preceded by a {\bf File =} and on a separate line.
1185
1186 \footnotesize
1187 \begin{verbatim}
1188 FileSet {
1189   Name = "Full Set"
1190   Include {
1191     Options {
1192       Compression=GZIP
1193       signature=SHA1
1194       Sparse = yes
1195     }
1196     @/etc/backup.list
1197   }
1198   Include {
1199      Options {
1200         wildfile = "*.o"
1201         wildfile = "*.exe"
1202         Exclude = yes
1203      }
1204      File = /root/myfile
1205      File = /usr/lib/another_file
1206   }
1207 }
1208 \end{verbatim}
1209 \normalsize
1210
1211 In the above example, all the files contained in /etc/backup.list will
1212 be compressed with GZIP compression, an SHA1 signature will be computed on the
1213 file's contents (its data), and sparse file handling will apply. 
1214
1215 The two directories /root/myfile and /usr/lib/another\_file will also be saved
1216 without any options, but all files in those directories with the extensions
1217 {\bf .o} and {\bf .exe} will be excluded. 
1218
1219 Let's say that you now want to exclude the directory /tmp. The simplest way
1220 to do so is to add an exclude directive that lists /tmp.  The example
1221 above would then become:
1222
1223 \footnotesize 
1224 \begin{verbatim}
1225 FileSet {
1226   Name = "Full Set"
1227   Include {
1228     Options {
1229       Compression=GZIP
1230       signature=SHA1
1231       Sparse = yes
1232     }
1233     @/etc/backup.list
1234   }
1235   Include {
1236      Options {
1237         wildfile = "*.o"
1238         wildfile = "*.exe"
1239         Exclude = yes
1240      }
1241      File = /root/myfile
1242      File = /usr/lib/another_file
1243   }
1244   Exclude {
1245      File = /tmp                          # don't add trailing /
1246   }
1247 }
1248 \end{verbatim}
1249 \normalsize
1250
1251
1252 You can add wild-cards to the File directives listed in the Exclude
1253 directory, but you need to take care because if you exclude a directory,
1254 it and all files and directories below it will also be excluded.
1255
1256 Now lets take a slight variation on the above and suppose
1257 you want to save all your whole filesystem except {\bf /tmp}. 
1258 The problem that comes up is that Bacula will not normally
1259 cross from one filesystem to another.
1260 Doing a {\bf df} command, you get the following output: 
1261
1262 \footnotesize
1263 \begin{verbatim}
1264 [kern@rufus k]$ df
1265 Filesystem      1k-blocks      Used Available Use% Mounted on
1266 /dev/hda5         5044156    439232   4348692  10% /
1267 /dev/hda1           62193      4935     54047   9% /boot
1268 /dev/hda9        20161172   5524660  13612372  29% /home
1269 /dev/hda2           62217      6843     52161  12% /rescue
1270 /dev/hda8         5044156     42548   4745376   1% /tmp
1271 /dev/hda6         5044156   2613132   2174792  55% /usr
1272 none               127708         0    127708   0% /dev/shm
1273 //minimatou/c$   14099200   9895424   4203776  71% /mnt/mmatou
1274 lmatou:/          1554264    215884   1258056  15% /mnt/matou
1275 lmatou:/home      2478140   1589952    760072  68% /mnt/matou/home
1276 lmatou:/usr       1981000   1199960    678628  64% /mnt/matou/usr
1277 lpmatou:/          995116    484112    459596  52% /mnt/pmatou
1278 lpmatou:/home    19222656   2787880  15458228  16% /mnt/pmatou/home
1279 lpmatou:/usr      2478140   2038764    311260  87% /mnt/pmatou/usr
1280 deuter:/          4806936     97684   4465064   3% /mnt/deuter
1281 deuter:/home      4806904    280100   4282620   7% /mnt/deuter/home
1282 deuter:/files    44133352  27652876  14238608  67% /mnt/deuter/files
1283 \end{verbatim}
1284 \normalsize
1285
1286 And we see that there are a number of separate filesystems (/ /boot
1287 /home /rescue /tmp and /usr not to mention mounted systems).
1288 If you specify only {\bf /} in your Include list, Bacula will only save the
1289 Filesystem {\bf /dev/hda5}. To save all filesystems except {\bf /tmp} with
1290 out including any of the Samba or NFS mounted systems, and explicitly
1291 excluding a /tmp, /proc, .journal, and .autofsck, which you will not want to
1292 be saved and restored, you can use the following: 
1293
1294 \footnotesize
1295 \begin{verbatim}
1296 FileSet {
1297   Name = Include_example
1298   Include {
1299     Options {
1300        wilddir = /proc
1301        wilddir = /tmp
1302        wildfile = "/.journal"
1303        wildfile = "/.autofsck"
1304        exclude = yes
1305     }
1306     File = /
1307     File = /boot
1308     File = /home
1309     File = /rescue
1310     File = /usr
1311   }
1312 }
1313 \end{verbatim}
1314 \normalsize
1315
1316 Since /tmp is on its own filesystem and it was not explicitly named in the
1317 Include list, it is not really needed in the exclude list. It is better to
1318 list it in the Exclude list for clarity, and in case the disks are changed so
1319 that it is no longer in its own partition. 
1320
1321 Now, lets assume you only want to backup .Z and .gz files and nothing 
1322 else. This is a bit trickier because Bacula by default will select 
1323 everything to backup, so we must exclude everything but .Z and .gz files.
1324 If we take the first example above and make the obvious modifications
1325 to it, we might come up with a FileSet that looks like this:
1326
1327 \footnotesize 
1328 \begin{verbatim}
1329 FileSet {
1330   Name = "Full Set"
1331   Include {                    !!!!!!!!!!!!
1332      Options {                    This
1333         wildfile = "*.Z"          example
1334         wildfile = "*.gz"         doesn't
1335                                   work
1336      }                          !!!!!!!!!!!!
1337      File = /myfile
1338   }
1339 }
1340 \end{verbatim}
1341 \normalsize
1342
1343 The *.Z and *.gz files will indeed be backed up, but all other files
1344 that are not matched by the Options directives will automatically
1345 be backed up too (i.e. that is the default rule).
1346
1347 To accomplish what we want, we must explicitly exclude all other files.
1348 We do this with the following:
1349
1350 \footnotesize
1351 \begin{verbatim}
1352 FileSet {
1353   Name = "Full Set"
1354   Include {
1355      Options {
1356         wildfile = "*.Z"
1357         wildfile = "*.gz"
1358      }
1359      Options {
1360         Exclude = yes
1361         RegexFile = ".*"
1362      }
1363      File = /myfile
1364   }
1365 }
1366 \end{verbatim}
1367 \normalsize
1368
1369 The "trick" here was to add a RegexFile expression that matches
1370 all files. It does not match directory names, so all directories in
1371 /myfile will be backed up (the directory entry) and any *.Z and *.gz
1372 files contained in them. If you know that certain directories do
1373 not contain any *.Z or *.gz files and you do not want the directory
1374 entries backed up, you will need to explicitly exclude those directories.
1375 Backing up a directory entries is not very expensive.
1376
1377 Bacula uses the system regex library and some of them are
1378 different on different OSes. The above has been reported not to work
1379 on FreeBSD. This can be tested by using the {\bf estimate job=job-name
1380 listing} command in the console and adapting the RegexFile expression
1381 appropriately. In a future version of Bacula, we will supply our own
1382 Regex code to avoid such system dependencies.
1383
1384 Please be aware that allowing Bacula to traverse or change file systems can be
1385 {\bf very} dangerous. For example, with the following: 
1386
1387 \footnotesize
1388 \begin{verbatim}
1389 FileSet {
1390   Name = "Bad example"
1391   Include {
1392     Options { onefs=no }
1393     File = /mnt/matou
1394   }
1395 }
1396 \end{verbatim}
1397 \normalsize
1398
1399 you will be backing up an NFS mounted partition ({\bf /mnt/matou}), and since
1400 {\bf onefs} is set to {\bf no}, Bacula will traverse file systems. Now if {\bf
1401 /mnt/matou} has the current machine's file systems mounted, as is often the
1402 case, you will get yourself into a recursive loop and the backup will never
1403 end. 
1404
1405 As a final example, let's say that you have only one or two 
1406 subdirectories of /home that you want to backup.  For example,
1407 you want to backup only subdirectories beginning with the letter
1408 a and the letter b -- i.e. /home/a* and /home/b*.  Now, you might first
1409 try:
1410 \footnotesize
1411 \begin{verbatim}
1412 FileSet {
1413   Name = "Full Set"
1414   Include {
1415      Options {
1416         wilddir = "/home/a*"
1417         wilddir = "/home/b*"
1418      }
1419      File = /home
1420   }
1421 }
1422 \end{verbatim}
1423 \normalsize
1424
1425 The problem is that the above will include everything in /home.  To get
1426 things to work correctly, you need to start with the idea of exclusion
1427 instead of inclusion.  So, you could simply exclude all directories
1428 except the two you want to use:
1429 \footnotesize
1430 \begin{verbatim}
1431 FileSet {
1432   Name = "Full Set"
1433   Include {
1434      Options {
1435         RegexDir = "^/home/[c-z]"
1436         exclude = yes
1437      }
1438      File = /home
1439   }
1440 }
1441 \end{verbatim}
1442 \normalsize
1443
1444 And assuming that all subdirectories start with a lowercase letter, this
1445 would work.
1446
1447 An alternative would be to include the two subdirectories desired and
1448 exclude everything else:
1449 \footnotesize
1450 \begin{verbatim}
1451 FileSet {
1452   Name = "Full Set"
1453   Include {
1454      Options {
1455         wilddir = "/home/a*"
1456         wilddir = "/home/b*"
1457      }
1458      Options {
1459         RegexDir = ".*"
1460         exclude = yes
1461      }
1462      File = /home
1463   }
1464 }
1465 \end{verbatim}
1466 \normalsize
1467
1468
1469 The following example shows how to back up only the My Pictures directory inside
1470 the My Documents directory for all users in C:/Documents and Settings, i.e.
1471 everything matching the pattern:
1472
1473 C:/Documents and Settings/*/My Documents/My Pictures/*
1474
1475 To understand how this can be achieved, there are two important points to
1476 remember:
1477
1478 Firstly, Bacula walks over the filesystem depth-first starting from the File =
1479 lines.  It stops descending when a directory is excluded, so you must include
1480 all ancestor directories of each directory containing files to be included.
1481
1482 Secondly, each directory and file is compared to the Options clauses in the
1483 order they appear in the FileSet.  When a match is found, no further clauses
1484 are compared and the directory or file is either included or excluded.
1485
1486 The FileSet resource definition below implements this by including specifc
1487 directories and files and excluding everything else.
1488
1489 \footnotesize
1490 \begin{verbatim}
1491 FileSet {
1492   Name = "AllPictures"
1493
1494   Include {
1495
1496     File  = "C:/Documents and Settings"
1497
1498     Options {
1499       signature = SHA1
1500       verify = s1
1501       IgnoreCase = yes
1502
1503       # Include all users' directories so we reach the inner ones.  Unlike a
1504       # WildDir pattern ending in *, this RegExDir only matches the top-level
1505       # directories and not any inner ones.
1506       RegExDir = "^C:/Documents and Settings/[^/]+$"
1507
1508       # Ditto all users' My Documents directories.
1509       WildDir = "C:/Documents and Settings/*/My Documents"
1510
1511       # Ditto all users' My Documents/My Pictures directories.
1512       WildDir = "C:/Documents and Settings/*/My Documents/My Pictures"
1513
1514       # Include the contents of the My Documents/My Pictures directories and
1515       # any subdirectories.
1516       Wild = "C:/Documents and Settings/*/My Documents/My Pictures/*"
1517     }
1518
1519     Options {
1520       Exclude = yes
1521       IgnoreCase = yes
1522
1523       # Exclude everything else, in particular any files at the top level and
1524       # any other directories or files in the users' directories.
1525       Wild = "C:/Documents and Settings/*"
1526     }
1527   }
1528 }
1529 \end{verbatim}
1530 \normalsize
1531
1532 \section{Backing up Raw Partitions}
1533 \index[general]{Backing up!Partitions }
1534 \index[general]{Backing up Raw Partitions }
1535
1536 The following FileSet definition will backup a raw partition: 
1537
1538 \footnotesize
1539 \begin{verbatim}
1540 FileSet {
1541   Name = "RawPartition"
1542   Include {
1543     Options { sparse=yes }
1544     File = /dev/hda2
1545   }
1546 }
1547 \end{verbatim}
1548 \normalsize
1549
1550 While backing up and restoring a raw partition, you should ensure that no
1551 other process including the system is writing to that partition. As a
1552 precaution, you are strongly urged to ensure that the raw partition is not
1553 mounted or is mounted read-only. If necessary, this can be done using the {\bf
1554 RunBeforeJob} directive. 
1555
1556
1557 \section{Excluding Files and Directories}
1558 \index[general]{Directories!Excluding Files and }
1559 \index[general]{Excluding Files and Directories }
1560
1561 You may also include full filenames or directory names in addition to using
1562 wild-cards and {\bf Exclude=yes} in the Options resource as specified above by
1563 simply including the files to be excluded in an Exclude resource within the
1564 FileSet. It accepts wild-cards pattern, so for a directory, don't add a trailing
1565 /. For example:
1566
1567 \footnotesize
1568 \begin{verbatim}
1569 FileSet {
1570   Name = Exclusion_example
1571   Include {
1572     Options {
1573       Signature = SHA1
1574     }
1575     File = /
1576     File = /boot
1577     File = /home
1578     File = /rescue
1579     File = /usr
1580   }
1581   Exclude {
1582     File = /proc
1583     File = /tmp                          # Don't add trailing /
1584     File = .journal
1585     File = .autofsck
1586   }
1587 }
1588 \end{verbatim}
1589 \normalsize
1590
1591 \label{win32}
1592 \section{Windows FileSets}
1593 \index[general]{Windows FileSets }
1594 \index[general]{FileSets!Windows }
1595 If you are entering Windows file names, the directory path may be preceded by
1596 the drive and a colon (as in c:). However, the path separators must be
1597 specified in Unix convention (i.e. forward slash (/)). If you wish to include
1598 a quote in a file name, precede the quote with a backslash
1599 (\textbackslash{}). For example you might use the following
1600 for a Windows machine to backup the "My Documents" directory: 
1601
1602 \footnotesize
1603 \begin{verbatim}
1604 FileSet {
1605   Name = "Windows Set"
1606   Include {
1607     Options {
1608        WildFile = "*.obj"
1609        WildFile = "*.exe"
1610        exclude = yes
1611      }
1612      File = "c:/My Documents"
1613   }
1614 }
1615 \end{verbatim}
1616 \normalsize
1617
1618 For exclude lists to work correctly on Windows, you must observe the following
1619 rules: 
1620
1621 \begin{itemize}
1622 \item Filenames are case sensitive, so you must use the correct case.  
1623 \item To exclude a directory, you must not have a trailing slash on the 
1624    directory name.  
1625 \item If you have spaces in your filename, you must enclose the entire name 
1626    in double-quote characters ("). Trying to use a backslash before  the space
1627    will not work.  
1628 \item If you are using the old Exclude syntax (noted below), you may not
1629    specify a drive letter in the exclude.  The new syntax noted above
1630    should work fine including driver letters.
1631 \end{itemize}
1632
1633 Thanks to Thiago Lima for summarizing the above items for us. If you are
1634 having difficulties getting includes or excludes to work, you might want to
1635 try using the {\bf estimate job=xxx listing} command documented in the 
1636 \ilink{Console chapter}{estimate} of this manual. 
1637
1638 On Win32 systems, if you move a directory or file or rename a file into the
1639 set of files being backed up, and a Full backup has already been made, Bacula
1640 will not know there are new files to be saved during an Incremental or
1641 Differential backup (blame Microsoft, not me). To avoid this problem, please
1642 {\bf copy} any new directory or files into the backup area. If you do not have
1643 enough disk to copy the directory or files, move them, but then initiate a
1644 Full backup. 
1645
1646
1647 \paragraph*{A Windows Example FileSet}
1648 \index[general]{FileSet!Windows Example }
1649 \index[general]{Windows Example FileSet }
1650
1651 The following example was contributed by Russell Howe. Please note that
1652 for presentation purposes, the lines beginning with Data and Internet 
1653 have been wrapped and should included on the previous line with one
1654 space.
1655
1656 \footnotesize
1657 \begin{verbatim}
1658 This is my Windows 2000 fileset:
1659 FileSet {
1660  Name = "Windows 2000"
1661  Include {
1662   Options {
1663    signature = MD5
1664    Exclude = yes
1665    IgnoreCase = yes
1666    # Exclude Mozilla-based programs' file caches
1667    WildDir = "[A-Z]:/Documents and Settings/*/Application 
1668 Data/*/Profiles/*/*/Cache"
1669    WildDir = "[A-Z]:/Documents and Settings/*/Application 
1670 Data/*/Profiles/*/*/Cache.Trash"
1671    WildDir = "[A-Z]:/Documents and Settings/*/Application
1672 Data/*/Profiles/*/*/ImapMail"
1673
1674    # Exclude user's registry files - they're always in use anyway.
1675    WildFile = "[A-Z]:/Documents and Settings/*/Local Settings/Application
1676 Data/Microsoft/Windows/usrclass.*"
1677    WildFile = "[A-Z]:/Documents and Settings/*/ntuser.*"
1678
1679    # Exclude directories full of lots and lots of useless little files
1680    WildDir = "[A-Z]:/Documents and Settings/*/Cookies"
1681    WildDir = "[A-Z]:/Documents and Settings/*/Recent"
1682    WildDir = "[A-Z]:/Documents and Settings/*/Local Settings/History"
1683    WildDir = "[A-Z]:/Documents and Settings/*/Local Settings/Temp"
1684    WildDir = "[A-Z]:/Documents and Settings/*/Local Settings/Temporary
1685 Internet Files"
1686
1687    # These are always open and unable to be backed up
1688    WildFile = "[A-Z]:/Documents and Settings/All Users/Application
1689 Data/Microsoft/Network/Downloader/qmgr[01].dat"
1690
1691    # Some random bits of Windows we want to ignore
1692    WildFile = "[A-Z]:/WINNT/security/logs/scepol.log"
1693    WildDir = "[A-Z]:/WINNT/system32/config"
1694    WildDir = "[A-Z]:/WINNT/msdownld.tmp"
1695    WildDir = "[A-Z]:/WINNT/Internet Logs"
1696    WildDir = "[A-Z]:/WINNT/$Nt*Uninstall*"
1697    WildDir = "[A-Z]:/WINNT/sysvol"
1698    WildFile = "[A-Z]:/WINNT/cluster/CLUSDB"
1699    WildFile = "[A-Z]:/WINNT/cluster/CLUSDB.LOG"
1700    WildFile = "[A-Z]:/WINNT/NTDS/edb.log"
1701    WildFile = "[A-Z]:/WINNT/NTDS/ntds.dit"
1702    WildFile = "[A-Z]:/WINNT/NTDS/temp.edb"
1703    WildFile = "[A-Z]:/WINNT/ntfrs/jet/log/edb.log"
1704    WildFile = "[A-Z]:/WINNT/ntfrs/jet/ntfrs.jdb"
1705    WildFile = "[A-Z]:/WINNT/ntfrs/jet/temp/tmp.edb"
1706    WildFile = "[A-Z]:/WINNT/system32/CPL.CFG"
1707    WildFile = "[A-Z]:/WINNT/system32/dhcp/dhcp.mdb"
1708    WildFile = "[A-Z]:/WINNT/system32/dhcp/j50.log"
1709    WildFile = "[A-Z]:/WINNT/system32/dhcp/tmp.edb"
1710    WildFile = "[A-Z]:/WINNT/system32/LServer/edb.log"
1711    WildFile = "[A-Z]:/WINNT/system32/LServer/TLSLic.edb"
1712    WildFile = "[A-Z]:/WINNT/system32/LServer/tmp.edb"
1713    WildFile = "[A-Z]:/WINNT/system32/wins/j50.log"
1714    WildFile = "[A-Z]:/WINNT/system32/wins/wins.mdb"
1715    WildFile = "[A-Z]:/WINNT/system32/wins/winstmp.mdb"
1716
1717    # Temporary directories & files
1718    WildDir = "[A-Z]:/WINNT/Temp"
1719    WildDir = "[A-Z]:/temp"
1720    WildFile = "*.tmp"
1721    WildDir = "[A-Z]:/tmp"
1722    WildDir = "[A-Z]:/var/tmp"
1723
1724    # Recycle bins
1725    WildDir = "[A-Z]:/RECYCLER"
1726
1727    # Swap files
1728    WildFile = "[A-Z]:/pagefile.sys"
1729
1730    # These are programs and are easier to reinstall than restore from
1731    # backup
1732    WildDir = "[A-Z]:/cygwin"
1733    WildDir = "[A-Z]:/Program Files/Grisoft"
1734    WildDir = "[A-Z]:/Program Files/Java"
1735    WildDir = "[A-Z]:/Program Files/Java Web Start"
1736    WildDir = "[A-Z]:/Program Files/JavaSoft"
1737    WildDir = "[A-Z]:/Program Files/Microsoft Office"
1738    WildDir = "[A-Z]:/Program Files/Mozilla Firefox"
1739    WildDir = "[A-Z]:/Program Files/Mozilla Thunderbird"
1740    WildDir = "[A-Z]:/Program Files/mozilla.org"
1741    WildDir = "[A-Z]:/Program Files/OpenOffice*"
1742   }
1743
1744   # Our Win2k boxen all have C: and D: as the main hard drives.
1745   File = "C:/"
1746   File = "D:/"
1747  }
1748 }
1749 \end{verbatim}
1750 \normalsize
1751
1752 Note, the three line of the above Exclude were split to fit on the document
1753 page, they should be written on a single line in real use. 
1754
1755 \paragraph*{Windows NTFS Naming Considerations}
1756 \index[general]{Windows NTFS Naming Considerations }
1757 \index[general]{Considerations!Windows NTFS Naming }
1758
1759 NTFS filenames containing Unicode characters should now be supported
1760 as of version 1.37.30 or later.
1761
1762 \section{Testing Your FileSet}
1763 \index[general]{FileSet!Testing Your }
1764 \index[general]{Testing Your FileSet }
1765
1766 If you wish to get an idea of what your FileSet will really backup or if your
1767 exclusion rules will work correctly, you can test it by using the {\bf
1768 estimate} command in the Console program. See the 
1769 \ilink{estimate}{estimate} in the Console chapter of this
1770 manual.
1771
1772 As an example, suppose you add the following test FileSet:
1773
1774 \footnotesize
1775 \begin{verbatim}
1776 FileSet {
1777   Name = Test
1778   Include {
1779     File = /home/xxx/test
1780     Options {
1781        regex = ".*\.c$"
1782     }
1783   }
1784 }
1785 \end{verbatim}
1786 \normalsize
1787
1788 You could then add some test files to the directory {\bf /home/xxx/test}
1789 and use the following command in the console:
1790
1791 \footnotesize
1792 \begin{verbatim}
1793 estimate job=<any-job-name> listing client=<desired-client> fileset=Test
1794 \end{verbatim}
1795 \normalsize
1796
1797 to give you a listing of all files that match.