]> git.sur5r.net Git - bacula/bacula/blobdiff - bacula/src/findlib/find_one.c
Merge Preben's patch for ACLs and for Mac OS X resource forks.
[bacula/bacula] / bacula / src / findlib / find_one.c
index 39a58ccff104951d696fe11f51e3f8a3ef980e02..90709c47eed3056b65d284d89227c8601e9b868f 100755 (executable)
@@ -1,5 +1,5 @@
-/* 
-   Copyright (C) 2000-2003 Kern Sibbald and John Walker
+/*
+   Copyright (C) 2000-20054 Kern Sibbald
 
    This program is free software; you can redistribute it and/or
    modify it under the terms of the GNU General Public License as
 
    Thanks to the TAR programmers.
 
+     Version $Id$
+
  */
 
 #include "bacula.h"
 #include "find.h"
-
-
-extern size_t name_max;              /* filename max length */
-extern size_t path_max;              /* path name max length */
-
-#ifndef HAVE_READDIR_R
-int readdir_r(DIR *dirp, struct dirent *entry, struct dirent **result);
+#ifdef HAVE_DARWIN_OS
+#include <sys/attr.h>
 #endif
 
+extern int32_t name_max;             /* filename max length */
+extern int32_t path_max;             /* path name max length */
 
 /*
- * Structure for keeping track of hard linked files, we   
+ * Structure for keeping track of hard linked files, we
  *   keep an entry for each hardlinked file that we save,
  *   which is the first one found. For all the other files that
  *   are linked to this one, we save only the directory
@@ -53,31 +52,90 @@ struct f_link {
     char name[1];                    /* The name */
 };
 
+static void free_dir_ff_pkt(FF_PKT *dir_ff_pkt)
+{
+   free(dir_ff_pkt->fname);
+   free(dir_ff_pkt->link);
+   free_pool_memory(dir_ff_pkt->sys_fname);
+   free(dir_ff_pkt);
+}
 
-#if HAVE_UTIME_H
-# include <utime.h>
-#else
-struct utimbuf {
-    long actime;
-    long modtime;
-};
-#endif
+/*
+ * Check to see if we allow the file system type of a file or directory.
+ * If we do not have a list of file system types, we accept anything.
+ */
+static int accept_fstype(FF_PKT *ff, void *dummy) {
+   int i;
+   char fs[1000];
+   bool accept = true;
+
+   if (ff->fstypes.size()) {
+      accept = false;
+      if (!fstype(ff->fname, fs, sizeof(fs))) {
+         Dmsg1(50, "Cannot determine file system type for \"%s\"\n", ff->fname);
+      } else {
+        for (i = 0; i < ff->fstypes.size(); ++i) {
+           if (strcmp(fs, (char *)ff->fstypes.get(i)) == 0) {
+               Dmsg2(100, "Accepting fstype %s for \"%s\"\n", fs, ff->fname);
+              accept = true;
+              break;
+           }
+            Dmsg3(200, "fstype %s for \"%s\" does not match %s\n", fs,
+                 ff->fname, ff->fstypes.get(i));
+        }
+      }
+   }
+   return accept;
+}
 
+/*
+ * This function determines whether we can use getattrlist()
+ * It's odd, but we have to use the function to determine that...
+ * Also, the man pages talk about things as if they were implemented.
+ *
+ * On Mac OS X, this succesfully differentiates between HFS+ and UFS
+ * volumes, which makes me trust it is OK for others, too.
+ */
+static bool volume_has_attrlist(const char *fname)
+{
+#ifdef HAVE_DARWIN_OS
+   struct statfs st;
+   struct volinfo_struct {
+      unsigned long length;              /* Mandatory field */
+      vol_capabilities_attr_t info;      /* Volume capabilities */
+   } vol;
+   struct attrlist attrList;
+
+   memset(&attrList, 0, sizeof(attrList));
+   attrList.bitmapcount = ATTR_BIT_MAP_COUNT;
+   attrList.volattr = ATTR_VOL_INFO | ATTR_VOL_CAPABILITIES;
+   if (statfs(fname, &st) == 0) {
+      /* We need to check on the mount point */
+      if (getattrlist(st.f_mntonname, &attrList, &vol, sizeof(vol), FSOPT_NOFOLLOW) == 0
+           && (vol.info.capabilities[VOL_CAPABILITIES_INTERFACES] & VOL_CAP_INT_ATTRLIST)
+           && (vol.info.valid[VOL_CAPABILITIES_INTERFACES] & VOL_CAP_INT_ATTRLIST)) {
+        return true;
+      }
+   }
+#endif
+   return false;
+}
 
 /*
- * Find a single file.                       
+ * Find a single file.
  * handle_file is the callback for handling the file.
  * p is the filename
- * parent_device is the device we are currently on 
- * top_level is 1 when not recursing or 0 when 
- *  decending into a directory.
+ * parent_device is the device we are currently on
+ * top_level is 1 when not recursing or 0 when
+ *  descending into a directory.
  */
 int
-find_one_file(JCR *jcr, FF_PKT *ff_pkt, int handle_file(FF_PKT *ff, void *hpkt), 
+find_one_file(JCR *jcr, FF_PKT *ff_pkt, int handle_file(FF_PKT *ff, void *hpkt),
               void *pkt, char *fname, dev_t parent_device, int top_level)
 {
    struct utimbuf restore_times;
    int rtn_stat;
+   int len;
 
    ff_pkt->fname = ff_pkt->link = fname;
 
@@ -88,11 +146,7 @@ find_one_file(JCR *jcr, FF_PKT *ff_pkt, int handle_file(FF_PKT *ff, void *hpkt),
        return handle_file(ff_pkt, pkt);
    }
 
-   Dmsg1(60, "File ----: %s\n", fname);
-#ifdef DEBUG
-   if (S_ISLNK(ff_pkt->statp.st_mode))
-      Dmsg1(60, "Link-------------: %s \n", fname);
-#endif
+   Dmsg1(300, "File ----: %s\n", fname);
 
    /* Save current times of this directory in case we need to
     * reset them because the user doesn't want them changed.
@@ -100,28 +154,57 @@ find_one_file(JCR *jcr, FF_PKT *ff_pkt, int handle_file(FF_PKT *ff, void *hpkt),
    restore_times.actime = ff_pkt->statp.st_atime;
    restore_times.modtime = ff_pkt->statp.st_mtime;
 
+   /*
+    * We check for allowed fstypes at top_level and fstype change (below).
+    */
+   if (top_level) {
+      if (!accept_fstype(ff_pkt, NULL)) {
+        ff_pkt->type = FT_INVALIDFS;
+        if (ff_pkt->flags & FO_KEEPATIME) {
+           utime(fname, &restore_times);
+        }
+        Jmsg1(jcr, M_ERROR, 0, _("Top level directory \"%s\" has an unlisted fstype\n"), fname);
+        return 1;      /* Just ignore this error - or the whole backup is cancelled */
+      }
+      ff_pkt->volhas_attrlist = volume_has_attrlist(fname);
+   }
 
-   /* 
+   /*
     * If this is an Incremental backup, see if file was modified
     * since our last "save_time", presumably the last Full save
     * or Incremental.
     */
    if (ff_pkt->incremental && !S_ISDIR(ff_pkt->statp.st_mode)) {
-      Dmsg1(100, "Non-directory incremental: %s\n", ff_pkt->fname);
+      Dmsg1(300, "Non-directory incremental: %s\n", ff_pkt->fname);
       /* Not a directory */
       if (ff_pkt->statp.st_mtime < ff_pkt->save_time
-         && (ff_pkt->mtime_only || 
+         && ((ff_pkt->flags & FO_MTIMEONLY) ||
              ff_pkt->statp.st_ctime < ff_pkt->save_time)) {
         /* Incremental option, file not changed */
         ff_pkt->type = FT_NOCHG;
-         Dmsg1(100, "File not changed: %s\n", ff_pkt->fname);
-         Dmsg4(200, "save_time=%d mtime=%d mtime_only=%d st_ctime=%d\n",
-           ff_pkt->save_time, ff_pkt->statp.st_mtime, 
-           ff_pkt->mtime_only, ff_pkt->statp.st_ctime);
         return handle_file(ff_pkt, pkt);
       }
    }
 
+#ifdef HAVE_DARWIN_OS
+   if (ff_pkt->flags & FO_HFSPLUS && ff_pkt->volhas_attrlist
+        && S_ISREG(ff_pkt->statp.st_mode)) {
+       /* TODO: initialise attrList once elsewhere? */
+       struct attrlist attrList;
+       memset(&attrList, 0, sizeof(attrList));
+       attrList.bitmapcount = ATTR_BIT_MAP_COUNT;
+       attrList.commonattr = ATTR_CMN_FNDRINFO;
+       attrList.fileattr = ATTR_FILE_RSRCLENGTH;
+       if (getattrlist(fname, &attrList, &ff_pkt->hfsinfo,
+               sizeof(ff_pkt->hfsinfo), FSOPT_NOFOLLOW) != 0) {
+         ff_pkt->type = FT_NOSTAT;
+         ff_pkt->ff_errno = errno;
+         return handle_file(ff_pkt, pkt);
+       }
+   }
+#endif
+
+/* ***FIXME*** implement this */
 #if xxxxxxx
    /* See if we are trying to dump the archive.  */
    if (ar_dev && ff_pkt->statp.st_dev == ar_dev && ff_pkt->statp.st_ino == ar_ino) {
@@ -130,14 +213,15 @@ find_one_file(JCR *jcr, FF_PKT *ff_pkt, int handle_file(FF_PKT *ff, void *hpkt),
    }
 #endif
    ff_pkt->LinkFI = 0;
-   /* 
+   /*
     * Handle hard linked files
     *
     * Maintain a list of hard linked files already backed up. This
-    *  allows us to ensure that the data of each file gets backed 
+    *  allows us to ensure that the data of each file gets backed
     *  up only once.
     */
-   if (ff_pkt->statp.st_nlink > 1
+   if (!(ff_pkt->flags & FO_NO_HARDLINK)
+       && ff_pkt->statp.st_nlink > 1
        && (S_ISREG(ff_pkt->statp.st_mode)
           || S_ISCHR(ff_pkt->statp.st_mode)
           || S_ISBLK(ff_pkt->statp.st_mode)
@@ -148,7 +232,14 @@ find_one_file(JCR *jcr, FF_PKT *ff_pkt, int handle_file(FF_PKT *ff, void *hpkt),
 
       /* Search link list of hard linked files */
       for (lp = ff_pkt->linklist; lp; lp = lp->next)
-        if (lp->ino == ff_pkt->statp.st_ino && lp->dev == ff_pkt->statp.st_dev) {
+        if (lp->ino == (ino_t)ff_pkt->statp.st_ino &&
+            lp->dev == (dev_t)ff_pkt->statp.st_dev) {
+             /* If we have already backed up the hard linked file don't do it again */
+            if (strcmp(lp->name, fname) == 0) {
+                Jmsg1(jcr, M_WARNING, 0, _("Attempt to backup hard linked file %s twice ignored.\n"),
+                  fname);
+               return 1;             /* ignore */
+            }
             ff_pkt->link = lp->name;
             ff_pkt->type = FT_LNKSAVED;       /* Handle link, file already saved */
             ff_pkt->LinkFI = lp->FileIndex;
@@ -156,10 +247,11 @@ find_one_file(JCR *jcr, FF_PKT *ff_pkt, int handle_file(FF_PKT *ff, void *hpkt),
         }
 
       /* File not previously dumped. Chain it into our list. */
-      lp = (struct f_link *)bmalloc(sizeof(struct f_link) + strlen(fname) +1);
+      len = strlen(fname) + 1;
+      lp = (struct f_link *)bmalloc(sizeof(struct f_link) + len);
       lp->ino = ff_pkt->statp.st_ino;
       lp->dev = ff_pkt->statp.st_dev;
-      strcpy(lp->name, fname);
+      bstrncpy(lp->name, fname, len);
       lp->next = ff_pkt->linklist;
       ff_pkt->linklist = lp;
       ff_pkt->linked = lp;           /* mark saved link */
@@ -188,13 +280,13 @@ find_one_file(JCR *jcr, FF_PKT *ff_pkt, int handle_file(FF_PKT *ff, void *hpkt),
       return rtn_stat;
 
 
-   } else if (S_ISLNK(ff_pkt->statp.st_mode)) {
+   } else if (S_ISLNK(ff_pkt->statp.st_mode)) {  /* soft link */
       int size;
-      char *buffer = (char *)alloca(path_max + name_max + 2);
+      char *buffer = (char *)alloca(path_max + name_max + 102);
 
-      size = readlink(fname, buffer, path_max + name_max + 1);
+      size = readlink(fname, buffer, path_max + name_max + 101);
       if (size < 0) {
-        /* Could not follow link */                             
+        /* Could not follow link */
         ff_pkt->type = FT_NOFOLLOW;
         ff_pkt->ff_errno = errno;
         rtn_stat = handle_file(ff_pkt, pkt);
@@ -204,8 +296,8 @@ find_one_file(JCR *jcr, FF_PKT *ff_pkt, int handle_file(FF_PKT *ff, void *hpkt),
         return rtn_stat;
       }
       buffer[size] = 0;
-      ff_pkt->link = buffer;
-      ff_pkt->type = FT_LNK;          /* got a real link */
+      ff_pkt->link = buffer;         /* point to link */
+      ff_pkt->type = FT_LNK;         /* got a real link */
       rtn_stat = handle_file(ff_pkt, pkt);
       if (ff_pkt->linked) {
         ff_pkt->linked->FileIndex = ff_pkt->FileIndex;
@@ -220,19 +312,28 @@ find_one_file(JCR *jcr, FF_PKT *ff_pkt, int handle_file(FF_PKT *ff, void *hpkt),
       int len;
       int status;
       dev_t our_device = ff_pkt->statp.st_dev;
+      bool recurse = true;
+      bool volhas_attrlist = ff_pkt->volhas_attrlist;   /* Remember this if we recurse */
 
-      if (access(fname, R_OK) == -1 && geteuid() != 0) {
-        /* Could not access() directory */
-        ff_pkt->type = FT_NOACCESS;
-        ff_pkt->ff_errno = errno;
-        rtn_stat = handle_file(ff_pkt, pkt);
-        if (ff_pkt->linked) {
-           ff_pkt->linked->FileIndex = ff_pkt->FileIndex;
+      /*
+       * If we are using Win32 (non-portable) backup API, don't check
+       *  access as everything is more complicated, and
+       *  in principle, we should be able to access everything.
+       */
+      if (!have_win32_api() || (ff_pkt->flags & FO_PORTABLE)) {
+        if (access(fname, R_OK) == -1 && geteuid() != 0) {
+           /* Could not access() directory */
+           ff_pkt->type = FT_NOACCESS;
+           ff_pkt->ff_errno = errno;
+           rtn_stat = handle_file(ff_pkt, pkt);
+           if (ff_pkt->linked) {
+              ff_pkt->linked->FileIndex = ff_pkt->FileIndex;
+           }
+           return rtn_stat;
         }
-        return rtn_stat;
       }
 
-      /* Build a canonical directory name with a trailing slash. */
+      /* Build a canonical directory name with a trailing slash in link var */
       len = strlen(fname);
       link_len = len + 200;
       link = (char *)bmalloc(link_len + 2);
@@ -250,77 +351,119 @@ find_one_file(JCR *jcr, FF_PKT *ff_pkt, int handle_file(FF_PKT *ff, void *hpkt),
         /* Incremental option, directory entry not changed */
         ff_pkt->type = FT_DIRNOCHG;
       } else {
-        ff_pkt->type = FT_DIR;
+        ff_pkt->type = FT_DIRBEGIN;
       }
-      handle_file(ff_pkt, pkt);       /* handle directory entry */
-      if (ff_pkt->linked) {
-        ff_pkt->linked->FileIndex = ff_pkt->FileIndex;
+      /*
+       * Note, we return the directory to the calling program (handle_file)
+       * when we first see the directory (FT_DIRBEGIN.
+       * This allows the program to apply matches and make a
+       * choice whether or not to accept it.  If it is accepted, we
+       * do not immediately save it, but do so only after everything
+       * in the directory is seen (i.e. the FT_DIREND).
+       */
+      rtn_stat = handle_file(ff_pkt, pkt);
+      if (rtn_stat < 1) {            /* ignore or error status */
+        free(link);
+        return rtn_stat;
+      }
+      /* Done with DIRBEGIN, next call will be DIREND */
+      if (ff_pkt->type == FT_DIRBEGIN) {
+        ff_pkt->type = FT_DIREND;
       }
 
-      ff_pkt->link = ff_pkt->fname;     /* reset "link" */
+      /*
+       * Create a temporary ff packet for this directory
+       *   entry, and defer handling the directory until
+       *   we have recursed into it.  This saves the
+       *   directory after all files have been processed, and
+       *   during the restore, the directory permissions will
+       *   be reset after all the files have been restored.
+       */
+      Dmsg1(300, "Create temp ff packet for dir: %s\n", ff_pkt->fname);
+      FF_PKT *dir_ff_pkt = (FF_PKT *)bmalloc(sizeof(FF_PKT));
+      memcpy(dir_ff_pkt, ff_pkt, sizeof(FF_PKT));
+      dir_ff_pkt->fname = bstrdup(ff_pkt->fname);
+      dir_ff_pkt->link = bstrdup(ff_pkt->link);
+      dir_ff_pkt->sys_fname = get_pool_memory(PM_FNAME);
+      dir_ff_pkt->included_files_list = NULL;
+      dir_ff_pkt->excluded_files_list = NULL;
+      dir_ff_pkt->excluded_paths_list = NULL;
+      dir_ff_pkt->linklist = NULL;
 
-      /* 
-       * Do not decend into subdirectories (recurse) if the
+      /*
+       * Do not descend into subdirectories (recurse) if the
        * user has turned it off for this directory.
+       *
+       * If we are crossing file systems, we are either not allowed
+       * to cross, or we may be restricted by a list of permitted
+       * file systems.
        */
       if (ff_pkt->flags & FO_NO_RECURSION) {
-        free(link);
-        /* No recursion into this directory */
         ff_pkt->type = FT_NORECURSE;
-        rtn_stat = handle_file(ff_pkt, pkt);
-        if (ff_pkt->linked) {
-           ff_pkt->linked->FileIndex = ff_pkt->FileIndex;
+        recurse = false;
+      } else if (!top_level && parent_device != ff_pkt->statp.st_dev) {
+        if(!(ff_pkt->flags & FO_MULTIFS)) {
+           ff_pkt->type = FT_NOFSCHG;
+           recurse = false;
+        } else if (!accept_fstype(ff_pkt, NULL)) {
+           ff_pkt->type = FT_INVALIDFS;
+           recurse = false;
+        } else {
+           ff_pkt->volhas_attrlist = volume_has_attrlist(fname);
         }
-        return rtn_stat;
       }
-
-      /* 
-       * See if we are crossing file systems, and
-       * avoid doing so if the user only wants to dump one file system.
-       */
-      if (!top_level && !(ff_pkt->flags & FO_MULTIFS) &&
-          parent_device != ff_pkt->statp.st_dev) {
-        free(link);
-        /* returning here means we do not handle this directory */
-        ff_pkt->type = FT_NOFSCHG;
+      /* If not recursing, just backup dir and return */
+      if (!recurse) {
         rtn_stat = handle_file(ff_pkt, pkt);
         if (ff_pkt->linked) {
            ff_pkt->linked->FileIndex = ff_pkt->FileIndex;
         }
+        free(link);
+        free_dir_ff_pkt(dir_ff_pkt);
+         ff_pkt->link = ff_pkt->fname;     /* reset "link" */
+        if (ff_pkt->flags & FO_KEEPATIME) {
+           utime(fname, &restore_times);
+        }
         return rtn_stat;
       }
-      /* 
-       * Now process the files in this directory.
+
+      ff_pkt->link = ff_pkt->fname;     /* reset "link" */
+
+      /*
+       * Descend into or "recurse" into the directory to read
+       *   all the files in it.
        */
       errno = 0;
       if ((directory = opendir(fname)) == NULL) {
-        free(link);
         ff_pkt->type = FT_NOOPEN;
         ff_pkt->ff_errno = errno;
         rtn_stat = handle_file(ff_pkt, pkt);
         if (ff_pkt->linked) {
            ff_pkt->linked->FileIndex = ff_pkt->FileIndex;
         }
+        free(link);
+        free_dir_ff_pkt(dir_ff_pkt);
         return rtn_stat;
       }
 
       /*
-       * This would possibly run faster if we chdir to the directory
-       * before traversing it.
+       * Process all files in this directory entry (recursing).
+       *    This would possibly run faster if we chdir to the directory
+       *    before traversing it.
        */
       rtn_stat = 1;
       entry = (struct dirent *)malloc(sizeof(struct dirent) + name_max + 100);
-      for ( ; !job_cancelled(jcr); ) {
+      for ( ; !job_canceled(jcr); ) {
         char *p, *q;
         int i;
 
         status  = readdir_r(directory, entry, &result);
-         Dmsg3(200, "readdir stat=%d result=%x name=%s\n", status, result,
-           entry->d_name);
         if (status != 0 || result == NULL) {
+//          Dmsg2(99, "readdir returned stat=%d result=0x%x\n",
+//            status, (long)result);
            break;
         }
-        ASSERT(name_max+1 > sizeof(struct dirent) + (int)NAMELEN(entry));
+        ASSERT(name_max+1 > (int)sizeof(struct dirent) + (int)NAMELEN(entry));
         p = entry->d_name;
          /* Skip `.', `..', and excluded file names.  */
          if (p[0] == '\0' || (p[0] == '.' && (p[1] == '\0' ||
@@ -348,9 +491,23 @@ find_one_file(JCR *jcr, FF_PKT *ff_pkt, int handle_file(FF_PKT *ff, void *hpkt),
       free(link);
       free(entry);
 
-      if (ff_pkt->atime_preserve) {
+      /*
+       * Now that we have recursed through all the files in the
+       *  directory, we "save" the directory so that after all
+       *  the files are restored, this entry will serve to reset
+       *  the directory modes and dates.  Temp directory values
+       *  were used without this record.
+       */
+      handle_file(dir_ff_pkt, pkt);      /* handle directory entry */
+      if (ff_pkt->linked) {
+        ff_pkt->linked->FileIndex = dir_ff_pkt->FileIndex;
+      }
+      free_dir_ff_pkt(dir_ff_pkt);
+
+      if (ff_pkt->flags & FO_KEEPATIME) {
         utime(fname, &restore_times);
       }
+      ff_pkt->volhas_attrlist = volhas_attrlist;      /* Restore value in case it changed. */
       return rtn_stat;
    } /* end check for directory */
 
@@ -359,7 +516,18 @@ find_one_file(JCR *jcr, FF_PKT *ff_pkt, int handle_file(FF_PKT *ff, void *hpkt),
     *  a block device, we do a raw backup of it or if it is
     *  a fifo, we simply read it.
     */
+#ifdef HAVE_FREEBSD_OS
+   /*
+    * On FreeBSD, all block devices are character devices, so
+    *  to be able to read a raw disk, we need the check for
+    *  a character device.
+    * crw-r-----  1 root  operator  - 116, 0x00040002 Jun  9 19:32 /dev/ad0s3
+    * crw-r-----  1 root  operator  - 116, 0x00040002 Jun  9 19:32 /dev/rad0s3
+    */
+   if (top_level && (S_ISBLK(ff_pkt->statp.st_mode) || S_ISCHR(ff_pkt->statp.st_mode))) {
+#else
    if (top_level && S_ISBLK(ff_pkt->statp.st_mode)) {
+#endif
       ff_pkt->type = FT_RAW;         /* raw partition */
    } else if (top_level && S_ISFIFO(ff_pkt->statp.st_mode) &&
              ff_pkt->flags & FO_READFIFO) {
@@ -379,7 +547,7 @@ int term_find_one(FF_PKT *ff)
 {
    struct f_link *lp, *lc;
    int count = 0;
-  
+
    /* Free up list of hard linked files */
    for (lp = ff->linklist; lp;) {
       lc = lp;