]> git.sur5r.net Git - bacula/bacula/blobdiff - bacula/src/stored/stored.c
I finally found and squashed the elusive SD crash.
[bacula/bacula] / bacula / src / stored / stored.c
index d45ca8b0d3f99efbc53f3aba9382afa5a865d1b1..b91718ed486885119280e360242e83625754ac9d 100644 (file)
    Copyright (C) 2000-2005 Kern Sibbald
 
    This program is free software; you can redistribute it and/or
-   modify it under the terms of the GNU General Public License as
-   published by the Free Software Foundation; either version 2 of
-   the License, or (at your option) any later version.
+   modify it under the terms of the GNU General Public License
+   version 2 as amended with additional clauses defined in the
+   file LICENSE in the main source directory.
 
    This program is distributed in the hope that it will be useful,
    but WITHOUT ANY WARRANTY; without even the implied warranty of
-   MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE. See the GNU
-   General Public License for more details.
-
-   You should have received a copy of the GNU General Public
-   License along with this program; if not, write to the Free
-   Software Foundation, Inc., 59 Temple Place - Suite 330, Boston,
-   MA 02111-1307, USA.
+   MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE. See the 
+   the file LICENSE for additional details.
 
  */
 
@@ -37,7 +32,7 @@
 
 /* Forward referenced functions */
 void terminate_stored(int sig);
-static void check_config();
+static int check_resources();
 
 extern "C" void *device_initialization(void *arg);
 
@@ -54,7 +49,8 @@ pthread_cond_t wait_device_release = PTHREAD_COND_INITIALIZER;
 
 static uint32_t VolSessionId = 0;
 uint32_t VolSessionTime;
-char *configfile;
+char *configfile = NULL;
+bool init_done = false;
 
 /* Global static variables */
 static int foreground = 0;
@@ -184,12 +180,21 @@ int main (int argc, char *argv[])
    }
 
    parse_config(configfile);
-   check_config();
+
+   if (init_tls() != 0) {
+      Jmsg((JCR *)NULL, M_ERROR_TERM, 0, _("TLS library initialization failed.\n"));
+   }
+
+   if (!check_resources()) {
+      Jmsg((JCR *)NULL, M_ERROR_TERM, 0, _("Please correct configuration file: %s\n"), configfile);
+   }
 
    if (test_config) {
       terminate_stored(0);
    }
 
+   my_name_is(0, (char **)NULL, me->hdr.name);     /* Set our real name */
+
    if (!foreground) {
       daemon_start();                 /* become daemon */
       init_stack_dump();              /* pick up new pid */
@@ -208,8 +213,7 @@ int main (int argc, char *argv[])
       Jmsg0(NULL, M_ABORT, 0, _("Volume Session Time is ZERO!\n"));
    }
 
-   init_python_interpreter(me->hdr.name, me->scripts_directory ?
-         me->scripts_directory : ".", "SDStartUp");
+   init_python_interpreter(me->hdr.name, me->scripts_directory, "SDStartUp");
 
    /* Make sure on Solaris we can run concurrent, watch dog + servers + misc */
    set_thread_concurrency(me->max_concurrent_jobs * 2 + 4);
@@ -217,20 +221,14 @@ int main (int argc, char *argv[])
     /*
      * Start the device allocation thread
      */
+   create_volume_list();              /* do before device_init */
    if (pthread_create(&thid, NULL, device_initialization, NULL) != 0) {
       Emsg1(M_ABORT, 0, _("Unable to create thread. ERR=%s\n"), strerror(errno));
    }
 
    start_watchdog();                  /* start watchdog thread */
-
    init_jcr_subsystem();              /* start JCR watchdogs etc. */
 
-   /*
-    * Sleep a bit to give device thread a chance to lock the resource
-    * chain before we start the server.
-    */
-   bmicrosleep(1, 0);
-
    /* Single server used for Director and File daemon */
    bnet_thread_server(me->sdaddrs, me->max_concurrent_jobs * 2 + 1,
                       &dird_workq, handle_connection_request);
@@ -250,78 +248,198 @@ uint32_t newVolSessionId()
 }
 
 /* Check Configuration file for necessary info */
-static void check_config()
+static int check_resources()
 {
+   bool OK = true;
    AUTOCHANGER *changer;
 
-   LockRes();
+
    me = (STORES *)GetNextRes(R_STORAGE, NULL);
    if (!me) {
-      UnlockRes();
-      Jmsg1(NULL, M_ERROR_TERM, 0, _("No Storage resource defined in %s. Cannot continue.\n"),
+      Jmsg1(NULL, M_ERROR, 0, _("No Storage resource defined in %s. Cannot continue.\n"),
          configfile);
+      OK = false;
    }
-   my_name_is(0, (char **)NULL, me->hdr.name);     /* Set our real name */
 
    if (GetNextRes(R_STORAGE, (RES *)me) != NULL) {
-      UnlockRes();
-      Jmsg1(NULL, M_ERROR_TERM, 0, _("Only one Storage resource permitted in %s\n"),
+      Jmsg1(NULL, M_ERROR, 0, _("Only one Storage resource permitted in %s\n"),
          configfile);
+      OK = false;
    }
    if (GetNextRes(R_DIRECTOR, NULL) == NULL) {
-      UnlockRes();
-      Jmsg1(NULL, M_ERROR_TERM, 0, _("No Director resource defined in %s. Cannot continue.\n"),
+      Jmsg1(NULL, M_ERROR, 0, _("No Director resource defined in %s. Cannot continue.\n"),
          configfile);
+      OK = false;
    }
    if (GetNextRes(R_DEVICE, NULL) == NULL){
-      UnlockRes();
-      Jmsg1(NULL, M_ERROR_TERM, 0, _("No Device resource defined in %s. Cannot continue.\n"),
+      Jmsg1(NULL, M_ERROR, 0, _("No Device resource defined in %s. Cannot continue.\n"),
            configfile);
+      OK = false;
    }
+
    if (!me->messages) {
       me->messages = (MSGS *)GetNextRes(R_MSGS, NULL);
       if (!me->messages) {
-         Jmsg1(NULL, M_ERROR_TERM, 0, _("No Messages resource defined in %s. Cannot continue.\n"),
+         Jmsg1(NULL, M_ERROR, 0, _("No Messages resource defined in %s. Cannot continue.\n"),
             configfile);
+         OK = false;
       }
    }
-   close_msg(NULL);                   /* close temp message handler */
-   init_msg(NULL, me->messages);      /* open daemon message handler */
-
 
    if (!me->working_directory) {
-      Jmsg1(NULL, M_ERROR_TERM, 0, _("No Working Directory defined in %s. Cannot continue.\n"),
+      Jmsg1(NULL, M_ERROR, 0, _("No Working Directory defined in %s. Cannot continue.\n"),
          configfile);
+      OK = false;
+   }
+
+   DIRRES *director;
+   STORES *store;
+   foreach_res(store, R_STORAGE) { 
+      /* tls_require implies tls_enable */
+      if (store->tls_require) {
+         if (have_tls) {
+            store->tls_enable = true;
+         } else {
+            Jmsg(NULL, M_FATAL, 0, _("TLS required but not configured in Bacula.\n"));
+            OK = false;
+            continue;
+         }
+      }
+
+      if (!store->tls_certfile && store->tls_enable) {
+         Jmsg(NULL, M_FATAL, 0, _("\"TLS Certificate\" file not defined for Storage \"%s\" in %s.\n"),
+              store->hdr.name, configfile);
+         OK = false;
+      }
+
+      if (!store->tls_keyfile && store->tls_enable) {
+         Jmsg(NULL, M_FATAL, 0, _("\"TLS Key\" file not defined for Storage \"%s\" in %s.\n"),
+              store->hdr.name, configfile);
+         OK = false;
+      }
+
+      if ((!store->tls_ca_certfile && !store->tls_ca_certdir) && store->tls_enable && store->tls_verify_peer) {
+         Jmsg(NULL, M_FATAL, 0, _("Neither \"TLS CA Certificate\""
+              " or \"TLS CA Certificate Dir\" are defined for Storage \"%s\" in %s."
+              " At least one CA certificate store is required"
+              " when using \"TLS Verify Peer\".\n"),
+              store->hdr.name, configfile);
+         OK = false;
+      }
+
+      /* If everything is well, attempt to initialize our per-resource TLS context */
+      if (OK && (store->tls_enable || store->tls_require)) {
+         /* Initialize TLS context:
+          * Args: CA certfile, CA certdir, Certfile, Keyfile,
+          * Keyfile PEM Callback, Keyfile CB Userdata, DHfile, Verify Peer */
+         store->tls_ctx = new_tls_context(store->tls_ca_certfile,
+            store->tls_ca_certdir, store->tls_certfile,
+            store->tls_keyfile, NULL, NULL, store->tls_dhfile,
+            store->tls_verify_peer);
+
+         if (!store->tls_ctx) { 
+            Jmsg(NULL, M_FATAL, 0, _("Failed to initialize TLS context for Storage \"%s\" in %s.\n"),
+                 store->hdr.name, configfile);
+            OK = false;
+         }
+      }
+   }
+
+   foreach_res(director, R_DIRECTOR) { 
+      /* tls_require implies tls_enable */
+      if (director->tls_require) {
+         director->tls_enable = true;
+      }
+
+      if (!director->tls_certfile && director->tls_enable) {
+         Jmsg(NULL, M_FATAL, 0, _("\"TLS Certificate\" file not defined for Director \"%s\" in %s.\n"),
+              director->hdr.name, configfile);
+         OK = false;
+      }
+
+      if (!director->tls_keyfile && director->tls_enable) {
+         Jmsg(NULL, M_FATAL, 0, _("\"TLS Key\" file not defined for Director \"%s\" in %s.\n"),
+              director->hdr.name, configfile);
+         OK = false;
+      }
+
+      if ((!director->tls_ca_certfile && !director->tls_ca_certdir) && director->tls_enable && director->tls_verify_peer) {
+         Jmsg(NULL, M_FATAL, 0, _("Neither \"TLS CA Certificate\""
+              " or \"TLS CA Certificate Dir\" are defined for Director \"%s\" in %s."
+              " At least one CA certificate store is required"
+              " when using \"TLS Verify Peer\".\n"),
+              director->hdr.name, configfile);
+         OK = false;
+      }
+
+      /* If everything is well, attempt to initialize our per-resource TLS context */
+      if (OK && (director->tls_enable || director->tls_require)) {
+         /* Initialize TLS context:
+          * Args: CA certfile, CA certdir, Certfile, Keyfile,
+          * Keyfile PEM Callback, Keyfile CB Userdata, DHfile, Verify Peer */
+         director->tls_ctx = new_tls_context(director->tls_ca_certfile,
+            director->tls_ca_certdir, director->tls_certfile,
+            director->tls_keyfile, NULL, NULL, director->tls_dhfile,
+            director->tls_verify_peer);
+
+         if (!director->tls_ctx) { 
+            Jmsg(NULL, M_FATAL, 0, _("Failed to initialize TLS context for Director \"%s\" in %s.\n"),
+                 director->hdr.name, configfile);
+            OK = false;
+         }
+      }
    }
-   set_working_directory(me->working_directory);
 
    /* Ensure that the media_type for each device is the same */
    foreach_res(changer, R_AUTOCHANGER) {
       DEVRES *device;
       char *media_type = NULL;
       foreach_alist(device, changer->device) {
-         if (media_type == NULL) {
-            media_type = device->media_type;
-            continue;
-         }     
-         if (strcmp(media_type, device->media_type) != 0) {
-            Jmsg(NULL, M_ERROR_TERM, 0, 
-               _("Media Type not the same for all devices in changer %s. Cannot continue.\n"),
-               changer->hdr.name);
-         }
          /*
           * If the device does not have a changer name or changer command
-          * defined, used the one from the Autochanger resource 
+          *   defined, used the one from the Autochanger resource 
           */
-         if (!device->changer_name) {
+         if (!device->changer_name && changer->changer_name) {
             device->changer_name = bstrdup(changer->changer_name);
          }
-         if (!device->changer_command) {
+         if (!device->changer_command && changer->changer_command) {
             device->changer_command = bstrdup(changer->changer_command);
          }
+         if (!device->changer_name) {
+            Jmsg(NULL, M_ERROR, 0, 
+               _("No Changer Name given for device %s. Cannot continue.\n"),
+               device->hdr.name);
+            OK = false;
+         }   
+         if (!device->changer_command) {
+            Jmsg(NULL, M_ERROR, 0, 
+               _("No Changer Command given for device %s. Cannot continue.\n"),
+               device->hdr.name);
+            OK = false;
+         }   
+
+         if (media_type == NULL) {
+            media_type = device->media_type;     /* get Media Type of first device */
+            continue;
+         }     
+         /* Ensure that other devices Media Types are the same */
+         if (strcmp(media_type, device->media_type) != 0) {
+            Jmsg(NULL, M_ERROR, 0, 
+               _("Media Type not the same for all devices in changer %s. Cannot continue.\n"),
+               changer->hdr.name);
+            OK = false;
+            continue;
+         }
       }
    }
-   UnlockRes();
+   
+   if (OK) {
+      close_msg(NULL);                   /* close temp message handler */
+      init_msg(NULL, me->messages);      /* open daemon message handler */
+      set_working_directory(me->working_directory);
+   }
+
+   return OK;
 }
 
 /*
@@ -332,48 +450,57 @@ extern "C"
 void *device_initialization(void *arg)
 {
    DEVRES *device;
+   DCR *dcr;
+   JCR *jcr;
+   DEVICE *dev;
 
    LockRes();
+
    pthread_detach(pthread_self());
+   jcr = new_jcr(sizeof(JCR), stored_free_jcr);
+   jcr->JobType = JT_SYSTEM;
+   /* Initialize FD start condition variable */
+   int errstat = pthread_cond_init(&jcr->job_start_wait, NULL);
+   if (errstat != 0) {
+      Jmsg1(jcr, M_ABORT, 0, _("Unable to init job cond variable: ERR=%s\n"), strerror(errstat));
+   }
 
    foreach_res(device, R_DEVICE) {
       Dmsg1(90, "calling init_dev %s\n", device->device_name);
-      device->dev = init_dev(NULL, NULL, device);
+      device->dev = dev = init_dev(NULL, device);
       Dmsg1(10, "SD init done %s\n", device->device_name);
-      if (!device->dev) {
+      if (!dev) {
          Jmsg1(NULL, M_ERROR, 0, _("Could not initialize %s\n"), device->device_name);
          continue;
       }
 
+      dcr = new_dcr(jcr, dev);
+
       if (device->cap_bits & CAP_ALWAYSOPEN) {
-         Dmsg1(20, "calling first_open_device %s\n", device->device_name);
-         if (!first_open_device(device->dev)) {
-            Jmsg1(NULL, M_ERROR, 0, _("Could not open device %s\n"), device->device_name);
+         Dmsg1(20, "calling first_open_device %s\n", dev->print_name());
+         if (!first_open_device(dcr)) {
+            Jmsg1(NULL, M_ERROR, 0, _("Could not open device %s\n"), dev->print_name());
+            Dmsg1(20, "Could not open device %s\n", dev->print_name());
+            term_dev(dev);
+            device->dev = NULL;
+            free_dcr(dcr);
+            continue;
          }
       }
-      if (device->cap_bits & CAP_AUTOMOUNT && device->dev &&
-          device->dev->is_open()) {
-         JCR *jcr;
-         DCR *dcr;
-         jcr = new_jcr(sizeof(JCR), stored_free_jcr);
-         jcr->JobType = JT_SYSTEM;
-         /* Initialize FD start condition variable */
-         int errstat = pthread_cond_init(&jcr->job_start_wait, NULL);
-         if (errstat != 0) {
-            Jmsg1(jcr, M_ABORT, 0, _("Unable to init job cond variable: ERR=%s\n"), strerror(errstat));
-         }
-         dcr = new_dcr(jcr, device->dev);
+      if (device->cap_bits & CAP_AUTOMOUNT && dev->is_open()) {
          switch (read_dev_volume_label(dcr)) {
          case VOL_OK:
-            memcpy(&dcr->dev->VolCatInfo, &dcr->VolCatInfo, sizeof(dcr->dev->VolCatInfo));
+            memcpy(&dev->VolCatInfo, &dcr->VolCatInfo, sizeof(dev->VolCatInfo));
             break;
          default:
-            Jmsg1(NULL, M_WARNING, 0, _("Could not mount device %s\n"), device->device_name);
+            Jmsg1(NULL, M_WARNING, 0, _("Could not mount device %s\n"), dev->print_name());
             break;
          }
-         free_jcr(jcr);
       }
+      free_dcr(dcr);
    }
+   free_jcr(jcr); 
+   init_done = true;
    UnlockRes();
    return NULL;
 }
@@ -398,11 +525,10 @@ void terminate_stored(int sig)
        *   them up so that they will report back the correct
        *   volume status.
        */
-      lock_jcr_chain();
       foreach_jcr(jcr) {
          BSOCK *fd;
-         free_locked_jcr(jcr);
          if (jcr->JobId == 0) {
+            free_jcr(jcr);
             continue;                 /* ignore console */
          }
          set_jcr_job_status(jcr, JS_Canceled);
@@ -417,9 +543,9 @@ void terminate_stored(int sig)
                pthread_cond_broadcast(&wait_device_release);
             }
             bmicrosleep(0, 50000);
-          }
+         }
+         free_jcr(jcr);
       }
-      unlock_jcr_chain();
       bmicrosleep(0, 500000);         /* give them 1/2 sec to clean up */
    }
 
@@ -428,16 +554,20 @@ void terminate_stored(int sig)
 
    Dmsg1(200, "In terminate_stored() sig=%d\n", sig);
 
-   LockRes();
    foreach_res(device, R_DEVICE) {
+      Dmsg1(10, "Term device %s\n", device->device_name);
       if (device->dev) {
+         free_volume(device->dev);
          term_dev(device->dev);
+      } else {
+         Dmsg1(10, "No dev structure %s\n", device->device_name);
       }
    }
-   UnlockRes();
 
-   if (configfile)
-   free(configfile);
+   if (configfile) {
+      free(configfile);
+      configfile = NULL;
+   }
    free_config_resources();
 
    if (debug_level > 10) {
@@ -445,6 +575,8 @@ void terminate_stored(int sig)
    }
    term_msg();
    stop_watchdog();
+   cleanup_tls();
+   free_volume_list();
    close_memory_pool();
 
    sm_dump(false);                    /* dump orphaned buffers */