]> git.sur5r.net Git - bacula/bacula/blob - bacula/src/stored/stored.c
Apply Preben 'Peppe' Guldberg <peppe@wielders.org>
[bacula/bacula] / bacula / src / stored / stored.c
1 /*
2  * Second generation Storage daemon.
3  *
4  * It accepts a number of simple commands from the File daemon
5  * and acts on them. When a request to append data is made,
6  * it opens a data channel and accepts data from the
7  * File daemon.
8  *
9  *   Version $Id$
10  *
11  */
12 /*
13    Copyright (C) 2000-2004 Kern Sibbald and John Walker
14
15    This program is free software; you can redistribute it and/or
16    modify it under the terms of the GNU General Public License as
17    published by the Free Software Foundation; either version 2 of
18    the License, or (at your option) any later version.
19
20    This program is distributed in the hope that it will be useful,
21    but WITHOUT ANY WARRANTY; without even the implied warranty of
22    MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE. See the GNU
23    General Public License for more details.
24
25    You should have received a copy of the GNU General Public
26    License along with this program; if not, write to the Free
27    Software Foundation, Inc., 59 Temple Place - Suite 330, Boston,
28    MA 02111-1307, USA.
29
30  */
31
32 #include "bacula.h"
33 #include "stored.h"
34
35 /* Imported functions */
36
37
38 /* Forward referenced functions */
39 void terminate_stored(int sig);
40 static void check_config();
41
42 extern "C" void *device_allocation(void *arg);
43
44
45
46 #define CONFIG_FILE "bacula-sd.conf"  /* Default config file */
47
48
49 /* Global variables exported */
50 char OK_msg[]   = "3000 OK\n";
51 char TERM_msg[] = "3999 Terminate\n";
52 STORES *me = NULL;                    /* our Global resource */
53 bool forge_on = false;                /* proceed inspite of I/O errors */
54
55 static uint32_t VolSessionId = 0;
56 uint32_t VolSessionTime;
57 char *configfile;
58
59 /* Global static variables */
60 static int foreground = 0;
61 static pthread_mutex_t mutex = PTHREAD_MUTEX_INITIALIZER;
62 static workq_t dird_workq;            /* queue for processing connections */
63
64
65 static void usage()
66 {
67    fprintf(stderr, _(
68 "Copyright (C) 2000-2004 Kern Sibbald and John Walker.\n"
69 "\nVersion: " VERSION " (" BDATE ")\n\n"
70 "Usage: stored [options] [-c config_file] [config_file]\n"
71 "        -c <file>   use <file> as configuration file\n"
72 "        -dnn        set debug level to nn\n"
73 "        -f          run in foreground (for debugging)\n"
74 "        -g <group>  set groupid to group\n"
75 "        -p          proceed despite I/O errors\n"
76 "        -s          no signals (for debugging)\n"
77 "        -t          test - read config and exit\n"
78 "        -u <user>   userid to <user>\n"
79 "        -v          verbose user messages\n"
80 "        -?          print this message.\n"
81 "\n"));
82    exit(1);
83 }
84
85 /*********************************************************************
86  *
87  *  Main Bacula Unix Storage Daemon
88  *
89  */
90 int main (int argc, char *argv[])
91 {
92    int ch;
93    int no_signals = FALSE;
94    int test_config = FALSE;
95    pthread_t thid;
96    char *uid = NULL;
97    char *gid = NULL;
98
99    init_stack_dump();
100    my_name_is(argc, argv, "bacula-sd");
101    textdomain("bacula");
102    init_msg(NULL, NULL);
103    daemon_start_time = time(NULL);
104
105    /* Sanity checks */
106    if (TAPE_BSIZE % DEV_BSIZE != 0 || TAPE_BSIZE / DEV_BSIZE == 0) {
107       Emsg2(M_ABORT, 0, "Tape block size (%d) not multiple of system size (%d)\n",
108          TAPE_BSIZE, DEV_BSIZE);
109    }
110    if (TAPE_BSIZE != (1 << (ffs(TAPE_BSIZE)-1))) {
111       Emsg1(M_ABORT, 0, "Tape block size (%d) is not a power of 2\n", TAPE_BSIZE);
112    }
113
114    while ((ch = getopt(argc, argv, "c:d:fg:pstu:v?")) != -1) {
115       switch (ch) {
116       case 'c':                    /* configuration file */
117          if (configfile != NULL) {
118             free(configfile);
119          }
120          configfile = bstrdup(optarg);
121          break;
122
123       case 'd':                    /* debug level */
124          debug_level = atoi(optarg);
125          if (debug_level <= 0) {
126             debug_level = 1;
127          }
128          break;
129
130       case 'f':                    /* run in foreground */
131          foreground = TRUE;
132          break;
133
134       case 'g':                    /* set group id */
135          gid = optarg;
136          break;
137
138       case 'p':                    /* proceed in spite of I/O errors */
139          forge_on = true;
140          break;
141
142       case 's':                    /* no signals */
143          no_signals = TRUE;
144          break;
145
146       case 't':
147          test_config = TRUE;
148          break;
149
150       case 'u':                    /* set uid */
151          uid = optarg;
152          break;
153
154       case 'v':                    /* verbose */
155          verbose++;
156          break;
157
158       case '?':
159       default:
160          usage();
161          break;
162       }
163    }
164    argc -= optind;
165    argv += optind;
166
167    if (argc) {
168       if (configfile != NULL) {
169          free(configfile);
170       }
171       configfile = bstrdup(*argv);
172       argc--;
173       argv++;
174    }
175    if (argc)
176       usage();
177
178    if (!no_signals) {
179       init_signals(terminate_stored);
180    }
181
182
183    if (configfile == NULL) {
184       configfile = bstrdup(CONFIG_FILE);
185    }
186
187    parse_config(configfile);
188    check_config();
189
190    if (test_config) {
191       terminate_stored(0);
192    }
193
194    if (!foreground) {
195       daemon_start();                 /* become daemon */
196       init_stack_dump();              /* pick up new pid */
197    }
198
199    create_pid_file(me->pid_directory, "bacula-sd", get_first_port_host_order(me->sdaddrs));
200    read_state_file(me->working_directory, "bacula-sd", get_first_port_host_order(me->sdaddrs));
201
202    drop(uid, gid);
203
204    /* Ensure that Volume Session Time and Id are both
205     * set and are both non-zero.
206     */
207    VolSessionTime = (long)daemon_start_time;
208    if (VolSessionTime == 0) { /* paranoid */
209       Emsg0(M_ABORT, 0, _("Volume Session Time is ZERO!\n"));
210    }
211
212    /* Make sure on Solaris we can run concurrent, watch dog + servers + misc */
213    set_thread_concurrency(me->max_concurrent_jobs * 2 + 4);
214
215     /*
216      * Start the device allocation thread
217      */
218    if (pthread_create(&thid, NULL, device_allocation, NULL) != 0) {
219       Emsg1(M_ABORT, 0, _("Unable to create thread. ERR=%s\n"), strerror(errno));
220    }
221
222    start_watchdog();                  /* start watchdog thread */
223
224    init_jcr_subsystem();              /* start JCR watchdogs etc. */
225
226    /*
227     * Sleep a bit to give device thread a chance to lock the resource
228     * chain before we start the server.
229     */
230    bmicrosleep(1, 0);
231
232    /* Single server used for Director and File daemon */
233    bnet_thread_server(me->sdaddrs, me->max_concurrent_jobs * 2 + 1,
234                       &dird_workq, handle_connection_request);
235    exit(1);                           /* to keep compiler quiet */
236 }
237
238 /* Return a new Session Id */
239 uint32_t newVolSessionId()
240 {
241    uint32_t Id;
242
243    P(mutex);
244    VolSessionId++;
245    Id = VolSessionId;
246    V(mutex);
247    return Id;
248 }
249
250 /* Check Configuration file for necessary info */
251 static void check_config()
252 {
253    LockRes();
254    me = (STORES *)GetNextRes(R_STORAGE, NULL);
255    if (!me) {
256       UnlockRes();
257       Emsg1(M_ERROR_TERM, 0, _("No Storage resource defined in %s. Cannot continue.\n"),
258          configfile);
259    }
260
261    my_name_is(0, (char **)NULL, me->hdr.name);     /* Set our real name */
262
263    if (GetNextRes(R_STORAGE, (RES *)me) != NULL) {
264       UnlockRes();
265       Emsg1(M_ERROR_TERM, 0, _("Only one Storage resource permitted in %s\n"),
266          configfile);
267    }
268    if (GetNextRes(R_DIRECTOR, NULL) == NULL) {
269       UnlockRes();
270       Emsg1(M_ERROR_TERM, 0, _("No Director resource defined in %s. Cannot continue.\n"),
271          configfile);
272    }
273    if (GetNextRes(R_DEVICE, NULL) == NULL){
274       UnlockRes();
275       Emsg1(M_ERROR_TERM, 0, _("No Device resource defined in %s. Cannot continue.\n"),
276            configfile);
277    }
278    if (!me->messages) {
279       me->messages = (MSGS *)GetNextRes(R_MSGS, NULL);
280       if (!me->messages) {
281          Emsg1(M_ERROR_TERM, 0, _("No Messages resource defined in %s. Cannot continue.\n"),
282             configfile);
283       }
284    }
285    close_msg(NULL);                   /* close temp message handler */
286    init_msg(NULL, me->messages);      /* open daemon message handler */
287
288    UnlockRes();
289
290    if (!me->working_directory) {
291       Emsg1(M_ERROR_TERM, 0, _("No Working Directory defined in %s. Cannot continue.\n"),
292          configfile);
293    }
294
295    set_working_directory(me->working_directory);
296 }
297
298 /*
299  * We are started as a separate thread.  The
300  *  resources are alread locked.
301  */
302 extern "C"
303 void *device_allocation(void *arg)
304 {
305    DEVRES *device;
306
307    LockRes();
308    pthread_detach(pthread_self());
309
310    foreach_res(device, R_DEVICE) {
311       Dmsg1(90, "calling init_dev %s\n", device->device_name);
312       device->dev = init_dev(NULL, device);
313       Dmsg1(10, "SD init done %s\n", device->device_name);
314       if (!device->dev) {
315          Emsg1(M_ERROR, 0, _("Could not initialize %s\n"), device->device_name);
316          continue;
317       }
318
319       if (device->cap_bits & CAP_ALWAYSOPEN) {
320          Dmsg1(20, "calling first_open_device %s\n", device->device_name);
321          if (!first_open_device(device->dev)) {
322             Emsg1(M_ERROR, 0, _("Could not open device %s\n"), device->device_name);
323          }
324       }
325       if (device->cap_bits & CAP_AUTOMOUNT && device->dev &&
326           device->dev->state & ST_OPENED) {
327          JCR *jcr;
328          DCR *dcr;
329          jcr = new_jcr(sizeof(JCR), stored_free_jcr);
330          jcr->JobType = JT_SYSTEM;
331          /* Initialize FD start condition variable */
332          int errstat = pthread_cond_init(&jcr->job_start_wait, NULL);
333          if (errstat != 0) {
334             Jmsg1(jcr, M_ABORT, 0, _("Unable to init job cond variable: ERR=%s\n"), strerror(errstat));
335          }
336          jcr->device = device;
337          dcr = new_dcr(jcr, device->dev);
338          switch (read_dev_volume_label(dcr)) {
339             case VOL_OK:
340                memcpy(&dcr->dev->VolCatInfo, &dcr->VolCatInfo, sizeof(dcr->dev->VolCatInfo));
341                break;
342             default:
343                Emsg1(M_WARNING, 0, _("Could not mount device %s\n"), device->device_name);
344                break;
345          }
346          free_jcr(jcr);
347       }
348    }
349    UnlockRes();
350    return NULL;
351 }
352
353
354 /* Clean up and then exit */
355 void terminate_stored(int sig)
356 {
357    static bool in_here = false;
358    DEVRES *device;
359    JCR *jcr;
360
361    if (in_here) {                     /* prevent loops */
362       exit(1);
363    }
364    in_here = true;
365
366    if (sig == SIGTERM) {              /* normal shutdown request? */
367       /*
368        * This is a normal shutdown request. We wiffle through
369        *   all open jobs canceling them and trying to wake
370        *   them up so that they will report back the correct
371        *   volume status.
372        */
373       lock_jcr_chain();
374       foreach_jcr(jcr) {
375          BSOCK *fd;
376          free_locked_jcr(jcr);
377          if (jcr->JobId == 0) {
378             continue;                 /* ignore console */
379          }
380          set_jcr_job_status(jcr, JS_Canceled);
381          fd = jcr->file_bsock;
382          if (fd) {
383             fd->timed_out = true;
384             Dmsg1(100, "term_stored killing JobId=%d\n", jcr->JobId);
385             pthread_kill(jcr->my_thread_id, TIMEOUT_SIGNAL);
386             if (jcr->device && jcr->device->dev && jcr->device->dev->dev_blocked) {
387                pthread_cond_signal(&jcr->device->dev->wait_next_vol);
388             }
389             bmicrosleep(0, 50000);
390           }
391       }
392       unlock_jcr_chain();
393       bmicrosleep(0, 500000);         /* give them 1/2 sec to clean up */
394    }
395
396    write_state_file(me->working_directory, "bacula-sd", get_first_port_host_order(me->sdaddrs));
397    delete_pid_file(me->pid_directory, "bacula-sd", get_first_port_host_order(me->sdaddrs));
398
399    Dmsg1(200, "In terminate_stored() sig=%d\n", sig);
400
401    LockRes();
402    foreach_res(device, R_DEVICE) {
403       if (device->dev) {
404          term_dev(device->dev);
405       }
406    }
407    UnlockRes();
408
409    if (configfile)
410    free(configfile);
411    free_config_resources();
412
413    if (debug_level > 10) {
414       print_memory_pool_stats();
415    }
416    term_msg();
417    stop_watchdog();
418    close_memory_pool();
419
420    sm_dump(false);                    /* dump orphaned buffers */
421    exit(sig);
422 }