]> git.sur5r.net Git - bacula/bacula/blob - bacula/src/stored/dircmd.c
Make new big-virtual-changer test. Test concurrency
[bacula/bacula] / bacula / src / stored / dircmd.c
1 /*
2    Bacula® - The Network Backup Solution
3
4    Copyright (C) 2001-2008 Free Software Foundation Europe e.V.
5
6    The main author of Bacula is Kern Sibbald, with contributions from
7    many others, a complete list can be found in the file AUTHORS.
8    This program is Free Software; you can redistribute it and/or
9    modify it under the terms of version two of the GNU General Public
10    License as published by the Free Software Foundation and included
11    in the file LICENSE.
12
13    This program is distributed in the hope that it will be useful, but
14    WITHOUT ANY WARRANTY; without even the implied warranty of
15    MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE. See the GNU
16    General Public License for more details.
17
18    You should have received a copy of the GNU General Public License
19    along with this program; if not, write to the Free Software
20    Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA
21    02110-1301, USA.
22
23    Bacula® is a registered trademark of Kern Sibbald.
24    The licensor of Bacula is the Free Software Foundation Europe
25    (FSFE), Fiduciary Program, Sumatrastrasse 25, 8006 Zürich,
26    Switzerland, email:ftf@fsfeurope.org.
27 */
28 /*
29  *  This file handles accepting Director Commands
30  *
31  *    Most Director commands are handled here, with the
32  *    exception of the Job command command and subsequent
33  *    subcommands that are handled
34  *    in job.c.
35  *
36  *    N.B. in this file, in general we must use P(dev->mutex) rather
37  *      than dev->r_lock() so that we can examine the blocked
38  *      state rather than blocking ourselves because a Job
39  *      thread has the device blocked. In some "safe" cases,
40  *      we can do things to a blocked device. CAREFUL!!!!
41  *
42  *    File daemon commands are handled in fdcmd.c
43  *
44  *     Kern Sibbald, May MMI
45  *
46  *   Version $Id$
47  *
48  */
49
50 #include "bacula.h"
51 #include "stored.h"
52
53 /* Exported variables */
54
55 /* Imported variables */
56 extern BSOCK *filed_chan;
57 extern struct s_last_job last_job;
58 extern bool init_done;
59
60 /* Static variables */
61 static char derrmsg[]     = "3900 Invalid command\n";
62 static char OKsetdebug[]  = "3000 OK setdebug=%d\n";
63 static char invalid_cmd[] = "3997 Invalid command for a Director with Monitor directive enabled.\n";
64 static char OK_bootstrap[]    = "3000 OK bootstrap\n";
65 static char ERROR_bootstrap[] = "3904 Error bootstrap\n";
66
67 /* Imported functions */
68 extern void terminate_child();
69 extern bool job_cmd(JCR *jcr);
70 extern bool use_cmd(JCR *jcr);
71 extern bool run_cmd(JCR *jcr);
72 extern bool status_cmd(JCR *sjcr);
73 extern bool qstatus_cmd(JCR *jcr);
74 //extern bool query_cmd(JCR *jcr);
75
76 /* Forward referenced functions */
77 static bool label_cmd(JCR *jcr);
78 static bool die_cmd(JCR *jcr);
79 static bool relabel_cmd(JCR *jcr);
80 static bool readlabel_cmd(JCR *jcr);
81 static bool release_cmd(JCR *jcr);
82 static bool setdebug_cmd(JCR *jcr);
83 static bool cancel_cmd(JCR *cjcr);
84 static bool mount_cmd(JCR *jcr);
85 static bool unmount_cmd(JCR *jcr);
86 static bool bootstrap_cmd(JCR *jcr);
87 static bool changer_cmd(JCR *sjcr);
88 static bool do_label(JCR *jcr, int relabel);
89 static DCR *find_device(JCR *jcr, POOL_MEM &dev_name, int drive);
90 static void read_volume_label(JCR *jcr, DCR *dcr, DEVICE *dev, int Slot);
91 static void label_volume_if_ok(DCR *dcr, char *oldname,
92                                char *newname, char *poolname,
93                                int Slot, int relabel);
94 static bool try_autoload_device(JCR *jcr, DCR *dcr, int slot, const char *VolName);
95 static void send_dir_busy_message(BSOCK *dir, DEVICE *dev);
96
97 struct s_cmds {
98    const char *cmd;
99    bool (*func)(JCR *jcr);
100    bool monitoraccess;                      /* set if monitors can access this cmd */
101 };
102
103 /*
104  * The following are the recognized commands from the Director.
105  */
106 static struct s_cmds cmds[] = {
107    {"JobId=",      job_cmd,         0},     /* start Job */
108    {"autochanger", changer_cmd,     0},
109    {"bootstrap",   bootstrap_cmd,   0},
110    {"cancel",      cancel_cmd,      0},
111    {".die",        die_cmd,         0},
112    {"label",       label_cmd,       0},     /* label a tape */
113    {"mount",       mount_cmd,       0},
114    {"readlabel",   readlabel_cmd,   0},
115    {"release",     release_cmd,     0},
116    {"relabel",     relabel_cmd,     0},     /* relabel a tape */
117    {"setdebug=",   setdebug_cmd,    0},     /* set debug level */
118    {"status",      status_cmd,      1},
119    {".status",     qstatus_cmd,     1},
120    {"unmount",     unmount_cmd,     0},
121    {"use storage=", use_cmd,        0},
122    {"run",         run_cmd,         0},
123 // {"query",       query_cmd,       0},
124    {NULL,        NULL}                      /* list terminator */
125 };
126
127
128 /*
129  * Connection request. We accept connections either from the
130  *  Director or a Client (File daemon).
131  *
132  * Note, we are running as a seperate thread of the Storage daemon.
133  *  and it is because a Director has made a connection with
134  *  us on the "Message" channel.
135  *
136  * Basic tasks done here:
137  *  - Create a JCR record
138  *  - If it was from the FD, call handle_filed_connection()
139  *  - Authenticate the Director
140  *  - We wait for a command
141  *  - We execute the command
142  *  - We continue or exit depending on the return status
143  */
144 void *handle_connection_request(void *arg)
145 {
146    BSOCK *bs = (BSOCK *)arg;
147    JCR *jcr;
148    int i;
149    bool found, quit;
150    int bnet_stat = 0;
151    char name[500];
152    char tbuf[100];
153
154    if (bs->recv() <= 0) {
155       Emsg0(M_ERROR, 0, _("Connection request failed.\n"));
156       bs->close();
157       return NULL;
158    }
159
160    /*
161     * Do a sanity check on the message received
162     */
163    if (bs->msglen < 25 || bs->msglen > (int)sizeof(name)) {
164       Dmsg1(000, "<filed: %s", bs->msg);
165       Emsg1(M_ERROR, 0, _("Invalid connection. Len=%d\n"), bs->msglen);
166       bs->close();
167       return NULL;
168    }
169    /*
170     * See if this is a File daemon connection. If so
171     *   call FD handler.
172     */
173    Dmsg1(110, "Conn: %s", bs->msg);
174    if (debug_level == 3) {
175       Dmsg1(000, "<filed: %s", bs->msg);
176    }
177    if (sscanf(bs->msg, "Hello Start Job %127s", name) == 1) {
178       Dmsg1(110, "Got a FD connection at %s\n", bstrftimes(tbuf, sizeof(tbuf), 
179             (utime_t)time(NULL)));
180       Dmsg1(50, "%s", bs->msg);
181       handle_filed_connection(bs, name);
182       return NULL;
183    }
184
185    /* 
186     * This is a connection from the Director, so setup a JCR 
187     */
188    Dmsg1(110, "Got a DIR connection at %s\n", bstrftimes(tbuf, sizeof(tbuf), 
189          (utime_t)time(NULL)));
190    jcr = new_jcr(sizeof(JCR), stored_free_jcr); /* create Job Control Record */
191    jcr->dir_bsock = bs;               /* save Director bsock */
192    jcr->dir_bsock->set_jcr(jcr);
193    jcr->dcrs = New(alist(10, not_owned_by_alist));
194    /* Initialize FD start condition variable */
195    int errstat = pthread_cond_init(&jcr->job_start_wait, NULL);
196    if (errstat != 0) {
197       berrno be;
198       Jmsg1(jcr, M_FATAL, 0, _("Unable to init job cond variable: ERR=%s\n"), be.bstrerror(errstat));
199       goto bail_out;
200    }
201
202    Dmsg0(1000, "stored in start_job\n");
203
204    /*
205     * Authenticate the Director
206     */
207    if (!authenticate_director(jcr)) {
208       Jmsg(jcr, M_FATAL, 0, _("Unable to authenticate Director\n"));
209       goto bail_out;
210    }
211    Dmsg0(90, "Message channel init completed.\n");
212
213    for (quit=false; !quit;) {
214       /* Read command */
215       if ((bnet_stat = bs->recv()) <= 0) {
216          break;               /* connection terminated */
217       }
218       Dmsg1(199, "<dird: %s\n", bs->msg);
219       /* Ensure that device initialization is complete */
220       while (!init_done) {
221          bmicrosleep(1, 0);
222       }
223       found = false;
224       for (i=0; cmds[i].cmd; i++) {
225         if (strncmp(cmds[i].cmd, bs->msg, strlen(cmds[i].cmd)) == 0) {
226            if ((!cmds[i].monitoraccess) && (jcr->director->monitor)) {
227               Dmsg1(100, "Command \"%s\" is invalid.\n", cmds[i].cmd);
228               bs->fsend(invalid_cmd);
229               bs->signal(BNET_EOD);
230               break;
231            }
232            Dmsg1(200, "Do command: %s\n", cmds[i].cmd);
233            if (!cmds[i].func(jcr)) { /* do command */
234               quit = true; /* error, get out */
235               Dmsg1(190, "Command %s reqeusts quit\n", cmds[i].cmd);
236            }
237            found = true;             /* indicate command found */
238            break;
239         }
240       }
241       if (!found) {                   /* command not found */
242         bs->fsend(derrmsg);
243         break;
244       }
245    }
246 bail_out:
247    generate_daemon_event(jcr, "JobEnd");
248    dequeue_messages(jcr);             /* send any queued messages */
249    bs->signal(BNET_TERMINATE);
250    free_jcr(jcr);
251    return NULL;
252 }
253
254
255 /*
256  * Force SD to die, and hopefully dump itself.  Turned on only
257  *  in development version.
258  */
259 static bool die_cmd(JCR *jcr)
260 {
261 #ifdef DEVELOPER
262    JCR *djcr = NULL;
263    int a;
264    Pmsg0(000, "I have been requested to die ...");
265    a = djcr->JobId;   /* ref NULL pointer */
266 #endif
267    return 0;
268 }
269
270      
271
272 /*
273  * Set debug level as requested by the Director
274  *
275  */
276 static bool setdebug_cmd(JCR *jcr)
277 {
278    BSOCK *dir = jcr->dir_bsock;
279    int level, trace_flag;
280
281    Dmsg1(10, "setdebug_cmd: %s", dir->msg);
282    if (sscanf(dir->msg, "setdebug=%d trace=%d", &level, &trace_flag) != 2 || level < 0) {
283       dir->fsend(_("3991 Bad setdebug command: %s\n"), dir->msg);
284       return 0;
285    }
286    debug_level = level;
287    set_trace(trace_flag);
288    return dir->fsend(OKsetdebug, level);
289 }
290
291
292 /*
293  * Cancel a Job
294  */
295 static bool cancel_cmd(JCR *cjcr)
296 {
297    BSOCK *dir = cjcr->dir_bsock;
298    int oldStatus;
299    char Job[MAX_NAME_LENGTH];
300    JCR *jcr;
301
302    if (sscanf(dir->msg, "cancel Job=%127s", Job) == 1) {
303       if (!(jcr=get_jcr_by_full_name(Job))) {
304          dir->fsend(_("3904 Job %s not found.\n"), Job);
305       } else {
306          oldStatus = jcr->JobStatus;
307          set_jcr_job_status(jcr, JS_Canceled);
308          if (!jcr->authenticated && oldStatus == JS_WaitFD) {
309             pthread_cond_signal(&jcr->job_start_wait); /* wake waiting thread */
310          }
311          if (jcr->file_bsock) {
312             bnet_sig(jcr->file_bsock, BNET_TERMINATE);
313          } else {
314             /* Still waiting for FD to connect, release it */
315             pthread_cond_signal(&jcr->job_start_wait); /* wake waiting job */
316          }
317          /* If thread waiting on mount, wake him */
318          if (jcr->dcr && jcr->dcr->dev && jcr->dcr->dev->waiting_for_mount()) {
319             pthread_cond_broadcast(&jcr->dcr->dev->wait_next_vol);
320             Dmsg1(100, "JobId=%u broadcast wait_device_release\n", (uint32_t)jcr->JobId);
321             pthread_cond_broadcast(&wait_device_release);
322          }
323          if (jcr->read_dcr && jcr->read_dcr->dev && jcr->read_dcr->dev->waiting_for_mount()) {
324             pthread_cond_broadcast(&jcr->read_dcr->dev->wait_next_vol);
325             Dmsg1(100, "JobId=%u broadcast wait_device_release\n", (uint32_t)jcr->JobId);
326             pthread_cond_broadcast(&wait_device_release);
327          }
328          Jmsg(jcr, M_INFO, 0, _("Job %s marked to be canceled.\n"), jcr->Job);
329          dir->fsend(_("3000 Job %s marked to be canceled.\n"), jcr->Job);
330          free_jcr(jcr);
331       }
332    } else {
333       dir->fsend(_("3903 Error scanning cancel command.\n"));
334    }
335    dir->signal(BNET_EOD);
336    return 1;
337 }
338
339 /*
340  * Label a Volume
341  *
342  */
343 static bool label_cmd(JCR *jcr)
344 {
345    return do_label(jcr, 0);
346 }
347
348 static bool relabel_cmd(JCR *jcr)
349 {
350    return do_label(jcr, 1);
351 }
352
353 static bool do_label(JCR *jcr, int relabel)
354 {
355    POOLMEM *newname, *oldname, *poolname, *mtype;
356    POOL_MEM dev_name;
357    BSOCK *dir = jcr->dir_bsock;
358    DCR *dcr;
359    DEVICE *dev;
360    bool ok = false;
361    int slot;
362    int drive;
363
364    newname = get_memory(dir->msglen+1);
365    oldname = get_memory(dir->msglen+1);
366    poolname = get_memory(dir->msglen+1);
367    mtype = get_memory(dir->msglen+1);
368    if (relabel) {
369       if (sscanf(dir->msg, "relabel %127s OldName=%127s NewName=%127s PoolName=%127s "
370                  "MediaType=%127s Slot=%d drive=%d",
371                   dev_name.c_str(), oldname, newname, poolname, mtype, 
372                   &slot, &drive) == 7) {
373          ok = true;
374       }
375    } else {
376       *oldname = 0;
377       if (sscanf(dir->msg, "label %127s VolumeName=%127s PoolName=%127s "
378                  "MediaType=%127s Slot=%d drive=%d", 
379           dev_name.c_str(), newname, poolname, mtype, &slot, &drive) == 6) {
380          ok = true;
381       }
382    }
383    if (ok) {
384       unbash_spaces(newname);
385       unbash_spaces(oldname);
386       unbash_spaces(poolname);
387       unbash_spaces(mtype);
388       dcr = find_device(jcr, dev_name, drive);
389       if (dcr) {
390          dev = dcr->dev;
391          dev->dlock();                 /* Use P to avoid indefinite block */
392          if (!dev->is_open() && !dev->is_busy()) {
393             Dmsg1(400, "Can %slabel. Device is not open\n", relabel?"re":"");
394             label_volume_if_ok(dcr, oldname, newname, poolname, slot, relabel);
395             dev->close();
396          /* Under certain "safe" conditions, we can steal the lock */
397          } else if (dev->can_steal_lock()) {
398             Dmsg0(400, "Can relabel. can_steal_lock\n");
399             label_volume_if_ok(dcr, oldname, newname, poolname, slot, relabel);
400          } else if (dev->is_busy() || dev->is_blocked()) {
401             send_dir_busy_message(dir, dev);
402          } else {                     /* device not being used */
403             Dmsg0(400, "Can relabel. device not used\n");
404             label_volume_if_ok(dcr, oldname, newname, poolname, slot, relabel);
405          }
406          dev->dunlock();
407          free_dcr(dcr);
408       } else {
409          dir->fsend(_("3999 Device \"%s\" not found or could not be opened.\n"), dev_name.c_str());
410       }
411    } else {
412       /* NB dir->msg gets clobbered in bnet_fsend, so save command */
413       pm_strcpy(jcr->errmsg, dir->msg);
414       dir->fsend(_("3903 Error scanning label command: %s\n"), jcr->errmsg);
415    }
416    free_memory(oldname);
417    free_memory(newname);
418    free_memory(poolname);
419    free_memory(mtype);
420    dir->signal(BNET_EOD);
421    return true;
422 }
423
424 /*
425  * Read the tape label and determine if we can safely
426  * label the tape (not a Bacula volume), then label it.
427  *
428  *  Enter with the mutex set
429  */
430 static void label_volume_if_ok(DCR *dcr, char *oldname,
431                                char *newname, char *poolname,
432                                int slot, int relabel)
433 {
434    BSOCK *dir = dcr->jcr->dir_bsock;
435    bsteal_lock_t hold;
436    DEVICE *dev = dcr->dev;
437    int label_status;
438    int mode;
439    const char *volname = (relabel == 1) ? oldname : newname;
440    char ed1[50];
441
442    steal_device_lock(dev, &hold, BST_WRITING_LABEL);
443    Dmsg1(100, "Stole device %s lock, writing label.\n", dev->print_name());
444
445
446    Dmsg0(90, "try_autoload_device - looking for volume_info\n");
447    if (!try_autoload_device(dcr->jcr, dcr, slot, volname)) {
448       goto bail_out;                  /* error */
449    }
450
451    /* Ensure that the device is open -- autoload_device() closes it */
452    if (dev->is_tape()) {
453       mode = OPEN_READ_WRITE;
454    } else {
455       mode = CREATE_READ_WRITE;
456    }
457
458    if (relabel) {
459       dev->truncating = true;         /* let open() know we will truncate it */
460    }
461    /* Set old volume name for open if relabeling */
462    bstrncpy(dcr->VolCatInfo.VolCatName, volname, sizeof(dcr->VolCatInfo.VolCatName));
463    if (dev->open(dcr, mode) < 0) {
464       dir->fsend(_("3910 Unable to open device %s: ERR=%s\n"),
465          dev->print_name(), dev->bstrerror());
466       goto bail_out;      
467    }
468
469    /* See what we have for a Volume */
470    label_status = read_dev_volume_label(dcr);
471    
472    /* Set new volume name */
473    bstrncpy(dcr->VolCatInfo.VolCatName, newname, sizeof(dcr->VolCatInfo.VolCatName));
474    switch(label_status) {
475    case VOL_NAME_ERROR:
476    case VOL_VERSION_ERROR:
477    case VOL_LABEL_ERROR:
478    case VOL_OK:
479       if (!relabel) {
480          dir->fsend(_(
481             "3920 Cannot label Volume because it is already labeled: \"%s\"\n"),
482              dev->VolHdr.VolumeName);
483          break;
484       }
485
486       /* Relabel request. If oldname matches, continue */
487       if (strcmp(oldname, dev->VolHdr.VolumeName) != 0) {
488          dir->fsend(_("3921 Wrong volume mounted.\n"));
489          break;
490       }
491       if (dev->label_type != B_BACULA_LABEL) {
492          dir->fsend(_("3922 Cannot relabel an ANSI/IBM labeled Volume.\n"));
493          break;
494       }
495       /* Fall through wanted! */
496    case VOL_IO_ERROR:
497    case VOL_NO_LABEL:
498       if (!write_new_volume_label_to_dev(dcr, newname, poolname, 
499            relabel, true /* write dvd now */)) {
500          dir->fsend(_("3912 Failed to label Volume: ERR=%s\n"), dev->bstrerror());
501          break;
502       }
503       bstrncpy(dcr->VolumeName, newname, sizeof(dcr->VolumeName));
504       /* The following 3000 OK label. string is scanned in ua_label.c */
505       dir->fsend("3000 OK label. VolBytes=%s DVD=%d Volume=\"%s\" Device=%s\n",
506                  edit_uint64(dev->VolCatInfo.VolCatBytes, ed1),
507                  dev->is_dvd()?1:0, newname, dev->print_name());
508       break;
509    case VOL_NO_MEDIA:
510       dir->fsend(_("3914 Failed to label Volume (no media): ERR=%s\n"), dev->bstrerror());
511       break;
512    default:
513       dir->fsend(_("3913 Cannot label Volume. "
514 "Unknown status %d from read_volume_label()\n"), label_status);
515       break;
516    }
517
518 bail_out:
519    if (!dev->is_open()) {
520       dev->clear_volhdr();
521    }
522    volume_unused(dcr);                   /* no longer using volume */
523    give_back_device_lock(dev, &hold);
524    return;
525 }
526
527
528 /*
529  * Read the tape label
530  *
531  *  Enter with the mutex set
532  */
533 static bool read_label(DCR *dcr)
534 {
535    int ok;
536    JCR *jcr = dcr->jcr;
537    BSOCK *dir = jcr->dir_bsock;
538    bsteal_lock_t hold;
539    DEVICE *dev = dcr->dev;
540
541    steal_device_lock(dev, &hold, BST_DOING_ACQUIRE);
542
543    dcr->VolumeName[0] = 0;
544    dev->clear_labeled();              /* force read of label */
545    switch (read_dev_volume_label(dcr)) {
546    case VOL_OK:
547       dir->fsend(_("3001 Mounted Volume: %s\n"), dev->VolHdr.VolumeName);
548       ok = true;
549       break;
550    default:
551       dir->fsend(_("3902 Cannot mount Volume on Storage Device %s because:\n%s"),
552          dev->print_name(), jcr->errmsg);
553       ok = false;
554       break;
555    }
556    volume_unused(dcr);
557    give_back_device_lock(dev, &hold);
558    return ok;
559 }
560
561 /* 
562  * Searches for device by name, and if found, creates a dcr and
563  *  returns it.
564  */
565 static DCR *find_device(JCR *jcr, POOL_MEM &devname, int drive)
566 {
567    DEVRES *device;
568    AUTOCHANGER *changer;
569    bool found = false;
570    DCR *dcr = NULL;
571
572    unbash_spaces(devname);
573    foreach_res(device, R_DEVICE) {
574       /* Find resource, and make sure we were able to open it */
575       if (strcmp(device->hdr.name, devname.c_str()) == 0) {
576          if (!device->dev) {
577             device->dev = init_dev(jcr, device);
578          }
579          if (!device->dev) {
580             Jmsg(jcr, M_WARNING, 0, _("\n"
581                "     Device \"%s\" requested by DIR could not be opened or does not exist.\n"),
582                  devname.c_str());
583             continue;
584          }
585          Dmsg1(20, "Found device %s\n", device->hdr.name);
586          found = true;
587          break;
588       }
589    }
590    if (!found) {
591       foreach_res(changer, R_AUTOCHANGER) {
592          /* Find resource, and make sure we were able to open it */
593          if (strcmp(devname.c_str(), changer->hdr.name) == 0) {
594             /* Try each device in this AutoChanger */
595             foreach_alist(device, changer->device) {
596                Dmsg1(100, "Try changer device %s\n", device->hdr.name);
597                if (!device->dev) {
598                   device->dev = init_dev(jcr, device);
599                }
600                if (!device->dev) {
601                   Dmsg1(100, "Device %s could not be opened. Skipped\n", devname.c_str());
602                   Jmsg(jcr, M_WARNING, 0, _("\n"
603                      "     Device \"%s\" in changer \"%s\" requested by DIR could not be opened or does not exist.\n"),
604                        device->hdr.name, devname.c_str());
605                   continue;
606                }
607                if (!device->dev->autoselect) {
608                   Dmsg1(100, "Device %s not autoselect skipped.\n", devname.c_str());
609                   continue;              /* device is not available */
610                }
611                if (drive < 0 || drive == (int)device->dev->drive_index) {
612                   Dmsg1(20, "Found changer device %s\n", device->hdr.name);
613                   found = true;
614                   break;
615                }
616                Dmsg3(100, "Device %s drive wrong: want=%d got=%d skipping\n",
617                   devname.c_str(), drive, (int)device->dev->drive_index);
618             }
619             break;                    /* we found it but could not open a device */
620          }
621       }
622    }
623
624    if (found) {
625       Dmsg1(100, "Found device %s\n", device->hdr.name);
626       dcr = new_dcr(jcr, NULL, device->dev);
627       dcr->device = device;
628    }
629    return dcr;
630 }
631
632
633 /*
634  * Mount command from Director
635  */
636 static bool mount_cmd(JCR *jcr)
637 {
638    POOL_MEM devname;
639    BSOCK *dir = jcr->dir_bsock;
640    DEVICE *dev;
641    DCR *dcr;
642    int drive;
643    int slot = 0;
644    bool ok;
645
646    ok = sscanf(dir->msg, "mount %127s drive=%d slot=%d", devname.c_str(), 
647                &drive, &slot) == 3;
648    if (!ok) {
649       ok = sscanf(dir->msg, "mount %127s drive=%d", devname.c_str(), &drive) == 2;
650    }
651    if (ok) {
652       dcr = find_device(jcr, devname, drive);
653       if (dcr) {
654          dev = dcr->dev;
655          dev->dlock();                 /* Use P to avoid indefinite block */
656          Dmsg2(100, "mount cmd blocked=%d must_unload=%d\n", dev->blocked(), 
657             dev->must_unload());
658          switch (dev->blocked()) {         /* device blocked? */
659          case BST_WAITING_FOR_SYSOP:
660             /* Someone is waiting, wake him */
661             Dmsg0(100, "Waiting for mount. Attempting to wake thread\n");
662             dev->set_blocked(BST_MOUNT);
663             dir->fsend("3001 OK mount requested. %sDevice=%s\n", 
664                        slot>0?_("Specified slot ignored. "):"",
665                        dev->print_name());
666             pthread_cond_broadcast(&dev->wait_next_vol);
667             Dmsg1(100, "JobId=%u broadcast wait_device_release\n", (uint32_t)dcr->jcr->JobId);
668             pthread_cond_broadcast(&wait_device_release);
669             break;
670
671          /* In both of these two cases, we (the user) unmounted the Volume */
672          case BST_UNMOUNTED_WAITING_FOR_SYSOP:
673          case BST_UNMOUNTED:
674             if (dev->is_autochanger() && slot > 0) {
675                try_autoload_device(jcr, dcr, slot, "");
676             }
677             /* We freed the device, so reopen it and wake any waiting threads */
678             if (dev->open(dcr, OPEN_READ_ONLY) < 0) {
679                dir->fsend(_("3901 Unable to open device %s: ERR=%s\n"),
680                   dev->print_name(), dev->bstrerror());
681                if (dev->blocked() == BST_UNMOUNTED) {
682                   /* We blocked the device, so unblock it */
683                   Dmsg0(100, "Unmounted. Unblocking device\n");
684                   unblock_device(dev);
685                }
686                break;
687             }
688             read_dev_volume_label(dcr);
689             if (dev->blocked() == BST_UNMOUNTED) {
690                /* We blocked the device, so unblock it */
691                Dmsg0(100, "Unmounted. Unblocking device\n");
692                read_label(dcr);       /* this should not be necessary */
693                unblock_device(dev);
694             } else {
695                Dmsg0(100, "Unmounted waiting for mount. Attempting to wake thread\n");
696                dev->set_blocked(BST_MOUNT);
697             }
698             if (dev->is_labeled()) {
699                dir->fsend(_("3001 Device %s is mounted with Volume \"%s\"\n"),
700                   dev->print_name(), dev->VolHdr.VolumeName);
701             } else {
702                dir->fsend(_("3905 Device %s open but no Bacula volume is mounted.\n"
703                                  "If this is not a blank tape, try unmounting and remounting the Volume.\n"),
704                           dev->print_name());
705             }
706             pthread_cond_broadcast(&dev->wait_next_vol);
707             Dmsg1(100, "JobId=%u broadcast wait_device_release\n", (uint32_t)dcr->jcr->JobId);
708             pthread_cond_broadcast(&wait_device_release);
709             break;
710
711          case BST_DOING_ACQUIRE:
712             dir->fsend(_("3001 Device %s is doing acquire.\n"),
713                        dev->print_name());
714             break;
715
716          case BST_WRITING_LABEL:
717             dir->fsend(_("3903 Device %s is being labeled.\n"), 
718                dev->print_name());
719             break;
720
721          case BST_NOT_BLOCKED:
722             if (dev->is_autochanger() && slot > 0) {
723                try_autoload_device(jcr, dcr, slot, "");
724             }
725             if (dev->is_open()) {
726                if (dev->is_labeled()) {
727                   dir->fsend(_("3001 Device %s is mounted with Volume \"%s\"\n"),
728                      dev->print_name(), dev->VolHdr.VolumeName);
729                } else {
730                   dir->fsend(_("3905 Device %s open but no Bacula volume is mounted.\n"
731                                  "If this is not a blank tape, try unmounting and remounting the Volume.\n"),
732                              dev->print_name());
733                }
734             } else if (dev->is_tape()) {
735                if (dev->open(dcr, OPEN_READ_ONLY) < 0) {
736                   dir->fsend(_("3901 Unable to open device %s: ERR=%s\n"),
737                      dev->print_name(), dev->bstrerror());
738                   break;
739                }
740                read_label(dcr);
741                if (dev->is_labeled()) {
742                   dir->fsend(_("3001 Device %s is already mounted with Volume \"%s\"\n"),
743                      dev->print_name(), dev->VolHdr.VolumeName);
744                } else {
745                   dir->fsend(_("3905 Device %s open but no Bacula volume is mounted.\n"
746                                     "If this is not a blank tape, try unmounting and remounting the Volume.\n"),
747                              dev->print_name());
748                }
749             } else if (dev->is_unmountable()) {
750                if (dev->mount(1)) {
751                   dir->fsend(_("3002 Device %s is mounted.\n"), 
752                      dev->print_name());
753                } else {
754                   dir->fsend(_("3907 %s"), dev->bstrerror());
755                } 
756             } else { /* must be file */
757                dir->fsend(_("3906 File device %s is always mounted.\n"),
758                   dev->print_name());
759             }
760             break;
761
762          default:
763             dir->fsend(_("3905 Bizarre wait state %d\n"), dev->blocked());
764             break;
765          }
766          dev->dunlock();
767          free_dcr(dcr);
768       } else {
769          dir->fsend(_("3999 Device \"%s\" not found or could not be opened.\n"), devname.c_str());
770       }
771    } else {
772       pm_strcpy(jcr->errmsg, dir->msg);
773       dir->fsend(_("3909 Error scanning mount command: %s\n"), jcr->errmsg);
774    }
775    dir->signal(BNET_EOD);
776    return true;
777 }
778
779 /*
780  * unmount command from Director
781  */
782 static bool unmount_cmd(JCR *jcr)
783 {
784    POOL_MEM devname;
785    BSOCK *dir = jcr->dir_bsock;
786    DEVICE *dev;
787    DCR *dcr;
788    int drive;
789
790    if (sscanf(dir->msg, "unmount %127s drive=%d", devname.c_str(), &drive) == 2) {
791       dcr = find_device(jcr, devname, drive);
792       if (dcr) {
793          dev = dcr->dev;
794          dev->dlock();                 /* Use P to avoid indefinite block */
795          if (!dev->is_open()) {
796             if (!dev->is_busy()) {
797                unload_autochanger(dcr, -1);          
798             }
799             if (dev->is_unmountable()) {
800                if (dev->unmount(0)) {
801                   dir->fsend(_("3002 Device %s unmounted.\n"), 
802                      dev->print_name());
803                } else {
804                   dir->fsend(_("3907 %s"), dev->bstrerror());
805                } 
806             } else {
807                Dmsg0(90, "Device already unmounted\n");
808                dir->fsend(_("3901 Device %s is already unmounted.\n"), 
809                   dev->print_name());
810             }
811          } else if (dev->blocked() == BST_WAITING_FOR_SYSOP) {
812             Dmsg2(90, "%d waiter dev_block=%d. doing unmount\n", dev->num_waiting,
813                dev->blocked());
814             if (!unload_autochanger(dcr, -1)) {
815                /* ***FIXME**** what is this ????  */
816                dev->close();
817             }
818             if (dev->is_unmountable() && !dev->unmount(0)) {
819                dir->fsend(_("3907 %s"), dev->bstrerror());
820             } else {
821                dev->set_blocked(BST_UNMOUNTED_WAITING_FOR_SYSOP);
822                dir->fsend(_("3001 Device %s unmounted.\n"), 
823                   dev->print_name());
824             }
825
826          } else if (dev->blocked() == BST_DOING_ACQUIRE) {
827             dir->fsend(_("3902 Device %s is busy in acquire.\n"), 
828                dev->print_name());
829
830          } else if (dev->blocked() == BST_WRITING_LABEL) {
831             dir->fsend(_("3903 Device %s is being labeled.\n"), 
832                dev->print_name());
833
834          } else if (dev->is_busy()) {
835             send_dir_busy_message(dir, dev);
836          } else {                     /* device not being used */
837             Dmsg0(90, "Device not in use, unmounting\n");
838             /* On FreeBSD, I am having ASSERT() failures in block_device()
839              * and I can only imagine that the thread id that we are
840              * leaving in no_wait_id is being re-used. So here,
841              * we simply do it by hand.  Gross, but a solution.
842              */
843             /*  block_device(dev, BST_UNMOUNTED); replace with 2 lines below */
844             dev->set_blocked(BST_UNMOUNTED);
845             clear_thread_id(dev->no_wait_id);
846             if (!unload_autochanger(dcr, -1)) {
847                dev->close();
848             }
849             if (dev->is_unmountable() && !dev->unmount(0)) {
850                dir->fsend(_("3907 %s"), dev->bstrerror());
851             } else {
852                dir->fsend(_("3002 Device %s unmounted.\n"), 
853                   dev->print_name());
854             }
855          }
856          dev->dunlock();
857          free_dcr(dcr);
858       } else {
859          dir->fsend(_("3999 Device \"%s\" not found or could not be opened.\n"), devname.c_str());
860       }
861    } else {
862       /* NB dir->msg gets clobbered in bnet_fsend, so save command */
863       pm_strcpy(jcr->errmsg, dir->msg);
864       dir->fsend(_("3907 Error scanning unmount command: %s\n"), jcr->errmsg);
865    }
866    dir->signal(BNET_EOD);
867    return true;
868 }
869
870 /*
871  * Release command from Director. This rewinds the device and if
872  *   configured does a offline and ensures that Bacula will
873  *   re-read the label of the tape before continuing. This gives
874  *   the operator the chance to change the tape anytime before the
875  *   next job starts.
876  */
877 static bool release_cmd(JCR *jcr)
878 {
879    POOL_MEM devname;
880    BSOCK *dir = jcr->dir_bsock;
881    DEVICE *dev;
882    DCR *dcr;
883    int drive;
884
885    if (sscanf(dir->msg, "release %127s drive=%d", devname.c_str(), &drive) == 2) {
886       dcr = find_device(jcr, devname, drive);
887       if (dcr) {
888          dev = dcr->dev;
889          dev->dlock();                 /* Use P to avoid indefinite block */
890          if (!dev->is_open()) {
891             if (!dev->is_busy()) {
892                unload_autochanger(dcr, -1);
893             }
894             Dmsg0(90, "Device already released\n");
895             dir->fsend(_("3921 Device %s already released.\n"), 
896                dev->print_name());
897
898          } else if (dev->blocked() == BST_WAITING_FOR_SYSOP) {
899             Dmsg2(90, "%d waiter dev_block=%d.\n", dev->num_waiting,
900                dev->blocked());
901             unload_autochanger(dcr, -1);
902             dir->fsend(_("3922 Device %s waiting for sysop.\n"), 
903                dev->print_name());
904
905          } else if (dev->blocked() == BST_UNMOUNTED_WAITING_FOR_SYSOP) {
906             Dmsg2(90, "%d waiter dev_block=%d. doing unmount\n", dev->num_waiting,
907                dev->blocked());
908             dir->fsend(_("3922 Device %s waiting for mount.\n"), 
909                dev->print_name());
910
911          } else if (dev->blocked() == BST_DOING_ACQUIRE) {
912             dir->fsend(_("3923 Device %s is busy in acquire.\n"), 
913                dev->print_name());
914
915          } else if (dev->blocked() == BST_WRITING_LABEL) {
916             dir->fsend(_("3914 Device %s is being labeled.\n"), 
917                dev->print_name());
918
919          } else if (dev->is_busy()) {
920             send_dir_busy_message(dir, dev);
921          } else {                     /* device not being used */
922             Dmsg0(90, "Device not in use, releasing\n");
923             dcr->release_volume();
924             dir->fsend(_("3022 Device %s released.\n"), 
925                dev->print_name());
926          }
927          dev->dunlock();
928          free_dcr(dcr);
929       } else {
930          dir->fsend(_("3999 Device \"%s\" not found or could not be opened.\n"), devname.c_str());
931       }
932    } else {
933       /* NB dir->msg gets clobbered in bnet_fsend, so save command */
934       pm_strcpy(jcr->errmsg, dir->msg);
935       dir->fsend(_("3927 Error scanning release command: %s\n"), jcr->errmsg);
936    }
937    dir->signal(BNET_EOD);
938    return true;
939 }
940
941 static pthread_mutex_t bsr_mutex = PTHREAD_MUTEX_INITIALIZER;
942 static uint32_t bsr_uniq = 0;
943
944 static bool get_bootstrap_file(JCR *jcr, BSOCK *sock)
945 {
946    POOLMEM *fname = get_pool_memory(PM_FNAME);
947    FILE *bs;
948    bool ok = false;
949
950    if (jcr->RestoreBootstrap) {
951       unlink(jcr->RestoreBootstrap);
952       free_pool_memory(jcr->RestoreBootstrap);
953    }
954    P(bsr_mutex);
955    bsr_uniq++;
956    Mmsg(fname, "%s/%s.%s.%d.bootstrap", me->working_directory, me->hdr.name,
957       jcr->Job, bsr_uniq);
958    V(bsr_mutex);
959    Dmsg1(400, "bootstrap=%s\n", fname);
960    jcr->RestoreBootstrap = fname;
961    bs = fopen(fname, "a+b");           /* create file */
962    if (!bs) {
963       berrno be;
964       Jmsg(jcr, M_FATAL, 0, _("Could not create bootstrap file %s: ERR=%s\n"),
965          jcr->RestoreBootstrap, be.bstrerror());
966       goto bail_out;
967    }
968    Dmsg0(10, "=== Bootstrap file ===\n");
969    while (sock->recv() >= 0) {
970        Dmsg1(10, "%s", sock->msg);
971        fputs(sock->msg, bs);
972    }
973    fclose(bs);
974    Dmsg0(10, "=== end bootstrap file ===\n");
975    jcr->bsr = parse_bsr(jcr, jcr->RestoreBootstrap);
976    if (!jcr->bsr) {
977       Jmsg(jcr, M_FATAL, 0, _("Error parsing bootstrap file.\n"));
978       goto bail_out;
979    }
980    if (debug_level >= 10) {
981       dump_bsr(jcr->bsr, true);
982    }
983    /* If we got a bootstrap, we are reading, so create read volume list */
984    create_restore_volume_list(jcr);
985    ok = true;
986
987 bail_out:
988    unlink(jcr->RestoreBootstrap);
989    free_pool_memory(jcr->RestoreBootstrap);
990    jcr->RestoreBootstrap = NULL;
991    if (!ok) {
992       sock->fsend(ERROR_bootstrap);
993       return false;
994    }
995    return sock->fsend(OK_bootstrap);
996 }
997
998 static bool bootstrap_cmd(JCR *jcr)
999 {
1000    return get_bootstrap_file(jcr, jcr->dir_bsock);
1001 }
1002
1003 /*
1004  * Autochanger command from Director
1005  */
1006 static bool changer_cmd(JCR *jcr)
1007 {
1008    POOL_MEM devname;
1009    BSOCK *dir = jcr->dir_bsock;
1010    DEVICE *dev;
1011    DCR *dcr;
1012    const char *cmd = NULL;
1013    bool ok = false;
1014    /*
1015     * A safe_cmd may call autochanger script but does not load/unload
1016     *    slots so it can be done at the same time that the drive is open.
1017     */
1018    bool safe_cmd = false;
1019
1020    if (sscanf(dir->msg, "autochanger list %127s", devname.c_str()) == 1) {
1021       cmd = "list";
1022       safe_cmd = ok = true;
1023    } else if (sscanf(dir->msg, "autochanger slots %127s", devname.c_str()) == 1) {
1024       cmd = "slots";
1025       safe_cmd = ok = true;
1026    } else if (sscanf(dir->msg, "autochanger drives %127s", devname.c_str()) == 1) {
1027       cmd = "drives";
1028       safe_cmd = ok = true;
1029    }
1030    if (ok) {
1031       dcr = find_device(jcr, devname, -1);
1032       if (dcr) {
1033          dev = dcr->dev;
1034          dev->dlock();                 /* Use P to avoid indefinite block */
1035          if (!dev->device->changer_res) {
1036             dir->fsend(_("3995 Device %s is not an autochanger.\n"), 
1037                dev->print_name());
1038          /* Under certain "safe" conditions, we can steal the lock */
1039          } else if (safe_cmd || !dev->is_open() || dev->can_steal_lock()) {
1040             autochanger_cmd(dcr, dir, cmd);
1041          } else if (dev->is_busy() || dev->is_blocked()) {
1042             send_dir_busy_message(dir, dev);
1043          } else {                     /* device not being used */
1044             autochanger_cmd(dcr, dir, cmd);
1045          }
1046          dev->dunlock();
1047          free_dcr(dcr);
1048       } else {
1049          dir->fsend(_("3999 Device \"%s\" not found or could not be opened.\n"), devname.c_str());
1050       }
1051    } else {  /* error on scanf */
1052       pm_strcpy(jcr->errmsg, dir->msg);
1053       dir->fsend(_("3908 Error scanning autocharger drives/list/slots command: %s\n"),
1054          jcr->errmsg);
1055    }
1056    dir->signal(BNET_EOD);
1057    return true;
1058 }
1059
1060 /*
1061  * Read and return the Volume label
1062  */
1063 static bool readlabel_cmd(JCR *jcr)
1064 {
1065    POOL_MEM devname;
1066    BSOCK *dir = jcr->dir_bsock;
1067    DEVICE *dev;
1068    DCR *dcr;
1069    int Slot;
1070    int drive;
1071
1072    if (sscanf(dir->msg, "readlabel %127s Slot=%d drive=%d", devname.c_str(), 
1073        &Slot, &drive) == 3) {
1074       dcr = find_device(jcr, devname, drive);
1075       if (dcr) {
1076          dev = dcr->dev;
1077          dev->dlock();                 /* Use P to avoid indefinite block */
1078          if (!dev->is_open()) {
1079             read_volume_label(jcr, dcr, dev, Slot);
1080             dev->close();
1081          /* Under certain "safe" conditions, we can steal the lock */
1082          } else if (dev->can_steal_lock()) {
1083             read_volume_label(jcr, dcr, dev, Slot);
1084          } else if (dev->is_busy() || dev->is_blocked()) {
1085             send_dir_busy_message(dir, dev);
1086          } else {                     /* device not being used */
1087             read_volume_label(jcr, dcr, dev, Slot);
1088          }
1089          dev->dunlock();
1090          free_dcr(dcr);
1091       } else {
1092          dir->fsend(_("3999 Device \"%s\" not found or could not be opened.\n"), devname.c_str());
1093       }
1094    } else {
1095       pm_strcpy(jcr->errmsg, dir->msg);
1096       dir->fsend(_("3909 Error scanning readlabel command: %s\n"), jcr->errmsg);
1097    }
1098    dir->signal(BNET_EOD);
1099    return true;
1100 }
1101
1102
1103 /*
1104  * Read the tape label
1105  *
1106  *  Enter with the mutex set
1107  */
1108 static void read_volume_label(JCR *jcr, DCR *dcr, DEVICE *dev, int Slot)
1109 {
1110    BSOCK *dir = jcr->dir_bsock;
1111    bsteal_lock_t hold;
1112
1113    dcr->dev = dev;
1114    steal_device_lock(dev, &hold, BST_WRITING_LABEL);
1115
1116    if (!try_autoload_device(jcr, dcr, Slot, "")) {
1117       goto bail_out;                  /* error */
1118    }
1119
1120    dev->clear_labeled();              /* force read of label */
1121    switch (read_dev_volume_label(dcr)) {
1122    case VOL_OK:
1123       /* DO NOT add quotes around the Volume name. It is scanned in the DIR */
1124       dir->fsend(_("3001 Volume=%s Slot=%d\n"), dev->VolHdr.VolumeName, Slot);
1125       Dmsg1(100, "Volume: %s\n", dev->VolHdr.VolumeName);
1126       break;
1127    default:
1128       dir->fsend(_("3902 Cannot mount Volume on Storage Device %s because:\n%s"),
1129                  dev->print_name(), jcr->errmsg);
1130       break;
1131    }
1132
1133 bail_out:
1134    give_back_device_lock(dev, &hold);
1135    return;
1136 }
1137
1138 static bool try_autoload_device(JCR *jcr, DCR *dcr, int slot, const char *VolName)
1139 {
1140    BSOCK *dir = jcr->dir_bsock;
1141
1142    bstrncpy(dcr->VolumeName, VolName, sizeof(dcr->VolumeName));
1143    dcr->VolCatInfo.Slot = slot;
1144    dcr->VolCatInfo.InChanger = slot > 0;
1145    if (autoload_device(dcr, 0, dir) < 0) {    /* autoload if possible */
1146       return false;
1147    }
1148    return true;
1149 }
1150
1151 static void send_dir_busy_message(BSOCK *dir, DEVICE *dev)
1152 {
1153    if (dev->is_blocked()) {
1154       switch (dev->blocked()) {
1155       case BST_UNMOUNTED:
1156          dir->fsend(_("3931 Device %s is BLOCKED. user unmounted.\n"),
1157             dev->print_name());
1158          break;
1159       case BST_UNMOUNTED_WAITING_FOR_SYSOP:
1160          dir->fsend(_("3932 Device %s is BLOCKED. user unmounted during wait for media/mount.\n"),
1161              dev->print_name());
1162          break;
1163       case BST_WAITING_FOR_SYSOP:
1164          dir->fsend(_("3933 Device %s is BLOCKED waiting for media.\n"),
1165             dev->print_name());
1166          break;
1167       case BST_DOING_ACQUIRE:
1168          dir->fsend(_("3934 Device %s is being initialized.\n"),
1169             dev->print_name());
1170          break;
1171       case BST_WRITING_LABEL:
1172          dir->fsend(_("3935 Device %s is blocked labeling a Volume.\n"),
1173             dev->print_name());
1174          break;
1175       default:
1176          dir->fsend(_("3935 Device %s is blocked for unknown reason.\n"),
1177             dev->print_name());
1178          break;
1179       }
1180    } else if (dev->can_read()) {
1181        dir->fsend(_("3936 Device %s is busy reading.\n"),
1182                    dev->print_name());;
1183    } else {
1184        dir->fsend(_("3937 Device %s is busy with %d writer(s).\n"),
1185           dev->print_name(), dev->num_writers);
1186    }
1187 }