]> git.sur5r.net Git - bacula/bacula/blob - bacula/src/stored/reserve.c
kes Rework class structures for VOLRES, DCR, and DEVICE to make
[bacula/bacula] / bacula / src / stored / reserve.c
1 /*
2    Bacula® - The Network Backup Solution
3
4    Copyright (C) 2000-2008 Free Software Foundation Europe e.V.
5
6    The main author of Bacula is Kern Sibbald, with contributions from
7    many others, a complete list can be found in the file AUTHORS.
8    This program is Free Software; you can redistribute it and/or
9    modify it under the terms of version two of the GNU General Public
10    License as published by the Free Software Foundation and included
11    in the file LICENSE.
12
13    This program is distributed in the hope that it will be useful, but
14    WITHOUT ANY WARRANTY; without even the implied warranty of
15    MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE. See the GNU
16    General Public License for more details.
17
18    You should have received a copy of the GNU General Public License
19    along with this program; if not, write to the Free Software
20    Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA
21    02110-1301, USA.
22
23    Bacula® is a registered trademark of John Walker.
24    The licensor of Bacula is the Free Software Foundation Europe
25    (FSFE), Fiduciary Program, Sumatrastrasse 25, 8006 Zürich,
26    Switzerland, email:ftf@fsfeurope.org.
27 */
28 /*
29  *   Drive reservation functions for Storage Daemon
30  *
31  *   Kern Sibbald, MM
32  *
33  *   Split from job.c and acquire.c June 2005
34  *
35  *   Version $Id$
36  *
37  */
38
39 #include "bacula.h"
40 #include "stored.h"
41
42 const int dbglvl =  50;
43
44 static dlist *vol_list = NULL;
45 static brwlock_t reservation_lock;
46 static brwlock_t vol_list_lock;
47
48 /* Forward referenced functions */
49 static int can_reserve_drive(DCR *dcr, RCTX &rctx);
50 static int reserve_device(RCTX &rctx);
51 static bool reserve_device_for_read(DCR *dcr);
52 static bool reserve_device_for_append(DCR *dcr, RCTX &rctx);
53 static bool use_storage_cmd(JCR *jcr);
54 static void queue_reserve_message(JCR *jcr);
55 static void pop_reserve_messages(JCR *jcr);
56 //void switch_device(DCR *dcr, DEVICE *dev);
57
58 /* Requests from the Director daemon */
59 static char use_storage[]  = "use storage=%127s media_type=%127s "
60    "pool_name=%127s pool_type=%127s append=%d copy=%d stripe=%d\n";
61 static char use_device[]  = "use device=%127s\n";
62
63 /* Responses sent to Director daemon */
64 static char OK_device[] = "3000 OK use device device=%s\n";
65 static char NO_device[] = "3924 Device \"%s\" not in SD Device resources.\n";
66 static char BAD_use[]   = "3913 Bad use command: %s\n";
67
68 bool use_cmd(JCR *jcr) 
69 {
70    /*
71     * Get the device, media, and pool information
72     */
73    if (!use_storage_cmd(jcr)) {
74       set_jcr_job_status(jcr, JS_ErrorTerminated);
75       memset(jcr->sd_auth_key, 0, strlen(jcr->sd_auth_key));
76       return false;
77    }
78    return true;
79 }
80
81 static int my_compare(void *item1, void *item2)
82 {
83    return strcmp(((VOLRES *)item1)->vol_name, ((VOLRES *)item2)->vol_name);
84 }
85
86 /*
87  * This allows a given thread to recursively call lock_reservations.
88  *   It must, of course, call unlock_... the same number of times.
89  */
90 void init_reservations_lock()
91 {
92    int errstat;
93    if ((errstat=rwl_init(&reservation_lock)) != 0) {
94       berrno be;
95       Emsg1(M_ABORT, 0, _("Unable to initialize reservation lock. ERR=%s\n"),
96             be.bstrerror(errstat));
97    }
98
99    if ((errstat=rwl_init(&vol_list_lock)) != 0) {
100       berrno be;
101       Emsg1(M_ABORT, 0, _("Unable to initialize volume list lock. ERR=%s\n"),
102             be.bstrerror(errstat));
103    }
104 }
105
106 void term_reservations_lock()
107 {
108    rwl_destroy(&reservation_lock);
109    rwl_destroy(&vol_list_lock);
110 }
111
112 int reservations_lock_count = 0;
113
114 /* This applies to a drive and to Volumes */
115 void _lock_reservations()
116 {
117    int errstat;
118    reservations_lock_count++;
119    if ((errstat=rwl_writelock(&reservation_lock)) != 0) {
120       berrno be;
121       Emsg2(M_ABORT, 0, "rwl_writelock failure. stat=%d: ERR=%s\n",
122            errstat, be.bstrerror(errstat));
123    }
124 }
125
126 void _unlock_reservations()
127 {
128    int errstat;
129    reservations_lock_count--;
130    if ((errstat=rwl_writeunlock(&reservation_lock)) != 0) {
131       berrno be;
132       Emsg2(M_ABORT, 0, "rwl_writeunlock failure. stat=%d: ERR=%s\n",
133            errstat, be.bstrerror(errstat));
134    }
135 }
136
137 int vol_list_lock_count = 0;
138
139 /* 
140  * This allows a given thread to recursively call to lock_volumes()
141  */
142 void _lock_volumes()
143 {
144    int errstat;
145    vol_list_lock_count++;
146    if ((errstat=rwl_writelock(&vol_list_lock)) != 0) {
147       berrno be;
148       Emsg2(M_ABORT, 0, "rwl_writelock failure. stat=%d: ERR=%s\n",
149            errstat, be.bstrerror(errstat));
150    }
151 }
152
153 void _unlock_volumes()
154 {
155    int errstat;
156    vol_list_lock_count--;
157    if ((errstat=rwl_writeunlock(&vol_list_lock)) != 0) {
158       berrno be;
159       Emsg2(M_ABORT, 0, "rwl_writeunlock failure. stat=%d: ERR=%s\n",
160            errstat, be.bstrerror(errstat));
161    }
162 }
163
164
165 /*
166  * List Volumes -- this should be moved to status.c
167  */
168 enum {
169    debug_lock = true,
170    debug_nolock = false
171 };
172
173 static void debug_list_volumes(const char *imsg)
174 {
175    VOLRES *vol;
176    POOL_MEM msg(PM_MESSAGE);
177
178    lock_volumes();
179    foreach_dlist(vol, vol_list) {
180       if (vol->dev) {
181          Mmsg(msg, "List %s: %s in_use=%d on device %s\n", imsg, 
182               vol->vol_name, vol->is_in_use(), vol->dev->print_name());
183       } else {
184          Mmsg(msg, "List %s: %s in_use=%d no dev\n", imsg, vol->vol_name, 
185               vol->is_in_use());
186       }
187       Dmsg1(dbglvl, "%s", msg.c_str());
188    }
189
190 #ifdef xxx
191    DEVICE *dev = NULL;
192    foreach_dlist(vol, vol_list) {
193       if (vol->dev == dev) {
194          Dmsg0(dbglvl, "Two Volumes on same device.\n");
195          ASSERT(0);
196          dev = vol->dev;
197       }
198    }
199 #endif
200
201    unlock_volumes();
202 }
203
204
205 /*
206  * List Volumes -- this should be moved to status.c
207  */
208 void list_volumes(void sendit(const char *msg, int len, void *sarg), void *arg)
209 {
210    VOLRES *vol;
211    POOL_MEM msg(PM_MESSAGE);
212    int len;
213
214    lock_volumes();
215    foreach_dlist(vol, vol_list) {
216       DEVICE *dev = vol->dev;
217       if (dev) {
218          len = Mmsg(msg, "%s on device %s\n", vol->vol_name, dev->print_name());
219          sendit(msg.c_str(), len, arg);
220          len = Mmsg(msg, "    Reader=%d writers=%d devres=%d volinuse=%d\n", 
221             dev->can_read()?1:0, dev->num_writers, dev->num_reserved(),   
222             vol->is_in_use());
223          sendit(msg.c_str(), len, arg);
224       } else {
225          len = Mmsg(msg, "%s no device. volinuse= %d\n", vol->vol_name, 
226             vol->is_in_use());
227          sendit(msg.c_str(), len, arg);
228       }
229    }
230    unlock_volumes();
231 }
232
233 /*
234  * Create a Volume item to put in the Volume list
235  *   Ensure that the device points to it.
236  */
237 static VOLRES *new_vol_item(DCR *dcr, const char *VolumeName)
238 {
239    VOLRES *vol;
240    vol = (VOLRES *)malloc(sizeof(VOLRES));
241    memset(vol, 0, sizeof(VOLRES));
242    vol->vol_name = bstrdup(VolumeName);
243    vol->dev = dcr->dev;
244    Dmsg3(dbglvl, "new Vol=%s at %p dev=%s\n",
245          VolumeName, vol->vol_name, vol->dev->print_name());
246    return vol;
247 }
248
249 static void free_vol_item(VOLRES *vol)
250 {
251    DEVICE *dev = NULL;
252
253    free(vol->vol_name);
254    if (vol->dev) {
255       dev = vol->dev;
256    }
257    free(vol);
258    if (dev) {
259       dev->vol = NULL;
260    }
261 }
262
263 /*
264  * Put a new Volume entry in the Volume list. This
265  *  effectively reserves the volume so that it will
266  *  not be mounted again.
267  *
268  * If the device has any current volume associated with it,
269  *  and it is a different Volume, and the device is not busy,
270  *  we release the old Volume item and insert the new one.
271  * 
272  * It is assumed that the device is free and locked so that
273  *  we can change the device structure.
274  *
275  * Some details of the Volume list handling:
276  *
277  *  1. The Volume list entry must be attached to the drive (rather than 
278  *       attached to a job as it currently is. I.e. the drive that "owns" 
279  *       the volume (in use, mounted)
280  *       must point to the volume (still to be maintained in a list).
281  *
282  *  2. The Volume is entered in the list when a drive is reserved.  
283  *
284  *  3. When a drive is in use, the device code must appropriately update the
285  *      volume name as it changes (currently the list is static -- an entry is
286  *      removed when the Volume is no longer reserved, in use or mounted).  
287  *      The new code must keep the same list entry as long as the drive
288  *       has any volume associated with it but the volume name in the list
289  *       must be updated when the drive has a different volume mounted.
290  *
291  *  4. A job that has reserved a volume, can un-reserve the volume, and if the 
292  *      volume is not mounted, and not reserved, and not in use, it will be
293  *      removed from the list.
294  *
295  *  5. If a job wants to reserve a drive with a different Volume from the one on
296  *      the drive, it can re-use the drive for the new Volume.
297  *
298  *  6. If a job wants a Volume that is in a different drive, it can either use the
299  *      other drive or take the volume, only if the other drive is not in use or
300  *      not reserved.
301  *
302  *  One nice aspect of this is that the reserve use count and the writer use count 
303  *  already exist and are correctly programmed and will need no changes -- use 
304  *  counts are always very tricky.
305  *
306  *  The old code had a concept of "reserving" a Volume, but was changed 
307  *  to reserving and using a drive.  A volume is must be attached to (owned by) a 
308  *  drive and can move from drive to drive or be unused given certain specific 
309  *  conditions of the drive.  The key is that the drive must "own" the Volume.  
310  *  The old code had the job (dcr) owning the volume (more or less).  The job was
311  *  to change the insertion and removal of the volumes from the list to be based 
312  *  on the drive rather than the job.  
313  *
314  *  Return: VOLRES entry on success
315  *          NULL volume busy on another drive
316  */
317 VOLRES *reserve_volume(DCR *dcr, const char *VolumeName)
318 {
319    VOLRES *vol, *nvol;
320    DEVICE * volatile dev = dcr->dev;
321
322    ASSERT(dev != NULL);
323
324    Dmsg2(dbglvl, "enter reserve_volume=%s drive=%s\n", VolumeName, 
325       dcr->dev->print_name());
326    /* 
327     * We lock the reservations system here to ensure
328     *  when adding a new volume that no newly scheduled
329     *  job can reserve it.
330     */
331    lock_volumes();
332    debug_list_volumes("begin reserve_volume");
333    /* 
334     * First, remove any old volume attached to this device as it
335     *  is no longer used.
336     */
337    if (dev->vol) {
338       vol = dev->vol;
339       Dmsg4(dbglvl, "Vol attached=%s, newvol=%s volinuse=%d on %s\n",
340          vol->vol_name, VolumeName, vol->is_in_use(), dev->print_name());
341       /*
342        * Make sure we don't remove the current volume we are inserting
343        *  because it was probably inserted by another job, or it
344        *  is not being used and is marked as not reserved.
345        */
346       if (strcmp(vol->vol_name, VolumeName) == 0) {
347          Dmsg2(dbglvl, "=== set reserved vol=%s dev=%s\n", VolumeName,
348                vol->dev->print_name());
349          vol->set_in_use();             /* retake vol if released previously */
350          dcr->reserved_volume = true;   /* reserved volume */
351          goto get_out;                  /* Volume already on this device */
352       } else {
353          /* Don't release a volume if it was reserved by someone other than us */
354          if (vol->is_in_use() && !dcr->reserved_volume) { 
355             Dmsg1(dbglvl, "Cannot free vol=%s. It is reserved.\n", vol->vol_name);
356             vol = NULL;                  /* vol in use */
357             goto get_out;
358          }
359          Dmsg2(dbglvl, "reserve_vol free vol=%s at %p\n", vol->vol_name, vol->vol_name);
360          free_volume(dev);
361          dev->set_unload();             /* have to unload current volume */
362          debug_list_volumes("reserve_vol free");
363       }
364    }
365
366    /* Create a new Volume entry */
367    nvol = new_vol_item(dcr, VolumeName);
368
369    /*
370     * Now try to insert the new Volume
371     */
372    vol = (VOLRES *)vol_list->binary_insert(nvol, my_compare);
373    if (vol != nvol) {
374       Dmsg2(dbglvl, "Found vol=%s dev-same=%d\n", vol->vol_name, dev==vol->dev);
375       /*
376        * At this point, a Volume with this name already is in the list,
377        *   so we simply release our new Volume entry. Note, this should
378        *   only happen if we are moving the volume from one drive to another.
379        */
380       Dmsg2(dbglvl, "reserve_vol free-tmp vol=%s at %p\n", 
381             vol->vol_name, vol->vol_name);
382       /*
383        * Clear dev pointer so that free_vol_item() doesn't 
384        *  take away our volume. 
385        */
386       nvol->dev = NULL;                  /* don't zap dev entry */
387       free_vol_item(nvol);
388
389       /* Check if we are trying to use the Volume on a different drive */
390       if (dev != vol->dev) {
391          /* Caller wants to switch Volume to another device */
392          if (!vol->dev->is_busy() && !vol->is_swapping()) {
393             Dmsg3(dbglvl, "==== Swap vol=%s from dev=%s to %s\n", 
394                VolumeName, vol->dev->print_name(), dev->print_name());
395             free_volume(dev);            /* free any volume attached to our drive */
396             vol->set_swapping();
397             vol->dev->set_unload();
398             dev->swap_dev = vol->dev;    /* remember to get this vol */
399             vol->dev->vol = NULL;        /* take volume */
400             vol->dev = dev;
401             dev->vol = vol;
402             Dmsg3(dbglvl, "==== Swap vol=%s from dev=%s to %s\n", 
403                VolumeName, vol->dev->print_name(), dev->print_name());
404          } else {
405             Dmsg3(dbglvl, "==== Swap not possible Vol busy vol=%s from dev=%s to %s\n", 
406                VolumeName, vol->dev->print_name(), dev->print_name());
407             vol = NULL;                  /* device busy */
408             goto get_out;
409          }
410       } else {
411          dev->vol = vol;
412       }
413    } else {
414       dev->vol = vol;                    /* point to newly inserted volume */
415    }
416
417 get_out:
418    if (vol) {
419       Dmsg2(dbglvl, "=== set in_use. vol=%s dev=%s\n", vol->vol_name,
420             vol->dev->print_name());
421       vol->set_in_use();
422       dcr->reserved_volume = true;
423    }
424    debug_list_volumes("end new volume");
425    unlock_volumes();
426    return vol;
427 }
428
429 /* 
430  * Switch from current device to given device  
431  *   (not yet used) 
432  */
433 #ifdef xxx
434 void switch_device(DCR *dcr, DEVICE *dev)
435 {
436    DCR save_dcr;
437
438    dev->dlock();
439    memcpy(&save_dcr, dcr, sizeof(save_dcr));
440    clean_device(dcr);                  /* clean up the dcr */
441
442    dcr->dev = dev;                     /* get new device pointer */
443    Jmsg(dcr->jcr, M_INFO, 0, _("Device switch. New device %s chosen.\n"),
444       dcr->dev->print_name());
445
446    bstrncpy(dcr->VolumeName, save_dcr.VolumeName, sizeof(dcr->VolumeName));
447    bstrncpy(dcr->media_type, save_dcr.media_type, sizeof(dcr->media_type));
448    dcr->VolCatInfo.Slot = save_dcr.VolCatInfo.Slot;
449    bstrncpy(dcr->pool_name, save_dcr.pool_name, sizeof(dcr->pool_name));
450    bstrncpy(dcr->pool_type, save_dcr.pool_type, sizeof(dcr->pool_type));
451    bstrncpy(dcr->dev_name, dev->dev_name, sizeof(dcr->dev_name));
452
453 // dcr->set_reserved();
454
455    dev->dunlock();
456 }
457 #endif
458
459 /*
460  * Search for a Volume name in the Volume list.
461  *
462  *  Returns: VOLRES entry on success
463  *           NULL if the Volume is not in the list
464  */
465 VOLRES *find_volume(const char *VolumeName) 
466 {
467    VOLRES vol, *fvol;
468    /* Do not lock reservations here */
469    lock_volumes();
470    vol.vol_name = bstrdup(VolumeName);
471    fvol = (VOLRES *)vol_list->binary_search(&vol, my_compare);
472    free(vol.vol_name);
473    Dmsg2(dbglvl, "find_vol=%s found=%d\n", VolumeName, fvol!=NULL);
474    debug_list_volumes("find_volume");
475    unlock_volumes();
476    return fvol;
477 }
478
479 void DCR::set_reserved()
480 {
481    m_reserved = true;
482    Dmsg2(dbglvl, "Inc reserve=%d dev=%s\n", dev->num_reserved(), dev->print_name());
483    dev->inc_reserved();
484 }
485
486 void DCR::clear_reserved()
487 {
488    if (m_reserved) {
489       m_reserved = false;
490       dev->dec_reserved();
491       Dmsg2(dbglvl, "Dec reserve=%d dev=%s\n", dev->num_reserved(), dev->print_name());
492    }
493 }
494
495 /* 
496  * Remove any reservation from a drive and tell the system
497  *  that the volume is unused at least by us.
498  */
499 void DCR::unreserve_device()
500 {
501    lock_volumes();
502    if (is_reserved()) {
503       clear_reserved();
504       reserved_volume = false;
505       /* If we set read mode in reserving, remove it */
506       if (dev->can_read()) {
507          dev->clear_read();
508       }
509       if (dev->num_writers < 0) {
510          Jmsg1(jcr, M_ERROR, 0, _("Hey! num_writers=%d!!!!\n"), dev->num_writers);
511          dev->num_writers = 0;
512       }
513       if (dev->num_reserved() == 0 && dev->num_writers == 0) {
514          volume_unused(this);
515       }
516    }
517    unlock_volumes();
518 }
519
520 /*  
521  * Free a Volume from the Volume list if it is no longer used
522  *   Note, for tape drives we want to remember where the Volume
523  *   was when last used, so rather than free the volume entry,
524  *   we simply mark it "not reserved" so when the drive is really
525  *   needed for another volume, we can reuse it.
526  *
527  *  Returns: true if the Volume found and "removed" from the list
528  *           false if the Volume is not in the list or is in use
529  */
530 bool volume_unused(DCR *dcr)
531 {
532    DEVICE *dev = dcr->dev;
533
534    if (!dev->vol) {
535       Dmsg1(dbglvl, "vol_unused: no vol on %s\n", dev->print_name());
536       debug_list_volumes("null vol cannot unreserve_volume");
537       return false;
538    }
539    if (dev->vol->is_swapping()) {
540       Dmsg1(dbglvl, "vol_unused: vol being swapped on %s\n", dev->print_name());
541       debug_list_volumes("swapping vol cannot unreserve_volume");
542       return false;
543    }
544
545 #ifdef xxx
546    if (dev->is_busy()) {
547       Dmsg1(dbglvl, "vol_unused: busy on %s\n", dev->print_name());
548       debug_list_volumes("dev busy cannot unreserve_volume");
549       return false;
550    }
551 #endif
552 #ifdef xxx
553    if (dev->num_writers > 0 || dev->num_reserved() > 0) {
554       ASSERT(0);
555    }
556 #endif
557
558    /*  
559     * If this is a tape, we do not free the volume, rather we wait
560     *  until the autoloader unloads it, or until another tape is
561     *  explicitly read in this drive. This allows the SD to remember
562     *  where the tapes are or last were.
563     */
564    Dmsg3(dbglvl, "=== mark not reserved vol=%s num_writers=%d dev_reserved=%d\n",
565       dev->vol->vol_name, dev->num_writers, dev->num_reserved());
566    dev->vol->clear_in_use();
567    Dmsg2(dbglvl, "=== set not reserved. Vol=%s dev=%s\n", dev->vol->vol_name,
568          dev->print_name());
569    if (dev->is_tape() || dev->is_autochanger()) {
570       return true;
571    } else {
572       /*
573        * Note, this frees the volume reservation entry, but the 
574        *   file descriptor remains open with the OS.
575        */
576       return free_volume(dev);
577    }
578 }
579
580 /*
581  * Unconditionally release the volume entry
582  */
583 bool free_volume(DEVICE *dev)
584 {
585    VOLRES *vol;
586
587    if (dev->vol == NULL) {
588       Dmsg1(dbglvl, "No vol on dev %s\n", dev->print_name());
589       return false;
590    }
591    lock_volumes();
592    vol = dev->vol;
593    dev->vol = NULL;
594    vol_list->remove(vol);
595    Dmsg2(dbglvl, "=== free_volume %s dev=%s\n", vol->vol_name, dev->print_name());
596    free_vol_item(vol);
597    debug_list_volumes("free_volume");
598    unlock_volumes();
599    return true;
600 }
601
602       
603 /* Create the Volume list */
604 void create_volume_list()
605 {
606    VOLRES *vol = NULL;
607    if (vol_list == NULL) {
608       vol_list = New(dlist(vol, &vol->link));
609    }
610 }
611
612 /* Release all Volumes from the list */
613 void free_volume_list()
614 {
615    VOLRES *vol;
616    if (!vol_list) {
617       return;
618    }
619    lock_volumes();
620    foreach_dlist(vol, vol_list) {
621       if (vol->dev) {
622          Dmsg2(dbglvl, "free vol_list Volume=%s dev=%s\n", vol->vol_name, vol->dev->print_name());
623       } else {
624          Dmsg1(dbglvl, "free vol_list Volume=%s No dev\n", vol->vol_name);
625       }
626       free(vol->vol_name);
627       vol->vol_name = NULL;
628    }
629    delete vol_list;
630    vol_list = NULL;
631    unlock_volumes();
632 }
633
634 bool DCR::can_i_use_volume()
635 {
636    bool rtn = true;
637    VOLRES *vol;
638
639    lock_volumes();
640    vol = find_volume(VolumeName);
641    if (!vol) {
642       Dmsg1(dbglvl, "Vol=%s not in use.\n", VolumeName);
643       goto get_out;                   /* vol not in list */
644    }
645    ASSERT(vol->dev != NULL);
646
647    if (dev == vol->dev) {        /* same device OK */
648       Dmsg1(dbglvl, "Vol=%s on same dev.\n", VolumeName);
649       goto get_out;
650    } else {
651       Dmsg3(dbglvl, "Vol=%s on %s we have %s\n", VolumeName,
652             vol->dev->print_name(), dev->print_name());
653    }
654    /* ***FIXME*** check this ... */
655    if (!vol->dev->is_busy()) {
656       Dmsg2(dbglvl, "Vol=%s dev=%s not busy.\n", VolumeName, vol->dev->print_name());
657       goto get_out;
658    } else {
659       Dmsg2(dbglvl, "Vol=%s dev=%s busy.\n", VolumeName, vol->dev->print_name());
660    }
661    Dmsg2(dbglvl, "Vol=%s in use by %s.\n", VolumeName, vol->dev->print_name());
662    rtn = false;
663
664 get_out:
665    unlock_volumes();
666    return rtn;
667
668 }
669
670
671 /*
672  * We get the following type of information:
673  *
674  * use storage=xxx media_type=yyy pool_name=xxx pool_type=yyy append=1 copy=0 strip=0
675  *  use device=zzz
676  *  use device=aaa
677  *  use device=bbb
678  * use storage=xxx media_type=yyy pool_name=xxx pool_type=yyy append=0 copy=0 strip=0
679  *  use device=bbb
680  *
681  */
682 static bool use_storage_cmd(JCR *jcr)
683 {
684    POOL_MEM store_name, dev_name, media_type, pool_name, pool_type;
685    BSOCK *dir = jcr->dir_bsock;
686    int append;
687    bool ok;       
688    int Copy, Stripe;
689    DIRSTORE *store;
690    RCTX rctx;
691    alist *dirstore;
692
693    memset(&rctx, 0, sizeof(RCTX));
694    rctx.jcr = jcr;
695    /*
696     * If there are multiple devices, the director sends us
697     *   use_device for each device that it wants to use.
698     */
699    dirstore = New(alist(10, not_owned_by_alist));
700    jcr->reserve_msgs = New(alist(10, not_owned_by_alist));  
701    do {
702       Dmsg1(dbglvl, "<dird: %s", dir->msg);
703       ok = sscanf(dir->msg, use_storage, store_name.c_str(), 
704                   media_type.c_str(), pool_name.c_str(), 
705                   pool_type.c_str(), &append, &Copy, &Stripe) == 7;
706       if (!ok) {
707          break;
708       }
709       if (append) {
710          jcr->write_store = dirstore;
711       } else {
712          jcr->read_store = dirstore;
713       }
714       rctx.append = append;
715       unbash_spaces(store_name);
716       unbash_spaces(media_type);
717       unbash_spaces(pool_name);
718       unbash_spaces(pool_type);
719       store = new DIRSTORE;
720       dirstore->append(store);
721       memset(store, 0, sizeof(DIRSTORE));
722       store->device = New(alist(10));
723       bstrncpy(store->name, store_name, sizeof(store->name));
724       bstrncpy(store->media_type, media_type, sizeof(store->media_type));
725       bstrncpy(store->pool_name, pool_name, sizeof(store->pool_name));
726       bstrncpy(store->pool_type, pool_type, sizeof(store->pool_type));
727       store->append = append;
728
729       /* Now get all devices */
730       while (dir->recv() >= 0) {
731          Dmsg1(dbglvl, "<dird device: %s", dir->msg);
732          ok = sscanf(dir->msg, use_device, dev_name.c_str()) == 1;
733          if (!ok) {
734             break;
735          }
736          unbash_spaces(dev_name);
737          store->device->append(bstrdup(dev_name.c_str()));
738       }
739    }  while (ok && dir->recv() >= 0);
740
741    /* Developer debug code */
742    char *device_name;
743    if (debug_level >= dbglvl) {
744       foreach_alist(store, dirstore) {
745          Dmsg5(dbglvl, "Storage=%s media_type=%s pool=%s pool_type=%s append=%d\n", 
746             store->name, store->media_type, store->pool_name, 
747             store->pool_type, store->append);
748          foreach_alist(device_name, store->device) {
749             Dmsg1(dbglvl, "     Device=%s\n", device_name);
750          }
751       }
752    }
753
754    init_jcr_device_wait_timers(jcr);
755    jcr->dcr = new_dcr(jcr, NULL, NULL);         /* get a dcr */
756    if (!jcr->dcr) {
757       BSOCK *dir = jcr->dir_bsock;
758       dir->fsend(_("3939 Could not get dcr\n"));
759       Dmsg1(dbglvl, ">dird: %s", dir->msg);
760       ok = false;
761    }
762    /*                    
763     * At this point, we have a list of all the Director's Storage
764     *  resources indicated for this Job, which include Pool, PoolType,
765     *  storage name, and Media type.     
766     * Then for each of the Storage resources, we have a list of
767     *  device names that were given.
768     *
769     * Wiffle through them and find one that can do the backup.
770     */
771    if (ok) {
772       int wait_for_device_retries = 0;  
773       int repeat = 0;
774       bool fail = false;
775       rctx.notify_dir = true;
776
777       lock_reservations();
778       for ( ; !fail && !job_canceled(jcr); ) {
779          pop_reserve_messages(jcr);
780          rctx.suitable_device = false;
781          rctx.have_volume = false;
782          rctx.VolumeName[0] = 0;
783          rctx.any_drive = false;
784          if (!jcr->PreferMountedVols) {
785             /*
786              * Here we try to find a drive that is not used.
787              * This will maximize the use of available drives.
788              *
789              */
790             rctx.num_writers = 20000000;   /* start with impossible number */
791             rctx.low_use_drive = NULL;
792             rctx.PreferMountedVols = false;                
793             rctx.exact_match = false;
794             rctx.autochanger_only = true;
795             Dmsg5(dbglvl, "PrefMnt=%d exact=%d suitable=%d chgronly=%d any=%d\n",
796                rctx.PreferMountedVols, rctx.exact_match, rctx.suitable_device,
797                rctx.autochanger_only, rctx.any_drive);
798             if ((ok = find_suitable_device_for_job(jcr, rctx))) {
799                break;
800             }
801             /* Look through all drives possibly for low_use drive */
802             if (rctx.low_use_drive) {
803                rctx.try_low_use_drive = true;
804                if ((ok = find_suitable_device_for_job(jcr, rctx))) {
805                   break;
806                }
807                rctx.try_low_use_drive = false;
808             }
809             rctx.autochanger_only = false;
810             Dmsg5(dbglvl, "PrefMnt=%d exact=%d suitable=%d chgronly=%d any=%d\n",
811                rctx.PreferMountedVols, rctx.exact_match, rctx.suitable_device,
812                rctx.autochanger_only, rctx.any_drive);
813             if ((ok = find_suitable_device_for_job(jcr, rctx))) {
814                break;
815             }
816          }
817          /*
818           * Now we look for a drive that may or may not be in
819           *  use.
820           */
821          /* Look for an exact Volume match all drives */
822          rctx.PreferMountedVols = true;
823          rctx.exact_match = true;
824          rctx.autochanger_only = false;
825          Dmsg5(dbglvl, "PrefMnt=%d exact=%d suitable=%d chgronly=%d any=%d\n",
826             rctx.PreferMountedVols, rctx.exact_match, rctx.suitable_device,
827             rctx.autochanger_only, rctx.any_drive);
828          if ((ok = find_suitable_device_for_job(jcr, rctx))) {
829             break;
830          }
831          /* Look for any mounted drive */
832          rctx.exact_match = false;
833          Dmsg5(dbglvl, "PrefMnt=%d exact=%d suitable=%d chgronly=%d any=%d\n",
834             rctx.PreferMountedVols, rctx.exact_match, rctx.suitable_device,
835             rctx.autochanger_only, rctx.any_drive);
836          if ((ok = find_suitable_device_for_job(jcr, rctx))) {
837             break;
838          }
839          /* Try any drive */
840          rctx.any_drive = true;
841          Dmsg5(dbglvl, "PrefMnt=%d exact=%d suitable=%d chgronly=%d any=%d\n",
842             rctx.PreferMountedVols, rctx.exact_match, rctx.suitable_device,
843             rctx.autochanger_only, rctx.any_drive);
844          if ((ok = find_suitable_device_for_job(jcr, rctx))) {
845             break;
846          }
847          /* Keep reservations locked *except* during wait_for_device() */
848          unlock_reservations();
849          /*     
850           * The idea of looping on repeat a few times it to ensure
851           * that if there is some subtle timing problem between two
852           * jobs, we will simply try again, and most likely succeed.
853           * This can happen if one job reserves a drive or finishes using
854           * a drive at the same time a second job wants it.
855           */
856          if (repeat++ > 1) {              /* try algorithm 3 times */
857             bmicrosleep(30, 0);           /* wait a bit */
858             Dmsg0(dbglvl, "repeat reserve algorithm\n");
859          } else if (!rctx.suitable_device || !wait_for_device(jcr, wait_for_device_retries)) {
860             Dmsg0(dbglvl, "Fail. !suitable_device || !wait_for_device\n");
861             fail = true;
862          }   
863          lock_reservations();
864          dir->signal(BNET_HEARTBEAT);  /* Inform Dir that we are alive */
865       }
866       unlock_reservations();
867       if (!ok) {
868          /*
869           * If we get here, there are no suitable devices available, which
870           *  means nothing configured.  If a device is suitable but busy
871           *  with another Volume, we will not come here.
872           */
873          unbash_spaces(dir->msg);
874          pm_strcpy(jcr->errmsg, dir->msg);
875          Jmsg(jcr, M_INFO, 0, _("Failed command: %s\n"), jcr->errmsg);
876          Jmsg(jcr, M_FATAL, 0, _("\n"
877             "     Device \"%s\" with MediaType \"%s\" requested by DIR not found in SD Device resources.\n"),
878               dev_name.c_str(), media_type.c_str());
879          dir->fsend(NO_device, dev_name.c_str());
880
881          Dmsg1(dbglvl, ">dird: %s", dir->msg);
882       }
883    } else {
884       unbash_spaces(dir->msg);
885       pm_strcpy(jcr->errmsg, dir->msg);
886       Jmsg(jcr, M_FATAL, 0, _("Failed command: %s\n"), jcr->errmsg);
887       dir->fsend(BAD_use, jcr->errmsg);
888       Dmsg1(dbglvl, ">dird: %s", dir->msg);
889    }
890
891    release_reserve_messages(jcr);
892    return ok;
893 }
894
895
896 /*
897  * Walk through the autochanger resources and check if
898  *  the volume is in one of them.
899  * 
900  * Returns:  true  if volume is in device
901  *           false otherwise
902  */
903 static bool is_vol_in_autochanger(RCTX &rctx, VOLRES *vol)
904 {
905    AUTOCHANGER *changer = vol->dev->device->changer_res;
906
907    /* Find resource, and make sure we were able to open it */
908    if (strcmp(rctx.device_name, changer->hdr.name) == 0) {
909       Dmsg1(dbglvl, "Found changer device %s\n", vol->dev->device->hdr.name);
910       return true;
911    }  
912    Dmsg1(dbglvl, "Incorrect changer device %s\n", changer->hdr.name);
913    return false;
914 }
915
916 /*
917  * Search for a device suitable for this job.
918  * Note, this routine sets sets rctx.suitable_device if any 
919  *   device exists within the SD.  The device may not be actually
920  *   useable.
921  * It also returns if it finds a useable device.  
922  */
923 bool find_suitable_device_for_job(JCR *jcr, RCTX &rctx)
924 {
925    bool ok = false;
926    DIRSTORE *store;
927    char *device_name;
928    alist *dirstore;
929    DCR *dcr = jcr->dcr;
930
931    if (rctx.append) {
932       dirstore = jcr->write_store;
933    } else {
934       dirstore = jcr->read_store;
935    }
936    Dmsg4(dbglvl, "PrefMnt=%d exact=%d suitable=%d chgronly=%d\n",
937       rctx.PreferMountedVols, rctx.exact_match, rctx.suitable_device,
938       rctx.autochanger_only);
939
940    /* 
941     * If the appropriate conditions of this if are met, namely that
942     *  we are appending and the user wants mounted drive (or we
943     *  force try a mounted drive because they are all busy), we
944     *  start by looking at all the Volumes in the volume list.
945     */
946    if (!vol_list->empty() && rctx.append && rctx.PreferMountedVols) {
947       dlist *temp_vol_list, *save_vol_list;
948       VOLRES *vol = NULL;
949       lock_volumes();
950       Dmsg0(dbglvl, "lock volumes\n");                           
951
952       /*  
953        * Create a temporary copy of the volume list.  We do this,
954        *   to avoid having the volume list locked during the
955        *   call to reserve_device(), which would cause a deadlock.
956        * Note, we may want to add an update counter on the vol_list
957        *   so that if it is modified while we are traversing the copy
958        *   we can take note and act accordingly (probably redo the 
959        *   search at least a few times).
960        */
961       Dmsg0(dbglvl, "duplicate vol list\n");
962       temp_vol_list = New(dlist(vol, &vol->link));
963       foreach_dlist(vol, vol_list) {
964          VOLRES *nvol;
965          VOLRES *tvol = (VOLRES *)malloc(sizeof(VOLRES));
966          memset(tvol, 0, sizeof(VOLRES));
967          tvol->vol_name = bstrdup(vol->vol_name);
968          tvol->dev = vol->dev;
969          nvol = (VOLRES *)temp_vol_list->binary_insert(tvol, my_compare);
970          if (tvol != nvol) {
971             tvol->dev = NULL;                   /* don't zap dev entry */
972             free_vol_item(tvol);
973             Pmsg0(000, "Logic error. Duplicating vol list hit duplicate.\n");
974             Jmsg(jcr, M_WARNING, 0, "Logic error. Duplicating vol list hit duplicate.\n");
975          }
976       }
977       Dmsg0(dbglvl, "unlock volumes\n");
978       unlock_volumes();
979
980       /* Look through reserved volumes for one we can use */
981       Dmsg0(dbglvl, "look for vol in vol list\n");
982       foreach_dlist(vol, temp_vol_list) {
983          if (!vol->dev) {
984             Dmsg1(dbglvl, "vol=%s no dev\n", vol->vol_name);
985             continue;
986          }
987          /* Check with Director if this Volume is OK */
988          bstrncpy(dcr->VolumeName, vol->vol_name, sizeof(dcr->VolumeName));
989          if (!dir_get_volume_info(dcr, GET_VOL_INFO_FOR_WRITE)) {
990             continue;
991          }
992
993          Dmsg1(dbglvl, "vol=%s OK for this job\n", vol->vol_name);
994          foreach_alist(store, dirstore) {
995             int stat;
996             rctx.store = store;
997             foreach_alist(device_name, store->device) {
998                /* Found a device, try to use it */
999                rctx.device_name = device_name;
1000                rctx.device = vol->dev->device;
1001
1002                if (vol->dev->is_autochanger()) {
1003                   Dmsg1(dbglvl, "vol=%s is in changer\n", vol->vol_name);
1004                   if (!is_vol_in_autochanger(rctx, vol)) {
1005                      continue;
1006                   }
1007                } else if (strcmp(device_name, vol->dev->device->hdr.name) != 0) {
1008                   Dmsg2(dbglvl, "device=%s not suitable want %s\n",
1009                         vol->dev->device->hdr.name, device_name);
1010                   continue;
1011                }
1012
1013                bstrncpy(rctx.VolumeName, vol->vol_name, sizeof(rctx.VolumeName));
1014                rctx.have_volume = true;
1015                /* Try reserving this device and volume */
1016                Dmsg2(dbglvl, "try vol=%s on device=%s\n", rctx.VolumeName, device_name);
1017                stat = reserve_device(rctx);
1018                if (stat == 1) {             /* found available device */
1019                   Dmsg1(dbglvl, "Suitable device found=%s\n", device_name);
1020                   ok = true;
1021                   break;
1022                } else if (stat == 0) {      /* device busy */
1023                   Dmsg1(dbglvl, "Suitable device=%s, busy: not use\n", device_name);
1024                } else {
1025                   /* otherwise error */
1026                   Dmsg0(dbglvl, "No suitable device found.\n");
1027                }
1028                rctx.have_volume = false;
1029                rctx.VolumeName[0] = 0;
1030             }
1031             if (ok) {
1032                break;
1033             }
1034          }
1035          if (ok) {
1036             break;
1037          }
1038       } /* end for loop over reserved volumes */
1039
1040       Dmsg0(dbglvl, "lock volumes\n");
1041       lock_volumes();
1042       save_vol_list = vol_list;
1043       vol_list = temp_vol_list;
1044       free_volume_list();                  /* release temp_vol_list */
1045       vol_list = save_vol_list;
1046       Dmsg0(dbglvl, "deleted temp vol list\n");
1047       Dmsg0(dbglvl, "unlock volumes\n");
1048       unlock_volumes();
1049       debug_list_volumes("=== After free temp table\n");
1050    }
1051    if (ok) {
1052       Dmsg1(dbglvl, "Usable dev found. Vol=%s from in-use vols list\n", rctx.VolumeName);
1053       return true;
1054    }
1055
1056    /* 
1057     * No reserved volume we can use, so now search for an available device.  
1058     *
1059     * For each storage device that the user specified, we
1060     *  search and see if there is a resource for that device.
1061     */
1062    foreach_alist(store, dirstore) {
1063       rctx.store = store;
1064       foreach_alist(device_name, store->device) {
1065          int stat;
1066          rctx.device_name = device_name;
1067          stat = search_res_for_device(rctx); 
1068          if (stat == 1) {             /* found available device */
1069             Dmsg1(dbglvl, "available device found=%s\n", device_name);
1070             ok = true;
1071             break;
1072          } else if (stat == 0) {      /* device busy */
1073             Dmsg1(dbglvl, "No usable device=%s, busy: not use\n", device_name);
1074          } else {
1075             /* otherwise error */
1076             Dmsg0(dbglvl, "No usable device found.\n");
1077          }
1078       }
1079       if (ok) {
1080          break;
1081       }
1082    }
1083    if (ok) {
1084       Dmsg1(dbglvl, "Usable dev found. Vol=%s\n", rctx.VolumeName);
1085    }
1086    return ok;
1087 }
1088
1089 /*
1090  * Search for a particular storage device with particular storage
1091  *  characteristics (MediaType).
1092  */
1093 int search_res_for_device(RCTX &rctx) 
1094 {
1095    AUTOCHANGER *changer;
1096    int stat;
1097
1098    Dmsg1(dbglvl, "search res for %s\n", rctx.device_name);
1099    /* Look through Autochangers first */
1100    foreach_res(changer, R_AUTOCHANGER) {
1101       Dmsg1(dbglvl, "Try match changer res=%s\n", changer->hdr.name);
1102       /* Find resource, and make sure we were able to open it */
1103       if (strcmp(rctx.device_name, changer->hdr.name) == 0) {
1104          /* Try each device in this AutoChanger */
1105          foreach_alist(rctx.device, changer->device) {
1106             Dmsg1(dbglvl, "Try changer device %s\n", rctx.device->hdr.name);
1107             stat = reserve_device(rctx);
1108             if (stat != 1) {             /* try another device */
1109                continue;
1110             }
1111             /* Debug code */
1112             if (rctx.store->append == SD_APPEND) {
1113                Dmsg2(dbglvl, "Device %s reserved=%d for append.\n", 
1114                   rctx.device->hdr.name, rctx.jcr->dcr->dev->num_reserved());
1115             } else {
1116                Dmsg2(dbglvl, "Device %s reserved=%d for read.\n", 
1117                   rctx.device->hdr.name, rctx.jcr->read_dcr->dev->num_reserved());
1118             }
1119             return stat;
1120          }
1121       }
1122    }
1123
1124    /* Now if requested look through regular devices */
1125    if (!rctx.autochanger_only) {
1126       foreach_res(rctx.device, R_DEVICE) {
1127          Dmsg1(dbglvl, "Try match res=%s\n", rctx.device->hdr.name);
1128          /* Find resource, and make sure we were able to open it */
1129          if (strcmp(rctx.device_name, rctx.device->hdr.name) == 0) {
1130             stat = reserve_device(rctx);
1131             if (stat != 1) {             /* try another device */
1132                continue;
1133             }
1134             /* Debug code */
1135             if (rctx.store->append == SD_APPEND) {
1136                Dmsg2(dbglvl, "Device %s reserved=%d for append.\n", 
1137                   rctx.device->hdr.name, rctx.jcr->dcr->dev->num_reserved());
1138             } else {
1139                Dmsg2(dbglvl, "Device %s reserved=%d for read.\n", 
1140                   rctx.device->hdr.name, rctx.jcr->read_dcr->dev->num_reserved());
1141             }
1142             return stat;
1143          }
1144       }
1145    }
1146    return -1;                    /* nothing found */
1147 }
1148
1149 /*
1150  *  Try to reserve a specific device.
1151  *
1152  *  Returns: 1 -- OK, have DCR
1153  *           0 -- must wait
1154  *          -1 -- fatal error
1155  */
1156 static int reserve_device(RCTX &rctx)
1157 {
1158    bool ok;
1159    DCR *dcr;
1160    const int name_len = MAX_NAME_LENGTH;
1161
1162    /* Make sure MediaType is OK */
1163    Dmsg2(dbglvl, "chk MediaType device=%s request=%s\n",
1164          rctx.device->media_type, rctx.store->media_type);
1165    if (strcmp(rctx.device->media_type, rctx.store->media_type) != 0) {
1166       return -1;
1167    }
1168
1169    /* Make sure device exists -- i.e. we can stat() it */
1170    if (!rctx.device->dev) {
1171       rctx.device->dev = init_dev(rctx.jcr, rctx.device);
1172    }
1173    if (!rctx.device->dev) {
1174       if (rctx.device->changer_res) {
1175         Jmsg(rctx.jcr, M_WARNING, 0, _("\n"
1176            "     Device \"%s\" in changer \"%s\" requested by DIR could not be opened or does not exist.\n"),
1177              rctx.device->hdr.name, rctx.device_name);
1178       } else {
1179          Jmsg(rctx.jcr, M_WARNING, 0, _("\n"
1180             "     Device \"%s\" requested by DIR could not be opened or does not exist.\n"),
1181               rctx.device_name);
1182       }
1183       return -1;  /* no use waiting */
1184    }  
1185
1186    rctx.suitable_device = true;
1187    Dmsg1(dbglvl, "try reserve %s\n", rctx.device->hdr.name);
1188    rctx.jcr->dcr = dcr = new_dcr(rctx.jcr, rctx.jcr->dcr, rctx.device->dev);
1189    if (!dcr) {
1190       BSOCK *dir = rctx.jcr->dir_bsock;
1191       dir->fsend(_("3926 Could not get dcr for device: %s\n"), rctx.device_name);
1192       Dmsg1(dbglvl, ">dird: %s", dir->msg);
1193       return -1;
1194    }
1195    bstrncpy(dcr->pool_name, rctx.store->pool_name, name_len);
1196    bstrncpy(dcr->pool_type, rctx.store->pool_type, name_len);
1197    bstrncpy(dcr->media_type, rctx.store->media_type, name_len);
1198    bstrncpy(dcr->dev_name, rctx.device_name, name_len);
1199    if (rctx.store->append == SD_APPEND) {
1200       Dmsg2(dbglvl, "call reserve for append: have_vol=%d vol=%s\n", rctx.have_volume, rctx.VolumeName);                                   
1201       ok = reserve_device_for_append(dcr, rctx);
1202       if (!ok) {
1203          goto bail_out;
1204       }
1205
1206       rctx.jcr->dcr = dcr;
1207       Dmsg5(dbglvl, "Reserved=%d dev_name=%s mediatype=%s pool=%s ok=%d\n",
1208                dcr->dev->num_reserved(),
1209                dcr->dev_name, dcr->media_type, dcr->pool_name, ok);
1210       Dmsg3(dbglvl, "Vol=%s num_writers=%d, have_vol=%d\n", 
1211          rctx.VolumeName, dcr->dev->num_writers, rctx.have_volume);
1212       if (rctx.have_volume) {
1213          Dmsg0(dbglvl, "Call reserve_volume\n");
1214          if (reserve_volume(dcr, rctx.VolumeName)) {
1215             Dmsg1(dbglvl, "Reserved vol=%s\n", rctx.VolumeName);
1216          } else {
1217             Dmsg1(dbglvl, "Could not reserve vol=%s\n", rctx.VolumeName);
1218             goto bail_out;
1219          }
1220       } else {
1221          dcr->any_volume = true;
1222          Dmsg0(dbglvl, "no vol, call find_next_appendable_vol.\n");
1223          if (dir_find_next_appendable_volume(dcr)) {
1224             bstrncpy(rctx.VolumeName, dcr->VolumeName, sizeof(rctx.VolumeName));
1225             rctx.have_volume = true;
1226             Dmsg1(dbglvl, "looking for Volume=%s\n", rctx.VolumeName);
1227          } else {
1228             Dmsg0(dbglvl, "No next volume found\n");
1229             rctx.have_volume = false;
1230             rctx.VolumeName[0] = 0;
1231             /*
1232              * If there is at least one volume that is valid and in use,
1233              *   but we get here, check if we are running with prefers
1234              *   non-mounted drives.  In that case, we have selected a
1235              *   non-used drive and our one and only volume is mounted
1236              *   elsewhere, so we bail out and retry using that drive.
1237              */
1238             if (dcr->found_in_use() && !rctx.PreferMountedVols) {
1239                rctx.PreferMountedVols = true;
1240                if (dcr->VolumeName[0]) {
1241                   dcr->unreserve_device();
1242                }
1243                goto bail_out;
1244             }
1245             /*
1246              * Note. Under some circumstances, the Director can hand us
1247              *  a Volume name that is not the same as the one on the current
1248              *  drive, and in that case, the call above to find the next
1249              *  volume will fail because in attempting to reserve the Volume
1250              *  the code will realize that we already have a tape mounted,
1251              *  and it will fail.  This *should* only happen if there are 
1252              *  writers, thus the following test.  In that case, we simply
1253              *  bail out, and continue waiting, rather than plunging on
1254              *  and hoping that the operator can resolve the problem. 
1255              */
1256             if (dcr->dev->num_writers != 0) {
1257                if (dcr->VolumeName[0]) {
1258                   dcr->unreserve_device();
1259                }
1260                goto bail_out;
1261             }
1262          }
1263       }
1264    } else {
1265       ok = reserve_device_for_read(dcr);
1266       if (ok) {
1267          rctx.jcr->read_dcr = dcr;
1268          Dmsg5(dbglvl, "Read reserved=%d dev_name=%s mediatype=%s pool=%s ok=%d\n",
1269                dcr->dev->num_reserved(),
1270                dcr->dev_name, dcr->media_type, dcr->pool_name, ok);
1271       }
1272    }
1273    if (!ok) {
1274       goto bail_out;
1275    }
1276
1277    if (rctx.notify_dir) {
1278       POOL_MEM dev_name;
1279       BSOCK *dir = rctx.jcr->dir_bsock;
1280       pm_strcpy(dev_name, rctx.device->hdr.name);
1281       bash_spaces(dev_name);
1282       ok = dir->fsend(OK_device, dev_name.c_str());  /* Return real device name */
1283       Dmsg1(dbglvl, ">dird: %s", dir->msg);
1284    } else {
1285       ok = true;
1286    }
1287    return ok ? 1 : -1;
1288
1289 bail_out:
1290    rctx.have_volume = false;
1291    rctx.VolumeName[0] = 0;
1292    Dmsg0(dbglvl, "Not OK.\n");
1293    return 0;
1294 }
1295
1296 /*
1297  * We "reserve" the drive by setting the ST_READ bit. No one else
1298  *  should touch the drive until that is cleared.
1299  *  This allows the DIR to "reserve" the device before actually
1300  *  starting the job. 
1301  */
1302 static bool reserve_device_for_read(DCR *dcr)
1303 {
1304    DEVICE *dev = dcr->dev;
1305    JCR *jcr = dcr->jcr;
1306    bool ok = false;
1307
1308    ASSERT(dcr);
1309
1310    dev->dlock();  
1311
1312    if (is_device_unmounted(dev)) {             
1313       Dmsg1(dbglvl, "Device %s is BLOCKED due to user unmount.\n", dev->print_name());
1314       Mmsg(jcr->errmsg, _("3601 JobId=%u device %s is BLOCKED due to user unmount.\n"),
1315            jcr->JobId, dev->print_name());
1316       queue_reserve_message(jcr);
1317       goto bail_out;
1318    }
1319
1320    if (dev->is_busy()) {
1321       Dmsg4(dbglvl, "Device %s is busy ST_READ=%d num_writers=%d reserved=%d.\n", 
1322          dev->print_name(),
1323          dev->state & ST_READ?1:0, dev->num_writers, dev->num_reserved());
1324       Mmsg(jcr->errmsg, _("3602 JobId=%u device %s is busy (already reading/writing).\n"),
1325             jcr->JobId, dev->print_name());
1326       queue_reserve_message(jcr);
1327       goto bail_out;
1328    }
1329
1330    dev->clear_append();
1331    dev->set_read();
1332    ok = true;
1333    dcr->set_reserved();
1334
1335 bail_out:
1336    dev->dunlock();
1337    return ok;
1338 }
1339
1340
1341 /*
1342  * We reserve the device for appending by incrementing the 
1343  *  reserved_device. We do virtually all the same work that
1344  *  is done in acquire_device_for_append(), but we do
1345  *  not attempt to mount the device. This routine allows
1346  *  the DIR to reserve multiple devices before *really* 
1347  *  starting the job. It also permits the SD to refuse 
1348  *  certain devices (not up, ...).
1349  *
1350  * Note, in reserving a device, if the device is for the
1351  *  same pool and the same pool type, then it is acceptable.
1352  *  The Media Type has already been checked. If we are
1353  *  the first tor reserve the device, we put the pool
1354  *  name and pool type in the device record.
1355  */
1356 static bool reserve_device_for_append(DCR *dcr, RCTX &rctx)
1357 {
1358    JCR *jcr = dcr->jcr;
1359    DEVICE *dev = dcr->dev;
1360    bool ok = false;
1361
1362    ASSERT(dcr);
1363
1364    dev->dlock();
1365
1366    /* If device is being read, we cannot write it */
1367    if (dev->can_read()) {
1368       Mmsg(jcr->errmsg, _("3603 JobId=%u device %s is busy reading.\n"), 
1369          jcr->JobId, dev->print_name());
1370       Dmsg1(dbglvl, "%s", jcr->errmsg);
1371       queue_reserve_message(jcr);
1372       goto bail_out;
1373    }
1374
1375    /* If device is unmounted, we are out of luck */
1376    if (is_device_unmounted(dev)) {
1377       Mmsg(jcr->errmsg, _("3604 JobId=%u device %s is BLOCKED due to user unmount.\n"), 
1378          jcr->JobId, dev->print_name());
1379       Dmsg1(dbglvl, "%s", jcr->errmsg);
1380       queue_reserve_message(jcr);
1381       goto bail_out;
1382    }
1383
1384    Dmsg1(dbglvl, "reserve_append device is %s\n", dev->print_name());
1385
1386    /* Now do detailed tests ... */
1387    if (can_reserve_drive(dcr, rctx) != 1) {
1388       Dmsg0(dbglvl, "can_reserve_drive!=1\n");
1389       goto bail_out;
1390    }
1391
1392    dcr->set_reserved();
1393    ok = true;
1394
1395 bail_out:
1396    dev->dunlock();
1397    return ok;
1398 }
1399
1400 static int is_pool_ok(DCR *dcr)
1401 {
1402    DEVICE *dev = dcr->dev;
1403    JCR *jcr = dcr->jcr;
1404
1405    /* Now check if we want the same Pool and pool type */
1406    if (strcmp(dev->pool_name, dcr->pool_name) == 0 &&
1407        strcmp(dev->pool_type, dcr->pool_type) == 0) {
1408       /* OK, compatible device */
1409       Dmsg1(dbglvl, "OK dev: %s num_writers=0, reserved, pool matches\n", dev->print_name());
1410       return 1;
1411    } else {
1412       /* Drive Pool not suitable for us */
1413       Mmsg(jcr->errmsg, _(
1414 "3608 JobId=%u wants Pool=\"%s\" but have Pool=\"%s\" nreserve=%d on drive %s.\n"), 
1415             (uint32_t)jcr->JobId, dcr->pool_name, dev->pool_name,
1416             dev->num_reserved(), dev->print_name());
1417       queue_reserve_message(jcr);
1418       Dmsg2(dbglvl, "failed: busy num_writers=0, reserved, pool=%s wanted=%s\n",
1419          dev->pool_name, dcr->pool_name);
1420    }
1421    return 0;
1422 }
1423
1424 static bool is_max_jobs_ok(DCR *dcr) 
1425 {
1426    DEVICE *dev = dcr->dev;
1427    JCR *jcr = dcr->jcr;
1428
1429    Dmsg4(dbglvl, "MaxJobs=%d Jobs=%d reserves=%d Vol=%s\n",
1430          dcr->VolCatInfo.VolCatMaxJobs,
1431          dcr->VolCatInfo.VolCatJobs, dev->num_reserved(),
1432          dcr->VolumeName);
1433    if (dcr->VolCatInfo.VolCatMaxJobs > 0 && dcr->VolCatInfo.VolCatMaxJobs <=
1434         (dcr->VolCatInfo.VolCatJobs + dev->num_reserved())) {
1435       /* Max Job Vols depassed or already reserved */
1436       Mmsg(jcr->errmsg, _("3610 JobId=%u Volume max jobs exceeded on drive %s.\n"), 
1437             (uint32_t)jcr->JobId, dev->print_name());
1438       queue_reserve_message(jcr);
1439       Dmsg1(dbglvl, "reserve dev failed: %s", jcr->errmsg);
1440       return false;                /* wait */
1441    }
1442    return true;
1443 }
1444
1445 /*
1446  * Returns: 1 if drive can be reserved
1447  *          0 if we should wait
1448  *         -1 on error or impossibility
1449  */
1450 static int can_reserve_drive(DCR *dcr, RCTX &rctx) 
1451 {
1452    DEVICE *dev = dcr->dev;
1453    JCR *jcr = dcr->jcr;
1454
1455    Dmsg5(dbglvl, "PrefMnt=%d exact=%d suitable=%d chgronly=%d any=%d\n",
1456          rctx.PreferMountedVols, rctx.exact_match, rctx.suitable_device,
1457          rctx.autochanger_only, rctx.any_drive);
1458
1459    /* Check for max jobs on this Volume */
1460    if (!is_max_jobs_ok(dcr)) {
1461       return 0;
1462    }
1463
1464    /* setting any_drive overrides PreferMountedVols flag */
1465    if (!rctx.any_drive) {
1466       /*
1467        * When PreferMountedVols is set, we keep track of the 
1468        *  drive in use that has the least number of writers, then if
1469        *  no unmounted drive is found, we try that drive. This   
1470        *  helps spread the load to the least used drives.  
1471        */
1472       if (rctx.try_low_use_drive && dev == rctx.low_use_drive) {
1473          Dmsg2(dbglvl, "OK dev=%s == low_drive=%s.\n",
1474             dev->print_name(), rctx.low_use_drive->print_name());
1475          return 1;
1476       }
1477       /* If he wants a free drive, but this one is busy, no go */
1478       if (!rctx.PreferMountedVols && dev->is_busy()) {
1479          /* Save least used drive */
1480          if ((dev->num_writers + dev->num_reserved()) < rctx.num_writers) {
1481             rctx.num_writers = dev->num_writers + dev->num_reserved();
1482             rctx.low_use_drive = dev;
1483             Dmsg2(dbglvl, "set low use drive=%s num_writers=%d\n", 
1484                dev->print_name(), rctx.num_writers);
1485          } else {
1486             Dmsg1(dbglvl, "not low use num_writers=%d\n", dev->num_writers+dev->num_reserved());
1487          }
1488          Dmsg0(dbglvl, "failed: !prefMnt && busy.\n");
1489          Mmsg(jcr->errmsg, _("3605 JobId=%u wants free drive but device %s is busy.\n"), 
1490             jcr->JobId, dev->print_name());
1491          queue_reserve_message(jcr);
1492          return 0;
1493       }
1494
1495       /* Check for prefer mounted volumes */
1496       if (rctx.PreferMountedVols && !dev->vol && dev->is_tape()) {
1497          Mmsg(jcr->errmsg, _("3606 JobId=%u prefers mounted drives, but drive %s has no Volume.\n"), 
1498             jcr->JobId, dev->print_name());
1499          queue_reserve_message(jcr);
1500          Dmsg0(dbglvl, "failed: want mounted -- no vol\n");
1501          return 0;                 /* No volume mounted */
1502       }
1503
1504       /* Check for exact Volume name match */
1505       /* ***FIXME*** for Disk, we can accept any volume that goes with this
1506        *    drive.
1507        */
1508       if (rctx.exact_match && rctx.have_volume) {
1509          bool ok;
1510          Dmsg5(dbglvl, "PrefMnt=%d exact=%d suitable=%d chgronly=%d any=%d\n",
1511                rctx.PreferMountedVols, rctx.exact_match, rctx.suitable_device,
1512                rctx.autochanger_only, rctx.any_drive);
1513          Dmsg4(dbglvl, "have_vol=%d have=%s resvol=%s want=%s\n",
1514                   rctx.have_volume, dev->VolHdr.VolumeName, 
1515                   dev->vol?dev->vol->vol_name:"*none*", rctx.VolumeName);
1516          ok = strcmp(dev->VolHdr.VolumeName, rctx.VolumeName) == 0 ||
1517                  (dev->vol && strcmp(dev->vol->vol_name, rctx.VolumeName) == 0);
1518          if (!ok) {
1519             Mmsg(jcr->errmsg, _("3607 JobId=%u wants Vol=\"%s\" drive has Vol=\"%s\" on drive %s.\n"), 
1520                jcr->JobId, rctx.VolumeName, dev->VolHdr.VolumeName, 
1521                dev->print_name());
1522             queue_reserve_message(jcr);
1523             Dmsg3(dbglvl, "not OK: dev have=%s resvol=%s want=%s\n",
1524                   dev->VolHdr.VolumeName, dev->vol?dev->vol->vol_name:"*none*", rctx.VolumeName);
1525             return 0;
1526          }
1527          if (!dcr->can_i_use_volume()) {
1528             return 0;              /* fail if volume on another drive */
1529          }
1530       }
1531    }
1532
1533    /* Check for unused autochanger drive */
1534    if (rctx.autochanger_only && !dev->is_busy() &&
1535        dev->VolHdr.VolumeName[0] == 0) {
1536       /* Device is available but not yet reserved, reserve it for us */
1537       Dmsg1(dbglvl, "OK Res Unused autochanger %s.\n", dev->print_name());
1538       bstrncpy(dev->pool_name, dcr->pool_name, sizeof(dev->pool_name));
1539       bstrncpy(dev->pool_type, dcr->pool_type, sizeof(dev->pool_type));
1540       return 1;                       /* reserve drive */
1541    }
1542
1543    /*
1544     * Handle the case that there are no writers
1545     */
1546    if (dev->num_writers == 0) {
1547       /* Now check if there are any reservations on the drive */
1548       if (dev->num_reserved()) {           
1549          return is_pool_ok(dcr);
1550       } else if (dev->can_append()) {
1551          if (is_pool_ok(dcr)) {
1552             return 1; 
1553          } else {
1554             /* Changing pool, unload old tape if any in drive */
1555             Dmsg0(dbglvl, "OK dev: num_writers=0, not reserved, pool change, unload changer\n");
1556             /* ***FIXME*** use set_unload() */
1557             unload_autochanger(dcr, 0);
1558          }
1559       }
1560       /* Device is available but not yet reserved, reserve it for us */
1561       Dmsg1(dbglvl, "OK Dev avail reserved %s\n", dev->print_name());
1562       bstrncpy(dev->pool_name, dcr->pool_name, sizeof(dev->pool_name));
1563       bstrncpy(dev->pool_type, dcr->pool_type, sizeof(dev->pool_type));
1564       return 1;                       /* reserve drive */
1565    }
1566
1567    /*
1568     * Check if the device is in append mode with writers (i.e.
1569     *  available if pool is the same).
1570     */
1571    if (dev->can_append() || dev->num_writers > 0) {
1572       return is_pool_ok(dcr);
1573    } else {
1574       Pmsg1(000, _("Logic error!!!! JobId=%u Should not get here.\n"), (int)jcr->JobId);
1575       Mmsg(jcr->errmsg, _("3910 JobId=%u Logic error!!!! drive %s Should not get here.\n"),
1576             jcr->JobId, dev->print_name());
1577       queue_reserve_message(jcr);
1578       Jmsg0(jcr, M_FATAL, 0, _("Logic error!!!! Should not get here.\n"));
1579       return -1;                      /* error, should not get here */
1580    }
1581    Mmsg(jcr->errmsg, _("3911 JobId=%u failed reserve drive %s.\n"), 
1582          jcr->JobId, dev->print_name());
1583    queue_reserve_message(jcr);
1584    Dmsg1(dbglvl, "failed: No reserve %s\n", dev->print_name());
1585    return 0;
1586 }
1587
1588
1589
1590
1591 /*
1592  * Queue a reservation error or failure message for this jcr
1593  */
1594 static void queue_reserve_message(JCR *jcr)
1595 {
1596    int i;   
1597    alist *msgs;
1598    char *msg;
1599
1600    jcr->lock();
1601
1602    msgs = jcr->reserve_msgs;
1603    if (!msgs) {
1604       goto bail_out;
1605    }
1606    /*
1607     * Look for duplicate message.  If found, do
1608     * not insert
1609     */
1610    for (i=msgs->size()-1; i >= 0; i--) {
1611       msg = (char *)msgs->get(i);
1612       if (!msg) {
1613          goto bail_out;
1614       }
1615       /* Comparison based on 4 digit message number */
1616       if (strncmp(msg, jcr->errmsg, 4) == 0) {
1617          goto bail_out;
1618       }
1619    }      
1620    /* Message unique, so insert it */
1621    jcr->reserve_msgs->push(bstrdup(jcr->errmsg));
1622
1623 bail_out:
1624    jcr->unlock();
1625 }
1626
1627 /*
1628  * Send any reservation messages queued for this jcr
1629  */
1630 void send_drive_reserve_messages(JCR *jcr, void sendit(const char *msg, int len, void *sarg), void *arg)
1631 {
1632    int i;
1633    alist *msgs;
1634    char *msg;
1635
1636    jcr->lock();
1637    msgs = jcr->reserve_msgs;
1638    if (!msgs || msgs->size() == 0) {
1639       goto bail_out;
1640    }
1641    for (i=msgs->size()-1; i >= 0; i--) {
1642       msg = (char *)msgs->get(i);
1643       if (msg) {
1644          sendit("   ", 3, arg);
1645          sendit(msg, strlen(msg), arg);
1646       } else {
1647          break;
1648       }
1649    }
1650
1651 bail_out:
1652    jcr->unlock();
1653 }
1654
1655 /*
1656  * Pop and release any reservations messages
1657  */
1658 static void pop_reserve_messages(JCR *jcr)
1659 {
1660    alist *msgs;
1661    char *msg;
1662
1663    jcr->lock();
1664    msgs = jcr->reserve_msgs;
1665    if (!msgs) {
1666       goto bail_out;
1667    }
1668    while ((msg = (char *)msgs->pop())) {
1669       free(msg);
1670    }
1671 bail_out:
1672    jcr->unlock();
1673 }
1674
1675 /*
1676  * Also called from acquire.c 
1677  */
1678 void release_reserve_messages(JCR *jcr)
1679 {
1680    pop_reserve_messages(jcr);
1681    jcr->lock();
1682    if (!jcr->reserve_msgs) {
1683       goto bail_out;
1684    }
1685    delete jcr->reserve_msgs;
1686    jcr->reserve_msgs = NULL;
1687
1688 bail_out:
1689    jcr->unlock();
1690 }