]> git.sur5r.net Git - bacula/bacula/blob - bacula/src/stored/reserve.c
Prevent a Volume that is being swapped from being freed from
[bacula/bacula] / bacula / src / stored / reserve.c
1 /*
2    Bacula® - The Network Backup Solution
3
4    Copyright (C) 2000-2008 Free Software Foundation Europe e.V.
5
6    The main author of Bacula is Kern Sibbald, with contributions from
7    many others, a complete list can be found in the file AUTHORS.
8    This program is Free Software; you can redistribute it and/or
9    modify it under the terms of version two of the GNU General Public
10    License as published by the Free Software Foundation and included
11    in the file LICENSE.
12
13    This program is distributed in the hope that it will be useful, but
14    WITHOUT ANY WARRANTY; without even the implied warranty of
15    MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE. See the GNU
16    General Public License for more details.
17
18    You should have received a copy of the GNU General Public License
19    along with this program; if not, write to the Free Software
20    Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA
21    02110-1301, USA.
22
23    Bacula® is a registered trademark of John Walker.
24    The licensor of Bacula is the Free Software Foundation Europe
25    (FSFE), Fiduciary Program, Sumatrastrasse 25, 8006 Zürich,
26    Switzerland, email:ftf@fsfeurope.org.
27 */
28 /*
29  *   Drive reservation functions for Storage Daemon
30  *
31  *   Kern Sibbald, MM
32  *
33  *   Split from job.c and acquire.c June 2005
34  *
35  *   Version $Id$
36  *
37  */
38
39 #include "bacula.h"
40 #include "stored.h"
41
42 const int dbglvl =  50;
43
44 static dlist *vol_list = NULL;
45 static brwlock_t reservation_lock;
46 static brwlock_t vol_list_lock;
47
48 /* Forward referenced functions */
49 static int can_reserve_drive(DCR *dcr, RCTX &rctx);
50 static int reserve_device(RCTX &rctx);
51 static bool reserve_device_for_read(DCR *dcr);
52 static bool reserve_device_for_append(DCR *dcr, RCTX &rctx);
53 static bool use_storage_cmd(JCR *jcr);
54 static void queue_reserve_message(JCR *jcr);
55 static void pop_reserve_messages(JCR *jcr);
56 //void switch_device(DCR *dcr, DEVICE *dev);
57
58 /* Requests from the Director daemon */
59 static char use_storage[]  = "use storage=%127s media_type=%127s "
60    "pool_name=%127s pool_type=%127s append=%d copy=%d stripe=%d\n";
61 static char use_device[]  = "use device=%127s\n";
62
63 /* Responses sent to Director daemon */
64 static char OK_device[] = "3000 OK use device device=%s\n";
65 static char NO_device[] = "3924 Device \"%s\" not in SD Device resources.\n";
66 static char BAD_use[]   = "3913 Bad use command: %s\n";
67
68 bool use_cmd(JCR *jcr) 
69 {
70    /*
71     * Get the device, media, and pool information
72     */
73    if (!use_storage_cmd(jcr)) {
74       set_jcr_job_status(jcr, JS_ErrorTerminated);
75       memset(jcr->sd_auth_key, 0, strlen(jcr->sd_auth_key));
76       return false;
77    }
78    return true;
79 }
80
81 static int my_compare(void *item1, void *item2)
82 {
83    return strcmp(((VOLRES *)item1)->vol_name, ((VOLRES *)item2)->vol_name);
84 }
85
86 /*
87  * This allows a given thread to recursively call lock_reservations.
88  *   It must, of course, call unlock_... the same number of times.
89  */
90 void init_reservations_lock()
91 {
92    int errstat;
93    if ((errstat=rwl_init(&reservation_lock)) != 0) {
94       berrno be;
95       Emsg1(M_ABORT, 0, _("Unable to initialize reservation lock. ERR=%s\n"),
96             be.bstrerror(errstat));
97    }
98
99    if ((errstat=rwl_init(&vol_list_lock)) != 0) {
100       berrno be;
101       Emsg1(M_ABORT, 0, _("Unable to initialize volume list lock. ERR=%s\n"),
102             be.bstrerror(errstat));
103    }
104 }
105
106 void term_reservations_lock()
107 {
108    rwl_destroy(&reservation_lock);
109    rwl_destroy(&vol_list_lock);
110 }
111
112 int reservations_lock_count = 0;
113
114 /* This applies to a drive and to Volumes */
115 void _lock_reservations()
116 {
117    int errstat;
118    reservations_lock_count++;
119    if ((errstat=rwl_writelock(&reservation_lock)) != 0) {
120       berrno be;
121       Emsg2(M_ABORT, 0, "rwl_writelock failure. stat=%d: ERR=%s\n",
122            errstat, be.bstrerror(errstat));
123    }
124 }
125
126 void _unlock_reservations()
127 {
128    int errstat;
129    reservations_lock_count--;
130    if ((errstat=rwl_writeunlock(&reservation_lock)) != 0) {
131       berrno be;
132       Emsg2(M_ABORT, 0, "rwl_writeunlock failure. stat=%d: ERR=%s\n",
133            errstat, be.bstrerror(errstat));
134    }
135 }
136
137 int vol_list_lock_count = 0;
138
139 /* 
140  * This allows a given thread to recursively call to lock_volumes()
141  */
142 void _lock_volumes()
143 {
144    int errstat;
145    vol_list_lock_count++;
146    if ((errstat=rwl_writelock(&vol_list_lock)) != 0) {
147       berrno be;
148       Emsg2(M_ABORT, 0, "rwl_writelock failure. stat=%d: ERR=%s\n",
149            errstat, be.bstrerror(errstat));
150    }
151 }
152
153 void _unlock_volumes()
154 {
155    int errstat;
156    vol_list_lock_count--;
157    if ((errstat=rwl_writeunlock(&vol_list_lock)) != 0) {
158       berrno be;
159       Emsg2(M_ABORT, 0, "rwl_writeunlock failure. stat=%d: ERR=%s\n",
160            errstat, be.bstrerror(errstat));
161    }
162 }
163
164
165 /*
166  * List Volumes -- this should be moved to status.c
167  */
168 enum {
169    debug_lock = true,
170    debug_nolock = false
171 };
172
173 static void debug_list_volumes(const char *imsg)
174 {
175    VOLRES *vol;
176    POOL_MEM msg(PM_MESSAGE);
177
178    lock_volumes();
179    foreach_dlist(vol, vol_list) {
180       if (vol->dev) {
181          Mmsg(msg, "List %s: %s in_use=%d on device %s\n", imsg, 
182               vol->vol_name, vol->is_in_use(), vol->dev->print_name());
183       } else {
184          Mmsg(msg, "List %s: %s in_use=%d no dev\n", imsg, vol->vol_name, 
185               vol->is_in_use());
186       }
187       Dmsg1(dbglvl, "%s", msg.c_str());
188    }
189
190 #ifdef xxx
191    DEVICE *dev = NULL;
192    foreach_dlist(vol, vol_list) {
193       if (vol->dev == dev) {
194          Dmsg0(dbglvl, "Two Volumes on same device.\n");
195          ASSERT(0);
196          dev = vol->dev;
197       }
198    }
199 #endif
200
201    unlock_volumes();
202 }
203
204
205 /*
206  * List Volumes -- this should be moved to status.c
207  */
208 void list_volumes(void sendit(const char *msg, int len, void *sarg), void *arg)
209 {
210    VOLRES *vol;
211    POOL_MEM msg(PM_MESSAGE);
212    int len;
213
214    lock_volumes();
215    foreach_dlist(vol, vol_list) {
216       DEVICE *dev = vol->dev;
217       if (dev) {
218          len = Mmsg(msg, "%s on device %s\n", vol->vol_name, dev->print_name());
219          sendit(msg.c_str(), len, arg);
220          len = Mmsg(msg, "    Reader=%d writers=%d devres=%d volinuse=%d\n", 
221             dev->can_read()?1:0, dev->num_writers, dev->num_reserved(),   
222             vol->is_in_use());
223          sendit(msg.c_str(), len, arg);
224       } else {
225          len = Mmsg(msg, "%s no device. volinuse= %d\n", vol->vol_name, 
226             vol->is_in_use());
227          sendit(msg.c_str(), len, arg);
228       }
229    }
230    unlock_volumes();
231 }
232
233 /*
234  * Create a Volume item to put in the Volume list
235  *   Ensure that the device points to it.
236  */
237 static VOLRES *new_vol_item(DCR *dcr, const char *VolumeName)
238 {
239    VOLRES *vol;
240    vol = (VOLRES *)malloc(sizeof(VOLRES));
241    memset(vol, 0, sizeof(VOLRES));
242    vol->vol_name = bstrdup(VolumeName);
243    vol->dev = dcr->dev;
244    Dmsg3(dbglvl, "new Vol=%s at %p dev=%s\n",
245          VolumeName, vol->vol_name, vol->dev->print_name());
246    return vol;
247 }
248
249 static void free_vol_item(VOLRES *vol)
250 {
251    DEVICE *dev = NULL;
252
253    free(vol->vol_name);
254    if (vol->dev) {
255       dev = vol->dev;
256    }
257    free(vol);
258    if (dev) {
259       dev->vol = NULL;
260    }
261 }
262
263 /*
264  * Put a new Volume entry in the Volume list. This
265  *  effectively reserves the volume so that it will
266  *  not be mounted again.
267  *
268  * If the device has any current volume associated with it,
269  *  and it is a different Volume, and the device is not busy,
270  *  we release the old Volume item and insert the new one.
271  * 
272  * It is assumed that the device is free and locked so that
273  *  we can change the device structure.
274  *
275  * Some details of the Volume list handling:
276  *
277  *  1. The Volume list entry must be attached to the drive (rather than 
278  *       attached to a job as it currently is. I.e. the drive that "owns" 
279  *       the volume (in use, mounted)
280  *       must point to the volume (still to be maintained in a list).
281  *
282  *  2. The Volume is entered in the list when a drive is reserved.  
283  *
284  *  3. When a drive is in use, the device code must appropriately update the
285  *      volume name as it changes (currently the list is static -- an entry is
286  *      removed when the Volume is no longer reserved, in use or mounted).  
287  *      The new code must keep the same list entry as long as the drive
288  *       has any volume associated with it but the volume name in the list
289  *       must be updated when the drive has a different volume mounted.
290  *
291  *  4. A job that has reserved a volume, can un-reserve the volume, and if the 
292  *      volume is not mounted, and not reserved, and not in use, it will be
293  *      removed from the list.
294  *
295  *  5. If a job wants to reserve a drive with a different Volume from the one on
296  *      the drive, it can re-use the drive for the new Volume.
297  *
298  *  6. If a job wants a Volume that is in a different drive, it can either use the
299  *      other drive or take the volume, only if the other drive is not in use or
300  *      not reserved.
301  *
302  *  One nice aspect of this is that the reserve use count and the writer use count 
303  *  already exist and are correctly programmed and will need no changes -- use 
304  *  counts are always very tricky.
305  *
306  *  The old code had a concept of "reserving" a Volume, but was changed 
307  *  to reserving and using a drive.  A volume is must be attached to (owned by) a 
308  *  drive and can move from drive to drive or be unused given certain specific 
309  *  conditions of the drive.  The key is that the drive must "own" the Volume.  
310  *  The old code had the job (dcr) owning the volume (more or less).  The job was
311  *  to change the insertion and removal of the volumes from the list to be based 
312  *  on the drive rather than the job.  
313  *
314  *  Return: VOLRES entry on success
315  *          NULL volume busy on another drive
316  */
317 VOLRES *reserve_volume(DCR *dcr, const char *VolumeName)
318 {
319    VOLRES *vol, *nvol;
320    DEVICE * volatile dev = dcr->dev;
321
322    ASSERT(dev != NULL);
323
324    Dmsg2(dbglvl, "enter reserve_volume=%s drive=%s\n", VolumeName, 
325       dcr->dev->print_name());
326    /* 
327     * We lock the reservations system here to ensure
328     *  when adding a new volume that no newly scheduled
329     *  job can reserve it.
330     */
331    lock_volumes();
332    debug_list_volumes("begin reserve_volume");
333    /* 
334     * First, remove any old volume attached to this device as it
335     *  is no longer used.
336     */
337    if (dev->vol) {
338       vol = dev->vol;
339       Dmsg4(dbglvl, "Vol attached=%s, newvol=%s volinuse=%d on %s\n",
340          vol->vol_name, VolumeName, vol->is_in_use(), dev->print_name());
341       /*
342        * Make sure we don't remove the current volume we are inserting
343        *  because it was probably inserted by another job, or it
344        *  is not being used and is marked as not reserved.
345        */
346       if (strcmp(vol->vol_name, VolumeName) == 0) {
347          Dmsg2(dbglvl, "=== set reserved vol=%s dev=%s\n", VolumeName,
348                vol->dev->print_name());
349          vol->set_in_use();             /* retake vol if released previously */
350          dcr->reserved_volume = true;   /* reserved volume */
351          goto get_out;                  /* Volume already on this device */
352       } else {
353          /* Don't release a volume if it was reserved by someone other than us */
354          if (vol->is_in_use() && !dcr->reserved_volume) { 
355             Dmsg1(dbglvl, "Cannot free vol=%s. It is reserved.\n", vol->vol_name);
356             vol = NULL;                  /* vol in use */
357             goto get_out;
358          }
359          Dmsg2(dbglvl, "reserve_vol free vol=%s at %p\n", vol->vol_name, vol->vol_name);
360          free_volume(dev);
361          dev->set_unload();             /* have to unload current volume */
362          debug_list_volumes("reserve_vol free");
363       }
364    }
365
366    /* Create a new Volume entry */
367    nvol = new_vol_item(dcr, VolumeName);
368
369    /*
370     * Now try to insert the new Volume
371     */
372    vol = (VOLRES *)vol_list->binary_insert(nvol, my_compare);
373    if (vol != nvol) {
374       Dmsg2(dbglvl, "Found vol=%s dev-same=%d\n", vol->vol_name, dev==vol->dev);
375       /*
376        * At this point, a Volume with this name already is in the list,
377        *   so we simply release our new Volume entry. Note, this should
378        *   only happen if we are moving the volume from one drive to another.
379        */
380       Dmsg2(dbglvl, "reserve_vol free-tmp vol=%s at %p\n", 
381             vol->vol_name, vol->vol_name);
382       /*
383        * Clear dev pointer so that free_vol_item() doesn't 
384        *  take away our volume. 
385        */
386       nvol->dev = NULL;                  /* don't zap dev entry */
387       free_vol_item(nvol);
388
389       /*
390        * Check if we are trying to use the Volume on a different drive
391        *  dev      is our device
392        *  vol->dev is where the Volume we want is
393        */
394       if (dev != vol->dev) {
395          /* Caller wants to switch Volume to another device */
396          if (!vol->dev->is_busy() && !vol->is_swapping()) {
397             Dmsg3(dbglvl, "==== Swap vol=%s from dev=%s to %s\n", 
398                VolumeName, vol->dev->print_name(), dev->print_name());
399             free_volume(dev);            /* free any volume attached to our drive */
400             vol->dev->set_unload();      /* unload the other drive */
401             vol->set_swapping();         /* swap from other drive */
402             dev->swap_dev = vol->dev;    /* remember to get this vol */
403             vol->dev->set_load();        /* then reload on our drive */
404             vol->dev->vol = NULL;        /* remove volume from other drive */
405             vol->dev = dev;              /* point the Volume at our drive */
406             dev->vol = vol;              /* point our drive at the Volume */
407          } else {
408             Dmsg3(dbglvl, "==== Swap not possible Vol busy vol=%s from dev=%s to %s\n", 
409                VolumeName, vol->dev->print_name(), dev->print_name());
410             vol = NULL;                  /* device busy */
411             goto get_out;
412          }
413       } else {
414          dev->vol = vol;
415       }
416    } else {
417       dev->vol = vol;                    /* point to newly inserted volume */
418    }
419
420 get_out:
421    if (vol) {
422       Dmsg2(dbglvl, "=== set in_use. vol=%s dev=%s\n", vol->vol_name,
423             vol->dev->print_name());
424       vol->set_in_use();
425       dcr->reserved_volume = true;
426    }
427    debug_list_volumes("end new volume");
428    unlock_volumes();
429    return vol;
430 }
431
432 /* 
433  * Switch from current device to given device  
434  *   (not yet used) 
435  */
436 #ifdef xxx
437 void switch_device(DCR *dcr, DEVICE *dev)
438 {
439    DCR save_dcr;
440
441    dev->dlock();
442    memcpy(&save_dcr, dcr, sizeof(save_dcr));
443    clean_device(dcr);                  /* clean up the dcr */
444
445    dcr->dev = dev;                     /* get new device pointer */
446    Jmsg(dcr->jcr, M_INFO, 0, _("Device switch. New device %s chosen.\n"),
447       dcr->dev->print_name());
448
449    bstrncpy(dcr->VolumeName, save_dcr.VolumeName, sizeof(dcr->VolumeName));
450    bstrncpy(dcr->media_type, save_dcr.media_type, sizeof(dcr->media_type));
451    dcr->VolCatInfo.Slot = save_dcr.VolCatInfo.Slot;
452    bstrncpy(dcr->pool_name, save_dcr.pool_name, sizeof(dcr->pool_name));
453    bstrncpy(dcr->pool_type, save_dcr.pool_type, sizeof(dcr->pool_type));
454    bstrncpy(dcr->dev_name, dev->dev_name, sizeof(dcr->dev_name));
455
456 // dcr->set_reserved();
457
458    dev->dunlock();
459 }
460 #endif
461
462 /*
463  * Search for a Volume name in the Volume list.
464  *
465  *  Returns: VOLRES entry on success
466  *           NULL if the Volume is not in the list
467  */
468 VOLRES *find_volume(const char *VolumeName) 
469 {
470    VOLRES vol, *fvol;
471    /* Do not lock reservations here */
472    lock_volumes();
473    vol.vol_name = bstrdup(VolumeName);
474    fvol = (VOLRES *)vol_list->binary_search(&vol, my_compare);
475    free(vol.vol_name);
476    Dmsg2(dbglvl, "find_vol=%s found=%d\n", VolumeName, fvol!=NULL);
477    debug_list_volumes("find_volume");
478    unlock_volumes();
479    return fvol;
480 }
481
482 void DCR::set_reserved()
483 {
484    m_reserved = true;
485    Dmsg2(dbglvl, "Inc reserve=%d dev=%s\n", dev->num_reserved(), dev->print_name());
486    dev->inc_reserved();
487 }
488
489 void DCR::clear_reserved()
490 {
491    if (m_reserved) {
492       m_reserved = false;
493       dev->dec_reserved();
494       Dmsg2(dbglvl, "Dec reserve=%d dev=%s\n", dev->num_reserved(), dev->print_name());
495    }
496 }
497
498 /* 
499  * Remove any reservation from a drive and tell the system
500  *  that the volume is unused at least by us.
501  */
502 void DCR::unreserve_device()
503 {
504    lock_volumes();
505    if (is_reserved()) {
506       clear_reserved();
507       reserved_volume = false;
508       /* If we set read mode in reserving, remove it */
509       if (dev->can_read()) {
510          dev->clear_read();
511       }
512       if (dev->num_writers < 0) {
513          Jmsg1(jcr, M_ERROR, 0, _("Hey! num_writers=%d!!!!\n"), dev->num_writers);
514          dev->num_writers = 0;
515       }
516       if (dev->num_reserved() == 0 && dev->num_writers == 0) {
517          volume_unused(this);
518       }
519    }
520    unlock_volumes();
521 }
522
523 /*  
524  * Free a Volume from the Volume list if it is no longer used
525  *   Note, for tape drives we want to remember where the Volume
526  *   was when last used, so rather than free the volume entry,
527  *   we simply mark it "not reserved" so when the drive is really
528  *   needed for another volume, we can reuse it.
529  *
530  *  Returns: true if the Volume found and "removed" from the list
531  *           false if the Volume is not in the list or is in use
532  */
533 bool volume_unused(DCR *dcr)
534 {
535    DEVICE *dev = dcr->dev;
536
537    if (!dev->vol) {
538       Dmsg1(dbglvl, "vol_unused: no vol on %s\n", dev->print_name());
539       debug_list_volumes("null vol cannot unreserve_volume");
540       return false;
541    }
542    if (dev->vol->is_swapping()) {
543       Dmsg1(dbglvl, "vol_unused: vol being swapped on %s\n", dev->print_name());
544       debug_list_volumes("swapping vol cannot unreserve_volume");
545       return false;
546    }
547
548 #ifdef xxx
549    if (dev->is_busy()) {
550       Dmsg1(dbglvl, "vol_unused: busy on %s\n", dev->print_name());
551       debug_list_volumes("dev busy cannot unreserve_volume");
552       return false;
553    }
554 #endif
555 #ifdef xxx
556    if (dev->num_writers > 0 || dev->num_reserved() > 0) {
557       ASSERT(0);
558    }
559 #endif
560
561    /*  
562     * If this is a tape, we do not free the volume, rather we wait
563     *  until the autoloader unloads it, or until another tape is
564     *  explicitly read in this drive. This allows the SD to remember
565     *  where the tapes are or last were.
566     */
567    Dmsg4(dbglvl, "=== set not reserved vol=%s num_writers=%d dev_reserved=%d dev=%s\n",
568       dev->vol->vol_name, dev->num_writers, dev->num_reserved(), dev->print_name());
569    dev->vol->clear_in_use();
570    if (dev->is_tape() || dev->is_autochanger()) {
571       return true;
572    } else {
573       /*
574        * Note, this frees the volume reservation entry, but the 
575        *   file descriptor remains open with the OS.
576        */
577       return free_volume(dev);
578    }
579 }
580
581 /*
582  * Unconditionally release the volume entry
583  */
584 bool free_volume(DEVICE *dev)
585 {
586    VOLRES *vol;
587
588    if (dev->vol == NULL) {
589       Dmsg1(dbglvl, "No vol on dev %s\n", dev->print_name());
590       return false;
591    }
592    lock_volumes();
593    vol = dev->vol;
594    /* Don't free a volume while it is being swapped */
595    if (!vol->is_swapping()) {
596       dev->vol = NULL;
597       vol_list->remove(vol);
598       Dmsg2(dbglvl, "=== free_volume %s dev=%s\n", vol->vol_name, dev->print_name());
599       free_vol_item(vol);
600       debug_list_volumes("free_volume");
601    }
602    unlock_volumes();
603    return true;
604 }
605
606       
607 /* Create the Volume list */
608 void create_volume_list()
609 {
610    VOLRES *vol = NULL;
611    if (vol_list == NULL) {
612       vol_list = New(dlist(vol, &vol->link));
613    }
614 }
615
616 /* Release all Volumes from the list */
617 void free_volume_list()
618 {
619    VOLRES *vol;
620    if (!vol_list) {
621       return;
622    }
623    lock_volumes();
624    foreach_dlist(vol, vol_list) {
625       if (vol->dev) {
626          Dmsg2(dbglvl, "free vol_list Volume=%s dev=%s\n", vol->vol_name, vol->dev->print_name());
627       } else {
628          Dmsg1(dbglvl, "free vol_list Volume=%s No dev\n", vol->vol_name);
629       }
630       free(vol->vol_name);
631       vol->vol_name = NULL;
632    }
633    delete vol_list;
634    vol_list = NULL;
635    unlock_volumes();
636 }
637
638 bool DCR::can_i_use_volume()
639 {
640    bool rtn = true;
641    VOLRES *vol;
642
643    lock_volumes();
644    vol = find_volume(VolumeName);
645    if (!vol) {
646       Dmsg1(dbglvl, "Vol=%s not in use.\n", VolumeName);
647       goto get_out;                   /* vol not in list */
648    }
649    ASSERT(vol->dev != NULL);
650
651    if (dev == vol->dev) {        /* same device OK */
652       Dmsg1(dbglvl, "Vol=%s on same dev.\n", VolumeName);
653       goto get_out;
654    } else {
655       Dmsg3(dbglvl, "Vol=%s on %s we have %s\n", VolumeName,
656             vol->dev->print_name(), dev->print_name());
657    }
658    /* ***FIXME*** check this ... */
659    if (!vol->dev->is_busy()) {
660       Dmsg2(dbglvl, "Vol=%s dev=%s not busy.\n", VolumeName, vol->dev->print_name());
661       goto get_out;
662    } else {
663       Dmsg2(dbglvl, "Vol=%s dev=%s busy.\n", VolumeName, vol->dev->print_name());
664    }
665    Dmsg2(dbglvl, "Vol=%s in use by %s.\n", VolumeName, vol->dev->print_name());
666    rtn = false;
667
668 get_out:
669    unlock_volumes();
670    return rtn;
671
672 }
673
674
675 /*
676  * We get the following type of information:
677  *
678  * use storage=xxx media_type=yyy pool_name=xxx pool_type=yyy append=1 copy=0 strip=0
679  *  use device=zzz
680  *  use device=aaa
681  *  use device=bbb
682  * use storage=xxx media_type=yyy pool_name=xxx pool_type=yyy append=0 copy=0 strip=0
683  *  use device=bbb
684  *
685  */
686 static bool use_storage_cmd(JCR *jcr)
687 {
688    POOL_MEM store_name, dev_name, media_type, pool_name, pool_type;
689    BSOCK *dir = jcr->dir_bsock;
690    int append;
691    bool ok;       
692    int Copy, Stripe;
693    DIRSTORE *store;
694    RCTX rctx;
695    alist *dirstore;
696
697    memset(&rctx, 0, sizeof(RCTX));
698    rctx.jcr = jcr;
699    /*
700     * If there are multiple devices, the director sends us
701     *   use_device for each device that it wants to use.
702     */
703    dirstore = New(alist(10, not_owned_by_alist));
704    jcr->reserve_msgs = New(alist(10, not_owned_by_alist));  
705    do {
706       Dmsg1(dbglvl, "<dird: %s", dir->msg);
707       ok = sscanf(dir->msg, use_storage, store_name.c_str(), 
708                   media_type.c_str(), pool_name.c_str(), 
709                   pool_type.c_str(), &append, &Copy, &Stripe) == 7;
710       if (!ok) {
711          break;
712       }
713       if (append) {
714          jcr->write_store = dirstore;
715       } else {
716          jcr->read_store = dirstore;
717       }
718       rctx.append = append;
719       unbash_spaces(store_name);
720       unbash_spaces(media_type);
721       unbash_spaces(pool_name);
722       unbash_spaces(pool_type);
723       store = new DIRSTORE;
724       dirstore->append(store);
725       memset(store, 0, sizeof(DIRSTORE));
726       store->device = New(alist(10));
727       bstrncpy(store->name, store_name, sizeof(store->name));
728       bstrncpy(store->media_type, media_type, sizeof(store->media_type));
729       bstrncpy(store->pool_name, pool_name, sizeof(store->pool_name));
730       bstrncpy(store->pool_type, pool_type, sizeof(store->pool_type));
731       store->append = append;
732
733       /* Now get all devices */
734       while (dir->recv() >= 0) {
735          Dmsg1(dbglvl, "<dird device: %s", dir->msg);
736          ok = sscanf(dir->msg, use_device, dev_name.c_str()) == 1;
737          if (!ok) {
738             break;
739          }
740          unbash_spaces(dev_name);
741          store->device->append(bstrdup(dev_name.c_str()));
742       }
743    }  while (ok && dir->recv() >= 0);
744
745    /* Developer debug code */
746    char *device_name;
747    if (debug_level >= dbglvl) {
748       foreach_alist(store, dirstore) {
749          Dmsg5(dbglvl, "Storage=%s media_type=%s pool=%s pool_type=%s append=%d\n", 
750             store->name, store->media_type, store->pool_name, 
751             store->pool_type, store->append);
752          foreach_alist(device_name, store->device) {
753             Dmsg1(dbglvl, "     Device=%s\n", device_name);
754          }
755       }
756    }
757
758    init_jcr_device_wait_timers(jcr);
759    jcr->dcr = new_dcr(jcr, NULL, NULL);         /* get a dcr */
760    if (!jcr->dcr) {
761       BSOCK *dir = jcr->dir_bsock;
762       dir->fsend(_("3939 Could not get dcr\n"));
763       Dmsg1(dbglvl, ">dird: %s", dir->msg);
764       ok = false;
765    }
766    /*                    
767     * At this point, we have a list of all the Director's Storage
768     *  resources indicated for this Job, which include Pool, PoolType,
769     *  storage name, and Media type.     
770     * Then for each of the Storage resources, we have a list of
771     *  device names that were given.
772     *
773     * Wiffle through them and find one that can do the backup.
774     */
775    if (ok) {
776       int wait_for_device_retries = 0;  
777       int repeat = 0;
778       bool fail = false;
779       rctx.notify_dir = true;
780
781       lock_reservations();
782       for ( ; !fail && !job_canceled(jcr); ) {
783          pop_reserve_messages(jcr);
784          rctx.suitable_device = false;
785          rctx.have_volume = false;
786          rctx.VolumeName[0] = 0;
787          rctx.any_drive = false;
788          if (!jcr->PreferMountedVols) {
789             /*
790              * Here we try to find a drive that is not used.
791              * This will maximize the use of available drives.
792              *
793              */
794             rctx.num_writers = 20000000;   /* start with impossible number */
795             rctx.low_use_drive = NULL;
796             rctx.PreferMountedVols = false;                
797             rctx.exact_match = false;
798             rctx.autochanger_only = true;
799             if ((ok = find_suitable_device_for_job(jcr, rctx))) {
800                break;
801             }
802             /* Look through all drives possibly for low_use drive */
803             if (rctx.low_use_drive) {
804                rctx.try_low_use_drive = true;
805                if ((ok = find_suitable_device_for_job(jcr, rctx))) {
806                   break;
807                }
808                rctx.try_low_use_drive = false;
809             }
810             rctx.autochanger_only = false;
811             if ((ok = find_suitable_device_for_job(jcr, rctx))) {
812                break;
813             }
814          }
815          /*
816           * Now we look for a drive that may or may not be in
817           *  use.
818           */
819          /* Look for an exact Volume match all drives */
820          rctx.PreferMountedVols = true;
821          rctx.exact_match = true;
822          rctx.autochanger_only = false;
823          if ((ok = find_suitable_device_for_job(jcr, rctx))) {
824             break;
825          }
826          /* Look for any mounted drive */
827          rctx.exact_match = false;
828          if ((ok = find_suitable_device_for_job(jcr, rctx))) {
829             break;
830          }
831          /* Try any drive */
832          rctx.any_drive = true;
833          if ((ok = find_suitable_device_for_job(jcr, rctx))) {
834             break;
835          }
836          /* Keep reservations locked *except* during wait_for_device() */
837          unlock_reservations();
838          /*     
839           * The idea of looping on repeat a few times it to ensure
840           * that if there is some subtle timing problem between two
841           * jobs, we will simply try again, and most likely succeed.
842           * This can happen if one job reserves a drive or finishes using
843           * a drive at the same time a second job wants it.
844           */
845          if (repeat++ > 1) {              /* try algorithm 3 times */
846             bmicrosleep(30, 0);           /* wait a bit */
847             Dmsg0(dbglvl, "repeat reserve algorithm\n");
848          } else if (!rctx.suitable_device || !wait_for_device(jcr, wait_for_device_retries)) {
849             Dmsg0(dbglvl, "Fail. !suitable_device || !wait_for_device\n");
850             fail = true;
851          }   
852          lock_reservations();
853          dir->signal(BNET_HEARTBEAT);  /* Inform Dir that we are alive */
854       }
855       unlock_reservations();
856       if (!ok) {
857          /*
858           * If we get here, there are no suitable devices available, which
859           *  means nothing configured.  If a device is suitable but busy
860           *  with another Volume, we will not come here.
861           */
862          unbash_spaces(dir->msg);
863          pm_strcpy(jcr->errmsg, dir->msg);
864          Jmsg(jcr, M_INFO, 0, _("Failed command: %s\n"), jcr->errmsg);
865          Jmsg(jcr, M_FATAL, 0, _("\n"
866             "     Device \"%s\" with MediaType \"%s\" requested by DIR not found in SD Device resources.\n"),
867               dev_name.c_str(), media_type.c_str());
868          dir->fsend(NO_device, dev_name.c_str());
869
870          Dmsg1(dbglvl, ">dird: %s", dir->msg);
871       }
872    } else {
873       unbash_spaces(dir->msg);
874       pm_strcpy(jcr->errmsg, dir->msg);
875       Jmsg(jcr, M_FATAL, 0, _("Failed command: %s\n"), jcr->errmsg);
876       dir->fsend(BAD_use, jcr->errmsg);
877       Dmsg1(dbglvl, ">dird: %s", dir->msg);
878    }
879
880    release_reserve_messages(jcr);
881    return ok;
882 }
883
884
885 /*
886  * Walk through the autochanger resources and check if
887  *  the volume is in one of them.
888  * 
889  * Returns:  true  if volume is in device
890  *           false otherwise
891  */
892 static bool is_vol_in_autochanger(RCTX &rctx, VOLRES *vol)
893 {
894    AUTOCHANGER *changer = vol->dev->device->changer_res;
895
896    /* Find resource, and make sure we were able to open it */
897    if (strcmp(rctx.device_name, changer->hdr.name) == 0) {
898       Dmsg1(dbglvl, "Found changer device %s\n", vol->dev->device->hdr.name);
899       return true;
900    }  
901    Dmsg1(dbglvl, "Incorrect changer device %s\n", changer->hdr.name);
902    return false;
903 }
904
905 /*
906  * Search for a device suitable for this job.
907  * Note, this routine sets sets rctx.suitable_device if any 
908  *   device exists within the SD.  The device may not be actually
909  *   useable.
910  * It also returns if it finds a useable device.  
911  */
912 bool find_suitable_device_for_job(JCR *jcr, RCTX &rctx)
913 {
914    bool ok = false;
915    DIRSTORE *store;
916    char *device_name;
917    alist *dirstore;
918    DCR *dcr = jcr->dcr;
919
920    if (rctx.append) {
921       dirstore = jcr->write_store;
922    } else {
923       dirstore = jcr->read_store;
924    }
925    Dmsg5(dbglvl, "Start find_suit_dev PrefMnt=%d exact=%d suitable=%d chgronly=%d any=%d\n",
926          rctx.PreferMountedVols, rctx.exact_match, rctx.suitable_device,
927          rctx.autochanger_only, rctx.any_drive);
928
929    /* 
930     * If the appropriate conditions of this if are met, namely that
931     *  we are appending and the user wants mounted drive (or we
932     *  force try a mounted drive because they are all busy), we
933     *  start by looking at all the Volumes in the volume list.
934     */
935    if (!vol_list->empty() && rctx.append && rctx.PreferMountedVols) {
936       dlist *temp_vol_list, *save_vol_list;
937       VOLRES *vol = NULL;
938       lock_volumes();
939       Dmsg0(dbglvl, "lock volumes\n");                           
940
941       /*  
942        * Create a temporary copy of the volume list.  We do this,
943        *   to avoid having the volume list locked during the
944        *   call to reserve_device(), which would cause a deadlock.
945        * Note, we may want to add an update counter on the vol_list
946        *   so that if it is modified while we are traversing the copy
947        *   we can take note and act accordingly (probably redo the 
948        *   search at least a few times).
949        */
950       Dmsg0(dbglvl, "duplicate vol list\n");
951       temp_vol_list = New(dlist(vol, &vol->link));
952       foreach_dlist(vol, vol_list) {
953          VOLRES *nvol;
954          VOLRES *tvol = (VOLRES *)malloc(sizeof(VOLRES));
955          memset(tvol, 0, sizeof(VOLRES));
956          tvol->vol_name = bstrdup(vol->vol_name);
957          tvol->dev = vol->dev;
958          nvol = (VOLRES *)temp_vol_list->binary_insert(tvol, my_compare);
959          if (tvol != nvol) {
960             tvol->dev = NULL;                   /* don't zap dev entry */
961             free_vol_item(tvol);
962             Pmsg0(000, "Logic error. Duplicating vol list hit duplicate.\n");
963             Jmsg(jcr, M_WARNING, 0, "Logic error. Duplicating vol list hit duplicate.\n");
964          }
965       }
966       Dmsg0(dbglvl, "unlock volumes\n");
967       unlock_volumes();
968
969       /* Look through reserved volumes for one we can use */
970       Dmsg0(dbglvl, "look for vol in vol list\n");
971       foreach_dlist(vol, temp_vol_list) {
972          if (!vol->dev) {
973             Dmsg1(dbglvl, "vol=%s no dev\n", vol->vol_name);
974             continue;
975          }
976          /* Check with Director if this Volume is OK */
977          bstrncpy(dcr->VolumeName, vol->vol_name, sizeof(dcr->VolumeName));
978          if (!dir_get_volume_info(dcr, GET_VOL_INFO_FOR_WRITE)) {
979             continue;
980          }
981
982          Dmsg1(dbglvl, "vol=%s OK for this job\n", vol->vol_name);
983          foreach_alist(store, dirstore) {
984             int stat;
985             rctx.store = store;
986             foreach_alist(device_name, store->device) {
987                /* Found a device, try to use it */
988                rctx.device_name = device_name;
989                rctx.device = vol->dev->device;
990
991                if (vol->dev->is_autochanger()) {
992                   Dmsg1(dbglvl, "vol=%s is in changer\n", vol->vol_name);
993                   if (!is_vol_in_autochanger(rctx, vol)) {
994                      continue;
995                   }
996                } else if (strcmp(device_name, vol->dev->device->hdr.name) != 0) {
997                   Dmsg2(dbglvl, "device=%s not suitable want %s\n",
998                         vol->dev->device->hdr.name, device_name);
999                   continue;
1000                }
1001
1002                bstrncpy(rctx.VolumeName, vol->vol_name, sizeof(rctx.VolumeName));
1003                rctx.have_volume = true;
1004                /* Try reserving this device and volume */
1005                Dmsg2(dbglvl, "try vol=%s on device=%s\n", rctx.VolumeName, device_name);
1006                stat = reserve_device(rctx);
1007                if (stat == 1) {             /* found available device */
1008                   Dmsg1(dbglvl, "Suitable device found=%s\n", device_name);
1009                   ok = true;
1010                   break;
1011                } else if (stat == 0) {      /* device busy */
1012                   Dmsg1(dbglvl, "Suitable device=%s, busy: not use\n", device_name);
1013                } else {
1014                   /* otherwise error */
1015                   Dmsg0(dbglvl, "No suitable device found.\n");
1016                }
1017                rctx.have_volume = false;
1018                rctx.VolumeName[0] = 0;
1019             }
1020             if (ok) {
1021                break;
1022             }
1023          }
1024          if (ok) {
1025             break;
1026          }
1027       } /* end for loop over reserved volumes */
1028
1029       Dmsg0(dbglvl, "lock volumes\n");
1030       lock_volumes();
1031       save_vol_list = vol_list;
1032       vol_list = temp_vol_list;
1033       free_volume_list();                  /* release temp_vol_list */
1034       vol_list = save_vol_list;
1035       Dmsg0(dbglvl, "deleted temp vol list\n");
1036       Dmsg0(dbglvl, "unlock volumes\n");
1037       unlock_volumes();
1038       debug_list_volumes("=== After free temp table\n");
1039    }
1040    if (ok) {
1041       Dmsg1(dbglvl, "OK dev found. Vol=%s from in-use vols list\n", rctx.VolumeName);
1042       return true;
1043    }
1044
1045    /* 
1046     * No reserved volume we can use, so now search for an available device.  
1047     *
1048     * For each storage device that the user specified, we
1049     *  search and see if there is a resource for that device.
1050     */
1051    foreach_alist(store, dirstore) {
1052       rctx.store = store;
1053       foreach_alist(device_name, store->device) {
1054          int stat;
1055          rctx.device_name = device_name;
1056          stat = search_res_for_device(rctx); 
1057          if (stat == 1) {             /* found available device */
1058             Dmsg1(dbglvl, "available device found=%s\n", device_name);
1059             ok = true;
1060             break;
1061          } else if (stat == 0) {      /* device busy */
1062             Dmsg1(dbglvl, "No usable device=%s, busy: not use\n", device_name);
1063          } else {
1064             /* otherwise error */
1065             Dmsg0(dbglvl, "No usable device found.\n");
1066          }
1067       }
1068       if (ok) {
1069          break;
1070       }
1071    }
1072    if (ok) {
1073       Dmsg1(dbglvl, "OK dev found. Vol=%s\n", rctx.VolumeName);
1074    } else {
1075       Dmsg0(dbglvl, "Leave find_suit_dev: no dev found.\n");
1076    }
1077    return ok;
1078 }
1079
1080 /*
1081  * Search for a particular storage device with particular storage
1082  *  characteristics (MediaType).
1083  */
1084 int search_res_for_device(RCTX &rctx) 
1085 {
1086    AUTOCHANGER *changer;
1087    int stat;
1088
1089    Dmsg1(dbglvl, "search res for %s\n", rctx.device_name);
1090    /* Look through Autochangers first */
1091    foreach_res(changer, R_AUTOCHANGER) {
1092       Dmsg1(dbglvl, "Try match changer res=%s\n", changer->hdr.name);
1093       /* Find resource, and make sure we were able to open it */
1094       if (strcmp(rctx.device_name, changer->hdr.name) == 0) {
1095          /* Try each device in this AutoChanger */
1096          foreach_alist(rctx.device, changer->device) {
1097             Dmsg1(dbglvl, "Try changer device %s\n", rctx.device->hdr.name);
1098             stat = reserve_device(rctx);
1099             if (stat != 1) {             /* try another device */
1100                continue;
1101             }
1102             /* Debug code */
1103             if (rctx.store->append == SD_APPEND) {
1104                Dmsg2(dbglvl, "Device %s reserved=%d for append.\n", 
1105                   rctx.device->hdr.name, rctx.jcr->dcr->dev->num_reserved());
1106             } else {
1107                Dmsg2(dbglvl, "Device %s reserved=%d for read.\n", 
1108                   rctx.device->hdr.name, rctx.jcr->read_dcr->dev->num_reserved());
1109             }
1110             return stat;
1111          }
1112       }
1113    }
1114
1115    /* Now if requested look through regular devices */
1116    if (!rctx.autochanger_only) {
1117       foreach_res(rctx.device, R_DEVICE) {
1118          Dmsg1(dbglvl, "Try match res=%s\n", rctx.device->hdr.name);
1119          /* Find resource, and make sure we were able to open it */
1120          if (strcmp(rctx.device_name, rctx.device->hdr.name) == 0) {
1121             stat = reserve_device(rctx);
1122             if (stat != 1) {             /* try another device */
1123                continue;
1124             }
1125             /* Debug code */
1126             if (rctx.store->append == SD_APPEND) {
1127                Dmsg2(dbglvl, "Device %s reserved=%d for append.\n", 
1128                   rctx.device->hdr.name, rctx.jcr->dcr->dev->num_reserved());
1129             } else {
1130                Dmsg2(dbglvl, "Device %s reserved=%d for read.\n", 
1131                   rctx.device->hdr.name, rctx.jcr->read_dcr->dev->num_reserved());
1132             }
1133             return stat;
1134          }
1135       }
1136    }
1137    return -1;                    /* nothing found */
1138 }
1139
1140 /*
1141  *  Try to reserve a specific device.
1142  *
1143  *  Returns: 1 -- OK, have DCR
1144  *           0 -- must wait
1145  *          -1 -- fatal error
1146  */
1147 static int reserve_device(RCTX &rctx)
1148 {
1149    bool ok;
1150    DCR *dcr;
1151    const int name_len = MAX_NAME_LENGTH;
1152
1153    /* Make sure MediaType is OK */
1154    Dmsg2(dbglvl, "chk MediaType device=%s request=%s\n",
1155          rctx.device->media_type, rctx.store->media_type);
1156    if (strcmp(rctx.device->media_type, rctx.store->media_type) != 0) {
1157       return -1;
1158    }
1159
1160    /* Make sure device exists -- i.e. we can stat() it */
1161    if (!rctx.device->dev) {
1162       rctx.device->dev = init_dev(rctx.jcr, rctx.device);
1163    }
1164    if (!rctx.device->dev) {
1165       if (rctx.device->changer_res) {
1166         Jmsg(rctx.jcr, M_WARNING, 0, _("\n"
1167            "     Device \"%s\" in changer \"%s\" requested by DIR could not be opened or does not exist.\n"),
1168              rctx.device->hdr.name, rctx.device_name);
1169       } else {
1170          Jmsg(rctx.jcr, M_WARNING, 0, _("\n"
1171             "     Device \"%s\" requested by DIR could not be opened or does not exist.\n"),
1172               rctx.device_name);
1173       }
1174       return -1;  /* no use waiting */
1175    }  
1176
1177    rctx.suitable_device = true;
1178    Dmsg1(dbglvl, "try reserve %s\n", rctx.device->hdr.name);
1179    rctx.jcr->dcr = dcr = new_dcr(rctx.jcr, rctx.jcr->dcr, rctx.device->dev);
1180    if (!dcr) {
1181       BSOCK *dir = rctx.jcr->dir_bsock;
1182       dir->fsend(_("3926 Could not get dcr for device: %s\n"), rctx.device_name);
1183       Dmsg1(dbglvl, ">dird: %s", dir->msg);
1184       return -1;
1185    }
1186    bstrncpy(dcr->pool_name, rctx.store->pool_name, name_len);
1187    bstrncpy(dcr->pool_type, rctx.store->pool_type, name_len);
1188    bstrncpy(dcr->media_type, rctx.store->media_type, name_len);
1189    bstrncpy(dcr->dev_name, rctx.device_name, name_len);
1190    if (rctx.store->append == SD_APPEND) {
1191       Dmsg2(dbglvl, "call reserve for append: have_vol=%d vol=%s\n", rctx.have_volume, rctx.VolumeName);                                   
1192       ok = reserve_device_for_append(dcr, rctx);
1193       if (!ok) {
1194          goto bail_out;
1195       }
1196
1197       rctx.jcr->dcr = dcr;
1198       Dmsg5(dbglvl, "Reserved=%d dev_name=%s mediatype=%s pool=%s ok=%d\n",
1199                dcr->dev->num_reserved(),
1200                dcr->dev_name, dcr->media_type, dcr->pool_name, ok);
1201       Dmsg3(dbglvl, "Vol=%s num_writers=%d, have_vol=%d\n", 
1202          rctx.VolumeName, dcr->dev->num_writers, rctx.have_volume);
1203       if (rctx.have_volume) {
1204          Dmsg0(dbglvl, "Call reserve_volume\n");
1205          if (reserve_volume(dcr, rctx.VolumeName)) {
1206             Dmsg1(dbglvl, "Reserved vol=%s\n", rctx.VolumeName);
1207          } else {
1208             Dmsg1(dbglvl, "Could not reserve vol=%s\n", rctx.VolumeName);
1209             goto bail_out;
1210          }
1211       } else {
1212          dcr->any_volume = true;
1213          Dmsg0(dbglvl, "no vol, call find_next_appendable_vol.\n");
1214          if (dir_find_next_appendable_volume(dcr)) {
1215             bstrncpy(rctx.VolumeName, dcr->VolumeName, sizeof(rctx.VolumeName));
1216             rctx.have_volume = true;
1217             Dmsg1(dbglvl, "looking for Volume=%s\n", rctx.VolumeName);
1218          } else {
1219             Dmsg0(dbglvl, "No next volume found\n");
1220             rctx.have_volume = false;
1221             rctx.VolumeName[0] = 0;
1222             /*
1223              * If there is at least one volume that is valid and in use,
1224              *   but we get here, check if we are running with prefers
1225              *   non-mounted drives.  In that case, we have selected a
1226              *   non-used drive and our one and only volume is mounted
1227              *   elsewhere, so we bail out and retry using that drive.
1228              */
1229             if (dcr->found_in_use() && !rctx.PreferMountedVols) {
1230                rctx.PreferMountedVols = true;
1231                if (dcr->VolumeName[0]) {
1232                   dcr->unreserve_device();
1233                }
1234                goto bail_out;
1235             }
1236             /*
1237              * Note. Under some circumstances, the Director can hand us
1238              *  a Volume name that is not the same as the one on the current
1239              *  drive, and in that case, the call above to find the next
1240              *  volume will fail because in attempting to reserve the Volume
1241              *  the code will realize that we already have a tape mounted,
1242              *  and it will fail.  This *should* only happen if there are 
1243              *  writers, thus the following test.  In that case, we simply
1244              *  bail out, and continue waiting, rather than plunging on
1245              *  and hoping that the operator can resolve the problem. 
1246              */
1247             if (dcr->dev->num_writers != 0) {
1248                if (dcr->VolumeName[0]) {
1249                   dcr->unreserve_device();
1250                }
1251                goto bail_out;
1252             }
1253          }
1254       }
1255    } else {
1256       ok = reserve_device_for_read(dcr);
1257       if (ok) {
1258          rctx.jcr->read_dcr = dcr;
1259          Dmsg5(dbglvl, "Read reserved=%d dev_name=%s mediatype=%s pool=%s ok=%d\n",
1260                dcr->dev->num_reserved(),
1261                dcr->dev_name, dcr->media_type, dcr->pool_name, ok);
1262       }
1263    }
1264    if (!ok) {
1265       goto bail_out;
1266    }
1267
1268    if (rctx.notify_dir) {
1269       POOL_MEM dev_name;
1270       BSOCK *dir = rctx.jcr->dir_bsock;
1271       pm_strcpy(dev_name, rctx.device->hdr.name);
1272       bash_spaces(dev_name);
1273       ok = dir->fsend(OK_device, dev_name.c_str());  /* Return real device name */
1274       Dmsg1(dbglvl, ">dird: %s", dir->msg);
1275    } else {
1276       ok = true;
1277    }
1278    return ok ? 1 : -1;
1279
1280 bail_out:
1281    rctx.have_volume = false;
1282    rctx.VolumeName[0] = 0;
1283    Dmsg0(dbglvl, "Not OK.\n");
1284    return 0;
1285 }
1286
1287 /*
1288  * We "reserve" the drive by setting the ST_READ bit. No one else
1289  *  should touch the drive until that is cleared.
1290  *  This allows the DIR to "reserve" the device before actually
1291  *  starting the job. 
1292  */
1293 static bool reserve_device_for_read(DCR *dcr)
1294 {
1295    DEVICE *dev = dcr->dev;
1296    JCR *jcr = dcr->jcr;
1297    bool ok = false;
1298
1299    ASSERT(dcr);
1300
1301    dev->dlock();  
1302
1303    if (is_device_unmounted(dev)) {             
1304       Dmsg1(dbglvl, "Device %s is BLOCKED due to user unmount.\n", dev->print_name());
1305       Mmsg(jcr->errmsg, _("3601 JobId=%u device %s is BLOCKED due to user unmount.\n"),
1306            jcr->JobId, dev->print_name());
1307       queue_reserve_message(jcr);
1308       goto bail_out;
1309    }
1310
1311    if (dev->is_busy()) {
1312       Dmsg4(dbglvl, "Device %s is busy ST_READ=%d num_writers=%d reserved=%d.\n", 
1313          dev->print_name(),
1314          dev->state & ST_READ?1:0, dev->num_writers, dev->num_reserved());
1315       Mmsg(jcr->errmsg, _("3602 JobId=%u device %s is busy (already reading/writing).\n"),
1316             jcr->JobId, dev->print_name());
1317       queue_reserve_message(jcr);
1318       goto bail_out;
1319    }
1320
1321    dev->clear_append();
1322    dev->set_read();
1323    ok = true;
1324    dcr->set_reserved();
1325
1326 bail_out:
1327    dev->dunlock();
1328    return ok;
1329 }
1330
1331
1332 /*
1333  * We reserve the device for appending by incrementing the 
1334  *  reserved_device. We do virtually all the same work that
1335  *  is done in acquire_device_for_append(), but we do
1336  *  not attempt to mount the device. This routine allows
1337  *  the DIR to reserve multiple devices before *really* 
1338  *  starting the job. It also permits the SD to refuse 
1339  *  certain devices (not up, ...).
1340  *
1341  * Note, in reserving a device, if the device is for the
1342  *  same pool and the same pool type, then it is acceptable.
1343  *  The Media Type has already been checked. If we are
1344  *  the first tor reserve the device, we put the pool
1345  *  name and pool type in the device record.
1346  */
1347 static bool reserve_device_for_append(DCR *dcr, RCTX &rctx)
1348 {
1349    JCR *jcr = dcr->jcr;
1350    DEVICE *dev = dcr->dev;
1351    bool ok = false;
1352
1353    ASSERT(dcr);
1354
1355    dev->dlock();
1356
1357    /* If device is being read, we cannot write it */
1358    if (dev->can_read()) {
1359       Mmsg(jcr->errmsg, _("3603 JobId=%u device %s is busy reading.\n"), 
1360          jcr->JobId, dev->print_name());
1361       Dmsg1(dbglvl, "%s", jcr->errmsg);
1362       queue_reserve_message(jcr);
1363       goto bail_out;
1364    }
1365
1366    /* If device is unmounted, we are out of luck */
1367    if (is_device_unmounted(dev)) {
1368       Mmsg(jcr->errmsg, _("3604 JobId=%u device %s is BLOCKED due to user unmount.\n"), 
1369          jcr->JobId, dev->print_name());
1370       Dmsg1(dbglvl, "%s", jcr->errmsg);
1371       queue_reserve_message(jcr);
1372       goto bail_out;
1373    }
1374
1375    Dmsg1(dbglvl, "reserve_append device is %s\n", dev->print_name());
1376
1377    /* Now do detailed tests ... */
1378    if (can_reserve_drive(dcr, rctx) != 1) {
1379       Dmsg0(dbglvl, "can_reserve_drive!=1\n");
1380       goto bail_out;
1381    }
1382
1383    dcr->set_reserved();
1384    ok = true;
1385
1386 bail_out:
1387    dev->dunlock();
1388    return ok;
1389 }
1390
1391 static int is_pool_ok(DCR *dcr)
1392 {
1393    DEVICE *dev = dcr->dev;
1394    JCR *jcr = dcr->jcr;
1395
1396    /* Now check if we want the same Pool and pool type */
1397    if (strcmp(dev->pool_name, dcr->pool_name) == 0 &&
1398        strcmp(dev->pool_type, dcr->pool_type) == 0) {
1399       /* OK, compatible device */
1400       Dmsg1(dbglvl, "OK dev: %s num_writers=0, reserved, pool matches\n", dev->print_name());
1401       return 1;
1402    } else {
1403       /* Drive Pool not suitable for us */
1404       Mmsg(jcr->errmsg, _(
1405 "3608 JobId=%u wants Pool=\"%s\" but have Pool=\"%s\" nreserve=%d on drive %s.\n"), 
1406             (uint32_t)jcr->JobId, dcr->pool_name, dev->pool_name,
1407             dev->num_reserved(), dev->print_name());
1408       queue_reserve_message(jcr);
1409       Dmsg2(dbglvl, "failed: busy num_writers=0, reserved, pool=%s wanted=%s\n",
1410          dev->pool_name, dcr->pool_name);
1411    }
1412    return 0;
1413 }
1414
1415 static bool is_max_jobs_ok(DCR *dcr) 
1416 {
1417    DEVICE *dev = dcr->dev;
1418    JCR *jcr = dcr->jcr;
1419
1420    Dmsg5(dbglvl, "MaxJobs=%d Jobs=%d reserves=%d Status=%s Vol=%s\n",
1421          dcr->VolCatInfo.VolCatMaxJobs,
1422          dcr->VolCatInfo.VolCatJobs, dev->num_reserved(),
1423          dcr->VolCatInfo.VolCatStatus,
1424          dcr->VolumeName);
1425    if (strcmp(dcr->VolCatInfo.VolCatStatus, "Recycle") == 0) {
1426       return true;
1427    }
1428    if (dcr->VolCatInfo.VolCatMaxJobs > 0 && dcr->VolCatInfo.VolCatMaxJobs <=
1429         (dcr->VolCatInfo.VolCatJobs + dev->num_reserved())) {
1430       /* Max Job Vols depassed or already reserved */
1431       Mmsg(jcr->errmsg, _("3610 JobId=%u Volume max jobs exceeded on drive %s.\n"), 
1432             (uint32_t)jcr->JobId, dev->print_name());
1433       queue_reserve_message(jcr);
1434       Dmsg1(dbglvl, "reserve dev failed: %s", jcr->errmsg);
1435       return false;                /* wait */
1436    }
1437    return true;
1438 }
1439
1440 /*
1441  * Returns: 1 if drive can be reserved
1442  *          0 if we should wait
1443  *         -1 on error or impossibility
1444  */
1445 static int can_reserve_drive(DCR *dcr, RCTX &rctx) 
1446 {
1447    DEVICE *dev = dcr->dev;
1448    JCR *jcr = dcr->jcr;
1449
1450    Dmsg5(dbglvl, "PrefMnt=%d exact=%d suitable=%d chgronly=%d any=%d\n",
1451          rctx.PreferMountedVols, rctx.exact_match, rctx.suitable_device,
1452          rctx.autochanger_only, rctx.any_drive);
1453
1454    /* Check for max jobs on this Volume */
1455    if (!is_max_jobs_ok(dcr)) {
1456       return 0;
1457    }
1458
1459    /* setting any_drive overrides PreferMountedVols flag */
1460    if (!rctx.any_drive) {
1461       /*
1462        * When PreferMountedVols is set, we keep track of the 
1463        *  drive in use that has the least number of writers, then if
1464        *  no unmounted drive is found, we try that drive. This   
1465        *  helps spread the load to the least used drives.  
1466        */
1467       if (rctx.try_low_use_drive && dev == rctx.low_use_drive) {
1468          Dmsg2(dbglvl, "OK dev=%s == low_drive=%s.\n",
1469             dev->print_name(), rctx.low_use_drive->print_name());
1470          return 1;
1471       }
1472       /* If he wants a free drive, but this one is busy, no go */
1473       if (!rctx.PreferMountedVols && dev->is_busy()) {
1474          /* Save least used drive */
1475          if ((dev->num_writers + dev->num_reserved()) < rctx.num_writers) {
1476             rctx.num_writers = dev->num_writers + dev->num_reserved();
1477             rctx.low_use_drive = dev;
1478             Dmsg2(dbglvl, "set low use drive=%s num_writers=%d\n", 
1479                dev->print_name(), rctx.num_writers);
1480          } else {
1481             Dmsg1(dbglvl, "not low use num_writers=%d\n", dev->num_writers+dev->num_reserved());
1482          }
1483          Dmsg0(dbglvl, "failed: !prefMnt && busy.\n");
1484          Mmsg(jcr->errmsg, _("3605 JobId=%u wants free drive but device %s is busy.\n"), 
1485             jcr->JobId, dev->print_name());
1486          queue_reserve_message(jcr);
1487          return 0;
1488       }
1489
1490       /* Check for prefer mounted volumes */
1491       if (rctx.PreferMountedVols && !dev->vol && dev->is_tape()) {
1492          Mmsg(jcr->errmsg, _("3606 JobId=%u prefers mounted drives, but drive %s has no Volume.\n"), 
1493             jcr->JobId, dev->print_name());
1494          queue_reserve_message(jcr);
1495          Dmsg0(dbglvl, "failed: want mounted -- no vol\n");
1496          return 0;                 /* No volume mounted */
1497       }
1498
1499       /* Check for exact Volume name match */
1500       /* ***FIXME*** for Disk, we can accept any volume that goes with this
1501        *    drive.
1502        */
1503       if (rctx.exact_match && rctx.have_volume) {
1504          bool ok;
1505          Dmsg5(dbglvl, "PrefMnt=%d exact=%d suitable=%d chgronly=%d any=%d\n",
1506                rctx.PreferMountedVols, rctx.exact_match, rctx.suitable_device,
1507                rctx.autochanger_only, rctx.any_drive);
1508          Dmsg4(dbglvl, "have_vol=%d have=%s resvol=%s want=%s\n",
1509                   rctx.have_volume, dev->VolHdr.VolumeName, 
1510                   dev->vol?dev->vol->vol_name:"*none*", rctx.VolumeName);
1511          ok = strcmp(dev->VolHdr.VolumeName, rctx.VolumeName) == 0 ||
1512                  (dev->vol && strcmp(dev->vol->vol_name, rctx.VolumeName) == 0);
1513          if (!ok) {
1514             Mmsg(jcr->errmsg, _("3607 JobId=%u wants Vol=\"%s\" drive has Vol=\"%s\" on drive %s.\n"), 
1515                jcr->JobId, rctx.VolumeName, dev->VolHdr.VolumeName, 
1516                dev->print_name());
1517             queue_reserve_message(jcr);
1518             Dmsg3(dbglvl, "not OK: dev have=%s resvol=%s want=%s\n",
1519                   dev->VolHdr.VolumeName, dev->vol?dev->vol->vol_name:"*none*", rctx.VolumeName);
1520             return 0;
1521          }
1522          if (!dcr->can_i_use_volume()) {
1523             return 0;              /* fail if volume on another drive */
1524          }
1525       }
1526    }
1527
1528    /* Check for unused autochanger drive */
1529    if (rctx.autochanger_only && !dev->is_busy() &&
1530        dev->VolHdr.VolumeName[0] == 0) {
1531       /* Device is available but not yet reserved, reserve it for us */
1532       Dmsg1(dbglvl, "OK Res Unused autochanger %s.\n", dev->print_name());
1533       bstrncpy(dev->pool_name, dcr->pool_name, sizeof(dev->pool_name));
1534       bstrncpy(dev->pool_type, dcr->pool_type, sizeof(dev->pool_type));
1535       return 1;                       /* reserve drive */
1536    }
1537
1538    /*
1539     * Handle the case that there are no writers
1540     */
1541    if (dev->num_writers == 0) {
1542       /* Now check if there are any reservations on the drive */
1543       if (dev->num_reserved()) {           
1544          return is_pool_ok(dcr);
1545       } else if (dev->can_append()) {
1546          if (is_pool_ok(dcr)) {
1547             return 1; 
1548          } else {
1549             /* Changing pool, unload old tape if any in drive */
1550             Dmsg0(dbglvl, "OK dev: num_writers=0, not reserved, pool change, unload changer\n");
1551             /* ***FIXME*** use set_unload() */
1552             unload_autochanger(dcr, 0);
1553          }
1554       }
1555       /* Device is available but not yet reserved, reserve it for us */
1556       Dmsg1(dbglvl, "OK Dev avail reserved %s\n", dev->print_name());
1557       bstrncpy(dev->pool_name, dcr->pool_name, sizeof(dev->pool_name));
1558       bstrncpy(dev->pool_type, dcr->pool_type, sizeof(dev->pool_type));
1559       return 1;                       /* reserve drive */
1560    }
1561
1562    /*
1563     * Check if the device is in append mode with writers (i.e.
1564     *  available if pool is the same).
1565     */
1566    if (dev->can_append() || dev->num_writers > 0) {
1567       return is_pool_ok(dcr);
1568    } else {
1569       Pmsg1(000, _("Logic error!!!! JobId=%u Should not get here.\n"), (int)jcr->JobId);
1570       Mmsg(jcr->errmsg, _("3910 JobId=%u Logic error!!!! drive %s Should not get here.\n"),
1571             jcr->JobId, dev->print_name());
1572       queue_reserve_message(jcr);
1573       Jmsg0(jcr, M_FATAL, 0, _("Logic error!!!! Should not get here.\n"));
1574       return -1;                      /* error, should not get here */
1575    }
1576    Mmsg(jcr->errmsg, _("3911 JobId=%u failed reserve drive %s.\n"), 
1577          jcr->JobId, dev->print_name());
1578    queue_reserve_message(jcr);
1579    Dmsg1(dbglvl, "failed: No reserve %s\n", dev->print_name());
1580    return 0;
1581 }
1582
1583
1584
1585
1586 /*
1587  * Queue a reservation error or failure message for this jcr
1588  */
1589 static void queue_reserve_message(JCR *jcr)
1590 {
1591    int i;   
1592    alist *msgs;
1593    char *msg;
1594
1595    jcr->lock();
1596
1597    msgs = jcr->reserve_msgs;
1598    if (!msgs) {
1599       goto bail_out;
1600    }
1601    /*
1602     * Look for duplicate message.  If found, do
1603     * not insert
1604     */
1605    for (i=msgs->size()-1; i >= 0; i--) {
1606       msg = (char *)msgs->get(i);
1607       if (!msg) {
1608          goto bail_out;
1609       }
1610       /* Comparison based on 4 digit message number */
1611       if (strncmp(msg, jcr->errmsg, 4) == 0) {
1612          goto bail_out;
1613       }
1614    }      
1615    /* Message unique, so insert it */
1616    jcr->reserve_msgs->push(bstrdup(jcr->errmsg));
1617
1618 bail_out:
1619    jcr->unlock();
1620 }
1621
1622 /*
1623  * Send any reservation messages queued for this jcr
1624  */
1625 void send_drive_reserve_messages(JCR *jcr, void sendit(const char *msg, int len, void *sarg), void *arg)
1626 {
1627    int i;
1628    alist *msgs;
1629    char *msg;
1630
1631    jcr->lock();
1632    msgs = jcr->reserve_msgs;
1633    if (!msgs || msgs->size() == 0) {
1634       goto bail_out;
1635    }
1636    for (i=msgs->size()-1; i >= 0; i--) {
1637       msg = (char *)msgs->get(i);
1638       if (msg) {
1639          sendit("   ", 3, arg);
1640          sendit(msg, strlen(msg), arg);
1641       } else {
1642          break;
1643       }
1644    }
1645
1646 bail_out:
1647    jcr->unlock();
1648 }
1649
1650 /*
1651  * Pop and release any reservations messages
1652  */
1653 static void pop_reserve_messages(JCR *jcr)
1654 {
1655    alist *msgs;
1656    char *msg;
1657
1658    jcr->lock();
1659    msgs = jcr->reserve_msgs;
1660    if (!msgs) {
1661       goto bail_out;
1662    }
1663    while ((msg = (char *)msgs->pop())) {
1664       free(msg);
1665    }
1666 bail_out:
1667    jcr->unlock();
1668 }
1669
1670 /*
1671  * Also called from acquire.c 
1672  */
1673 void release_reserve_messages(JCR *jcr)
1674 {
1675    pop_reserve_messages(jcr);
1676    jcr->lock();
1677    if (!jcr->reserve_msgs) {
1678       goto bail_out;
1679    }
1680    delete jcr->reserve_msgs;
1681    jcr->reserve_msgs = NULL;
1682
1683 bail_out:
1684    jcr->unlock();
1685 }