]> git.sur5r.net Git - bacula/bacula/blob - bacula/src/stored/reserve.c
1aafd357f047cf937c00ae1ef08d333a6d7472bc
[bacula/bacula] / bacula / src / stored / reserve.c
1 /*
2    Bacula® - The Network Backup Solution
3
4    Copyright (C) 2000-2008 Free Software Foundation Europe e.V.
5
6    The main author of Bacula is Kern Sibbald, with contributions from
7    many others, a complete list can be found in the file AUTHORS.
8    This program is Free Software; you can redistribute it and/or
9    modify it under the terms of version two of the GNU General Public
10    License as published by the Free Software Foundation and included
11    in the file LICENSE.
12
13    This program is distributed in the hope that it will be useful, but
14    WITHOUT ANY WARRANTY; without even the implied warranty of
15    MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE. See the GNU
16    General Public License for more details.
17
18    You should have received a copy of the GNU General Public License
19    along with this program; if not, write to the Free Software
20    Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA
21    02110-1301, USA.
22
23    Bacula® is a registered trademark of John Walker.
24    The licensor of Bacula is the Free Software Foundation Europe
25    (FSFE), Fiduciary Program, Sumatrastrasse 25, 8006 Zürich,
26    Switzerland, email:ftf@fsfeurope.org.
27 */
28 /*
29  *   Drive reservation functions for Storage Daemon
30  *
31  *   Kern Sibbald, MM
32  *
33  *   Split from job.c and acquire.c June 2005
34  *
35  *   Version $Id$
36  *
37  */
38
39 #include "bacula.h"
40 #include "stored.h"
41
42 const int dbglvl =  50;
43
44 static dlist *vol_list = NULL;
45 static brwlock_t reservation_lock;
46 static brwlock_t vol_list_lock;
47
48 /* Forward referenced functions */
49 static int can_reserve_drive(DCR *dcr, RCTX &rctx);
50 static int reserve_device(RCTX &rctx);
51 static bool reserve_device_for_read(DCR *dcr);
52 static bool reserve_device_for_append(DCR *dcr, RCTX &rctx);
53 static bool use_storage_cmd(JCR *jcr);
54 static void queue_reserve_message(JCR *jcr);
55 static void pop_reserve_messages(JCR *jcr);
56 void switch_device(DCR *dcr, DEVICE *dev);
57
58 /* Requests from the Director daemon */
59 static char use_storage[]  = "use storage=%127s media_type=%127s "
60    "pool_name=%127s pool_type=%127s append=%d copy=%d stripe=%d\n";
61 static char use_device[]  = "use device=%127s\n";
62
63 /* Responses sent to Director daemon */
64 static char OK_device[] = "3000 OK use device device=%s\n";
65 static char NO_device[] = "3924 Device \"%s\" not in SD Device resources.\n";
66 static char BAD_use[]   = "3913 Bad use command: %s\n";
67
68 bool use_cmd(JCR *jcr) 
69 {
70    /*
71     * Get the device, media, and pool information
72     */
73    if (!use_storage_cmd(jcr)) {
74       set_jcr_job_status(jcr, JS_ErrorTerminated);
75       memset(jcr->sd_auth_key, 0, strlen(jcr->sd_auth_key));
76       return false;
77    }
78    return true;
79 }
80
81 static int my_compare(void *item1, void *item2)
82 {
83    return strcmp(((VOLRES *)item1)->vol_name, ((VOLRES *)item2)->vol_name);
84 }
85
86 /*
87  * This allows a given thread to recursively call lock_reservations.
88  *   It must, of course, call unlock_... the same number of times.
89  */
90 void init_reservations_lock()
91 {
92    int errstat;
93    if ((errstat=rwl_init(&reservation_lock)) != 0) {
94       berrno be;
95       Emsg1(M_ABORT, 0, _("Unable to initialize reservation lock. ERR=%s\n"),
96             be.bstrerror(errstat));
97    }
98
99    if ((errstat=rwl_init(&vol_list_lock)) != 0) {
100       berrno be;
101       Emsg1(M_ABORT, 0, _("Unable to initialize volume list lock. ERR=%s\n"),
102             be.bstrerror(errstat));
103    }
104 }
105
106 void term_reservations_lock()
107 {
108    rwl_destroy(&reservation_lock);
109    rwl_destroy(&vol_list_lock);
110 }
111
112 int reservations_lock_count = 0;
113
114 /* This applies to a drive and to Volumes */
115 void _lock_reservations()
116 {
117    int errstat;
118    reservations_lock_count++;
119    if ((errstat=rwl_writelock(&reservation_lock)) != 0) {
120       berrno be;
121       Emsg2(M_ABORT, 0, "rwl_writelock failure. stat=%d: ERR=%s\n",
122            errstat, be.bstrerror(errstat));
123    }
124 }
125
126 void _unlock_reservations()
127 {
128    int errstat;
129    reservations_lock_count--;
130    if ((errstat=rwl_writeunlock(&reservation_lock)) != 0) {
131       berrno be;
132       Emsg2(M_ABORT, 0, "rwl_writeunlock failure. stat=%d: ERR=%s\n",
133            errstat, be.bstrerror(errstat));
134    }
135 }
136
137 int vol_list_lock_count = 0;
138
139 /* 
140  * This allows a given thread to recursively call to lock_volumes()
141  */
142 void _lock_volumes()
143 {
144    int errstat;
145    vol_list_lock_count++;
146    if ((errstat=rwl_writelock(&vol_list_lock)) != 0) {
147       berrno be;
148       Emsg2(M_ABORT, 0, "rwl_writelock failure. stat=%d: ERR=%s\n",
149            errstat, be.bstrerror(errstat));
150    }
151 }
152
153 void _unlock_volumes()
154 {
155    int errstat;
156    vol_list_lock_count--;
157    if ((errstat=rwl_writeunlock(&vol_list_lock)) != 0) {
158       berrno be;
159       Emsg2(M_ABORT, 0, "rwl_writeunlock failure. stat=%d: ERR=%s\n",
160            errstat, be.bstrerror(errstat));
161    }
162 }
163
164
165 /*
166  * List Volumes -- this should be moved to status.c
167  */
168 enum {
169    debug_lock = true,
170    debug_nolock = false
171 };
172
173 static void debug_list_volumes(const char *imsg)
174 {
175    VOLRES *vol;
176    POOL_MEM msg(PM_MESSAGE);
177
178    lock_volumes();
179    foreach_dlist(vol, vol_list) {
180       if (vol->dev) {
181          Mmsg(msg, "List %s: %s rel=%d on device %s\n", imsg, 
182               vol->vol_name, vol->released, vol->dev->print_name());
183       } else {
184          Mmsg(msg, "List %s: %s rel=%d no dev\n", imsg, vol->vol_name, vol->released);
185       }
186       Dmsg1(dbglvl, "%s", msg.c_str());
187    }
188
189 #ifdef xxx
190    DEVICE *dev = NULL;
191    foreach_dlist(vol, vol_list) {
192       if (vol->dev == dev) {
193          Dmsg0(dbglvl, "Two Volumes on same device.\n");
194          ASSERT(0);
195          dev = vol->dev;
196       }
197    }
198 #endif
199
200 // Dmsg2(dbglvl, "List from %s: %d volumes\n", imsg, count);
201    unlock_volumes();
202 }
203
204
205 /*
206  * List Volumes -- this should be moved to status.c
207  */
208 void list_volumes(void sendit(const char *msg, int len, void *sarg), void *arg)
209 {
210    VOLRES *vol;
211    POOL_MEM msg(PM_MESSAGE);
212    int len;
213
214    lock_volumes();
215    foreach_dlist(vol, vol_list) {
216       DEVICE *dev = vol->dev;
217       if (dev) {
218          len = Mmsg(msg, "%s on device %s\n", vol->vol_name, dev->print_name());
219          sendit(msg.c_str(), len, arg);
220          len = Mmsg(msg, "    Reader=%d writers=%d reserved=%d released=%d\n", 
221             dev->can_read()?1:0, dev->num_writers, dev->reserved_device, vol->released);
222          sendit(msg.c_str(), len, arg);
223       } else {
224          len = Mmsg(msg, "%s no device. released=%d\n", vol->vol_name, vol->released);
225          sendit(msg.c_str(), len, arg);
226       }
227    }
228    unlock_volumes();
229 }
230
231 /*
232  * Create a Volume item to put in the Volume list
233  *   Ensure that the device points to it.
234  */
235 static VOLRES *new_vol_item(DCR *dcr, const char *VolumeName)
236 {
237    VOLRES *vol;
238    vol = (VOLRES *)malloc(sizeof(VOLRES));
239    memset(vol, 0, sizeof(VOLRES));
240    vol->vol_name = bstrdup(VolumeName);
241    vol->dev = dcr->dev;
242    Dmsg3(dbglvl, "new Vol=%s at %p dev=%s\n",
243          VolumeName, vol->vol_name, vol->dev->print_name());
244    return vol;
245 }
246
247 static void free_vol_item(VOLRES *vol)
248 {
249    free(vol->vol_name);
250    if (vol->dev) {
251       vol->dev->vol = NULL;
252    }
253    free(vol);
254 }
255
256
257 /*
258  * Put a new Volume entry in the Volume list. This
259  *  effectively reserves the volume so that it will
260  *  not be mounted again.
261  *
262  * If the device has any current volume associated with it,
263  *  and it is a different Volume, and the device is not busy,
264  *  we release the old Volume item and insert the new one.
265  * 
266  * It is assumed that the device is free and locked so that
267  *  we can change the device structure.
268  *
269  * Some details of the Volume list handling:
270  *
271  *  1. The Volume list entry must be attached to the drive (rather than 
272  *       attached to a job as it currently is. I.e. the drive that "owns" 
273  *       the volume (reserved, in use, mounted)
274  *       must point to the volume (still to be maintained in a list).
275  *
276  *  2. The Volume is entered in the list when a drive is reserved.  
277  *
278  *  3. When a drive is in use, the device code must appropriately update the
279  *      volume name as it changes (currently the list is static -- an entry is
280  *      removed when the Volume is no longer reserved, in use or mounted).  
281  *      The new code must keep the same list entry as long as the drive
282  *       has any volume associated with it but the volume name in the list
283  *       must be updated when the drive has a different volume mounted.
284  *
285  *  4. A job that has reserved a volume, can un-reserve the volume, and if the 
286  *      volume is not mounted, and not reserved, and not in use, it will be
287  *      removed from the list.
288  *
289  *  5. If a job wants to reserve a drive with a different Volume from the one on
290  *      the drive, it can re-use the drive for the new Volume.
291  *
292  *  6. If a job wants a Volume that is in a different drive, it can either use the
293  *      other drive or take the volume, only if the other drive is not in use or
294  *      not reserved.
295  *
296  *  One nice aspect of this is that the reserve use count and the writer use count 
297  *  already exist and are correctly programmed and will need no changes -- use 
298  *  counts are always very tricky.
299  *
300  *  The old code had a concept of "reserving" a Volume, but was changed 
301  *  to reserving and using a drive.  A volume is must be attached to (owned by) a 
302  *  drive and can move from drive to drive or be unused given certain specific 
303  *  conditions of the drive.  The key is that the drive must "own" the Volume.  
304  *  The old code had the job (dcr) owning the volume (more or less).  The job was
305  *  to change the insertion and removal of the volumes from the list to be based 
306  *  on the drive rather than the job.  
307  *
308  *  Return: VOLRES entry on success
309  *          NULL volume busy on another drive
310  */
311 VOLRES *reserve_volume(DCR *dcr, const char *VolumeName)
312 {
313    VOLRES *vol, *nvol;
314    DEVICE * volatile dev = dcr->dev;
315
316    ASSERT(dev != NULL);
317
318    Dmsg1(dbglvl, "enter reserve_volume %s\n", VolumeName);
319    /* 
320     * We lock the reservations system here to ensure
321     *  when adding a new volume that no newly scheduled
322     *  job can reserve it.
323     */
324    lock_volumes();
325    debug_list_volumes("begin reserve_volume");
326    /* 
327     * First, remove any old volume attached to this device as it
328     *  is no longer used.
329     */
330    if (dev->vol) {
331       vol = dev->vol;
332       Dmsg4(dbglvl, "Vol attached=%s, newvol=%s release=%d on %s\n",
333          vol->vol_name, VolumeName, vol->released, dev->print_name());
334       /*
335        * Make sure we don't remove the current volume we are inserting
336        *  because it was probably inserted by another job, or it
337        *  is not being used and is marked as released.
338        */
339       if (strcmp(vol->vol_name, VolumeName) == 0) {
340          Dmsg1(dbglvl, "=== OK, vol=%s on device. set not released.\n", VolumeName);
341          vol->released = false;         /* retake vol if released previously */
342          goto get_out;                  /* Volume already on this device */
343       } else {
344          /* Don't release a volume if it is in use */
345          if (!vol->released) {
346             Dmsg1(dbglvl, "Cannot free vol=%s. It is not released.\n", vol->vol_name);
347             vol = NULL;                  /* vol in use */
348             goto get_out;
349          }
350          Dmsg2(dbglvl, "reserve_vol free vol=%s at %p\n", vol->vol_name, vol->vol_name);
351          unload_autochanger(dcr, -1);   /* unload the volume */
352          free_volume(dev);
353          debug_list_volumes("reserve_vol free");
354       }
355    }
356
357    /* Create a new Volume entry */
358    nvol = new_vol_item(dcr, VolumeName);
359
360    /*
361     * Now try to insert the new Volume
362     */
363    vol = (VOLRES *)vol_list->binary_insert(nvol, my_compare);
364    if (vol != nvol) {
365       Dmsg2(dbglvl, "Found vol=%s dev-same=%d\n", vol->vol_name, dev==vol->dev);
366       /*
367        * At this point, a Volume with this name already is in the list,
368        *   so we simply release our new Volume entry. Note, this should
369        *   only happen if we are moving the volume from one drive to another.
370        */
371       Dmsg2(dbglvl, "reserve_vol free-tmp vol=%s at %p\n", 
372             vol->vol_name, vol->vol_name);
373       /*
374        * Clear dev pointer so that free_vol_item() doesn't 
375        *  take away our volume. 
376        */
377       nvol->dev = NULL;                   /* don't zap dev entry */
378       free_vol_item(nvol);
379
380       /* Check if we are trying to use the Volume on a different drive */
381       if (dev != vol->dev) {
382          /* Caller wants to switch Volume to another device */
383          switch_device(dcr, vol->dev);
384          dev = vol->dev;
385 #ifdef xxx
386          if (!vol->dev->is_busy()) {
387             /* OK to move it -- I'm not sure this will work */
388             Dmsg3(dbglvl, "==== Swap vol=%s from dev=%s to %s\n", VolumeName,
389                vol->dev->print_name(), dev->print_name());
390             vol->dev->vol = NULL;         /* take vol from old drive */
391             vol->dev->VolHdr.VolumeName[0] = 0;
392             vol->dev = dev;               /* point vol at new drive */
393             dev->vol = vol;               /* point dev at vol */
394             dev->VolHdr.VolumeName[0] = 0;
395          } else {
396             Dmsg3(dbglvl, "==== Swap not possible Vol busy vol=%s from dev=%s to %s\n", 
397                VolumeName, vol->dev->print_name(), dev->print_name());
398             vol = NULL;                /* device busy */
399             goto get_out;
400          }
401 #endif
402       }
403    }
404    dev->vol = vol;
405
406 get_out:
407    if (vol) {
408       Dmsg1(dbglvl, "=== set not released. vol=%s\n", vol->vol_name);
409       vol->released = false;
410    }
411    debug_list_volumes("end new volume");
412    unlock_volumes();
413    return vol;
414 }
415
416 /* 
417  * Switch from current device to given device  
418  *   (not yet used) 
419  */
420 void switch_device(DCR *dcr, DEVICE *dev)
421 {
422    // lock_reservations();
423    DCR save_dcr;
424
425    dev->dlock();
426    memcpy(&save_dcr, dcr, sizeof(save_dcr));
427    clean_device(dcr);                  /* clean up the dcr */
428
429    dcr->dev = dev;                     /* get new device pointer */
430    Jmsg(dcr->jcr, M_INFO, 0, _("Device switch. New device %s chosen.\n"),
431       dcr->dev->print_name());
432
433    bstrncpy(dcr->VolumeName, save_dcr.VolumeName, sizeof(dcr->VolumeName));
434    bstrncpy(dcr->media_type, save_dcr.media_type, sizeof(dcr->media_type));
435    dcr->VolCatInfo.Slot = save_dcr.VolCatInfo.Slot;
436    bstrncpy(dcr->pool_name, save_dcr.pool_name, sizeof(dcr->pool_name));
437    bstrncpy(dcr->pool_type, save_dcr.pool_type, sizeof(dcr->pool_type));
438    bstrncpy(dcr->dev_name, dev->dev_name, sizeof(dcr->dev_name));
439
440    dev->reserved_device++;
441    dcr->reserved_device = true;
442
443    dev->dunlock();
444 }
445
446 /*
447  * Search for a Volume name in the Volume list.
448  *
449  *  Returns: VOLRES entry on success
450  *           NULL if the Volume is not in the list
451  */
452 VOLRES *find_volume(DCR *dcr)
453 {
454    VOLRES vol, *fvol;
455    /* Do not lock reservations here */
456    lock_volumes();
457    vol.vol_name = bstrdup(dcr->VolumeName);
458    fvol = (VOLRES *)vol_list->binary_search(&vol, my_compare);
459    free(vol.vol_name);
460    Dmsg2(dbglvl, "find_vol=%s found=%d\n", dcr->VolumeName, fvol!=NULL);
461    debug_list_volumes("find_volume");
462    unlock_volumes();
463    return fvol;
464 }
465
466 /* 
467  * Remove any reservation from a drive and tell the system
468  *  that the volume is unused at least by us.
469  */
470 void unreserve_device(DCR *dcr)
471 {
472    DEVICE *dev = dcr->dev;
473    if (dcr->reserved_device) {
474       dcr->reserved_device = false;
475       dev->reserved_device--;
476       Dmsg2(dbglvl, "Dec reserve=%d dev=%s\n", dev->reserved_device, dev->print_name());
477       dcr->reserved_device = false;
478       /* If we set read mode in reserving, remove it */
479       if (dev->can_read()) {
480          dev->clear_read();
481       }
482       if (dev->num_writers < 0) {
483          Jmsg1(dcr->jcr, M_ERROR, 0, _("Hey! num_writers=%d!!!!\n"), dev->num_writers);
484          dev->num_writers = 0;
485       }
486       if (dev->reserved_device == 0 && dev->num_writers == 0) {
487          volume_unused(dcr);
488       }
489    }
490 }
491
492 /*  
493  * Free a Volume from the Volume list if it is no longer used
494  *   Note, for tape drives we want to remember where the Volume
495  *   was when last used, so rather than free the volume entry,
496  *   we simply mark it "released" so when the drive is really
497  *   needed for another volume, we can reuse it.
498  *
499  *  Returns: true if the Volume found and "removed" from the list
500  *           false if the Volume is not in the list or is in use
501  */
502 bool volume_unused(DCR *dcr)
503 {
504    DEVICE *dev = dcr->dev;
505
506    if (dev->vol == NULL) {
507       Dmsg1(dbglvl, "vol_unused: no vol on %s\n", dev->print_name());
508       debug_list_volumes("null vol cannot unreserve_volume");
509       return false;
510    }
511
512 #ifdef xxx
513    if (dev->is_busy()) {
514       Dmsg1(dbglvl, "vol_unused: busy on %s\n", dev->print_name());
515       debug_list_volumes("dev busy cannot unreserve_volume");
516       return false;
517    }
518 #endif
519 #ifdef xxx
520    if (dev->num_writers > 0 || dev->reserved_device > 0) {
521       ASSERT(0);
522    }
523 #endif
524
525    /*  
526     * If this is a tape, we do not free the volume, rather we wait
527     *  until the autoloader unloads it, or until another tape is
528     *  explicitly read in this drive. This allows the SD to remember
529     *  where the tapes are or last were.
530     */
531    Dmsg3(dbglvl, "=== mark released vol=%s num_writers=%d reserved=%d\n",
532       dev->vol->vol_name, dev->num_writers, dev->reserved_device);
533    dev->vol->released = true;
534    if (dev->is_tape()) { // || dev->is_autochanger()) {
535       return true;
536    } else {
537       /*
538        * Note, this frees the volume reservation entry, but the 
539        *   file descriptor remains open with the OS.
540        */
541       return free_volume(dev);
542    }
543 }
544
545 /*
546  * Unconditionally release the volume entry
547  */
548 bool free_volume(DEVICE *dev)
549 {
550    VOLRES *vol;
551
552    if (dev->vol == NULL) {
553       Dmsg1(dbglvl, "No vol on dev %s\n", dev->print_name());
554       return false;
555    }
556    lock_volumes();
557    vol = dev->vol;
558    dev->vol = NULL;
559    vol_list->remove(vol);
560    Dmsg2(dbglvl, "=== free_volume %s dev=%s\n", vol->vol_name, dev->print_name());
561    free_vol_item(vol);
562    debug_list_volumes("free_volume");
563    unlock_volumes();
564    return vol != NULL;
565 }
566
567       
568 /* Create the Volume list */
569 void create_volume_list()
570 {
571    VOLRES *vol = NULL;
572    if (vol_list == NULL) {
573       vol_list = New(dlist(vol, &vol->link));
574    }
575 }
576
577 /* Release all Volumes from the list */
578 void free_volume_list()
579 {
580    VOLRES *vol;
581    if (!vol_list) {
582       return;
583    }
584    lock_volumes();
585    foreach_dlist(vol, vol_list) {
586       if (vol->dev) {
587          Dmsg2(dbglvl, "free vol_list Volume=%s dev=%s\n", vol->vol_name, vol->dev->print_name());
588       } else {
589          Dmsg1(dbglvl, "free vol_list Volume=%s No dev\n", vol->vol_name);
590       }
591       free(vol->vol_name);
592       vol->vol_name = NULL;
593    }
594    delete vol_list;
595    vol_list = NULL;
596    unlock_volumes();
597 }
598
599 bool is_volume_in_use(DCR *dcr)
600 {
601    VOLRES *vol = find_volume(dcr);
602    if (!vol) {
603       Dmsg1(dbglvl, "Vol=%s not in use.\n", dcr->VolumeName);
604       return false;                   /* vol not in list */
605    }
606    ASSERT(vol->dev != NULL);
607
608    if (dcr->dev == vol->dev) {        /* same device OK */
609       Dmsg1(dbglvl, "Vol=%s on same dev.\n", dcr->VolumeName);
610       return false;
611    } else {
612       Dmsg3(dbglvl, "Vol=%s on %s we have %s\n", dcr->VolumeName,
613             vol->dev->print_name(), dcr->dev->print_name());
614    }
615    if (!vol->dev->is_busy()) {
616       Dmsg2(dbglvl, "Vol=%s dev=%s not busy.\n", dcr->VolumeName, vol->dev->print_name());
617       return false;
618    } else {
619       Dmsg2(dbglvl, "Vol=%s dev=%s busy.\n", dcr->VolumeName, vol->dev->print_name());
620    }
621    Dmsg2(dbglvl, "Vol=%s in use by %s.\n", dcr->VolumeName, vol->dev->print_name());
622    return true;
623 }
624
625
626 /*
627  * We get the following type of information:
628  *
629  * use storage=xxx media_type=yyy pool_name=xxx pool_type=yyy append=1 copy=0 strip=0
630  *  use device=zzz
631  *  use device=aaa
632  *  use device=bbb
633  * use storage=xxx media_type=yyy pool_name=xxx pool_type=yyy append=0 copy=0 strip=0
634  *  use device=bbb
635  *
636  */
637 static bool use_storage_cmd(JCR *jcr)
638 {
639    POOL_MEM store_name, dev_name, media_type, pool_name, pool_type;
640    BSOCK *dir = jcr->dir_bsock;
641    int append;
642    bool ok;       
643    int Copy, Stripe;
644    DIRSTORE *store;
645    RCTX rctx;
646    alist *dirstore;
647
648    memset(&rctx, 0, sizeof(RCTX));
649    rctx.jcr = jcr;
650    /*
651     * If there are multiple devices, the director sends us
652     *   use_device for each device that it wants to use.
653     */
654    dirstore = New(alist(10, not_owned_by_alist));
655    jcr->reserve_msgs = New(alist(10, not_owned_by_alist));  
656    do {
657       Dmsg1(dbglvl, "<dird: %s", dir->msg);
658       ok = sscanf(dir->msg, use_storage, store_name.c_str(), 
659                   media_type.c_str(), pool_name.c_str(), 
660                   pool_type.c_str(), &append, &Copy, &Stripe) == 7;
661       if (!ok) {
662          break;
663       }
664       if (append) {
665          jcr->write_store = dirstore;
666       } else {
667          jcr->read_store = dirstore;
668       }
669       rctx.append = append;
670       unbash_spaces(store_name);
671       unbash_spaces(media_type);
672       unbash_spaces(pool_name);
673       unbash_spaces(pool_type);
674       store = new DIRSTORE;
675       dirstore->append(store);
676       memset(store, 0, sizeof(DIRSTORE));
677       store->device = New(alist(10));
678       bstrncpy(store->name, store_name, sizeof(store->name));
679       bstrncpy(store->media_type, media_type, sizeof(store->media_type));
680       bstrncpy(store->pool_name, pool_name, sizeof(store->pool_name));
681       bstrncpy(store->pool_type, pool_type, sizeof(store->pool_type));
682       store->append = append;
683
684       /* Now get all devices */
685       while (dir->recv() >= 0) {
686          Dmsg1(dbglvl, "<dird device: %s", dir->msg);
687          ok = sscanf(dir->msg, use_device, dev_name.c_str()) == 1;
688          if (!ok) {
689             break;
690          }
691          unbash_spaces(dev_name);
692          store->device->append(bstrdup(dev_name.c_str()));
693       }
694    }  while (ok && dir->recv() >= 0);
695
696    /* Developer debug code */
697    char *device_name;
698    if (debug_level >= dbglvl) {
699       foreach_alist(store, dirstore) {
700          Dmsg5(dbglvl, "Storage=%s media_type=%s pool=%s pool_type=%s append=%d\n", 
701             store->name, store->media_type, store->pool_name, 
702             store->pool_type, store->append);
703          foreach_alist(device_name, store->device) {
704             Dmsg1(dbglvl, "     Device=%s\n", device_name);
705          }
706       }
707    }
708
709    init_jcr_device_wait_timers(jcr);
710    jcr->dcr = new_dcr(jcr, NULL, NULL);         /* get a dcr */
711    if (!jcr->dcr) {
712       BSOCK *dir = jcr->dir_bsock;
713       dir->fsend(_("3939 Could not get dcr\n"));
714       Dmsg1(dbglvl, ">dird: %s", dir->msg);
715       ok = false;
716    }
717    /*                    
718     * At this point, we have a list of all the Director's Storage
719     *  resources indicated for this Job, which include Pool, PoolType,
720     *  storage name, and Media type.     
721     * Then for each of the Storage resources, we have a list of
722     *  device names that were given.
723     *
724     * Wiffle through them and find one that can do the backup.
725     */
726    if (ok) {
727       int wait_for_device_retries = 0;  
728       int repeat = 0;
729       bool fail = false;
730       rctx.notify_dir = true;
731
732       lock_reservations();
733       for ( ; !fail && !job_canceled(jcr); ) {
734          pop_reserve_messages(jcr);
735          rctx.suitable_device = false;
736          rctx.have_volume = false;
737          rctx.VolumeName[0] = 0;
738          rctx.any_drive = false;
739          if (!jcr->PreferMountedVols) {
740             /*
741              * Here we try to find a drive that is not used.
742              * This will maximize the use of available drives.
743              *
744              */
745             rctx.num_writers = 20000000;   /* start with impossible number */
746             rctx.low_use_drive = NULL;
747             rctx.PreferMountedVols = false;                
748             rctx.exact_match = false;
749             rctx.autochanger_only = true;
750             Dmsg5(dbglvl, "PrefMnt=%d exact=%d suitable=%d chgronly=%d any=%d\n",
751                rctx.PreferMountedVols, rctx.exact_match, rctx.suitable_device,
752                rctx.autochanger_only, rctx.any_drive);
753             if ((ok = find_suitable_device_for_job(jcr, rctx))) {
754                break;
755             }
756             /* Look through all drives possibly for low_use drive */
757             if (rctx.low_use_drive) {
758                rctx.try_low_use_drive = true;
759                if ((ok = find_suitable_device_for_job(jcr, rctx))) {
760                   break;
761                }
762                rctx.try_low_use_drive = false;
763             }
764             rctx.autochanger_only = false;
765             Dmsg5(dbglvl, "PrefMnt=%d exact=%d suitable=%d chgronly=%d any=%d\n",
766                rctx.PreferMountedVols, rctx.exact_match, rctx.suitable_device,
767                rctx.autochanger_only, rctx.any_drive);
768             if ((ok = find_suitable_device_for_job(jcr, rctx))) {
769                break;
770             }
771          }
772          /*
773           * Now we look for a drive that may or may not be in
774           *  use.
775           */
776          /* Look for an exact Volume match all drives */
777          rctx.PreferMountedVols = true;
778          rctx.exact_match = true;
779          rctx.autochanger_only = false;
780          Dmsg5(dbglvl, "PrefMnt=%d exact=%d suitable=%d chgronly=%d any=%d\n",
781             rctx.PreferMountedVols, rctx.exact_match, rctx.suitable_device,
782             rctx.autochanger_only, rctx.any_drive);
783          if ((ok = find_suitable_device_for_job(jcr, rctx))) {
784             break;
785          }
786          /* Look for any mounted drive */
787          rctx.exact_match = false;
788          Dmsg5(dbglvl, "PrefMnt=%d exact=%d suitable=%d chgronly=%d any=%d\n",
789             rctx.PreferMountedVols, rctx.exact_match, rctx.suitable_device,
790             rctx.autochanger_only, rctx.any_drive);
791          if ((ok = find_suitable_device_for_job(jcr, rctx))) {
792             break;
793          }
794          /* Try any drive */
795          rctx.any_drive = true;
796          Dmsg5(dbglvl, "PrefMnt=%d exact=%d suitable=%d chgronly=%d any=%d\n",
797             rctx.PreferMountedVols, rctx.exact_match, rctx.suitable_device,
798             rctx.autochanger_only, rctx.any_drive);
799          if ((ok = find_suitable_device_for_job(jcr, rctx))) {
800             break;
801          }
802          /* Keep reservations locked *except* during wait_for_device() */
803          unlock_reservations();
804          /*     
805           * The idea of looping on repeat a few times it to ensure
806           * that if there is some subtle timing problem between two
807           * jobs, we will simply try again, and most likely succeed.
808           * This can happen if one job reserves a drive or finishes using
809           * a drive at the same time a second job wants it.
810           */
811          if (repeat++ > 1) {              /* try algorithm 3 times */
812             bmicrosleep(30, 0);           /* wait a bit */
813             Dmsg0(dbglvl, "repeat reserve algorithm\n");
814          } else if (!rctx.suitable_device || !wait_for_device(jcr, wait_for_device_retries)) {
815             Dmsg0(dbglvl, "Fail. !suitable_device || !wait_for_device\n");
816             fail = true;
817          }   
818          lock_reservations();
819          dir->signal(BNET_HEARTBEAT);  /* Inform Dir that we are alive */
820       }
821       unlock_reservations();
822       if (!ok) {
823          /*
824           * If we get here, there are no suitable devices available, which
825           *  means nothing configured.  If a device is suitable but busy
826           *  with another Volume, we will not come here.
827           */
828          unbash_spaces(dir->msg);
829          pm_strcpy(jcr->errmsg, dir->msg);
830          Jmsg(jcr, M_INFO, 0, _("Failed command: %s\n"), jcr->errmsg);
831          Jmsg(jcr, M_FATAL, 0, _("\n"
832             "     Device \"%s\" with MediaType \"%s\" requested by DIR not found in SD Device resources.\n"),
833               dev_name.c_str(), media_type.c_str());
834          dir->fsend(NO_device, dev_name.c_str());
835
836          Dmsg1(dbglvl, ">dird: %s", dir->msg);
837       }
838    } else {
839       unbash_spaces(dir->msg);
840       pm_strcpy(jcr->errmsg, dir->msg);
841       Jmsg(jcr, M_FATAL, 0, _("Failed command: %s\n"), jcr->errmsg);
842       dir->fsend(BAD_use, jcr->errmsg);
843       Dmsg1(dbglvl, ">dird: %s", dir->msg);
844    }
845
846    release_reserve_messages(jcr);
847    return ok;
848 }
849
850
851 /*
852  * Walk through the autochanger resources and check if
853  *  the volume is in one of them.
854  * 
855  * Returns:  true  if volume is in device
856  *           false otherwise
857  */
858 static bool is_vol_in_autochanger(RCTX &rctx, VOLRES *vol)
859 {
860    AUTOCHANGER *changer = vol->dev->device->changer_res;
861
862    /* Find resource, and make sure we were able to open it */
863    if (strcmp(rctx.device_name, changer->hdr.name) == 0) {
864       Dmsg1(dbglvl, "Found changer device %s\n", vol->dev->device->hdr.name);
865       return true;
866    }  
867    Dmsg1(dbglvl, "Incorrect changer device %s\n", changer->hdr.name);
868    return false;
869 }
870
871 /*
872  * Search for a device suitable for this job.
873  */
874 bool find_suitable_device_for_job(JCR *jcr, RCTX &rctx)
875 {
876    bool ok = false;
877    DIRSTORE *store;
878    char *device_name;
879    alist *dirstore;
880    DCR *dcr = jcr->dcr;
881
882    if (rctx.append) {
883       dirstore = jcr->write_store;
884    } else {
885       dirstore = jcr->read_store;
886    }
887    Dmsg4(dbglvl, "PrefMnt=%d exact=%d suitable=%d chgronly=%d\n",
888       rctx.PreferMountedVols, rctx.exact_match, rctx.suitable_device,
889       rctx.autochanger_only);
890
891    /* 
892     * If the appropriate conditions of this if are met, namely that
893     *  we are appending and the user wants mounted drive (or we
894     *  force try a mounted drive because they are all busy), we
895     *  start by looking at all the Volumes in the volume list.
896     */
897    if (!vol_list->empty() && rctx.append && rctx.PreferMountedVols) {
898       dlist *temp_vol_list, *save_vol_list;
899       VOLRES *vol = NULL;
900       lock_volumes();
901       Dmsg0(dbglvl, "lock volumes\n");                           
902
903       /*  
904        * Create a temporary copy of the volume list.  We do this,
905        *   to avoid having the volume list locked during the
906        *   call to reserve_device(), which would cause a deadlock.
907        * Note, we may want to add an update counter on the vol_list
908        *   so that if it is modified while we are traversing the copy
909        *   we can take note and act accordingly (probably redo the 
910        *   search at least a few times).
911        */
912       Dmsg0(dbglvl, "duplicate vol list\n");
913       temp_vol_list = New(dlist(vol, &vol->link));
914       foreach_dlist(vol, vol_list) {
915          VOLRES *nvol;
916          VOLRES *tvol = (VOLRES *)malloc(sizeof(VOLRES));
917          memset(tvol, 0, sizeof(VOLRES));
918          tvol->vol_name = bstrdup(vol->vol_name);
919          tvol->dev = vol->dev;
920          nvol = (VOLRES *)temp_vol_list->binary_insert(tvol, my_compare);
921          if (tvol != nvol) {
922             tvol->dev = NULL;                   /* don't zap dev entry */
923             free_vol_item(tvol);
924             Pmsg0(000, "Logic error. Duplicating vol list hit duplicate.\n");
925             Jmsg(jcr, M_WARNING, 0, "Logic error. Duplicating vol list hit duplicate.\n");
926          }
927       }
928       Dmsg0(dbglvl, "unlock volumes\n");
929       unlock_volumes();
930
931       /* Look through reserved volumes for one we can use */
932       Dmsg0(dbglvl, "look for vol in vol list\n");
933       foreach_dlist(vol, temp_vol_list) {
934          if (!vol->dev) {
935             Dmsg1(dbglvl, "vol=%s no dev\n", vol->vol_name);
936             continue;
937          }
938          /* Check with Director if this Volume is OK */
939          bstrncpy(dcr->VolumeName, vol->vol_name, sizeof(dcr->VolumeName));
940          if (!dir_get_volume_info(dcr, GET_VOL_INFO_FOR_WRITE)) {
941             continue;
942          }
943
944          Dmsg1(dbglvl, "vol=%s OK for this job\n", vol->vol_name);
945          foreach_alist(store, dirstore) {
946             int stat;
947             rctx.store = store;
948             foreach_alist(device_name, store->device) {
949                /* Found a device, try to use it */
950                rctx.device_name = device_name;
951                rctx.device = vol->dev->device;
952
953                if (vol->dev->is_autochanger()) {
954                   Dmsg1(dbglvl, "vol=%s is in changer\n", vol->vol_name);
955                   if (!is_vol_in_autochanger(rctx, vol)) {
956                      continue;
957                   }
958                } else if (strcmp(device_name, vol->dev->device->hdr.name) != 0) {
959                   Dmsg2(dbglvl, "device=%s not suitable want %s\n",
960                         vol->dev->device->hdr.name, device_name);
961                   continue;
962                }
963
964                bstrncpy(rctx.VolumeName, vol->vol_name, sizeof(rctx.VolumeName));
965                rctx.have_volume = true;
966                /* Try reserving this device and volume */
967                Dmsg2(dbglvl, "try vol=%s on device=%s\n", rctx.VolumeName, device_name);
968                stat = reserve_device(rctx);
969                if (stat == 1) {             /* found available device */
970                   Dmsg1(dbglvl, "Suitable device found=%s\n", device_name);
971                   ok = true;
972                   break;
973                } else if (stat == 0) {      /* device busy */
974                   Dmsg1(dbglvl, "Suitable device=%s, busy: not use\n", device_name);
975                } else {
976                   /* otherwise error */
977                   Dmsg0(dbglvl, "No suitable device found.\n");
978                }
979                rctx.have_volume = false;
980                rctx.VolumeName[0] = 0;
981             }
982             if (ok) {
983                break;
984             }
985          }
986          if (ok) {
987             break;
988          }
989       } /* end for loop over reserved volumes */
990
991       Dmsg0(dbglvl, "lock volumes\n");
992       lock_volumes();
993       save_vol_list = vol_list;
994       vol_list = temp_vol_list;
995       free_volume_list();                  /* release temp_vol_list */
996       vol_list = save_vol_list;
997       Dmsg0(dbglvl, "deleted temp vol list\n");
998       Dmsg0(dbglvl, "unlock volumes\n");
999       unlock_volumes();
1000       debug_list_volumes("=== After free temp table\n");
1001    }
1002    if (ok) {
1003       Dmsg1(dbglvl, "got vol %s from in-use vols list\n", rctx.VolumeName);
1004       return true;
1005    }
1006
1007    /* 
1008     * No reserved volume we can use, so now search for an available device.  
1009     *
1010     * For each storage device that the user specified, we
1011     *  search and see if there is a resource for that device.
1012     */
1013    foreach_alist(store, dirstore) {
1014       rctx.store = store;
1015       foreach_alist(device_name, store->device) {
1016          int stat;
1017          rctx.device_name = device_name;
1018          stat = search_res_for_device(rctx); 
1019          if (stat == 1) {             /* found available device */
1020             Dmsg1(dbglvl, "available device found=%s\n", device_name);
1021             ok = true;
1022             break;
1023          } else if (stat == 0) {      /* device busy */
1024             Dmsg1(dbglvl, "Suitable device=%s, busy: not use\n", device_name);
1025          } else {
1026             /* otherwise error */
1027             Dmsg0(dbglvl, "No suitable device found.\n");
1028          }
1029       }
1030       if (ok) {
1031          break;
1032       }
1033    }
1034    return ok;
1035 }
1036
1037 /*
1038  * Search for a particular storage device with particular storage
1039  *  characteristics (MediaType).
1040  */
1041 int search_res_for_device(RCTX &rctx) 
1042 {
1043    AUTOCHANGER *changer;
1044    int stat;
1045
1046    Dmsg1(dbglvl, "search res for %s\n", rctx.device_name);
1047    /* Look through Autochangers first */
1048    foreach_res(changer, R_AUTOCHANGER) {
1049       Dmsg1(dbglvl, "Try match changer res=%s\n", changer->hdr.name);
1050       /* Find resource, and make sure we were able to open it */
1051       if (strcmp(rctx.device_name, changer->hdr.name) == 0) {
1052          /* Try each device in this AutoChanger */
1053          foreach_alist(rctx.device, changer->device) {
1054             Dmsg1(dbglvl, "Try changer device %s\n", rctx.device->hdr.name);
1055             stat = reserve_device(rctx);
1056             if (stat != 1) {             /* try another device */
1057                continue;
1058             }
1059             /* Debug code */
1060             if (rctx.store->append == SD_APPEND) {
1061                Dmsg2(dbglvl, "Device %s reserved=%d for append.\n", 
1062                   rctx.device->hdr.name, rctx.jcr->dcr->dev->reserved_device);
1063             } else {
1064                Dmsg2(dbglvl, "Device %s reserved=%d for read.\n", 
1065                   rctx.device->hdr.name, rctx.jcr->read_dcr->dev->reserved_device);
1066             }
1067             return stat;
1068          }
1069       }
1070    }
1071
1072    /* Now if requested look through regular devices */
1073    if (!rctx.autochanger_only) {
1074       foreach_res(rctx.device, R_DEVICE) {
1075          Dmsg1(dbglvl, "Try match res=%s\n", rctx.device->hdr.name);
1076          /* Find resource, and make sure we were able to open it */
1077          if (strcmp(rctx.device_name, rctx.device->hdr.name) == 0) {
1078             stat = reserve_device(rctx);
1079             if (stat != 1) {             /* try another device */
1080                continue;
1081             }
1082             /* Debug code */
1083             if (rctx.store->append == SD_APPEND) {
1084                Dmsg2(dbglvl, "Device %s reserved=%d for append.\n", 
1085                   rctx.device->hdr.name, rctx.jcr->dcr->dev->reserved_device);
1086             } else {
1087                Dmsg2(dbglvl, "Device %s reserved=%d for read.\n", 
1088                   rctx.device->hdr.name, rctx.jcr->read_dcr->dev->reserved_device);
1089             }
1090             return stat;
1091          }
1092       }
1093    }
1094    return -1;                    /* nothing found */
1095 }
1096
1097 /*
1098  *  Try to reserve a specific device.
1099  *
1100  *  Returns: 1 -- OK, have DCR
1101  *           0 -- must wait
1102  *          -1 -- fatal error
1103  */
1104 static int reserve_device(RCTX &rctx)
1105 {
1106    bool ok;
1107    DCR *dcr;
1108    const int name_len = MAX_NAME_LENGTH;
1109
1110    /* Make sure MediaType is OK */
1111    Dmsg2(dbglvl, "chk MediaType device=%s request=%s\n",
1112          rctx.device->media_type, rctx.store->media_type);
1113    if (strcmp(rctx.device->media_type, rctx.store->media_type) != 0) {
1114       return -1;
1115    }
1116
1117    /* Make sure device exists -- i.e. we can stat() it */
1118    if (!rctx.device->dev) {
1119       rctx.device->dev = init_dev(rctx.jcr, rctx.device);
1120    }
1121    if (!rctx.device->dev) {
1122       if (rctx.device->changer_res) {
1123         Jmsg(rctx.jcr, M_WARNING, 0, _("\n"
1124            "     Device \"%s\" in changer \"%s\" requested by DIR could not be opened or does not exist.\n"),
1125              rctx.device->hdr.name, rctx.device_name);
1126       } else {
1127          Jmsg(rctx.jcr, M_WARNING, 0, _("\n"
1128             "     Device \"%s\" requested by DIR could not be opened or does not exist.\n"),
1129               rctx.device_name);
1130       }
1131       return -1;  /* no use waiting */
1132    }  
1133
1134    rctx.suitable_device = true;
1135    Dmsg1(dbglvl, "try reserve %s\n", rctx.device->hdr.name);
1136    rctx.jcr->dcr = dcr = new_dcr(rctx.jcr, rctx.jcr->dcr, rctx.device->dev);
1137    if (!dcr) {
1138       BSOCK *dir = rctx.jcr->dir_bsock;
1139       dir->fsend(_("3926 Could not get dcr for device: %s\n"), rctx.device_name);
1140       Dmsg1(dbglvl, ">dird: %s", dir->msg);
1141       return -1;
1142    }
1143    bstrncpy(dcr->pool_name, rctx.store->pool_name, name_len);
1144    bstrncpy(dcr->pool_type, rctx.store->pool_type, name_len);
1145    bstrncpy(dcr->media_type, rctx.store->media_type, name_len);
1146    bstrncpy(dcr->dev_name, rctx.device_name, name_len);
1147    if (rctx.store->append == SD_APPEND) {
1148       Dmsg2(dbglvl, "call reserve for append: have_vol=%d vol=%s\n", rctx.have_volume, rctx.VolumeName);                                   
1149       ok = reserve_device_for_append(dcr, rctx);
1150       if (!ok) {
1151          goto bail_out;
1152       }
1153
1154       rctx.jcr->dcr = dcr;
1155       Dmsg5(dbglvl, "Reserved=%d dev_name=%s mediatype=%s pool=%s ok=%d\n",
1156                dcr->dev->reserved_device,
1157                dcr->dev_name, dcr->media_type, dcr->pool_name, ok);
1158       Dmsg3(dbglvl, "Vol=%s num_writers=%d, have_vol=%d\n", 
1159          rctx.VolumeName, dcr->dev->num_writers, rctx.have_volume);
1160       if (rctx.have_volume) {
1161          if (reserve_volume(dcr, rctx.VolumeName)) {
1162             Dmsg1(dbglvl, "Reserved vol=%s\n", rctx.VolumeName);
1163          } else {
1164             Dmsg1(dbglvl, "Could not reserve vol=%s\n", rctx.VolumeName);
1165             goto bail_out;
1166          }
1167       } else {
1168          dcr->any_volume = true;
1169          Dmsg0(dbglvl, "no vol, call find_next_appendable_vol.\n");
1170          if (dir_find_next_appendable_volume(dcr)) {
1171             bstrncpy(rctx.VolumeName, dcr->VolumeName, sizeof(rctx.VolumeName));
1172             rctx.have_volume = true;
1173             Dmsg1(dbglvl, "looking for Volume=%s\n", rctx.VolumeName);
1174          } else {
1175             Dmsg0(dbglvl, "No next volume found\n");
1176             rctx.have_volume = false;
1177             rctx.VolumeName[0] = 0;
1178             /*
1179              * If there is at least one volume that is valid and in use,
1180              *   but we get here, check if we are running with prefers
1181              *   non-mounted drives.  In that case, we have selected a
1182              *   non-used drive and our one and only volume is mounted
1183              *   elsewhere, so we bail out and retry using that drive.
1184              */
1185             if (dcr->volume_in_use && !rctx.PreferMountedVols) {
1186                rctx.PreferMountedVols = true;
1187                if (dcr->VolumeName[0]) {
1188                   unreserve_device(dcr);
1189                }
1190                goto bail_out;
1191             }
1192             /*
1193              * Note. Under some circumstances, the Director can hand us
1194              *  a Volume name that is not the same as the one on the current
1195              *  drive, and in that case, the call above to find the next
1196              *  volume will fail because in attempting to reserve the Volume
1197              *  the code will realize that we already have a tape mounted,
1198              *  and it will fail.  This *should* only happen if there are 
1199              *  writers, thus the following test.  In that case, we simply
1200              *  bail out, and continue waiting, rather than plunging on
1201              *  and hoping that the operator can resolve the problem. 
1202              */
1203             if (dcr->dev->num_writers != 0) {
1204                if (dcr->VolumeName[0]) {
1205                   unreserve_device(dcr);
1206                }
1207                goto bail_out;
1208             }
1209          }
1210       }
1211    } else {
1212       ok = reserve_device_for_read(dcr);
1213       if (ok) {
1214          rctx.jcr->read_dcr = dcr;
1215          Dmsg5(dbglvl, "Read reserved=%d dev_name=%s mediatype=%s pool=%s ok=%d\n",
1216                dcr->dev->reserved_device,
1217                dcr->dev_name, dcr->media_type, dcr->pool_name, ok);
1218       }
1219    }
1220    if (!ok) {
1221       goto bail_out;
1222    }
1223
1224    if (rctx.notify_dir) {
1225       POOL_MEM dev_name;
1226       BSOCK *dir = rctx.jcr->dir_bsock;
1227       pm_strcpy(dev_name, rctx.device->hdr.name);
1228       bash_spaces(dev_name);
1229       ok = dir->fsend(OK_device, dev_name.c_str());  /* Return real device name */
1230       Dmsg1(dbglvl, ">dird: %s", dir->msg);
1231    } else {
1232       ok = true;
1233    }
1234    return ok ? 1 : -1;
1235
1236 bail_out:
1237    rctx.have_volume = false;
1238    rctx.VolumeName[0] = 0;
1239    Dmsg0(dbglvl, "Not OK.\n");
1240    return 0;
1241 }
1242
1243 /*
1244  * We "reserve" the drive by setting the ST_READ bit. No one else
1245  *  should touch the drive until that is cleared.
1246  *  This allows the DIR to "reserve" the device before actually
1247  *  starting the job. 
1248  */
1249 static bool reserve_device_for_read(DCR *dcr)
1250 {
1251    DEVICE *dev = dcr->dev;
1252    JCR *jcr = dcr->jcr;
1253    bool ok = false;
1254
1255    ASSERT(dcr);
1256
1257    dev->dlock();  
1258
1259    if (is_device_unmounted(dev)) {             
1260       Dmsg1(dbglvl, "Device %s is BLOCKED due to user unmount.\n", dev->print_name());
1261       Mmsg(jcr->errmsg, _("3601 JobId=%u device %s is BLOCKED due to user unmount.\n"),
1262            jcr->JobId, dev->print_name());
1263       queue_reserve_message(jcr);
1264       goto bail_out;
1265    }
1266
1267    if (dev->is_busy()) {
1268       Dmsg4(dbglvl, "Device %s is busy ST_READ=%d num_writers=%d reserved=%d.\n", 
1269          dev->print_name(),
1270          dev->state & ST_READ?1:0, dev->num_writers, dev->reserved_device);
1271       Mmsg(jcr->errmsg, _("3602 JobId=%u device %s is busy (already reading/writing).\n"),
1272             jcr->JobId, dev->print_name());
1273       queue_reserve_message(jcr);
1274       goto bail_out;
1275    }
1276
1277    dev->clear_append();
1278    dev->set_read();
1279    ok = true;
1280    dev->reserved_device++;
1281    Dmsg3(dbglvl, "Inc reserve=%d dev=%s %p\n", dev->reserved_device, dev->print_name(), dev);
1282    dcr->reserved_device = true;
1283
1284 bail_out:
1285    dev->dunlock();
1286    return ok;
1287 }
1288
1289
1290 /*
1291  * We reserve the device for appending by incrementing the 
1292  *  reserved_device. We do virtually all the same work that
1293  *  is done in acquire_device_for_append(), but we do
1294  *  not attempt to mount the device. This routine allows
1295  *  the DIR to reserve multiple devices before *really* 
1296  *  starting the job. It also permits the SD to refuse 
1297  *  certain devices (not up, ...).
1298  *
1299  * Note, in reserving a device, if the device is for the
1300  *  same pool and the same pool type, then it is acceptable.
1301  *  The Media Type has already been checked. If we are
1302  *  the first tor reserve the device, we put the pool
1303  *  name and pool type in the device record.
1304  */
1305 static bool reserve_device_for_append(DCR *dcr, RCTX &rctx)
1306 {
1307    JCR *jcr = dcr->jcr;
1308    DEVICE *dev = dcr->dev;
1309    bool ok = false;
1310
1311    ASSERT(dcr);
1312
1313    dev->dlock();
1314
1315    /* If device is being read, we cannot write it */
1316    if (dev->can_read()) {
1317       Mmsg(jcr->errmsg, _("3603 JobId=%u device %s is busy reading.\n"), 
1318          jcr->JobId, dev->print_name());
1319       Dmsg1(dbglvl, "%s", jcr->errmsg);
1320       queue_reserve_message(jcr);
1321       goto bail_out;
1322    }
1323
1324    /* If device is unmounted, we are out of luck */
1325    if (is_device_unmounted(dev)) {
1326       Mmsg(jcr->errmsg, _("3604 JobId=%u device %s is BLOCKED due to user unmount.\n"), 
1327          jcr->JobId, dev->print_name());
1328       Dmsg1(dbglvl, "%s", jcr->errmsg);
1329       queue_reserve_message(jcr);
1330       goto bail_out;
1331    }
1332
1333    Dmsg1(dbglvl, "reserve_append device is %s\n", dev->print_name());
1334
1335    /* Now do detailed tests ... */
1336    if (can_reserve_drive(dcr, rctx) != 1) {
1337       Dmsg0(dbglvl, "can_reserve_drive!=1\n");
1338       goto bail_out;
1339    }
1340
1341    dev->reserved_device++;
1342    Dmsg3(dbglvl, "Inc reserve=%d dev=%s %p\n", dev->reserved_device, 
1343       dev->print_name(), dev);
1344    dcr->reserved_device = true;
1345    ok = true;
1346
1347 bail_out:
1348    dev->dunlock();
1349    return ok;
1350 }
1351
1352 static int is_pool_ok(DCR *dcr)
1353 {
1354    DEVICE *dev = dcr->dev;
1355    JCR *jcr = dcr->jcr;
1356
1357    /* Now check if we want the same Pool and pool type */
1358    if (strcmp(dev->pool_name, dcr->pool_name) == 0 &&
1359        strcmp(dev->pool_type, dcr->pool_type) == 0) {
1360       /* OK, compatible device */
1361       Dmsg1(dbglvl, "OK dev: %s num_writers=0, reserved, pool matches\n", dev->print_name());
1362       return 1;
1363    } else {
1364       /* Drive Pool not suitable for us */
1365       Mmsg(jcr->errmsg, _(
1366 "3608 JobId=%u wants Pool=\"%s\" but have Pool=\"%s\" nreserve=%d on drive %s.\n"), 
1367             (uint32_t)jcr->JobId, dcr->pool_name, dev->pool_name,
1368             dev->reserved_device, dev->print_name());
1369       queue_reserve_message(jcr);
1370       Dmsg2(dbglvl, "failed: busy num_writers=0, reserved, pool=%s wanted=%s\n",
1371          dev->pool_name, dcr->pool_name);
1372    }
1373    return 0;
1374 }
1375
1376 static bool is_max_jobs_ok(DCR *dcr) 
1377 {
1378    DEVICE *dev = dcr->dev;
1379    JCR *jcr = dcr->jcr;
1380
1381    Dmsg4(dbglvl, "MaxJobs=%d Jobs=%d reserves=%d Vol=%s\n",
1382          dcr->VolCatInfo.VolCatMaxJobs,
1383          dcr->VolCatInfo.VolCatJobs, dev->reserved_device,
1384          dcr->VolumeName);
1385    if (dcr->VolCatInfo.VolCatMaxJobs > 0 && dcr->VolCatInfo.VolCatMaxJobs <=
1386         (dcr->VolCatInfo.VolCatJobs + dev->reserved_device)) {
1387       /* Max Job Vols depassed or already reserved */
1388       Mmsg(jcr->errmsg, _("3610 JobId=%u Volume max jobs exceeded on drive %s.\n"), 
1389             (uint32_t)jcr->JobId, dev->print_name());
1390       queue_reserve_message(jcr);
1391       Dmsg1(dbglvl, "reserve dev failed: %s", jcr->errmsg);
1392       return false;                /* wait */
1393    }
1394    return true;
1395 }
1396
1397 /*
1398  * Returns: 1 if drive can be reserved
1399  *          0 if we should wait
1400  *         -1 on error or impossibility
1401  */
1402 static int can_reserve_drive(DCR *dcr, RCTX &rctx) 
1403 {
1404    DEVICE *dev = dcr->dev;
1405    JCR *jcr = dcr->jcr;
1406
1407    Dmsg5(dbglvl, "PrefMnt=%d exact=%d suitable=%d chgronly=%d any=%d\n",
1408          rctx.PreferMountedVols, rctx.exact_match, rctx.suitable_device,
1409          rctx.autochanger_only, rctx.any_drive);
1410
1411    /* Check for max jobs on this Volume */
1412    if (!is_max_jobs_ok(dcr)) {
1413       return 0;
1414    }
1415
1416    /* setting any_drive overrides PreferMountedVols flag */
1417    if (!rctx.any_drive) {
1418       /*
1419        * When PreferMountedVols is set, we keep track of the 
1420        *  drive in use that has the least number of writers, then if
1421        *  no unmounted drive is found, we try that drive. This   
1422        *  helps spread the load to the least used drives.  
1423        */
1424       if (rctx.try_low_use_drive && dev == rctx.low_use_drive) {
1425          Dmsg2(dbglvl, "OK dev=%s == low_drive=%s.\n",
1426             dev->print_name(), rctx.low_use_drive->print_name());
1427          return 1;
1428       }
1429       /* If he wants a free drive, but this one is busy, no go */
1430       if (!rctx.PreferMountedVols && dev->is_busy()) {
1431          /* Save least used drive */
1432          if ((dev->num_writers + dev->reserved_device) < rctx.num_writers) {
1433             rctx.num_writers = dev->num_writers + dev->reserved_device;
1434             rctx.low_use_drive = dev;
1435             Dmsg2(dbglvl, "set low use drive=%s num_writers=%d\n", 
1436                dev->print_name(), rctx.num_writers);
1437          } else {
1438             Dmsg1(dbglvl, "not low use num_writers=%d\n", dev->num_writers+dev->reserved_device);
1439          }
1440          Dmsg0(dbglvl, "failed: !prefMnt && busy.\n");
1441          Mmsg(jcr->errmsg, _("3605 JobId=%u wants free drive but device %s is busy.\n"), 
1442             jcr->JobId, dev->print_name());
1443          queue_reserve_message(jcr);
1444          return 0;
1445       }
1446
1447       /* Check for prefer mounted volumes */
1448       if (rctx.PreferMountedVols && !dev->vol && dev->is_tape()) {
1449          Mmsg(jcr->errmsg, _("3606 JobId=%u prefers mounted drives, but drive %s has no Volume.\n"), 
1450             jcr->JobId, dev->print_name());
1451          queue_reserve_message(jcr);
1452          Dmsg0(dbglvl, "failed: want mounted -- no vol\n");
1453          return 0;                 /* No volume mounted */
1454       }
1455
1456       /* Check for exact Volume name match */
1457       /* ***FIXME*** for Disk, we can accept any volume that goes with this
1458        *    drive.
1459        */
1460       if (rctx.exact_match && rctx.have_volume) {
1461          bool ok;
1462          Dmsg5(dbglvl, "PrefMnt=%d exact=%d suitable=%d chgronly=%d any=%d\n",
1463                rctx.PreferMountedVols, rctx.exact_match, rctx.suitable_device,
1464                rctx.autochanger_only, rctx.any_drive);
1465          Dmsg4(dbglvl, "have_vol=%d have=%s resvol=%s want=%s\n",
1466                   rctx.have_volume, dev->VolHdr.VolumeName, 
1467                   dev->vol?dev->vol->vol_name:"*none*", rctx.VolumeName);
1468          ok = strcmp(dev->VolHdr.VolumeName, rctx.VolumeName) == 0 ||
1469                  (dev->vol && strcmp(dev->vol->vol_name, rctx.VolumeName) == 0);
1470          if (!ok) {
1471             Mmsg(jcr->errmsg, _("3607 JobId=%u wants Vol=\"%s\" drive has Vol=\"%s\" on drive %s.\n"), 
1472                jcr->JobId, rctx.VolumeName, dev->VolHdr.VolumeName, 
1473                dev->print_name());
1474             queue_reserve_message(jcr);
1475             Dmsg3(dbglvl, "not OK: dev have=%s resvol=%s want=%s\n",
1476                   dev->VolHdr.VolumeName, dev->vol?dev->vol->vol_name:"*none*", rctx.VolumeName);
1477             return 0;
1478          }
1479          if (is_volume_in_use(dcr)) {
1480             return 0;              /* fail if volume on another drive */
1481          }
1482       }
1483    }
1484
1485    /* Check for unused autochanger drive */
1486    if (rctx.autochanger_only && !dev->is_busy() &&
1487        dev->VolHdr.VolumeName[0] == 0) {
1488       /* Device is available but not yet reserved, reserve it for us */
1489       Dmsg1(dbglvl, "OK Res Unused autochanger %s.\n", dev->print_name());
1490       bstrncpy(dev->pool_name, dcr->pool_name, sizeof(dev->pool_name));
1491       bstrncpy(dev->pool_type, dcr->pool_type, sizeof(dev->pool_type));
1492       return 1;                       /* reserve drive */
1493    }
1494
1495    /*
1496     * Handle the case that there are no writers
1497     */
1498    if (dev->num_writers == 0) {
1499       /* Now check if there are any reservations on the drive */
1500       if (dev->reserved_device) {           
1501          return is_pool_ok(dcr);
1502       } else if (dev->can_append()) {
1503          if (is_pool_ok(dcr)) {
1504             return 1; 
1505          } else {
1506             /* Changing pool, unload old tape if any in drive */
1507             Dmsg0(dbglvl, "OK dev: num_writers=0, not reserved, pool change, unload changer\n");
1508             unload_autochanger(dcr, 0);
1509          }
1510       }
1511       /* Device is available but not yet reserved, reserve it for us */
1512       Dmsg1(dbglvl, "OK Dev avail reserved %s\n", dev->print_name());
1513       bstrncpy(dev->pool_name, dcr->pool_name, sizeof(dev->pool_name));
1514       bstrncpy(dev->pool_type, dcr->pool_type, sizeof(dev->pool_type));
1515       return 1;                       /* reserve drive */
1516    }
1517
1518    /*
1519     * Check if the device is in append mode with writers (i.e.
1520     *  available if pool is the same).
1521     */
1522    if (dev->can_append() || dev->num_writers > 0) {
1523       return is_pool_ok(dcr);
1524    } else {
1525       Pmsg1(000, _("Logic error!!!! JobId=%u Should not get here.\n"), (int)jcr->JobId);
1526       Mmsg(jcr->errmsg, _("3910 JobId=%u Logic error!!!! drive %s Should not get here.\n"),
1527             jcr->JobId, dev->print_name());
1528       queue_reserve_message(jcr);
1529       Jmsg0(jcr, M_FATAL, 0, _("Logic error!!!! Should not get here.\n"));
1530       return -1;                      /* error, should not get here */
1531    }
1532    Mmsg(jcr->errmsg, _("3911 JobId=%u failed reserve drive %s.\n"), 
1533          jcr->JobId, dev->print_name());
1534    queue_reserve_message(jcr);
1535    Dmsg1(dbglvl, "failed: No reserve %s\n", dev->print_name());
1536    return 0;
1537 }
1538
1539
1540
1541
1542 /*
1543  * Queue a reservation error or failure message for this jcr
1544  */
1545 static void queue_reserve_message(JCR *jcr)
1546 {
1547    int i;   
1548    alist *msgs;
1549    char *msg;
1550
1551    jcr->lock();
1552
1553    msgs = jcr->reserve_msgs;
1554    if (!msgs) {
1555       goto bail_out;
1556    }
1557    /*
1558     * Look for duplicate message.  If found, do
1559     * not insert
1560     */
1561    for (i=msgs->size()-1; i >= 0; i--) {
1562       msg = (char *)msgs->get(i);
1563       if (!msg) {
1564          goto bail_out;
1565       }
1566       /* Comparison based on 4 digit message number */
1567       if (strncmp(msg, jcr->errmsg, 4) == 0) {
1568          goto bail_out;
1569       }
1570    }      
1571    /* Message unique, so insert it */
1572    jcr->reserve_msgs->push(bstrdup(jcr->errmsg));
1573
1574 bail_out:
1575    jcr->unlock();
1576 }
1577
1578 /*
1579  * Send any reservation messages queued for this jcr
1580  */
1581 void send_drive_reserve_messages(JCR *jcr, void sendit(const char *msg, int len, void *sarg), void *arg)
1582 {
1583    int i;
1584    alist *msgs;
1585    char *msg;
1586
1587    jcr->lock();
1588    msgs = jcr->reserve_msgs;
1589    if (!msgs || msgs->size() == 0) {
1590       goto bail_out;
1591    }
1592    for (i=msgs->size()-1; i >= 0; i--) {
1593       msg = (char *)msgs->get(i);
1594       if (msg) {
1595          sendit("   ", 3, arg);
1596          sendit(msg, strlen(msg), arg);
1597       } else {
1598          break;
1599       }
1600    }
1601
1602 bail_out:
1603    jcr->unlock();
1604 }
1605
1606 /*
1607  * Pop and release any reservations messages
1608  */
1609 static void pop_reserve_messages(JCR *jcr)
1610 {
1611    alist *msgs;
1612    char *msg;
1613
1614    jcr->lock();
1615    msgs = jcr->reserve_msgs;
1616    if (!msgs) {
1617       goto bail_out;
1618    }
1619    while ((msg = (char *)msgs->pop())) {
1620       free(msg);
1621    }
1622 bail_out:
1623    jcr->unlock();
1624 }
1625
1626 /*
1627  * Also called from acquire.c 
1628  */
1629 void release_reserve_messages(JCR *jcr)
1630 {
1631    pop_reserve_messages(jcr);
1632    jcr->lock();
1633    if (!jcr->reserve_msgs) {
1634       goto bail_out;
1635    }
1636    delete jcr->reserve_msgs;
1637    jcr->reserve_msgs = NULL;
1638
1639 bail_out:
1640    jcr->unlock();
1641 }