]> git.sur5r.net Git - bacula/bacula/blob - bacula/src/stored/reserve.c
Correct a problem where the maximum concurrent storage jobs counter gets out of sync...
[bacula/bacula] / bacula / src / stored / reserve.c
1 /*
2    Bacula® - The Network Backup Solution
3
4    Copyright (C) 2000-2007 Free Software Foundation Europe e.V.
5
6    The main author of Bacula is Kern Sibbald, with contributions from
7    many others, a complete list can be found in the file AUTHORS.
8    This program is Free Software; you can redistribute it and/or
9    modify it under the terms of version two of the GNU General Public
10    License as published by the Free Software Foundation and included
11    in the file LICENSE.
12
13    This program is distributed in the hope that it will be useful, but
14    WITHOUT ANY WARRANTY; without even the implied warranty of
15    MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE. See the GNU
16    General Public License for more details.
17
18    You should have received a copy of the GNU General Public License
19    along with this program; if not, write to the Free Software
20    Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA
21    02110-1301, USA.
22
23    Bacula® is a registered trademark of John Walker.
24    The licensor of Bacula is the Free Software Foundation Europe
25    (FSFE), Fiduciary Program, Sumatrastrasse 25, 8006 Zürich,
26    Switzerland, email:ftf@fsfeurope.org.
27 */
28 /*
29  *   Drive reservation functions for Storage Daemon
30  *
31  *   Kern Sibbald, MM
32  *
33  *   Split from job.c and acquire.c June 2005
34  *
35  *   Version $Id$
36  *
37  */
38
39 #include "bacula.h"
40 #include "stored.h"
41
42 const int dbglvl =  50;
43
44 static dlist *vol_list = NULL;
45 static brwlock_t reservation_lock;
46 static brwlock_t vol_list_lock;
47
48 /* Forward referenced functions */
49 static int can_reserve_drive(DCR *dcr, RCTX &rctx);
50 static int reserve_device(RCTX &rctx);
51 static bool reserve_device_for_read(DCR *dcr);
52 static bool reserve_device_for_append(DCR *dcr, RCTX &rctx);
53 static bool use_storage_cmd(JCR *jcr);
54 static void queue_reserve_message(JCR *jcr);
55 static void pop_reserve_messages(JCR *jcr);
56
57 /* Requests from the Director daemon */
58 static char use_storage[]  = "use storage=%127s media_type=%127s "
59    "pool_name=%127s pool_type=%127s append=%d copy=%d stripe=%d\n";
60 static char use_device[]  = "use device=%127s\n";
61
62 /* Responses sent to Director daemon */
63 static char OK_device[] = "3000 OK use device device=%s\n";
64 static char NO_device[] = "3924 Device \"%s\" not in SD Device resources.\n";
65 static char BAD_use[]   = "3913 Bad use command: %s\n";
66
67 bool use_cmd(JCR *jcr) 
68 {
69    /*
70     * Get the device, media, and pool information
71     */
72    if (!use_storage_cmd(jcr)) {
73       set_jcr_job_status(jcr, JS_ErrorTerminated);
74       memset(jcr->sd_auth_key, 0, strlen(jcr->sd_auth_key));
75       return false;
76    }
77    return true;
78 }
79
80 static int my_compare(void *item1, void *item2)
81 {
82    return strcmp(((VOLRES *)item1)->vol_name, ((VOLRES *)item2)->vol_name);
83 }
84
85
86 void init_reservations_lock()
87 {
88    int errstat;
89    if ((errstat=rwl_init(&reservation_lock)) != 0) {
90       berrno be;
91       Emsg1(M_ABORT, 0, _("Unable to initialize reservation lock. ERR=%s\n"),
92             be.bstrerror(errstat));
93    }
94
95    if ((errstat=rwl_init(&vol_list_lock)) != 0) {
96       berrno be;
97       Emsg1(M_ABORT, 0, _("Unable to initialize volume list lock. ERR=%s\n"),
98             be.bstrerror(errstat));
99    }
100 }
101
102 void term_reservations_lock()
103 {
104    rwl_destroy(&reservation_lock);
105    rwl_destroy(&vol_list_lock);
106 }
107
108 int reservations_lock_count = 0;
109
110 /* This applies to a drive and to Volumes */
111 void _lock_reservations()
112 {
113    int errstat;
114    reservations_lock_count++;
115    if ((errstat=rwl_writelock(&reservation_lock)) != 0) {
116       berrno be;
117       Emsg2(M_ABORT, 0, "rwl_writelock failure. stat=%d: ERR=%s\n",
118            errstat, be.bstrerror(errstat));
119    }
120 }
121
122 void _unlock_reservations()
123 {
124    int errstat;
125    reservations_lock_count--;
126    if ((errstat=rwl_writeunlock(&reservation_lock)) != 0) {
127       berrno be;
128       Emsg2(M_ABORT, 0, "rwl_writeunlock failure. stat=%d: ERR=%s\n",
129            errstat, be.bstrerror(errstat));
130    }
131 }
132
133 int vol_list_lock_count = 0;
134
135 void _lock_volumes()
136 {
137    int errstat;
138    vol_list_lock_count++;
139    if ((errstat=rwl_writelock(&vol_list_lock)) != 0) {
140       berrno be;
141       Emsg2(M_ABORT, 0, "rwl_writelock failure. stat=%d: ERR=%s\n",
142            errstat, be.bstrerror(errstat));
143    }
144 }
145
146 void _unlock_volumes()
147 {
148    int errstat;
149    vol_list_lock_count--;
150    if ((errstat=rwl_writeunlock(&vol_list_lock)) != 0) {
151       berrno be;
152       Emsg2(M_ABORT, 0, "rwl_writeunlock failure. stat=%d: ERR=%s\n",
153            errstat, be.bstrerror(errstat));
154    }
155 }
156
157
158 /*
159  * List Volumes -- this should be moved to status.c
160  */
161 enum {
162    debug_lock = true,
163    debug_nolock = false
164 };
165
166 static void debug_list_volumes(const char *imsg)
167 {
168    VOLRES *vol;
169    POOL_MEM msg(PM_MESSAGE);
170
171    lock_volumes();
172    foreach_dlist(vol, vol_list) {
173       if (vol->dev) {
174          Mmsg(msg, "List from %s: %s at %p on device %s\n", imsg, 
175               vol->vol_name, vol->vol_name, vol->dev->print_name());
176       } else {
177          Mmsg(msg, "List from %s: %s at %p no dev\n", imsg, vol->vol_name, vol->vol_name);
178       }
179       Dmsg1(dbglvl, "%s", msg.c_str());
180    }
181
182 #ifdef xxx
183    DEVICE *dev = NULL;
184    foreach_dlist(vol, vol_list) {
185       if (vol->dev == dev) {
186          Dmsg0(dbglvl, "Two Volumes on same device.\n");
187          ASSERT(0);
188          dev = vol->dev;
189       }
190    }
191 #endif
192
193 // Dmsg2(dbglvl, "List from %s: %d volumes\n", imsg, count);
194    unlock_volumes();
195 }
196
197
198 /*
199  * List Volumes -- this should be moved to status.c
200  */
201 void list_volumes(void sendit(const char *msg, int len, void *sarg), void *arg)
202 {
203    VOLRES *vol;
204    POOL_MEM msg(PM_MESSAGE);
205    int len;
206
207    lock_volumes();
208    foreach_dlist(vol, vol_list) {
209       DEVICE *dev = vol->dev;
210       if (dev) {
211          len = Mmsg(msg, "%s on device %s\n", vol->vol_name, dev->print_name());
212          sendit(msg.c_str(), len, arg);
213          len = Mmsg(msg, "    Reader=%d writers=%d reserved=%d released=%d\n", 
214             dev->can_read()?1:0, dev->num_writers, dev->reserved_device, vol->released);
215          sendit(msg.c_str(), len, arg);
216       } else {
217          len = Mmsg(msg, "%s no device. released=%d\n", vol->vol_name, vol->released);
218          sendit(msg.c_str(), len, arg);
219       }
220    }
221    unlock_volumes();
222 }
223
224 /*
225  * Create a Volume item to put in the Volume list
226  *   Ensure that the device points to it.
227  */
228 static VOLRES *new_vol_item(DCR *dcr, const char *VolumeName)
229 {
230    VOLRES *vol;
231    vol = (VOLRES *)malloc(sizeof(VOLRES));
232    memset(vol, 0, sizeof(VOLRES));
233    vol->vol_name = bstrdup(VolumeName);
234    vol->dev = dcr->dev;
235    Dmsg3(dbglvl, "new Vol=%s at %p dev=%s\n",
236          VolumeName, vol->vol_name, vol->dev->print_name());
237    return vol;
238 }
239
240 static void free_vol_item(VOLRES *vol)
241 {
242    free(vol->vol_name);
243    if (vol->dev) {
244       vol->dev->vol = NULL;
245    }
246    free(vol);
247 }
248
249
250 /*
251  * Put a new Volume entry in the Volume list. This
252  *  effectively reserves the volume so that it will
253  *  not be mounted again.
254  *
255  * If the device has any current volume associated with it,
256  *  and it is a different Volume, and the device is not busy,
257  *  we release the old Volume item and insert the new one.
258  * 
259  * It is assumed that the device is free and locked so that
260  *  we can change the device structure.
261  *
262  * Some details of the Volume list handling:
263  *
264  *  1. The Volume list entry must be attached to the drive (rather than 
265  *       attached to a job as it currently is. I.e. the drive that "owns" 
266  *       the volume (reserved, in use, mounted)
267  *       must point to the volume (still to be maintained in a list).
268  *
269  *  2. The Volume is entered in the list when a drive is reserved.  
270  *
271  *  3. When a drive is in use, the device code must appropriately update the
272  *      volume name as it changes (currently the list is static -- an entry is
273  *      removed when the Volume is no longer reserved, in use or mounted).  
274  *      The new code must keep the same list entry as long as the drive
275  *       has any volume associated with it but the volume name in the list
276  *       must be updated when the drive has a different volume mounted.
277  *
278  *  4. A job that has reserved a volume, can un-reserve the volume, and if the 
279  *      volume is not mounted, and not reserved, and not in use, it will be
280  *      removed from the list.
281  *
282  *  5. If a job wants to reserve a drive with a different Volume from the one on
283  *      the drive, it can re-use the drive for the new Volume.
284  *
285  *  6. If a job wants a Volume that is in a different drive, it can either use the
286  *      other drive or take the volume, only if the other drive is not in use or
287  *      not reserved.
288  *
289  *  One nice aspect of this is that the reserve use count and the writer use count 
290  *  already exist and are correctly programmed and will need no changes -- use 
291  *  counts are always very tricky.
292  *
293  *  The old code had a concept of "reserving" a Volume, but was changed 
294  *  to reserving and using a drive.  A volume is must be attached to (owned by) a 
295  *  drive and can move from drive to drive or be unused given certain specific 
296  *  conditions of the drive.  The key is that the drive must "own" the Volume.  
297  *  The old code had the job (dcr) owning the volume (more or less).  The job was
298  *  to change the insertion and removal of the volumes from the list to be based 
299  *  on the drive rather than the job.  
300  *
301  *  Return: VOLRES entry on success
302  *          NULL volume busy on another drive
303  */
304 VOLRES *reserve_volume(DCR *dcr, const char *VolumeName)
305 {
306    VOLRES *vol, *nvol;
307    DEVICE *dev = dcr->dev;
308
309    ASSERT(dev != NULL);
310
311    Dmsg1(dbglvl, "reserve_volume %s\n", VolumeName);
312    /* 
313     * We lock the reservations system here to ensure
314     *  when adding a new volume that no newly scheduled
315     *  job can reserve it.
316     */
317    lock_volumes();
318    debug_list_volumes("begin reserve_volume");
319    /* 
320     * First, remove any old volume attached to this device as it
321     *  is no longer used.
322     */
323    if (dev->vol) {
324       vol = dev->vol;
325       /*
326        * Make sure we don't remove the current volume we are inserting
327        *  because it was probably inserted by another job.
328        */
329       if (strcmp(vol->vol_name, VolumeName) == 0) {
330          Dmsg1(dbglvl, "OK, vol=%s on device.\n", VolumeName);
331          goto get_out;                  /* Volume already on this device */
332       } else {
333          Dmsg2(dbglvl, "reserve_vol free vol=%s at %p\n", vol->vol_name, vol->vol_name);
334          vol_list->remove(vol);
335          free_vol_item(vol);
336          debug_list_volumes("reserve_vol free");
337       }
338    }
339
340    /* Create a new Volume entry */
341    nvol = new_vol_item(dcr, VolumeName);
342
343    /*
344     * Now try to insert the new Volume
345     */
346    vol = (VOLRES *)vol_list->binary_insert(nvol, my_compare);
347    if (vol != nvol) {
348       Dmsg2(dbglvl, "Found vol=%s dev-same=%d\n", vol->vol_name, dev==vol->dev);
349       /*
350        * At this point, a Volume with this name already is in the list,
351        *   so we simply release our new Volume entry. Note, this should
352        *   only happen if we are moving the volume from one drive to another.
353        */
354       Dmsg2(dbglvl, "reserve_vol free-tmp vol=%s at %p\n", 
355             vol->vol_name, vol->vol_name);
356       /*
357        * Clear dev pointer so that free_vol_item() doesn't 
358        *  take away our volume. 
359        */
360       nvol->dev = NULL;                   /* don't zap dev entry */
361       free_vol_item(nvol);
362
363       /* Check if we are trying to use the Volume on a different drive */
364       if (dev != vol->dev) {
365          /* Caller wants to switch Volume to another device */
366          if (!vol->dev->is_busy()) {
367             /* OK to move it -- I'm not sure this will work */
368             Dmsg3(dbglvl, "==== Swap vol=%s from dev=%s to %s\n", VolumeName,
369                vol->dev->print_name(), dev->print_name());
370             vol->dev->vol = NULL;         /* take vol from old drive */
371             vol->dev->VolHdr.VolumeName[0] = 0;
372             vol->dev = dev;               /* point vol at new drive */
373             dev->vol = vol;               /* point dev at vol */
374             dev->VolHdr.VolumeName[0] = 0;
375          } else {
376             Dmsg3(dbglvl, "Volume busy could not swap vol=%s from dev=%s to %s\n", 
377                VolumeName, vol->dev->print_name(), dev->print_name());
378             vol = NULL;                /* device busy */
379             goto get_out;
380          }
381       }
382    }
383    dev->vol = vol;
384
385 get_out:
386    if (vol) {
387       vol->released = false;
388    }
389    debug_list_volumes("end new volume");
390    unlock_volumes();
391    return vol;
392 }
393
394 /*
395  * Search for a Volume name in the Volume list.
396  *
397  *  Returns: VOLRES entry on success
398  *           NULL if the Volume is not in the list
399  */
400 VOLRES *find_volume(DCR *dcr)
401 {
402    VOLRES vol, *fvol;
403    /* Do not lock reservations here */
404    lock_volumes();
405    vol.vol_name = bstrdup(dcr->VolumeName);
406    fvol = (VOLRES *)vol_list->binary_search(&vol, my_compare);
407    free(vol.vol_name);
408    Dmsg2(dbglvl, "find_vol=%s found=%d\n", dcr->VolumeName, fvol!=NULL);
409    debug_list_volumes("find_volume");
410    unlock_volumes();
411    return fvol;
412 }
413
414 /* 
415  * Remove any reservation from a drive and tell the system
416  *  that the volume is unused at least by us.
417  */
418 void unreserve_device(DCR *dcr)
419 {
420    DEVICE *dev = dcr->dev;
421    if (dcr->reserved_device) {
422       dcr->reserved_device = false;
423       dev->reserved_device--;
424       Dmsg2(dbglvl, "Dec reserve=%d dev=%s\n", dev->reserved_device, dev->print_name());
425       dcr->reserved_device = false;
426       /* If we set read mode in reserving, remove it */
427       if (dev->can_read()) {
428          dev->clear_read();
429       }
430       if (dev->num_writers < 0) {
431          Jmsg1(dcr->jcr, M_ERROR, 0, _("Hey! num_writers=%d!!!!\n"), dev->num_writers);
432          dev->num_writers = 0;
433       }
434    }
435
436    volume_unused(dcr);
437 }
438
439 /*  
440  * Free a Volume from the Volume list if it is no longer used
441  *
442  *  Returns: true if the Volume found and removed from the list
443  *           false if the Volume is not in the list or is in use
444  */
445 bool volume_unused(DCR *dcr)
446 {
447    DEVICE *dev = dcr->dev;
448
449    if (dev->vol == NULL) {
450       Dmsg1(dbglvl, "vol_unused: no vol on %s\n", dev->print_name());
451       debug_list_volumes("null vol cannot unreserve_volume");
452       return false;
453    }
454
455    if (dev->is_busy()) {
456       Dmsg1(dbglvl, "vol_unused: busy on %s\n", dev->print_name());
457       debug_list_volumes("dev busy cannot unreserve_volume");
458       return false;
459    }
460
461    /*  
462     * If this is a tape, we do not free the volume, rather we wait
463     *  until the autoloader unloads it, or until another tape is
464     *  explicitly read in this drive. This allows the SD to remember
465     *  where the tapes are or last were.
466     */
467    dev->vol->released = true;
468    if (dev->is_tape() || dev->is_autochanger()) {
469       return true;
470    } else {
471       return free_volume(dev);
472    }
473 }
474
475 /*
476  * Unconditionally release the volume
477  */
478 bool free_volume(DEVICE *dev)
479 {
480    VOLRES *vol;
481
482    if (dev->vol == NULL) {
483       Dmsg1(dbglvl, "No vol on dev %s\n", dev->print_name());
484       return false;
485    }
486    lock_volumes();
487    vol = dev->vol;
488    dev->vol = NULL;
489    vol_list->remove(vol);
490    Dmsg2(dbglvl, "free_volume %s dev=%s\n", vol->vol_name, dev->print_name());
491    free_vol_item(vol);
492    debug_list_volumes("free_volume");
493    unlock_volumes();
494    return vol != NULL;
495 }
496
497       
498 /* Create the Volume list */
499 void create_volume_list()
500 {
501    VOLRES *vol = NULL;
502    if (vol_list == NULL) {
503       vol_list = New(dlist(vol, &vol->link));
504    }
505 }
506
507 /* Release all Volumes from the list */
508 void free_volume_list()
509 {
510    VOLRES *vol;
511    if (!vol_list) {
512       return;
513    }
514    lock_volumes();
515    foreach_dlist(vol, vol_list) {
516       if (vol->dev) {
517          Dmsg2(dbglvl, "free vol_list Volume=%s dev=%s\n", vol->vol_name, vol->dev->print_name());
518       } else {
519          Dmsg1(dbglvl, "free vol_list Volume=%s No dev\n", vol->vol_name);
520       }
521       free(vol->vol_name);
522       vol->vol_name = NULL;
523    }
524    delete vol_list;
525    vol_list = NULL;
526    unlock_volumes();
527 }
528
529 bool is_volume_in_use(DCR *dcr)
530 {
531    VOLRES *vol = find_volume(dcr);
532    if (!vol) {
533       Dmsg1(dbglvl, "Vol=%s not in use.\n", dcr->VolumeName);
534       return false;                   /* vol not in list */
535    }
536    ASSERT(vol->dev != NULL);
537
538    if (dcr->dev == vol->dev) {        /* same device OK */
539       Dmsg1(dbglvl, "Vol=%s on same dev.\n", dcr->VolumeName);
540       return false;
541    } else {
542       Dmsg3(dbglvl, "Vol=%s on %s we have %s\n", dcr->VolumeName,
543             vol->dev->print_name(), dcr->dev->print_name());
544    }
545    if (!vol->dev->is_busy()) {
546       Dmsg2(dbglvl, "Vol=%s dev=%s not busy.\n", dcr->VolumeName, vol->dev->print_name());
547       return false;
548    } else {
549       Dmsg2(dbglvl, "Vol=%s dev=%s busy.\n", dcr->VolumeName, vol->dev->print_name());
550    }
551    Dmsg2(dbglvl, "Vol=%s in use by %s.\n", dcr->VolumeName, vol->dev->print_name());
552    return true;
553 }
554
555
556 /*
557  * We get the following type of information:
558  *
559  * use storage=xxx media_type=yyy pool_name=xxx pool_type=yyy append=1 copy=0 strip=0
560  *  use device=zzz
561  *  use device=aaa
562  *  use device=bbb
563  * use storage=xxx media_type=yyy pool_name=xxx pool_type=yyy append=0 copy=0 strip=0
564  *  use device=bbb
565  *
566  */
567 static bool use_storage_cmd(JCR *jcr)
568 {
569    POOL_MEM store_name, dev_name, media_type, pool_name, pool_type;
570    BSOCK *dir = jcr->dir_bsock;
571    int append;
572    bool ok;       
573    int Copy, Stripe;
574    DIRSTORE *store;
575    RCTX rctx;
576    alist *dirstore;
577
578    memset(&rctx, 0, sizeof(RCTX));
579    rctx.jcr = jcr;
580    /*
581     * If there are multiple devices, the director sends us
582     *   use_device for each device that it wants to use.
583     */
584    dirstore = New(alist(10, not_owned_by_alist));
585    jcr->reserve_msgs = New(alist(10, not_owned_by_alist));  
586    do {
587       Dmsg1(dbglvl, "<dird: %s", dir->msg);
588       ok = sscanf(dir->msg, use_storage, store_name.c_str(), 
589                   media_type.c_str(), pool_name.c_str(), 
590                   pool_type.c_str(), &append, &Copy, &Stripe) == 7;
591       if (!ok) {
592          break;
593       }
594       if (append) {
595          jcr->write_store = dirstore;
596       } else {
597          jcr->read_store = dirstore;
598       }
599       rctx.append = append;
600       unbash_spaces(store_name);
601       unbash_spaces(media_type);
602       unbash_spaces(pool_name);
603       unbash_spaces(pool_type);
604       store = new DIRSTORE;
605       dirstore->append(store);
606       memset(store, 0, sizeof(DIRSTORE));
607       store->device = New(alist(10));
608       bstrncpy(store->name, store_name, sizeof(store->name));
609       bstrncpy(store->media_type, media_type, sizeof(store->media_type));
610       bstrncpy(store->pool_name, pool_name, sizeof(store->pool_name));
611       bstrncpy(store->pool_type, pool_type, sizeof(store->pool_type));
612       store->append = append;
613
614       /* Now get all devices */
615       while (dir->recv() >= 0) {
616          Dmsg1(dbglvl, "<dird device: %s", dir->msg);
617          ok = sscanf(dir->msg, use_device, dev_name.c_str()) == 1;
618          if (!ok) {
619             break;
620          }
621          unbash_spaces(dev_name);
622          store->device->append(bstrdup(dev_name.c_str()));
623       }
624    }  while (ok && dir->recv() >= 0);
625
626    /* Developer debug code */
627    char *device_name;
628    if (debug_level >= dbglvl) {
629       foreach_alist(store, dirstore) {
630          Dmsg5(dbglvl, "Storage=%s media_type=%s pool=%s pool_type=%s append=%d\n", 
631             store->name, store->media_type, store->pool_name, 
632             store->pool_type, store->append);
633          foreach_alist(device_name, store->device) {
634             Dmsg1(dbglvl, "     Device=%s\n", device_name);
635          }
636       }
637    }
638
639    init_jcr_device_wait_timers(jcr);
640    jcr->dcr = new_dcr(jcr, NULL, NULL);         /* get a dcr */
641    if (!jcr->dcr) {
642       BSOCK *dir = jcr->dir_bsock;
643       dir->fsend(_("3939 Could not get dcr\n"));
644       Dmsg1(dbglvl, ">dird: %s", dir->msg);
645       ok = false;
646    }
647    /*                    
648     * At this point, we have a list of all the Director's Storage
649     *  resources indicated for this Job, which include Pool, PoolType,
650     *  storage name, and Media type.     
651     * Then for each of the Storage resources, we have a list of
652     *  device names that were given.
653     *
654     * Wiffle through them and find one that can do the backup.
655     */
656    if (ok) {
657       int wait_for_device_retries = 0;  
658       int repeat = 0;
659       bool fail = false;
660       rctx.notify_dir = true;
661
662       lock_reservations();
663       for ( ; !fail && !job_canceled(jcr); ) {
664          pop_reserve_messages(jcr);
665          rctx.suitable_device = false;
666          rctx.have_volume = false;
667          rctx.VolumeName[0] = 0;
668          rctx.any_drive = false;
669          if (!jcr->PreferMountedVols) {
670             /*
671              * Here we try to find a drive that is not used.
672              * This will maximize the use of available drives.
673              *
674              */
675             rctx.num_writers = 20000000;   /* start with impossible number */
676             rctx.low_use_drive = NULL;
677             rctx.PreferMountedVols = false;                
678             rctx.exact_match = false;
679             rctx.autochanger_only = true;
680             Dmsg5(dbglvl, "PrefMnt=%d exact=%d suitable=%d chgronly=%d any=%d\n",
681                rctx.PreferMountedVols, rctx.exact_match, rctx.suitable_device,
682                rctx.autochanger_only, rctx.any_drive);
683             if ((ok = find_suitable_device_for_job(jcr, rctx))) {
684                break;
685             }
686             /* Look through all drives possibly for low_use drive */
687             if (rctx.low_use_drive) {
688                rctx.try_low_use_drive = true;
689                if ((ok = find_suitable_device_for_job(jcr, rctx))) {
690                   break;
691                }
692                rctx.try_low_use_drive = false;
693             }
694             rctx.autochanger_only = false;
695             Dmsg5(dbglvl, "PrefMnt=%d exact=%d suitable=%d chgronly=%d any=%d\n",
696                rctx.PreferMountedVols, rctx.exact_match, rctx.suitable_device,
697                rctx.autochanger_only, rctx.any_drive);
698             if ((ok = find_suitable_device_for_job(jcr, rctx))) {
699                break;
700             }
701          }
702          /*
703           * Now we look for a drive that may or may not be in
704           *  use.
705           */
706          /* Look for an exact Volume match all drives */
707          rctx.PreferMountedVols = true;
708          rctx.exact_match = true;
709          rctx.autochanger_only = false;
710          Dmsg5(dbglvl, "PrefMnt=%d exact=%d suitable=%d chgronly=%d any=%d\n",
711             rctx.PreferMountedVols, rctx.exact_match, rctx.suitable_device,
712             rctx.autochanger_only, rctx.any_drive);
713          if ((ok = find_suitable_device_for_job(jcr, rctx))) {
714             break;
715          }
716          /* Look for any mounted drive */
717          rctx.exact_match = false;
718          Dmsg5(dbglvl, "PrefMnt=%d exact=%d suitable=%d chgronly=%d any=%d\n",
719             rctx.PreferMountedVols, rctx.exact_match, rctx.suitable_device,
720             rctx.autochanger_only, rctx.any_drive);
721          if ((ok = find_suitable_device_for_job(jcr, rctx))) {
722             break;
723          }
724          /* Try any drive */
725          rctx.any_drive = true;
726          Dmsg5(dbglvl, "PrefMnt=%d exact=%d suitable=%d chgronly=%d any=%d\n",
727             rctx.PreferMountedVols, rctx.exact_match, rctx.suitable_device,
728             rctx.autochanger_only, rctx.any_drive);
729          if ((ok = find_suitable_device_for_job(jcr, rctx))) {
730             break;
731          }
732          /* Keep reservations locked *except* during wait_for_device() */
733          unlock_reservations();
734          /*     
735           * The idea of looping on repeat a few times it to ensure
736           * that if there is some subtle timing problem between two
737           * jobs, we will simply try again, and most likely succeed.
738           * This can happen if one job reserves a drive or finishes using
739           * a drive at the same time a second job wants it.
740           */
741          if (repeat++ > 1) {              /* try algorithm 3 times */
742             bmicrosleep(30, 0);           /* wait a bit */
743             Dmsg0(dbglvl, "repeat reserve algorithm\n");
744          } else if (!rctx.suitable_device || !wait_for_device(jcr, wait_for_device_retries)) {
745             Dmsg0(dbglvl, "Fail. !suitable_device || !wait_for_device\n");
746             fail = true;
747          }   
748          lock_reservations();
749          dir->signal(BNET_HEARTBEAT);  /* Inform Dir that we are alive */
750       }
751       unlock_reservations();
752       if (!ok) {
753          /*
754           * If we get here, there are no suitable devices available, which
755           *  means nothing configured.  If a device is suitable but busy
756           *  with another Volume, we will not come here.
757           */
758          unbash_spaces(dir->msg);
759          pm_strcpy(jcr->errmsg, dir->msg);
760          Jmsg(jcr, M_INFO, 0, _("Failed command: %s\n"), jcr->errmsg);
761          Jmsg(jcr, M_FATAL, 0, _("\n"
762             "     Device \"%s\" with MediaType \"%s\" requested by DIR not found in SD Device resources.\n"),
763               dev_name.c_str(), media_type.c_str());
764          dir->fsend(NO_device, dev_name.c_str());
765
766          Dmsg1(dbglvl, ">dird: %s", dir->msg);
767       }
768    } else {
769       unbash_spaces(dir->msg);
770       pm_strcpy(jcr->errmsg, dir->msg);
771       Jmsg(jcr, M_FATAL, 0, _("Failed command: %s\n"), jcr->errmsg);
772       dir->fsend(BAD_use, jcr->errmsg);
773       Dmsg1(dbglvl, ">dird: %s", dir->msg);
774    }
775
776    release_reserve_messages(jcr);
777    return ok;
778 }
779
780
781 /*
782  * Walk through the autochanger resources and check if
783  *  the volume is in one of them.
784  * 
785  * Returns:  true  if volume is in device
786  *           false otherwise
787  */
788 static bool is_vol_in_autochanger(RCTX &rctx, VOLRES *vol)
789 {
790    AUTOCHANGER *changer = vol->dev->device->changer_res;
791
792    /* Find resource, and make sure we were able to open it */
793    if (strcmp(rctx.device_name, changer->hdr.name) == 0) {
794       Dmsg1(dbglvl, "Found changer device %s\n", vol->dev->device->hdr.name);
795       return true;
796    }  
797    Dmsg1(dbglvl, "Incorrect changer device %s\n", changer->hdr.name);
798    return false;
799 }
800
801 /*
802  * Search for a device suitable for this job.
803  */
804 bool find_suitable_device_for_job(JCR *jcr, RCTX &rctx)
805 {
806    bool ok = false;
807    DIRSTORE *store;
808    char *device_name;
809    alist *dirstore;
810    DCR *dcr = jcr->dcr;
811
812    if (rctx.append) {
813       dirstore = jcr->write_store;
814    } else {
815       dirstore = jcr->read_store;
816    }
817    Dmsg4(dbglvl, "PrefMnt=%d exact=%d suitable=%d chgronly=%d\n",
818       rctx.PreferMountedVols, rctx.exact_match, rctx.suitable_device,
819       rctx.autochanger_only);
820
821    /* 
822     * If the appropriate conditions of this if are met, namely that
823     *  we are appending and the user wants mounted drive (or we
824     *  force try a mounted drive because they are all busy), we
825     *  start by looking at all the Volumes in the volume list.
826     */
827    if (!vol_list->empty() && rctx.append && rctx.PreferMountedVols) {
828       dlist *temp_vol_list, *save_vol_list;
829       VOLRES *vol = NULL;
830       lock_volumes();
831       Dmsg0(dbglvl, "lock volumes\n");                           
832
833       /*  
834        * Create a temporary copy of the volume list.  We do this,
835        *   to avoid having the volume list locked during the
836        *   call to reserve_device(), which would cause a deadlock.
837        * Note, we may want to add an update counter on the vol_list
838        *   so that if it is modified while we are traversing the copy
839        *   we can take note and act accordingly (probably redo the 
840        *   search at least a few times).
841        */
842       Dmsg0(dbglvl, "duplicate vol list\n");
843       temp_vol_list = New(dlist(vol, &vol->link));
844       foreach_dlist(vol, vol_list) {
845          VOLRES *nvol;
846          VOLRES *tvol = (VOLRES *)malloc(sizeof(VOLRES));
847          memset(tvol, 0, sizeof(VOLRES));
848          tvol->vol_name = bstrdup(vol->vol_name);
849          tvol->dev = vol->dev;
850          nvol = (VOLRES *)temp_vol_list->binary_insert(tvol, my_compare);
851          if (tvol != nvol) {
852             tvol->dev = NULL;                   /* don't zap dev entry */
853             free_vol_item(tvol);
854             Pmsg0(000, "Logic error. Duplicating vol list hit duplicate.\n");
855             Jmsg(jcr, M_WARNING, 0, "Logic error. Duplicating vol list hit duplicate.\n");
856          }
857       }
858       Dmsg0(dbglvl, "unlock volumes\n");
859       unlock_volumes();
860
861       /* Look through reserved volumes for one we can use */
862       Dmsg0(dbglvl, "look for vol in vol list\n");
863       foreach_dlist(vol, temp_vol_list) {
864          if (!vol->dev) {
865             Dmsg1(dbglvl, "vol=%s no dev\n", vol->vol_name);
866             continue;
867          }
868          /* Check with Director if this Volume is OK */
869          bstrncpy(dcr->VolumeName, vol->vol_name, sizeof(dcr->VolumeName));
870          if (!dir_get_volume_info(dcr, GET_VOL_INFO_FOR_WRITE)) {
871             continue;
872          }
873
874          Dmsg1(dbglvl, "vol=%s OK for this job\n", vol->vol_name);
875          foreach_alist(store, dirstore) {
876             int stat;
877             rctx.store = store;
878             foreach_alist(device_name, store->device) {
879                /* Found a device, try to use it */
880                rctx.device_name = device_name;
881                rctx.device = vol->dev->device;
882
883                if (vol->dev->is_autochanger()) {
884                   Dmsg1(dbglvl, "vol=%s is in changer\n", vol->vol_name);
885                   if (!is_vol_in_autochanger(rctx, vol)) {
886                      continue;
887                   }
888                } else if (strcmp(device_name, vol->dev->device->hdr.name) != 0) {
889                   Dmsg2(dbglvl, "device=%s not suitable want %s\n",
890                         vol->dev->device->hdr.name, device_name);
891                   continue;
892                }
893
894                bstrncpy(rctx.VolumeName, vol->vol_name, sizeof(rctx.VolumeName));
895                rctx.have_volume = true;
896                /* Try reserving this device and volume */
897                Dmsg2(dbglvl, "try vol=%s on device=%s\n", rctx.VolumeName, device_name);
898                stat = reserve_device(rctx);
899                if (stat == 1) {             /* found available device */
900                   Dmsg1(dbglvl, "Suitable device found=%s\n", device_name);
901                   ok = true;
902                   break;
903                } else if (stat == 0) {      /* device busy */
904                   Dmsg1(dbglvl, "Suitable device=%s, busy: not use\n", device_name);
905                } else {
906                   /* otherwise error */
907                   Dmsg0(dbglvl, "No suitable device found.\n");
908                }
909                rctx.have_volume = false;
910             }
911             if (ok) {
912                break;
913             }
914          }
915          if (ok) {
916             break;
917          }
918       } /* end for loop over reserved volumes */
919
920       Dmsg0(dbglvl, "lock volumes\n");
921       lock_volumes();
922       save_vol_list = vol_list;
923       vol_list = temp_vol_list;
924       free_volume_list();                  /* release temp_vol_list */
925       vol_list = save_vol_list;
926       Dmsg0(dbglvl, "deleted temp vol list\n");
927       Dmsg0(dbglvl, "lock volumes\n");
928       unlock_volumes();
929    }
930    if (ok) {
931       Dmsg1(dbglvl, "got vol %s from in-use vols list\n", rctx.VolumeName);
932       return true;
933    }
934
935    /* 
936     * No reserved volume we can use, so now search for an available device.  
937     *
938     * For each storage device that the user specified, we
939     *  search and see if there is a resource for that device.
940     */
941    foreach_alist(store, dirstore) {
942       rctx.store = store;
943       foreach_alist(device_name, store->device) {
944          int stat;
945          rctx.device_name = device_name;
946          stat = search_res_for_device(rctx); 
947          if (stat == 1) {             /* found available device */
948             Dmsg1(dbglvl, "available device found=%s\n", device_name);
949             ok = true;
950             break;
951          } else if (stat == 0) {      /* device busy */
952             Dmsg1(dbglvl, "Suitable device=%s, busy: not use\n", device_name);
953          } else {
954             /* otherwise error */
955             Dmsg0(dbglvl, "No suitable device found.\n");
956          }
957       }
958       if (ok) {
959          break;
960       }
961    }
962    return ok;
963 }
964
965 /*
966  * Search for a particular storage device with particular storage
967  *  characteristics (MediaType).
968  */
969 int search_res_for_device(RCTX &rctx) 
970 {
971    AUTOCHANGER *changer;
972    int stat;
973
974    Dmsg1(dbglvl, "search res for %s\n", rctx.device_name);
975    /* Look through Autochangers first */
976    foreach_res(changer, R_AUTOCHANGER) {
977       Dmsg1(dbglvl, "Try match changer res=%s\n", changer->hdr.name);
978       /* Find resource, and make sure we were able to open it */
979       if (strcmp(rctx.device_name, changer->hdr.name) == 0) {
980          /* Try each device in this AutoChanger */
981          foreach_alist(rctx.device, changer->device) {
982             Dmsg1(dbglvl, "Try changer device %s\n", rctx.device->hdr.name);
983             stat = reserve_device(rctx);
984             if (stat != 1) {             /* try another device */
985                continue;
986             }
987             /* Debug code */
988             if (rctx.store->append == SD_APPEND) {
989                Dmsg2(dbglvl, "Device %s reserved=%d for append.\n", 
990                   rctx.device->hdr.name, rctx.jcr->dcr->dev->reserved_device);
991             } else {
992                Dmsg2(dbglvl, "Device %s reserved=%d for read.\n", 
993                   rctx.device->hdr.name, rctx.jcr->read_dcr->dev->reserved_device);
994             }
995             return stat;
996          }
997       }
998    }
999
1000    /* Now if requested look through regular devices */
1001    if (!rctx.autochanger_only) {
1002       foreach_res(rctx.device, R_DEVICE) {
1003          Dmsg1(dbglvl, "Try match res=%s\n", rctx.device->hdr.name);
1004          /* Find resource, and make sure we were able to open it */
1005          if (strcmp(rctx.device_name, rctx.device->hdr.name) == 0) {
1006             stat = reserve_device(rctx);
1007             if (stat != 1) {             /* try another device */
1008                continue;
1009             }
1010             /* Debug code */
1011             if (rctx.store->append == SD_APPEND) {
1012                Dmsg2(dbglvl, "Device %s reserved=%d for append.\n", 
1013                   rctx.device->hdr.name, rctx.jcr->dcr->dev->reserved_device);
1014             } else {
1015                Dmsg2(dbglvl, "Device %s reserved=%d for read.\n", 
1016                   rctx.device->hdr.name, rctx.jcr->read_dcr->dev->reserved_device);
1017             }
1018             return stat;
1019          }
1020       }
1021    }
1022    return -1;                    /* nothing found */
1023 }
1024
1025 /*
1026  *  Try to reserve a specific device.
1027  *
1028  *  Returns: 1 -- OK, have DCR
1029  *           0 -- must wait
1030  *          -1 -- fatal error
1031  */
1032 static int reserve_device(RCTX &rctx)
1033 {
1034    bool ok;
1035    DCR *dcr;
1036    const int name_len = MAX_NAME_LENGTH;
1037
1038    /* Make sure MediaType is OK */
1039    Dmsg2(dbglvl, "chk MediaType device=%s request=%s\n",
1040          rctx.device->media_type, rctx.store->media_type);
1041    if (strcmp(rctx.device->media_type, rctx.store->media_type) != 0) {
1042       return -1;
1043    }
1044
1045    /* Make sure device exists -- i.e. we can stat() it */
1046    if (!rctx.device->dev) {
1047       rctx.device->dev = init_dev(rctx.jcr, rctx.device);
1048    }
1049    if (!rctx.device->dev) {
1050       if (rctx.device->changer_res) {
1051         Jmsg(rctx.jcr, M_WARNING, 0, _("\n"
1052            "     Device \"%s\" in changer \"%s\" requested by DIR could not be opened or does not exist.\n"),
1053              rctx.device->hdr.name, rctx.device_name);
1054       } else {
1055          Jmsg(rctx.jcr, M_WARNING, 0, _("\n"
1056             "     Device \"%s\" requested by DIR could not be opened or does not exist.\n"),
1057               rctx.device_name);
1058       }
1059       return -1;  /* no use waiting */
1060    }  
1061
1062    rctx.suitable_device = true;
1063    Dmsg1(dbglvl, "try reserve %s\n", rctx.device->hdr.name);
1064    rctx.jcr->dcr = dcr = new_dcr(rctx.jcr, rctx.jcr->dcr, rctx.device->dev);
1065    if (!dcr) {
1066       BSOCK *dir = rctx.jcr->dir_bsock;
1067       dir->fsend(_("3926 Could not get dcr for device: %s\n"), rctx.device_name);
1068       Dmsg1(dbglvl, ">dird: %s", dir->msg);
1069       return -1;
1070    }
1071    bstrncpy(dcr->pool_name, rctx.store->pool_name, name_len);
1072    bstrncpy(dcr->pool_type, rctx.store->pool_type, name_len);
1073    bstrncpy(dcr->media_type, rctx.store->media_type, name_len);
1074    bstrncpy(dcr->dev_name, rctx.device_name, name_len);
1075    if (rctx.store->append == SD_APPEND) {
1076       Dmsg2(dbglvl, "have_vol=%d vol=%s\n", rctx.have_volume, rctx.VolumeName);                                   
1077       ok = reserve_device_for_append(dcr, rctx);
1078       if (!ok) {
1079          goto bail_out;
1080       }
1081
1082       rctx.jcr->dcr = dcr;
1083       Dmsg5(dbglvl, "Reserved=%d dev_name=%s mediatype=%s pool=%s ok=%d\n",
1084                dcr->dev->reserved_device,
1085                dcr->dev_name, dcr->media_type, dcr->pool_name, ok);
1086       if (!rctx.have_volume) {
1087          dcr->any_volume = true;
1088          if (dir_find_next_appendable_volume(dcr)) {
1089             bstrncpy(rctx.VolumeName, dcr->VolumeName, sizeof(rctx.VolumeName));
1090             Dmsg1(dbglvl, "looking for Volume=%s\n", rctx.VolumeName);
1091             rctx.have_volume = true;
1092          } else {
1093             Dmsg0(dbglvl, "No next volume found\n");
1094             rctx.have_volume = false;
1095             rctx.VolumeName[0] = 0;
1096             /*
1097              * If there is at least one volume that is valid and in use,
1098              *   but we get here, check if we are running with prefers
1099              *   non-mounted drives.  In that case, we have selected a
1100              *   non-used drive and our one and only volume is mounted
1101              *   elsewhere, so we bail out and retry using that drive.
1102              */
1103             if (dcr->volume_in_use && !rctx.PreferMountedVols) {
1104                rctx.PreferMountedVols = true;
1105                if (dcr->VolumeName[0]) {
1106                   volume_unused(dcr);
1107                }
1108                goto bail_out;
1109             }
1110             /*
1111              * Note. Under some circumstances, the Director can hand us
1112              *  a Volume name that is no the same as the one on the current
1113              *  drive, and in that case, the call above to find the next
1114              *  volume will fail because in attempting to reserve the Volume
1115              *  the code will realize that we already have a tape mounted,
1116              *  and it will fail.  This *should* only happen if there are 
1117              *  writers, thus the following test.  In that case, we simply
1118              *  bail out, and continue waiting, rather than plunging on
1119              *  and hoping that the operator can resolve the problem. 
1120              */
1121             if (dcr->dev->num_writers != 0) {
1122                if (dcr->VolumeName[0]) {
1123                   volume_unused(dcr);
1124                }
1125                goto bail_out;
1126             }
1127          }
1128       }
1129    } else {
1130       ok = reserve_device_for_read(dcr);
1131       if (ok) {
1132          rctx.jcr->read_dcr = dcr;
1133          Dmsg5(dbglvl, "Read reserved=%d dev_name=%s mediatype=%s pool=%s ok=%d\n",
1134                dcr->dev->reserved_device,
1135                dcr->dev_name, dcr->media_type, dcr->pool_name, ok);
1136       }
1137    }
1138    if (!ok) {
1139       goto bail_out;
1140    }
1141    if (rctx.notify_dir) {
1142       POOL_MEM dev_name;
1143       BSOCK *dir = rctx.jcr->dir_bsock;
1144       pm_strcpy(dev_name, rctx.device->hdr.name);
1145       bash_spaces(dev_name);
1146       ok = dir->fsend(OK_device, dev_name.c_str());  /* Return real device name */
1147       Dmsg1(dbglvl, ">dird: %s", dir->msg);
1148    } else {
1149       ok = true;
1150    }
1151    return ok ? 1 : -1;
1152
1153 bail_out:
1154    rctx.have_volume = false;
1155 // free_dcr(dcr);
1156    Dmsg0(dbglvl, "Not OK.\n");
1157    return 0;
1158 }
1159
1160 /*
1161  * We "reserve" the drive by setting the ST_READ bit. No one else
1162  *  should touch the drive until that is cleared.
1163  *  This allows the DIR to "reserve" the device before actually
1164  *  starting the job. 
1165  */
1166 static bool reserve_device_for_read(DCR *dcr)
1167 {
1168    DEVICE *dev = dcr->dev;
1169    JCR *jcr = dcr->jcr;
1170    bool ok = false;
1171
1172    ASSERT(dcr);
1173
1174    dev->dlock();  
1175
1176    if (is_device_unmounted(dev)) {             
1177       Dmsg1(dbglvl, "Device %s is BLOCKED due to user unmount.\n", dev->print_name());
1178       Mmsg(jcr->errmsg, _("3601 JobId=%u device %s is BLOCKED due to user unmount.\n"),
1179            jcr->JobId, dev->print_name());
1180       queue_reserve_message(jcr);
1181       goto bail_out;
1182    }
1183
1184    if (dev->is_busy()) {
1185       Dmsg4(dbglvl, "Device %s is busy ST_READ=%d num_writers=%d reserved=%d.\n", 
1186          dev->print_name(),
1187          dev->state & ST_READ?1:0, dev->num_writers, dev->reserved_device);
1188       Mmsg(jcr->errmsg, _("3602 JobId=%u device %s is busy (already reading/writing).\n"),
1189             jcr->JobId, dev->print_name());
1190       queue_reserve_message(jcr);
1191       goto bail_out;
1192    }
1193
1194    dev->clear_append();
1195    dev->set_read();
1196    ok = true;
1197    dev->reserved_device++;
1198    Dmsg3(dbglvl, "Inc reserve=%d dev=%s %p\n", dev->reserved_device, dev->print_name(), dev);
1199    dcr->reserved_device = true;
1200
1201 bail_out:
1202    dev->dunlock();
1203    return ok;
1204 }
1205
1206
1207 /*
1208  * We reserve the device for appending by incrementing the 
1209  *  reserved_device. We do virtually all the same work that
1210  *  is done in acquire_device_for_append(), but we do
1211  *  not attempt to mount the device. This routine allows
1212  *  the DIR to reserve multiple devices before *really* 
1213  *  starting the job. It also permits the SD to refuse 
1214  *  certain devices (not up, ...).
1215  *
1216  * Note, in reserving a device, if the device is for the
1217  *  same pool and the same pool type, then it is acceptable.
1218  *  The Media Type has already been checked. If we are
1219  *  the first tor reserve the device, we put the pool
1220  *  name and pool type in the device record.
1221  */
1222 static bool reserve_device_for_append(DCR *dcr, RCTX &rctx)
1223 {
1224    JCR *jcr = dcr->jcr;
1225    DEVICE *dev = dcr->dev;
1226    bool ok = false;
1227
1228    ASSERT(dcr);
1229
1230    dev->dlock();
1231
1232    /* If device is being read, we cannot write it */
1233    if (dev->can_read()) {
1234       Mmsg(jcr->errmsg, _("3603 JobId=%u device %s is busy reading.\n"), 
1235          jcr->JobId, dev->print_name());
1236       Dmsg1(dbglvl, "%s", jcr->errmsg);
1237       queue_reserve_message(jcr);
1238       goto bail_out;
1239    }
1240
1241    /* If device is unmounted, we are out of luck */
1242    if (is_device_unmounted(dev)) {
1243       Mmsg(jcr->errmsg, _("3604 JobId=%u device %s is BLOCKED due to user unmount.\n"), 
1244          jcr->JobId, dev->print_name());
1245       Dmsg1(dbglvl, "%s", jcr->errmsg);
1246       queue_reserve_message(jcr);
1247       goto bail_out;
1248    }
1249
1250    Dmsg1(dbglvl, "reserve_append device is %s\n", dev->print_name());
1251
1252    /* Now do detailed tests ... */
1253    if (can_reserve_drive(dcr, rctx) != 1) {
1254       Dmsg0(dbglvl, "can_reserve_drive!=1\n");
1255       goto bail_out;
1256    }
1257
1258    dev->reserved_device++;
1259    Dmsg3(dbglvl, "Inc reserve=%d dev=%s %p\n", dev->reserved_device, 
1260       dev->print_name(), dev);
1261    dcr->reserved_device = true;
1262    ok = true;
1263
1264 bail_out:
1265    dev->dunlock();
1266    return ok;
1267 }
1268
1269 static int is_pool_ok(DCR *dcr)
1270 {
1271    DEVICE *dev = dcr->dev;
1272    JCR *jcr = dcr->jcr;
1273
1274    /* Now check if we want the same Pool and pool type */
1275    if (strcmp(dev->pool_name, dcr->pool_name) == 0 &&
1276        strcmp(dev->pool_type, dcr->pool_type) == 0) {
1277       /* OK, compatible device */
1278       Dmsg1(dbglvl, "OK dev: %s num_writers=0, reserved, pool matches\n", dev->print_name());
1279       return 1;
1280    } else {
1281       /* Drive Pool not suitable for us */
1282       Mmsg(jcr->errmsg, _(
1283 "3608 JobId=%u wants Pool=\"%s\" but have Pool=\"%s\" nreserve=%d on drive %s.\n"), 
1284             (uint32_t)jcr->JobId, dcr->pool_name, dev->pool_name,
1285             dev->reserved_device, dev->print_name());
1286       queue_reserve_message(jcr);
1287       Dmsg2(dbglvl, "failed: busy num_writers=0, reserved, pool=%s wanted=%s\n",
1288          dev->pool_name, dcr->pool_name);
1289    }
1290    return 0;
1291 }
1292
1293 static bool is_max_jobs_ok(DCR *dcr) 
1294 {
1295    DEVICE *dev = dcr->dev;
1296    JCR *jcr = dcr->jcr;
1297
1298    Dmsg4(dbglvl, "MaxJobs=%d Jobs=%d reserves=%d Vol=%s\n",
1299          dcr->VolCatInfo.VolCatMaxJobs,
1300          dcr->VolCatInfo.VolCatJobs, dev->reserved_device,
1301          dcr->VolumeName);
1302    if (dcr->VolCatInfo.VolCatMaxJobs > 0 && dcr->VolCatInfo.VolCatMaxJobs <=
1303         (dcr->VolCatInfo.VolCatJobs + dev->reserved_device)) {
1304       /* Max Job Vols depassed or already reserved */
1305       Mmsg(jcr->errmsg, _("3610 JobId=%u Volume max jobs exceeded on drive %s.\n"), 
1306             (uint32_t)jcr->JobId, dev->print_name());
1307       queue_reserve_message(jcr);
1308       Dmsg1(dbglvl, "reserve dev failed: %s", jcr->errmsg);
1309       return false;                /* wait */
1310    }
1311    return true;
1312 }
1313
1314 /*
1315  * Returns: 1 if drive can be reserved
1316  *          0 if we should wait
1317  *         -1 on error or impossibility
1318  */
1319 static int can_reserve_drive(DCR *dcr, RCTX &rctx) 
1320 {
1321    DEVICE *dev = dcr->dev;
1322    JCR *jcr = dcr->jcr;
1323
1324    Dmsg5(dbglvl, "PrefMnt=%d exact=%d suitable=%d chgronly=%d any=%d\n",
1325          rctx.PreferMountedVols, rctx.exact_match, rctx.suitable_device,
1326          rctx.autochanger_only, rctx.any_drive);
1327
1328    /* Check for max jobs on this Volume */
1329    if (!is_max_jobs_ok(dcr)) {
1330       return 0;
1331    }
1332
1333    /* setting any_drive overrides PreferMountedVols flag */
1334    if (!rctx.any_drive) {
1335       /*
1336        * When PreferMountedVols is set, we keep track of the 
1337        *  drive in use that has the least number of writers, then if
1338        *  no unmounted drive is found, we try that drive. This   
1339        *  helps spread the load to the least used drives.  
1340        */
1341       if (rctx.try_low_use_drive && dev == rctx.low_use_drive) {
1342          Dmsg2(dbglvl, "OK dev=%s == low_drive=%s.\n",
1343             dev->print_name(), rctx.low_use_drive->print_name());
1344          return 1;
1345       }
1346       /* If he wants a free drive, but this one is busy, no go */
1347       if (!rctx.PreferMountedVols && dev->is_busy()) {
1348          /* Save least used drive */
1349          if ((dev->num_writers + dev->reserved_device) < rctx.num_writers) {
1350             rctx.num_writers = dev->num_writers + dev->reserved_device;
1351             rctx.low_use_drive = dev;
1352             Dmsg2(dbglvl, "set low use drive=%s num_writers=%d\n", 
1353                dev->print_name(), rctx.num_writers);
1354          } else {
1355             Dmsg1(dbglvl, "not low use num_writers=%d\n", dev->num_writers+dev->reserved_device);
1356          }
1357          Dmsg0(dbglvl, "failed: !prefMnt && busy.\n");
1358          Mmsg(jcr->errmsg, _("3605 JobId=%u wants free drive but device %s is busy.\n"), 
1359             jcr->JobId, dev->print_name());
1360          queue_reserve_message(jcr);
1361          return 0;
1362       }
1363
1364       /* Check for prefer mounted volumes */
1365       if (rctx.PreferMountedVols && !dev->vol && dev->is_tape()) {
1366          Mmsg(jcr->errmsg, _("3606 JobId=%u prefers mounted drives, but drive %s has no Volume.\n"), 
1367             jcr->JobId, dev->print_name());
1368          queue_reserve_message(jcr);
1369          Dmsg0(dbglvl, "failed: want mounted -- no vol\n");
1370          return 0;                 /* No volume mounted */
1371       }
1372
1373       /* Check for exact Volume name match */
1374       /* ***FIXME*** for Disk, we can accept any volume that goes with this
1375        *    drive.
1376        */
1377       if (rctx.exact_match && rctx.have_volume) {
1378          bool ok;
1379          Dmsg5(dbglvl, "PrefMnt=%d exact=%d suitable=%d chgronly=%d any=%d\n",
1380                rctx.PreferMountedVols, rctx.exact_match, rctx.suitable_device,
1381                rctx.autochanger_only, rctx.any_drive);
1382          Dmsg4(dbglvl, "have_vol=%d have=%s resvol=%s want=%s\n",
1383                   rctx.have_volume, dev->VolHdr.VolumeName, 
1384                   dev->vol?dev->vol->vol_name:"*none*", rctx.VolumeName);
1385          ok = strcmp(dev->VolHdr.VolumeName, rctx.VolumeName) == 0 ||
1386                  (dev->vol && strcmp(dev->vol->vol_name, rctx.VolumeName) == 0);
1387          if (!ok) {
1388             Mmsg(jcr->errmsg, _("3607 JobId=%u wants Vol=\"%s\" drive has Vol=\"%s\" on drive %s.\n"), 
1389                jcr->JobId, rctx.VolumeName, dev->VolHdr.VolumeName, 
1390                dev->print_name());
1391             queue_reserve_message(jcr);
1392             Dmsg3(dbglvl, "not OK: dev have=%s resvol=%s want=%s\n",
1393                   dev->VolHdr.VolumeName, dev->vol?dev->vol->vol_name:"*none*", rctx.VolumeName);
1394             return 0;
1395          }
1396          if (is_volume_in_use(dcr)) {
1397             return 0;              /* fail if volume on another drive */
1398          }
1399       }
1400    }
1401
1402    /* Check for unused autochanger drive */
1403    if (rctx.autochanger_only && !dev->is_busy() &&
1404        dev->VolHdr.VolumeName[0] == 0) {
1405       /* Device is available but not yet reserved, reserve it for us */
1406       Dmsg1(dbglvl, "OK Res Unused autochanger %s.\n", dev->print_name());
1407       bstrncpy(dev->pool_name, dcr->pool_name, sizeof(dev->pool_name));
1408       bstrncpy(dev->pool_type, dcr->pool_type, sizeof(dev->pool_type));
1409       return 1;                       /* reserve drive */
1410    }
1411
1412    /*
1413     * Handle the case that there are no writers
1414     */
1415    if (dev->num_writers == 0) {
1416       /* Now check if there are any reservations on the drive */
1417       if (dev->reserved_device) {           
1418          return is_pool_ok(dcr);
1419       } else if (dev->can_append()) {
1420          if (is_pool_ok(dcr)) {
1421             return 1; 
1422          } else {
1423             /* Changing pool, unload old tape if any in drive */
1424             Dmsg0(dbglvl, "OK dev: num_writers=0, not reserved, pool change, unload changer\n");
1425             unload_autochanger(dcr, 0);
1426          }
1427       }
1428       /* Device is available but not yet reserved, reserve it for us */
1429       Dmsg1(dbglvl, "OK Dev avail reserved %s\n", dev->print_name());
1430       bstrncpy(dev->pool_name, dcr->pool_name, sizeof(dev->pool_name));
1431       bstrncpy(dev->pool_type, dcr->pool_type, sizeof(dev->pool_type));
1432       return 1;                       /* reserve drive */
1433    }
1434
1435    /*
1436     * Check if the device is in append mode with writers (i.e.
1437     *  available if pool is the same).
1438     */
1439    if (dev->can_append() || dev->num_writers > 0) {
1440       return is_pool_ok(dcr);
1441    } else {
1442       Pmsg1(000, _("Logic error!!!! JobId=%u Should not get here.\n"), (int)jcr->JobId);
1443       Mmsg(jcr->errmsg, _("3910 JobId=%u Logic error!!!! drive %s Should not get here.\n"),
1444             jcr->JobId, dev->print_name());
1445       queue_reserve_message(jcr);
1446       Jmsg0(jcr, M_FATAL, 0, _("Logic error!!!! Should not get here.\n"));
1447       return -1;                      /* error, should not get here */
1448    }
1449    Mmsg(jcr->errmsg, _("3911 JobId=%u failed reserve drive %s.\n"), 
1450          jcr->JobId, dev->print_name());
1451    queue_reserve_message(jcr);
1452    Dmsg1(dbglvl, "failed: No reserve %s\n", dev->print_name());
1453    return 0;
1454 }
1455
1456
1457
1458
1459 /*
1460  * Queue a reservation error or failure message for this jcr
1461  */
1462 static void queue_reserve_message(JCR *jcr)
1463 {
1464    int i;   
1465    alist *msgs;
1466    char *msg;
1467
1468    jcr->lock();
1469
1470    msgs = jcr->reserve_msgs;
1471    if (!msgs) {
1472       goto bail_out;
1473    }
1474    /*
1475     * Look for duplicate message.  If found, do
1476     * not insert
1477     */
1478    for (i=msgs->size()-1; i >= 0; i--) {
1479       msg = (char *)msgs->get(i);
1480       if (!msg) {
1481          goto bail_out;
1482       }
1483       /* Comparison based on 4 digit message number */
1484       if (strncmp(msg, jcr->errmsg, 4) == 0) {
1485          goto bail_out;
1486       }
1487    }      
1488    /* Message unique, so insert it */
1489    jcr->reserve_msgs->push(bstrdup(jcr->errmsg));
1490
1491 bail_out:
1492    jcr->unlock();
1493 }
1494
1495 /*
1496  * Send any reservation messages queued for this jcr
1497  */
1498 void send_drive_reserve_messages(JCR *jcr, void sendit(const char *msg, int len, void *sarg), void *arg)
1499 {
1500    int i;
1501    alist *msgs;
1502    char *msg;
1503
1504    jcr->lock();
1505    msgs = jcr->reserve_msgs;
1506    if (!msgs || msgs->size() == 0) {
1507       goto bail_out;
1508    }
1509    for (i=msgs->size()-1; i >= 0; i--) {
1510       msg = (char *)msgs->get(i);
1511       if (msg) {
1512          sendit("   ", 3, arg);
1513          sendit(msg, strlen(msg), arg);
1514       } else {
1515          break;
1516       }
1517    }
1518
1519 bail_out:
1520    jcr->unlock();
1521 }
1522
1523 /*
1524  * Pop and release any reservations messages
1525  */
1526 static void pop_reserve_messages(JCR *jcr)
1527 {
1528    alist *msgs;
1529    char *msg;
1530
1531    jcr->lock();
1532    msgs = jcr->reserve_msgs;
1533    if (!msgs) {
1534       goto bail_out;
1535    }
1536    while ((msg = (char *)msgs->pop())) {
1537       free(msg);
1538    }
1539 bail_out:
1540    jcr->unlock();
1541 }
1542
1543 /*
1544  * Also called from acquire.c 
1545  */
1546 void release_reserve_messages(JCR *jcr)
1547 {
1548    pop_reserve_messages(jcr);
1549    jcr->lock();
1550    if (!jcr->reserve_msgs) {
1551       goto bail_out;
1552    }
1553    delete jcr->reserve_msgs;
1554    jcr->reserve_msgs = NULL;
1555
1556 bail_out:
1557    jcr->unlock();
1558 }