]> git.sur5r.net Git - bacula/bacula/blob - bacula/src/stored/reserve.c
More tweaks to the mount volume routines to get everything
[bacula/bacula] / bacula / src / stored / reserve.c
1 /*
2    Bacula® - The Network Backup Solution
3
4    Copyright (C) 2000-2007 Free Software Foundation Europe e.V.
5
6    The main author of Bacula is Kern Sibbald, with contributions from
7    many others, a complete list can be found in the file AUTHORS.
8    This program is Free Software; you can redistribute it and/or
9    modify it under the terms of version two of the GNU General Public
10    License as published by the Free Software Foundation and included
11    in the file LICENSE.
12
13    This program is distributed in the hope that it will be useful, but
14    WITHOUT ANY WARRANTY; without even the implied warranty of
15    MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE. See the GNU
16    General Public License for more details.
17
18    You should have received a copy of the GNU General Public License
19    along with this program; if not, write to the Free Software
20    Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA
21    02110-1301, USA.
22
23    Bacula® is a registered trademark of John Walker.
24    The licensor of Bacula is the Free Software Foundation Europe
25    (FSFE), Fiduciary Program, Sumatrastrasse 25, 8006 Zürich,
26    Switzerland, email:ftf@fsfeurope.org.
27 */
28 /*
29  *   Drive reservation functions for Storage Daemon
30  *
31  *   Kern Sibbald, MM
32  *
33  *   Split from job.c and acquire.c June 2005
34  *
35  *   Version $Id$
36  *
37  */
38
39 #include "bacula.h"
40 #include "stored.h"
41
42 #define jid() ((uint32_t)get_jobid_from_tid())
43
44 const int dbglvl =  50;
45
46 static dlist *vol_list = NULL;
47 static brwlock_t reservation_lock;
48 static brwlock_t vol_list_lock;
49
50 /* Forward referenced functions */
51 static int can_reserve_drive(DCR *dcr, RCTX &rctx);
52 static int reserve_device(RCTX &rctx);
53 static bool reserve_device_for_read(DCR *dcr);
54 static bool reserve_device_for_append(DCR *dcr, RCTX &rctx);
55 static bool use_storage_cmd(JCR *jcr);
56 static void queue_reserve_message(JCR *jcr);
57 static void pop_reserve_messages(JCR *jcr);
58
59 /* Requests from the Director daemon */
60 static char use_storage[]  = "use storage=%127s media_type=%127s "
61    "pool_name=%127s pool_type=%127s append=%d copy=%d stripe=%d\n";
62 static char use_device[]  = "use device=%127s\n";
63
64 /* Responses sent to Director daemon */
65 static char OK_device[] = "3000 OK use device device=%s\n";
66 static char NO_device[] = "3924 Device \"%s\" not in SD Device resources.\n";
67 static char BAD_use[]   = "3913 Bad use command: %s\n";
68
69 bool use_cmd(JCR *jcr) 
70 {
71    /*
72     * Get the device, media, and pool information
73     */
74    if (!use_storage_cmd(jcr)) {
75       set_jcr_job_status(jcr, JS_ErrorTerminated);
76       memset(jcr->sd_auth_key, 0, strlen(jcr->sd_auth_key));
77       return false;
78    }
79    return true;
80 }
81
82 static int my_compare(void *item1, void *item2)
83 {
84    return strcmp(((VOLRES *)item1)->vol_name, ((VOLRES *)item2)->vol_name);
85 }
86
87
88 void init_reservations_lock()
89 {
90    int errstat;
91    if ((errstat=rwl_init(&reservation_lock)) != 0) {
92       berrno be;
93       Emsg1(M_ABORT, 0, _("Unable to initialize reservation lock. ERR=%s\n"),
94             be.bstrerror(errstat));
95    }
96
97    if ((errstat=rwl_init(&vol_list_lock)) != 0) {
98       berrno be;
99       Emsg1(M_ABORT, 0, _("Unable to initialize volume list lock. ERR=%s\n"),
100             be.bstrerror(errstat));
101    }
102 }
103
104 void term_reservations_lock()
105 {
106    rwl_destroy(&reservation_lock);
107    rwl_destroy(&vol_list_lock);
108 }
109
110 int reservations_lock_count = 0;
111
112 /* This applies to a drive and to Volumes */
113 void _lock_reservations()
114 {
115    int errstat;
116    reservations_lock_count++;
117    if ((errstat=rwl_writelock(&reservation_lock)) != 0) {
118       berrno be;
119       Emsg2(M_ABORT, 0, "rwl_writelock failure. stat=%d: ERR=%s\n",
120            errstat, be.bstrerror(errstat));
121    }
122 }
123
124 void _unlock_reservations()
125 {
126    int errstat;
127    reservations_lock_count--;
128    if ((errstat=rwl_writeunlock(&reservation_lock)) != 0) {
129       berrno be;
130       Emsg2(M_ABORT, 0, "rwl_writeunlock failure. stat=%d: ERR=%s\n",
131            errstat, be.bstrerror(errstat));
132    }
133 }
134
135 int vol_list_lock_count = 0;
136
137 void _lock_volumes()
138 {
139    int errstat;
140    vol_list_lock_count++;
141    if ((errstat=rwl_writelock(&vol_list_lock)) != 0) {
142       berrno be;
143       Emsg2(M_ABORT, 0, "rwl_writelock failure. stat=%d: ERR=%s\n",
144            errstat, be.bstrerror(errstat));
145    }
146 }
147
148 void _unlock_volumes()
149 {
150    int errstat;
151    vol_list_lock_count--;
152    if ((errstat=rwl_writeunlock(&vol_list_lock)) != 0) {
153       berrno be;
154       Emsg2(M_ABORT, 0, "rwl_writeunlock failure. stat=%d: ERR=%s\n",
155            errstat, be.bstrerror(errstat));
156    }
157 }
158
159
160 /*
161  * List Volumes -- this should be moved to status.c
162  */
163 enum {
164    debug_lock = true,
165    debug_nolock = false
166 };
167
168 static void debug_list_volumes(const char *imsg)
169 {
170    VOLRES *vol;
171    POOL_MEM msg(PM_MESSAGE);
172
173    lock_volumes();
174    foreach_dlist(vol, vol_list) {
175       if (vol->dev) {
176          Mmsg(msg, "List from %s: %s at %p on device %s\n", imsg, 
177               vol->vol_name, vol->vol_name, vol->dev->print_name());
178       } else {
179          Mmsg(msg, "List from %s: %s at %p no dev\n", imsg, vol->vol_name, vol->vol_name);
180       }
181       Dmsg2(dbglvl, "jid=%u %s", jid(), msg.c_str());
182    }
183
184 #ifdef xxx
185    DEVICE *dev = NULL;
186    foreach_dlist(vol, vol_list) {
187       if (vol->dev == dev) {
188          Dmsg0(dbglvl, "Two Volumes on same device.\n");
189          ASSERT(0);
190          dev = vol->dev;
191       }
192    }
193 #endif
194
195 // Dmsg2(dbglvl, "List from %s: %d volumes\n", imsg, count);
196    unlock_volumes();
197 }
198
199
200 /*
201  * List Volumes -- this should be moved to status.c
202  */
203 void list_volumes(void sendit(const char *msg, int len, void *sarg), void *arg)
204 {
205    VOLRES *vol;
206    POOL_MEM msg(PM_MESSAGE);
207    int len;
208
209    lock_volumes();
210    foreach_dlist(vol, vol_list) {
211       DEVICE *dev = vol->dev;
212       if (dev) {
213          len = Mmsg(msg, "%s on device %s\n", vol->vol_name, dev->print_name());
214          sendit(msg.c_str(), len, arg);
215          len = Mmsg(msg, "    Reader=%d writers=%d reserved=%d\n", dev->can_read()?1:0,
216             dev->num_writers, dev->reserved_device);
217          sendit(msg.c_str(), len, arg);
218       } else {
219          len = Mmsg(msg, "%s no dev\n", vol->vol_name);
220          sendit(msg.c_str(), len, arg);
221       }
222    }
223    unlock_volumes();
224 }
225
226 /*
227  * Create a Volume item to put in the Volume list
228  *   Ensure that the device points to it.
229  */
230 static VOLRES *new_vol_item(DCR *dcr, const char *VolumeName)
231 {
232    VOLRES *vol;
233    vol = (VOLRES *)malloc(sizeof(VOLRES));
234    memset(vol, 0, sizeof(VOLRES));
235    vol->vol_name = bstrdup(VolumeName);
236    vol->dev = dcr->dev;
237    Dmsg4(dbglvl, "jid=%u new Vol=%s at %p dev=%s\n", (int)dcr->jcr->JobId,
238          VolumeName, vol->vol_name, vol->dev->print_name());
239    return vol;
240 }
241
242 static void free_vol_item(VOLRES *vol)
243 {
244    free(vol->vol_name);
245    if (vol->dev) {
246       vol->dev->vol = NULL;
247    }
248    free(vol);
249 }
250
251
252 /*
253  * Put a new Volume entry in the Volume list. This
254  *  effectively reserves the volume so that it will
255  *  not be mounted again.
256  *
257  * If the device has any current volume associated with it,
258  *  and it is a different Volume, and the device is not busy,
259  *  we release the old Volume item and insert the new one.
260  * 
261  * It is assumed that the device is free and locked so that
262  *  we can change the device structure.
263  *
264  * Some details of the Volume list handling:
265  *
266  *  1. The Volume list entry must be attached to the drive (rather than 
267  *       attached to a job as it currently is. I.e. the drive that "owns" 
268  *       the volume (reserved, in use, mounted)
269  *       must point to the volume (still to be maintained in a list).
270  *
271  *  2. The Volume is entered in the list when a drive is reserved.  
272  *
273  *  3. When a drive is in use, the device code must appropriately update the
274  *      volume name as it changes (currently the list is static -- an entry is
275  *      removed when the Volume is no longer reserved, in use or mounted).  
276  *      The new code must keep the same list entry as long as the drive
277  *       has any volume associated with it but the volume name in the list
278  *       must be updated when the drive has a different volume mounted.
279  *
280  *  4. A job that has reserved a volume, can un-reserve the volume, and if the 
281  *      volume is not mounted, and not reserved, and not in use, it will be
282  *      removed from the list.
283  *
284  *  5. If a job wants to reserve a drive with a different Volume from the one on
285  *      the drive, it can re-use the drive for the new Volume.
286  *
287  *  6. If a job wants a Volume that is in a different drive, it can either use the
288  *      other drive or take the volume, only if the other drive is not in use or
289  *      not reserved.
290  *
291  *  One nice aspect of this is that the reserve use count and the writer use count 
292  *  already exist and are correctly programmed and will need no changes -- use 
293  *  counts are always very tricky.
294  *
295  *  The old code had a concept of "reserving" a Volume, but was changed 
296  *  to reserving and using a drive.  A volume is must be attached to (owned by) a 
297  *  drive and can move from drive to drive or be unused given certain specific 
298  *  conditions of the drive.  The key is that the drive must "own" the Volume.  
299  *  The old code had the job (dcr) owning the volume (more or less).  The job was
300  *  to change the insertion and removal of the volumes from the list to be based 
301  *  on the drive rather than the job.  
302  *
303  *  Return: VOLRES entry on success
304  *          NULL volume busy on another drive
305  */
306 VOLRES *reserve_volume(DCR *dcr, const char *VolumeName)
307 {
308    VOLRES *vol, *nvol;
309    DEVICE *dev = dcr->dev;
310
311    ASSERT(dev != NULL);
312
313    Dmsg2(dbglvl, "jid=%u reserve_volume %s\n", jid(), VolumeName);
314    /* 
315     * We lock the reservations system here to ensure
316     *  when adding a new volume that no newly scheduled
317     *  job can reserve it.
318     */
319    lock_volumes();
320    debug_list_volumes("begin reserve_volume");
321    /* 
322     * First, remove any old volume attached to this device as it
323     *  is no longer used.
324     */
325    if (dev->vol) {
326       vol = dev->vol;
327       /*
328        * Make sure we don't remove the current volume we are inserting
329        *  because it was probably inserted by another job.
330        */
331       if (strcmp(vol->vol_name, VolumeName) == 0) {
332          Dmsg2(dbglvl, "jid=%u OK, vol=%s on device.\n", (int)dcr->jcr->JobId, VolumeName);
333          goto get_out;                  /* Volume already on this device */
334       } else {
335          Dmsg3(dbglvl, "jid=%u reserve_vol free vol=%s at %p\n", 
336                (int)dcr->jcr->JobId, vol->vol_name, vol->vol_name);
337          debug_list_volumes("reserve_vol free");
338          vol_list->remove(vol);
339          free_vol_item(vol);
340       }
341    }
342
343    /* Create a new Volume entry */
344    nvol = new_vol_item(dcr, VolumeName);
345
346    /*
347     * Now try to insert the new Volume
348     */
349    vol = (VOLRES *)vol_list->binary_insert(nvol, my_compare);
350    if (vol != nvol) {
351       Dmsg3(dbglvl, "jid=%u Found vol=%s dev-same=%d\n", jid(), vol->vol_name, dev==vol->dev);
352       /*
353        * At this point, a Volume with this name already is in the list,
354        *   so we simply release our new Volume entry. Note, this should
355        *   only happen if we are moving the volume from one drive to another.
356        */
357       Dmsg3(dbglvl, "jid=%u reserve_vol free-tmp vol=%s at %p\n", 
358             (int)dcr->jcr->JobId, vol->vol_name, vol->vol_name);
359       /*
360        * Clear dev pointer so that free_vol_item() doesn't 
361        *  take away our volume. 
362        */
363       nvol->dev = NULL;                   /* don't zap dev entry */
364       free_vol_item(nvol);
365
366       /* Check if we are trying to use the Volume on a different drive */
367       if (dev != vol->dev) {
368          /* Caller wants to switch Volume to another device */
369          if (!vol->dev->is_busy()) {
370             /* OK to move it -- I'm not sure this will work */
371             Dmsg4(dbglvl, "==== jid=%u Swap vol=%s from dev=%s to %s\n", jid(), VolumeName,
372                vol->dev->print_name(), dev->print_name());
373             vol->dev->vol = NULL;         /* take vol from old drive */
374             vol->dev->VolHdr.VolumeName[0] = 0;
375             vol->dev = dev;               /* point vol at new drive */
376             dev->vol = vol;               /* point dev at vol */
377             dev->VolHdr.VolumeName[0] = 0;
378          } else {
379             Dmsg4(dbglvl, "jid=%u Volume busy could not swap vol=%s from dev=%s to %s\n", 
380                jid(), VolumeName, vol->dev->print_name(), dev->print_name());
381             vol = NULL;                /* device busy */
382          }
383       }
384    }
385    dev->vol = vol;
386
387 get_out:
388    debug_list_volumes("end new volume");
389    unlock_volumes();
390    return vol;
391 }
392
393 /*
394  * Search for a Volume name in the Volume list.
395  *
396  *  Returns: VOLRES entry on success
397  *           NULL if the Volume is not in the list
398  */
399 VOLRES *find_volume(DCR *dcr)
400 {
401    VOLRES vol, *fvol;
402    /* Do not lock reservations here */
403    lock_volumes();
404    vol.vol_name = bstrdup(dcr->VolumeName);
405    fvol = (VOLRES *)vol_list->binary_search(&vol, my_compare);
406    free(vol.vol_name);
407    Dmsg3(dbglvl, "jid=%u find_vol=%s found=%d\n", jid(), dcr->VolumeName, fvol!=NULL);
408    debug_list_volumes("find_volume");
409    unlock_volumes();
410    return fvol;
411 }
412
413 /* 
414  * Remove any reservation from a drive and tell the system
415  *  that the volume is unused at least by us.
416  */
417 void unreserve_device(DCR *dcr)
418 {
419    DEVICE *dev = dcr->dev;
420    if (dcr->reserved_device) {
421       dcr->reserved_device = false;
422       dev->reserved_device--;
423       Dmsg3(dbglvl, "jid=%u Dec reserve=%d dev=%s\n", jid(), dev->reserved_device, dev->print_name());
424       dcr->reserved_device = false;
425       /* If we set read mode in reserving, remove it */
426       if (dev->can_read()) {
427          dev->clear_read();
428       }
429       if (dev->num_writers < 0) {
430          Jmsg1(dcr->jcr, M_ERROR, 0, _("Hey! num_writers=%d!!!!\n"), dev->num_writers);
431          dev->num_writers = 0;
432       }
433    }
434
435    volume_unused(dcr);
436 }
437
438 /*  
439  * Free a Volume from the Volume list if it is no longer used
440  *
441  *  Returns: true if the Volume found and removed from the list
442  *           false if the Volume is not in the list or is in use
443  */
444 bool volume_unused(DCR *dcr)
445 {
446    DEVICE *dev = dcr->dev;
447
448    if (dev->vol == NULL) {
449       Dmsg2(dbglvl, "jid=%u vol_unused: no vol on %s\n", (int)dcr->jcr->JobId, dev->print_name());
450       debug_list_volumes("null vol cannot unreserve_volume");
451       return false;
452    }
453
454    if (dev->is_busy()) {
455       Dmsg2(dbglvl, "jid=%u vol_unused: no vol on %s\n", (int)dcr->jcr->JobId, dev->print_name());
456       debug_list_volumes("dev busy cannot unreserve_volume");
457       return false;
458    }
459
460    /*  
461     * If this is a tape, we do not free the volume, rather we wait
462     *  until the autoloader unloads it, or until another tape is
463     *  explicitly read in this drive. This allows the SD to remember
464     *  where the tapes are or last were.
465     */
466    if (dev->is_tape() || dev->is_autochanger()) {
467       return true;
468    } else {
469       return free_volume(dev);
470    }
471 }
472
473 /*
474  * Unconditionally release the volume
475  */
476 bool free_volume(DEVICE *dev)
477 {
478    VOLRES *vol;
479
480    if (dev->vol == NULL) {
481       Dmsg2(dbglvl, "jid=%u No vol on dev %s\n", jid(), dev->print_name());
482       return false;
483    }
484    lock_volumes();
485    vol = dev->vol;
486    dev->vol = NULL;
487    vol_list->remove(vol);
488    Dmsg3(dbglvl, "jid=%u free_volume %s dev=%s\n", jid(), vol->vol_name, dev->print_name());
489    free_vol_item(vol);
490    debug_list_volumes("free_volume");
491    unlock_volumes();
492    return vol != NULL;
493 }
494
495       
496 /* Create the Volume list */
497 void create_volume_list()
498 {
499    VOLRES *vol = NULL;
500    if (vol_list == NULL) {
501       vol_list = New(dlist(vol, &vol->link));
502    }
503 }
504
505 /* Release all Volumes from the list */
506 void free_volume_list()
507 {
508    VOLRES *vol;
509    if (!vol_list) {
510       return;
511    }
512    lock_volumes();
513    foreach_dlist(vol, vol_list) {
514       if (vol->dev) {
515          Dmsg3(dbglvl, "jid=%u free vol_list Volume=%s dev=%s\n", jid(),
516                vol->vol_name, vol->dev->print_name());
517       } else {
518          Dmsg3(dbglvl, "jid=%u free vol_list Volume=%s dev=%p\n", jid(), 
519                vol->vol_name, vol->dev);
520       }
521       free(vol->vol_name);
522       vol->vol_name = NULL;
523    }
524    delete vol_list;
525    vol_list = NULL;
526    unlock_volumes();
527 }
528
529 bool is_volume_in_use(DCR *dcr)
530 {
531    VOLRES *vol = find_volume(dcr);
532    if (!vol) {
533       Dmsg2(dbglvl, "jid=%u Vol=%s not in use.\n", jid(), dcr->VolumeName);
534       return false;                   /* vol not in list */
535    }
536    ASSERT(vol->dev != NULL);
537
538    if (dcr->dev == vol->dev) {        /* same device OK */
539       Dmsg2(dbglvl, "jid=%u Vol=%s on same dev.\n", jid(), dcr->VolumeName);
540       return false;
541    } else {
542       Dmsg4(dbglvl, "jid=%u Vol=%s on %s we have %s\n", jid(), dcr->VolumeName,
543             vol->dev->print_name(), dcr->dev->print_name());
544    }
545    if (!vol->dev->is_busy()) {
546       Dmsg3(dbglvl, "jid=%u Vol=%s dev=%s not busy.\n", jid(), dcr->VolumeName, vol->dev->print_name());
547       return false;
548    } else {
549       Dmsg3(dbglvl, "jid=%u Vol=%s dev=%s busy.\n", jid(), dcr->VolumeName, vol->dev->print_name());
550    }
551    Dmsg3(dbglvl, "jid=%u Vol=%s in use by %s.\n", jid(), dcr->VolumeName, vol->dev->print_name());
552    return true;
553 }
554
555
556 /*
557  * We get the following type of information:
558  *
559  * use storage=xxx media_type=yyy pool_name=xxx pool_type=yyy append=1 copy=0 strip=0
560  *  use device=zzz
561  *  use device=aaa
562  *  use device=bbb
563  * use storage=xxx media_type=yyy pool_name=xxx pool_type=yyy append=0 copy=0 strip=0
564  *  use device=bbb
565  *
566  */
567 static bool use_storage_cmd(JCR *jcr)
568 {
569    POOL_MEM store_name, dev_name, media_type, pool_name, pool_type;
570    BSOCK *dir = jcr->dir_bsock;
571    int append;
572    bool ok;       
573    int Copy, Stripe;
574    DIRSTORE *store;
575    RCTX rctx;
576    alist *dirstore;
577
578    memset(&rctx, 0, sizeof(RCTX));
579    rctx.jcr = jcr;
580    /*
581     * If there are multiple devices, the director sends us
582     *   use_device for each device that it wants to use.
583     */
584    dirstore = New(alist(10, not_owned_by_alist));
585    jcr->reserve_msgs = New(alist(10, not_owned_by_alist));  
586    do {
587       Dmsg2(dbglvl, "jid=%u <dird: %s", jid(), dir->msg);
588       ok = sscanf(dir->msg, use_storage, store_name.c_str(), 
589                   media_type.c_str(), pool_name.c_str(), 
590                   pool_type.c_str(), &append, &Copy, &Stripe) == 7;
591       if (!ok) {
592          break;
593       }
594       if (append) {
595          jcr->write_store = dirstore;
596       } else {
597          jcr->read_store = dirstore;
598       }
599       rctx.append = append;
600       unbash_spaces(store_name);
601       unbash_spaces(media_type);
602       unbash_spaces(pool_name);
603       unbash_spaces(pool_type);
604       store = new DIRSTORE;
605       dirstore->append(store);
606       memset(store, 0, sizeof(DIRSTORE));
607       store->device = New(alist(10));
608       bstrncpy(store->name, store_name, sizeof(store->name));
609       bstrncpy(store->media_type, media_type, sizeof(store->media_type));
610       bstrncpy(store->pool_name, pool_name, sizeof(store->pool_name));
611       bstrncpy(store->pool_type, pool_type, sizeof(store->pool_type));
612       store->append = append;
613
614       /* Now get all devices */
615       while (dir->recv() >= 0) {
616          Dmsg2(dbglvl, "jid=%u <dird device: %s", jid(), dir->msg);
617          ok = sscanf(dir->msg, use_device, dev_name.c_str()) == 1;
618          if (!ok) {
619             break;
620          }
621          unbash_spaces(dev_name);
622          store->device->append(bstrdup(dev_name.c_str()));
623       }
624    }  while (ok && dir->recv() >= 0);
625
626    /* Developer debug code */
627    char *device_name;
628    if (debug_level >= dbglvl) {
629       foreach_alist(store, dirstore) {
630          Dmsg6(dbglvl, "jid=%u Storage=%s media_type=%s pool=%s pool_type=%s append=%d\n", 
631             (int)rctx.jcr->JobId,
632             store->name, store->media_type, store->pool_name, 
633             store->pool_type, store->append);
634          foreach_alist(device_name, store->device) {
635             Dmsg2(dbglvl, "jid=%u     Device=%s\n", jid(), device_name);
636          }
637       }
638    }
639
640    init_jcr_device_wait_timers(jcr);
641    jcr->dcr = new_dcr(jcr, NULL, NULL);         /* get a dcr */
642    if (!jcr->dcr) {
643       BSOCK *dir = jcr->dir_bsock;
644       dir->fsend(_("3939 Could not get dcr\n"));
645       Dmsg1(dbglvl, ">dird: %s", dir->msg);
646       ok = false;
647    }
648    /*                    
649     * At this point, we have a list of all the Director's Storage
650     *  resources indicated for this Job, which include Pool, PoolType,
651     *  storage name, and Media type.     
652     * Then for each of the Storage resources, we have a list of
653     *  device names that were given.
654     *
655     * Wiffle through them and find one that can do the backup.
656     */
657    if (ok) {
658       int wait_for_device_retries = 0;  
659       int repeat = 0;
660       bool fail = false;
661       rctx.notify_dir = true;
662
663       lock_reservations();
664       for ( ; !fail && !job_canceled(jcr); ) {
665          pop_reserve_messages(jcr);
666          rctx.suitable_device = false;
667          rctx.have_volume = false;
668          rctx.VolumeName[0] = 0;
669          rctx.any_drive = false;
670          if (!jcr->PreferMountedVols) {
671             /*
672              * Here we try to find a drive that is not used.
673              * This will maximize the use of available drives.
674              *
675              */
676             rctx.num_writers = 20000000;   /* start with impossible number */
677             rctx.low_use_drive = NULL;
678             rctx.PreferMountedVols = false;                
679             rctx.exact_match = false;
680             rctx.autochanger_only = true;
681             Dmsg6(dbglvl, "jid=%u PrefMnt=%d exact=%d suitable=%d chgronly=%d any=%d\n",
682                (int)rctx.jcr->JobId,
683                rctx.PreferMountedVols, rctx.exact_match, rctx.suitable_device,
684                rctx.autochanger_only, rctx.any_drive);
685             if ((ok = find_suitable_device_for_job(jcr, rctx))) {
686                break;
687             }
688             /* Look through all drives possibly for low_use drive */
689             if (rctx.low_use_drive) {
690                rctx.try_low_use_drive = true;
691                if ((ok = find_suitable_device_for_job(jcr, rctx))) {
692                   break;
693                }
694                rctx.try_low_use_drive = false;
695             }
696             rctx.autochanger_only = false;
697             Dmsg6(dbglvl, "jid=%u PrefMnt=%d exact=%d suitable=%d chgronly=%d any=%d\n",
698                (int)rctx.jcr->JobId,
699                rctx.PreferMountedVols, rctx.exact_match, rctx.suitable_device,
700                rctx.autochanger_only, rctx.any_drive);
701             if ((ok = find_suitable_device_for_job(jcr, rctx))) {
702                break;
703             }
704          }
705          /*
706           * Now we look for a drive that may or may not be in
707           *  use.
708           */
709          /* Look for an exact Volume match all drives */
710          rctx.PreferMountedVols = true;
711          rctx.exact_match = true;
712          rctx.autochanger_only = false;
713          Dmsg6(dbglvl, "jid=%u PrefMnt=%d exact=%d suitable=%d chgronly=%d any=%d\n",
714             (int)rctx.jcr->JobId,
715             rctx.PreferMountedVols, rctx.exact_match, rctx.suitable_device,
716             rctx.autochanger_only, rctx.any_drive);
717          if ((ok = find_suitable_device_for_job(jcr, rctx))) {
718             break;
719          }
720          /* Look for any mounted drive */
721          rctx.exact_match = false;
722          Dmsg6(dbglvl, "jid=%u PrefMnt=%d exact=%d suitable=%d chgronly=%d any=%d\n",
723             (int)rctx.jcr->JobId,
724             rctx.PreferMountedVols, rctx.exact_match, rctx.suitable_device,
725             rctx.autochanger_only, rctx.any_drive);
726          if ((ok = find_suitable_device_for_job(jcr, rctx))) {
727             break;
728          }
729          /* Try any drive */
730          rctx.any_drive = true;
731          Dmsg6(dbglvl, "jid=%u PrefMnt=%d exact=%d suitable=%d chgronly=%d any=%d\n",
732             (int)rctx.jcr->JobId,
733             rctx.PreferMountedVols, rctx.exact_match, rctx.suitable_device,
734             rctx.autochanger_only, rctx.any_drive);
735          if ((ok = find_suitable_device_for_job(jcr, rctx))) {
736             break;
737          }
738          /* Keep reservations locked *except* during wait_for_device() */
739          unlock_reservations();
740          /*     
741           * The idea of looping on repeat a few times it to ensure
742           * that if there is some subtle timing problem between two
743           * jobs, we will simply try again, and most likely succeed.
744           * This can happen if one job reserves a drive or finishes using
745           * a drive at the same time a second job wants it.
746           */
747          if (repeat++ > 1) {              /* try algorithm 3 times */
748             bmicrosleep(30, 0);           /* wait a bit */
749             Dmsg1(dbglvl, "jid=%u repeat reserve algorithm\n", (int)rctx.jcr->JobId);
750          } else if (!rctx.suitable_device || !wait_for_device(jcr, wait_for_device_retries)) {
751             Dmsg1(dbglvl, "jid=%u Fail. !suitable_device || !wait_for_device\n",
752                  (int)rctx.jcr->JobId);
753             fail = true;
754          }   
755          lock_reservations();
756          dir->signal(BNET_HEARTBEAT);  /* Inform Dir that we are alive */
757       }
758       unlock_reservations();
759       if (!ok) {
760          /*
761           * If we get here, there are no suitable devices available, which
762           *  means nothing configured.  If a device is suitable but busy
763           *  with another Volume, we will not come here.
764           */
765          unbash_spaces(dir->msg);
766          pm_strcpy(jcr->errmsg, dir->msg);
767          Jmsg(jcr, M_INFO, 0, _("Failed command: %s\n"), jcr->errmsg);
768          Jmsg(jcr, M_FATAL, 0, _("\n"
769             "     Device \"%s\" with MediaType \"%s\" requested by DIR not found in SD Device resources.\n"),
770               dev_name.c_str(), media_type.c_str());
771          dir->fsend(NO_device, dev_name.c_str());
772
773          Dmsg2(dbglvl, "jid=%u >dird: %s", jid(), dir->msg);
774       }
775    } else {
776       unbash_spaces(dir->msg);
777       pm_strcpy(jcr->errmsg, dir->msg);
778       Jmsg(jcr, M_FATAL, 0, _("Failed command: %s\n"), jcr->errmsg);
779       dir->fsend(BAD_use, jcr->errmsg);
780       Dmsg2(dbglvl, "jid=%u >dird: %s", jid(), dir->msg);
781    }
782
783    release_reserve_messages(jcr);
784    return ok;
785 }
786
787
788 /*
789  * Walk through the autochanger resources and check if
790  *  the volume is in one of them.
791  * 
792  * Returns:  true  if volume is in device
793  *           false otherwise
794  */
795 static bool is_vol_in_autochanger(RCTX &rctx, VOLRES *vol)
796 {
797    AUTOCHANGER *changer = vol->dev->device->changer_res;
798
799    /* Find resource, and make sure we were able to open it */
800    if (strcmp(rctx.device_name, changer->hdr.name) == 0) {
801       Dmsg2(dbglvl, "jid=%u Found changer device %s\n",
802                      (int)rctx.jcr->JobId, vol->dev->device->hdr.name);
803       return true;
804    }  
805    Dmsg2(dbglvl, "jid=%u Incorrect changer device %s\n", 
806                   (int)rctx.jcr->JobId, changer->hdr.name);
807    return false;
808 }
809
810 /*
811  * Search for a device suitable for this job.
812  */
813 bool find_suitable_device_for_job(JCR *jcr, RCTX &rctx)
814 {
815    bool ok = false;
816    DIRSTORE *store;
817    char *device_name;
818    alist *dirstore;
819    DCR *dcr = jcr->dcr;
820
821    if (rctx.append) {
822       dirstore = jcr->write_store;
823    } else {
824       dirstore = jcr->read_store;
825    }
826    Dmsg5(dbglvl, "jid=%u PrefMnt=%d exact=%d suitable=%d chgronly=%d\n",
827       (int)rctx.jcr->JobId,
828       rctx.PreferMountedVols, rctx.exact_match, rctx.suitable_device,
829       rctx.autochanger_only);
830
831    /* 
832     * If the appropriate conditions of this if are met, namely that
833     *  we are appending and the user wants mounted drive (or we
834     *  force try a mounted drive because they are all busy), we
835     *  start by looking at all the Volumes in the volume list.
836     */
837    if (!vol_list->empty() && rctx.append && rctx.PreferMountedVols) {
838       dlist *temp_vol_list, *save_vol_list;
839       VOLRES *vol = NULL;
840       lock_volumes();
841       Dmsg1(dbglvl, "jid=%u lock volumes\n", (uint32_t)rctx.jcr->JobId);
842
843       /*  
844        * Create a temporary copy of the volume list.  We do this,
845        *   to avoid having the volume list locked during the
846        *   call to reserve_device(), which would cause a deadlock.
847        * Note, we may want to add an update counter on the vol_list
848        *   so that if it is modified while we are traversing the copy
849        *   we can take note and act accordingly (probably redo the 
850        *   search at least a few times).
851        */
852       Dmsg1(dbglvl, "jid=%u duplicate vol list\n", (int)rctx.jcr->JobId);
853       temp_vol_list = New(dlist(vol, &vol->link));
854       foreach_dlist(vol, vol_list) {
855          VOLRES *nvol;
856          VOLRES *tvol = (VOLRES *)malloc(sizeof(VOLRES));
857          memset(tvol, 0, sizeof(VOLRES));
858          tvol->vol_name = bstrdup(vol->vol_name);
859          tvol->dev = vol->dev;
860          nvol = (VOLRES *)temp_vol_list->binary_insert(tvol, my_compare);
861          if (tvol != nvol) {
862             tvol->dev = NULL;                   /* don't zap dev entry */
863             free_vol_item(tvol);
864             Pmsg0(000, "Logic error. Duplicating vol list hit duplicate.\n");
865             Jmsg(jcr, M_WARNING, 0, "Logic error. Duplicating vol list hit duplicate.\n");
866          }
867       }
868       Dmsg1(dbglvl, "jid=%u unlock volumes\n", (uint32_t)jcr->JobId);
869       unlock_volumes();
870
871       /* Look through reserved volumes for one we can use */
872       Dmsg1(dbglvl, "jid=%u look for vol in vol list\n", (int)rctx.jcr->JobId);
873       foreach_dlist(vol, temp_vol_list) {
874          if (!vol->dev) {
875             Dmsg2(dbglvl, "jid=%u vol=%s no dev\n", (int)rctx.jcr->JobId, vol->vol_name);
876             continue;
877          }
878          /* Check with Director if this Volume is OK */
879          bstrncpy(dcr->VolumeName, vol->vol_name, sizeof(dcr->VolumeName));
880          if (!dir_get_volume_info(dcr, GET_VOL_INFO_FOR_WRITE)) {
881             continue;
882          }
883
884          Dmsg2(dbglvl, "jid=%u vol=%s OK for this job\n", (int)rctx.jcr->JobId, vol->vol_name);
885          foreach_alist(store, dirstore) {
886             int stat;
887             rctx.store = store;
888             foreach_alist(device_name, store->device) {
889                /* Found a device, try to use it */
890                rctx.device_name = device_name;
891                rctx.device = vol->dev->device;
892
893                if (vol->dev->is_autochanger()) {
894                   Dmsg2(dbglvl, "jid=%u vol=%s is in changer\n", (int)rctx.jcr->JobId, 
895                         vol->vol_name);
896                   if (!is_vol_in_autochanger(rctx, vol)) {
897                      continue;
898                   }
899                } else if (strcmp(device_name, vol->dev->device->hdr.name) != 0) {
900                   Dmsg3(dbglvl, "jid=%u device=%s not suitable want %s\n", (int)rctx.jcr->JobId, 
901                         vol->dev->device->hdr.name, device_name);
902                   continue;
903                }
904
905                bstrncpy(rctx.VolumeName, vol->vol_name, sizeof(rctx.VolumeName));
906                rctx.have_volume = true;
907                /* Try reserving this device and volume */
908                Dmsg3(dbglvl, "jid=%u try vol=%s on device=%s\n", (int)rctx.jcr->JobId, 
909                      rctx.VolumeName, device_name);
910                stat = reserve_device(rctx);
911                if (stat == 1) {             /* found available device */
912                   Dmsg2(dbglvl, "jid=%u Suitable device found=%s\n", (int)rctx.jcr->JobId, 
913                         device_name);
914                   ok = true;
915                   break;
916                } else if (stat == 0) {      /* device busy */
917                   Dmsg2(dbglvl, "jid=%u Suitable device=%s, busy: not use\n", 
918                         (int)rctx.jcr->JobId, device_name);
919                } else {
920                   /* otherwise error */
921                   Dmsg1(dbglvl, "jid=%u No suitable device found.\n", (int)rctx.jcr->JobId);
922                }
923                rctx.have_volume = false;
924             }
925             if (ok) {
926                break;
927             }
928          }
929          if (ok) {
930             break;
931          }
932       } /* end for loop over reserved volumes */
933
934       Dmsg1(dbglvl, "jid=%u lock volumes\n", (uint32_t)rctx.jcr->JobId);
935       lock_volumes();
936       save_vol_list = vol_list;
937       vol_list = temp_vol_list;
938       free_volume_list();                  /* release temp_vol_list */
939       vol_list = save_vol_list;
940       Dmsg1(dbglvl, "jid=%u deleted temp vol list\n", (int)rctx.jcr->JobId);
941       Dmsg1(dbglvl, "jid=%u lock volumes\n", (uint32_t)rctx.jcr->JobId);
942       unlock_volumes();
943    }
944    if (ok) {
945       Dmsg2(dbglvl, "jid=%u got vol %s from in-use vols list\n", (int)rctx.jcr->JobId,
946             rctx.VolumeName);
947       return true;
948    }
949
950    /* 
951     * No reserved volume we can use, so now search for an available device.  
952     *
953     * For each storage device that the user specified, we
954     *  search and see if there is a resource for that device.
955     */
956    foreach_alist(store, dirstore) {
957       rctx.store = store;
958       foreach_alist(device_name, store->device) {
959          int stat;
960          rctx.device_name = device_name;
961          stat = search_res_for_device(rctx); 
962          if (stat == 1) {             /* found available device */
963             Dmsg2(dbglvl, "jid=%u available device found=%s\n", (int)rctx.jcr->JobId, 
964                   device_name);
965             ok = true;
966             break;
967          } else if (stat == 0) {      /* device busy */
968             Dmsg2(dbglvl, "jid=%u Suitable device=%s, busy: not use\n", 
969                   (int)rctx.jcr->JobId, device_name);
970          } else {
971             /* otherwise error */
972             Dmsg1(dbglvl, "jid=%u No suitable device found.\n", (int)rctx.jcr->JobId);
973          }
974       }
975       if (ok) {
976          break;
977       }
978    }
979    return ok;
980 }
981
982 /*
983  * Search for a particular storage device with particular storage
984  *  characteristics (MediaType).
985  */
986 int search_res_for_device(RCTX &rctx) 
987 {
988    AUTOCHANGER *changer;
989    int stat;
990
991    Dmsg2(dbglvl, "jid=%u search res for %s\n", (int)rctx.jcr->JobId, rctx.device_name);
992    /* Look through Autochangers first */
993    foreach_res(changer, R_AUTOCHANGER) {
994       Dmsg2(dbglvl, "jid=%u Try match changer res=%s\n", (int)rctx.jcr->JobId, changer->hdr.name);
995       /* Find resource, and make sure we were able to open it */
996       if (strcmp(rctx.device_name, changer->hdr.name) == 0) {
997          /* Try each device in this AutoChanger */
998          foreach_alist(rctx.device, changer->device) {
999             Dmsg2(dbglvl, "jid=%u Try changer device %s\n", (int)rctx.jcr->JobId, 
1000                   rctx.device->hdr.name);
1001             stat = reserve_device(rctx);
1002             if (stat != 1) {             /* try another device */
1003                continue;
1004             }
1005             /* Debug code */
1006             if (rctx.store->append == SD_APPEND) {
1007                Dmsg3(dbglvl, "jid=%u Device %s reserved=%d for append.\n", 
1008                   (int)rctx.jcr->JobId, rctx.device->hdr.name,
1009                   rctx.jcr->dcr->dev->reserved_device);
1010             } else {
1011                Dmsg3(dbglvl, "jid=%u Device %s reserved=%d for read.\n", 
1012                   (int)rctx.jcr->JobId, rctx.device->hdr.name,
1013                   rctx.jcr->read_dcr->dev->reserved_device);
1014             }
1015             return stat;
1016          }
1017       }
1018    }
1019
1020    /* Now if requested look through regular devices */
1021    if (!rctx.autochanger_only) {
1022       foreach_res(rctx.device, R_DEVICE) {
1023          Dmsg2(dbglvl, "jid=%u Try match res=%s\n", (int)rctx.jcr->JobId, rctx.device->hdr.name);
1024          /* Find resource, and make sure we were able to open it */
1025          if (strcmp(rctx.device_name, rctx.device->hdr.name) == 0) {
1026             stat = reserve_device(rctx);
1027             if (stat != 1) {             /* try another device */
1028                continue;
1029             }
1030             /* Debug code */
1031             if (rctx.store->append == SD_APPEND) {
1032                Dmsg3(dbglvl, "jid=%u Device %s reserved=%d for append.\n", 
1033                   (int)rctx.jcr->JobId, rctx.device->hdr.name,
1034                   rctx.jcr->dcr->dev->reserved_device);
1035             } else {
1036                Dmsg3(dbglvl, "jid=%u Device %s reserved=%d for read.\n", 
1037                   (int)rctx.jcr->JobId, rctx.device->hdr.name,
1038                   rctx.jcr->read_dcr->dev->reserved_device);
1039             }
1040             return stat;
1041          }
1042       }
1043    }
1044    return -1;                    /* nothing found */
1045 }
1046
1047 /*
1048  *  Try to reserve a specific device.
1049  *
1050  *  Returns: 1 -- OK, have DCR
1051  *           0 -- must wait
1052  *          -1 -- fatal error
1053  */
1054 static int reserve_device(RCTX &rctx)
1055 {
1056    bool ok;
1057    DCR *dcr;
1058    const int name_len = MAX_NAME_LENGTH;
1059
1060    /* Make sure MediaType is OK */
1061    Dmsg3(dbglvl, "jid=%u chk MediaType device=%s request=%s\n",
1062          (int)rctx.jcr->JobId,
1063          rctx.device->media_type, rctx.store->media_type);
1064    if (strcmp(rctx.device->media_type, rctx.store->media_type) != 0) {
1065       return -1;
1066    }
1067
1068    /* Make sure device exists -- i.e. we can stat() it */
1069    if (!rctx.device->dev) {
1070       rctx.device->dev = init_dev(rctx.jcr, rctx.device);
1071    }
1072    if (!rctx.device->dev) {
1073       if (rctx.device->changer_res) {
1074         Jmsg(rctx.jcr, M_WARNING, 0, _("\n"
1075            "     Device \"%s\" in changer \"%s\" requested by DIR could not be opened or does not exist.\n"),
1076              rctx.device->hdr.name, rctx.device_name);
1077       } else {
1078          Jmsg(rctx.jcr, M_WARNING, 0, _("\n"
1079             "     Device \"%s\" requested by DIR could not be opened or does not exist.\n"),
1080               rctx.device_name);
1081       }
1082       return -1;  /* no use waiting */
1083    }  
1084
1085    rctx.suitable_device = true;
1086    Dmsg2(dbglvl, "jid=%u try reserve %s\n", rctx.jcr->JobId, rctx.device->hdr.name);
1087    rctx.jcr->dcr = dcr = new_dcr(rctx.jcr, rctx.jcr->dcr, rctx.device->dev);
1088    if (!dcr) {
1089       BSOCK *dir = rctx.jcr->dir_bsock;
1090       dir->fsend(_("3926 Could not get dcr for device: %s\n"), rctx.device_name);
1091       Dmsg1(dbglvl, ">dird: %s", dir->msg);
1092       return -1;
1093    }
1094    bstrncpy(dcr->pool_name, rctx.store->pool_name, name_len);
1095    bstrncpy(dcr->pool_type, rctx.store->pool_type, name_len);
1096    bstrncpy(dcr->media_type, rctx.store->media_type, name_len);
1097    bstrncpy(dcr->dev_name, rctx.device_name, name_len);
1098    if (rctx.store->append == SD_APPEND) {
1099       Dmsg3(dbglvl, "jid=%u have_vol=%d vol=%s\n", (int)rctx.jcr->JobId,
1100           rctx.have_volume, rctx.VolumeName);                                   
1101       ok = reserve_device_for_append(dcr, rctx);
1102       if (!ok) {
1103          goto bail_out;
1104       }
1105
1106       rctx.jcr->dcr = dcr;
1107       Dmsg6(dbglvl, "jid=%u Reserved=%d dev_name=%s mediatype=%s pool=%s ok=%d\n",
1108                (int)rctx.jcr->JobId,
1109                dcr->dev->reserved_device,
1110                dcr->dev_name, dcr->media_type, dcr->pool_name, ok);
1111       if (!rctx.have_volume) {
1112          dcr->any_volume = true;
1113          if (dir_find_next_appendable_volume(dcr)) {
1114             bstrncpy(rctx.VolumeName, dcr->VolumeName, sizeof(rctx.VolumeName));
1115             Dmsg2(dbglvl, "jid=%u looking for Volume=%s\n", (int)rctx.jcr->JobId, rctx.VolumeName);
1116             rctx.have_volume = true;
1117          } else {
1118             Dmsg1(dbglvl, "jid=%u No next volume found\n", (int)rctx.jcr->JobId);
1119             rctx.have_volume = false;
1120             rctx.VolumeName[0] = 0;
1121             /*
1122              * If there is at least one volume that is valid and in use,
1123              *   but we get here, check if we are running with prefers
1124              *   non-mounted drives.  In that case, we have selected a
1125              *   non-used drive and our one and only volume is mounted
1126              *   elsewhere, so we bail out and retry using that drive.
1127              */
1128             if (dcr->volume_in_use && !rctx.PreferMountedVols) {
1129                rctx.PreferMountedVols = true;
1130                if (dcr->VolumeName[0]) {
1131                   volume_unused(dcr);
1132                }
1133                goto bail_out;
1134             }
1135             /*
1136              * Note. Under some circumstances, the Director can hand us
1137              *  a Volume name that is no the same as the one on the current
1138              *  drive, and in that case, the call above to find the next
1139              *  volume will fail because in attempting to reserve the Volume
1140              *  the code will realize that we already have a tape mounted,
1141              *  and it will fail.  This *should* only happen if there are 
1142              *  writers, thus the following test.  In that case, we simply
1143              *  bail out, and continue waiting, rather than plunging on
1144              *  and hoping that the operator can resolve the problem. 
1145              */
1146             if (dcr->dev->num_writers != 0) {
1147                if (dcr->VolumeName[0]) {
1148                   volume_unused(dcr);
1149                }
1150                goto bail_out;
1151             }
1152          }
1153       }
1154    } else {
1155       ok = reserve_device_for_read(dcr);
1156       if (ok) {
1157          rctx.jcr->read_dcr = dcr;
1158          Dmsg6(dbglvl, "jid=%u Read reserved=%d dev_name=%s mediatype=%s pool=%s ok=%d\n",
1159                (int)rctx.jcr->JobId,
1160                dcr->dev->reserved_device,
1161                dcr->dev_name, dcr->media_type, dcr->pool_name, ok);
1162       }
1163    }
1164    if (!ok) {
1165       goto bail_out;
1166    }
1167    if (rctx.notify_dir) {
1168       POOL_MEM dev_name;
1169       BSOCK *dir = rctx.jcr->dir_bsock;
1170       pm_strcpy(dev_name, rctx.device->hdr.name);
1171       bash_spaces(dev_name);
1172       ok = dir->fsend(OK_device, dev_name.c_str());  /* Return real device name */
1173       Dmsg2(dbglvl, "jid=%u >dird: %s", jid(), dir->msg);
1174    } else {
1175       ok = true;
1176    }
1177    return ok ? 1 : -1;
1178
1179 bail_out:
1180    rctx.have_volume = false;
1181 // free_dcr(dcr);
1182    Dmsg1(dbglvl, "jid=%u Not OK.\n", (int)rctx.jcr->JobId);
1183    return 0;
1184 }
1185
1186 /*
1187  * We "reserve" the drive by setting the ST_READ bit. No one else
1188  *  should touch the drive until that is cleared.
1189  *  This allows the DIR to "reserve" the device before actually
1190  *  starting the job. 
1191  */
1192 static bool reserve_device_for_read(DCR *dcr)
1193 {
1194    DEVICE *dev = dcr->dev;
1195    JCR *jcr = dcr->jcr;
1196    bool ok = false;
1197
1198    ASSERT(dcr);
1199
1200    dev->dlock();  
1201
1202    if (is_device_unmounted(dev)) {             
1203       Dmsg2(dbglvl, "jid=%u Device %s is BLOCKED due to user unmount.\n", 
1204          (int)jcr->JobId, dev->print_name());
1205       Mmsg(jcr->errmsg, _("3601 JobId=%u device %s is BLOCKED due to user unmount.\n"),
1206            jcr->JobId, dev->print_name());
1207       queue_reserve_message(jcr);
1208       goto bail_out;
1209    }
1210
1211    if (dev->is_busy()) {
1212       Dmsg5(dbglvl, "jid=%u Device %s is busy ST_READ=%d num_writers=%d reserved=%d.\n", 
1213          (int)jcr->JobId, dev->print_name(),
1214          dev->state & ST_READ?1:0, dev->num_writers, dev->reserved_device);
1215       Mmsg(jcr->errmsg, _("3602 JobId=%u device %s is busy (already reading/writing).\n"),
1216             jcr->JobId, dev->print_name());
1217       queue_reserve_message(jcr);
1218       goto bail_out;
1219    }
1220
1221    dev->clear_append();
1222    dev->set_read();
1223    ok = true;
1224    dev->reserved_device++;
1225    Dmsg4(dbglvl, "jid=%u Inc reserve=%d dev=%s %p\n", (int)jcr->JobId,
1226       dev->reserved_device, dev->print_name(), dev);
1227    dcr->reserved_device = true;
1228
1229 bail_out:
1230    dev->dunlock();
1231    return ok;
1232 }
1233
1234
1235 /*
1236  * We reserve the device for appending by incrementing the 
1237  *  reserved_device. We do virtually all the same work that
1238  *  is done in acquire_device_for_append(), but we do
1239  *  not attempt to mount the device. This routine allows
1240  *  the DIR to reserve multiple devices before *really* 
1241  *  starting the job. It also permits the SD to refuse 
1242  *  certain devices (not up, ...).
1243  *
1244  * Note, in reserving a device, if the device is for the
1245  *  same pool and the same pool type, then it is acceptable.
1246  *  The Media Type has already been checked. If we are
1247  *  the first tor reserve the device, we put the pool
1248  *  name and pool type in the device record.
1249  */
1250 static bool reserve_device_for_append(DCR *dcr, RCTX &rctx)
1251 {
1252    JCR *jcr = dcr->jcr;
1253    DEVICE *dev = dcr->dev;
1254    bool ok = false;
1255
1256    ASSERT(dcr);
1257
1258    dev->dlock();
1259
1260    /* If device is being read, we cannot write it */
1261    if (dev->can_read()) {
1262       Mmsg(jcr->errmsg, _("3603 JobId=%u device %s is busy reading.\n"), 
1263          jcr->JobId, dev->print_name());
1264       Dmsg2(dbglvl, "jid=%u %s", jid(), jcr->errmsg);
1265       queue_reserve_message(jcr);
1266       goto bail_out;
1267    }
1268
1269    /* If device is unmounted, we are out of luck */
1270    if (is_device_unmounted(dev)) {
1271       Mmsg(jcr->errmsg, _("3604 JobId=%u device %s is BLOCKED due to user unmount.\n"), 
1272          jcr->JobId, dev->print_name());
1273       Dmsg2(dbglvl, "jid=%u %s", jid(), jcr->errmsg);
1274       queue_reserve_message(jcr);
1275       goto bail_out;
1276    }
1277
1278    Dmsg2(dbglvl, "jid=%u reserve_append device is %s\n", 
1279        (int)jcr->JobId, dev->print_name());
1280
1281    /* Now do detailed tests ... */
1282    if (can_reserve_drive(dcr, rctx) != 1) {
1283       Dmsg1(dbglvl, "jid=%u can_reserve_drive!=1\n", (int)jcr->JobId);
1284       goto bail_out;
1285    }
1286
1287    dev->reserved_device++;
1288    Dmsg4(dbglvl, "jid=%u Inc reserve=%d dev=%s %p\n", (int)jcr->JobId, dev->reserved_device, 
1289       dev->print_name(), dev);
1290    dcr->reserved_device = true;
1291    ok = true;
1292
1293 bail_out:
1294    dev->dunlock();
1295    return ok;
1296 }
1297
1298 static int is_pool_ok(DCR *dcr)
1299 {
1300    DEVICE *dev = dcr->dev;
1301    JCR *jcr = dcr->jcr;
1302
1303    /* Now check if we want the same Pool and pool type */
1304    if (strcmp(dev->pool_name, dcr->pool_name) == 0 &&
1305        strcmp(dev->pool_type, dcr->pool_type) == 0) {
1306       /* OK, compatible device */
1307       Dmsg2(dbglvl, "jid=%u OK dev: %s num_writers=0, reserved, pool matches\n",
1308          jcr->JobId, dev->print_name());
1309       return 1;
1310    } else {
1311       /* Drive Pool not suitable for us */
1312       Mmsg(jcr->errmsg, _(
1313 "3608 JobId=%u wants Pool=\"%s\" but have Pool=\"%s\" nreserve=%d on drive %s.\n"), 
1314             jcr->JobId, dcr->pool_name, dev->pool_name,
1315             dev->reserved_device, dev->print_name());
1316       queue_reserve_message(jcr);
1317       Dmsg3(dbglvl, "jid=%u failed: busy num_writers=0, reserved, pool=%s wanted=%s\n",
1318          (int)jcr->JobId, dev->pool_name, dcr->pool_name);
1319    }
1320    return 0;
1321 }
1322
1323 static bool is_max_jobs_ok(DCR *dcr) 
1324 {
1325    DEVICE *dev = dcr->dev;
1326    JCR *jcr = dcr->jcr;
1327
1328    Dmsg5(dbglvl, "jid=%u MaxJobs=%d Jobs=%d reserves=%d Vol=%s\n",
1329          (uint32_t)jcr->JobId, dcr->VolCatInfo.VolCatMaxJobs,
1330          dcr->VolCatInfo.VolCatJobs, dev->reserved_device,
1331          dcr->VolumeName);
1332    if (dcr->VolCatInfo.VolCatMaxJobs > 0 && dcr->VolCatInfo.VolCatMaxJobs <=
1333         (dcr->VolCatInfo.VolCatJobs + dev->reserved_device)) {
1334       /* Max Job Vols depassed or already reserved */
1335       Mmsg(jcr->errmsg, _("3610 JobId=%u Volume max jobs exceeded on drive %s.\n"), 
1336             (uint32_t)jcr->JobId, dev->print_name());
1337       queue_reserve_message(jcr);
1338       Dmsg2(dbglvl, "jid=%u reserve dev failed: %s", (uint32_t)jcr->JobId, jcr->errmsg);
1339       return false;                /* wait */
1340    }
1341    return true;
1342 }
1343
1344 /*
1345  * Returns: 1 if drive can be reserved
1346  *          0 if we should wait
1347  *         -1 on error or impossibility
1348  */
1349 static int can_reserve_drive(DCR *dcr, RCTX &rctx) 
1350 {
1351    DEVICE *dev = dcr->dev;
1352    JCR *jcr = dcr->jcr;
1353
1354    Dmsg6(dbglvl, "jid=%u PrefMnt=%d exact=%d suitable=%d chgronly=%d any=%d\n",
1355          (int)jcr->JobId,
1356          rctx.PreferMountedVols, rctx.exact_match, rctx.suitable_device,
1357          rctx.autochanger_only, rctx.any_drive);
1358
1359    /* setting any_drive overrides PreferMountedVols flag */
1360    if (!rctx.any_drive) {
1361       /*
1362        * When PreferMountedVols is set, we keep track of the 
1363        *  drive in use that has the least number of writers, then if
1364        *  no unmounted drive is found, we try that drive. This   
1365        *  helps spread the load to the least used drives.  
1366        */
1367       if (rctx.try_low_use_drive && dev == rctx.low_use_drive) {
1368          Dmsg3(dbglvl, "jid=%u OK dev=%s == low_drive=%s.\n",
1369             jcr->JobId, dev->print_name(), rctx.low_use_drive->print_name());
1370          return 1;
1371       }
1372       /* If he wants a free drive, but this one is busy, no go */
1373       if (!rctx.PreferMountedVols && dev->is_busy()) {
1374          /* Save least used drive */
1375          if ((dev->num_writers + dev->reserved_device) < rctx.num_writers) {
1376             rctx.num_writers = dev->num_writers + dev->reserved_device;
1377             rctx.low_use_drive = dev;
1378             Dmsg3(dbglvl, "jid=%u set low use drive=%s num_writers=%d\n", 
1379                (int)jcr->JobId, dev->print_name(), rctx.num_writers);
1380          } else {
1381             Dmsg2(dbglvl, "jid=%u not low use num_writers=%d\n", 
1382                (int)jcr->JobId, dev->num_writers+dev->reserved_device);
1383          }
1384          Dmsg1(dbglvl, "jid=%u failed: !prefMnt && busy.\n", jcr->JobId);
1385          Mmsg(jcr->errmsg, _("3605 JobId=%u wants free drive but device %s is busy.\n"), 
1386             jcr->JobId, dev->print_name());
1387          queue_reserve_message(jcr);
1388          return 0;
1389       }
1390
1391       /* Check for prefer mounted volumes */
1392       if (rctx.PreferMountedVols && !dev->vol && dev->is_tape()) {
1393          Mmsg(jcr->errmsg, _("3606 JobId=%u prefers mounted drives, but drive %s has no Volume.\n"), 
1394             jcr->JobId, dev->print_name());
1395          queue_reserve_message(jcr);
1396          Dmsg1(dbglvl, "jid=%u failed: want mounted -- no vol\n", (uint32_t)jcr->JobId);
1397          return 0;                 /* No volume mounted */
1398       }
1399
1400       /* Check for exact Volume name match */
1401       /* ***FIXME*** for Disk, we can accept any volume that goes with this
1402        *    drive.
1403        */
1404       if (rctx.exact_match && rctx.have_volume) {
1405          bool ok;
1406          Dmsg6(dbglvl, "jid=%u PrefMnt=%d exact=%d suitable=%d chgronly=%d any=%d\n",
1407                (int)jcr->JobId,
1408                rctx.PreferMountedVols, rctx.exact_match, rctx.suitable_device,
1409                rctx.autochanger_only, rctx.any_drive);
1410          Dmsg5(dbglvl, "jid=%u have_vol=%d have=%s resvol=%s want=%s\n",
1411                   (int)jcr->JobId, rctx.have_volume, dev->VolHdr.VolumeName, 
1412                   dev->vol?dev->vol->vol_name:"*none*", rctx.VolumeName);
1413          ok = strcmp(dev->VolHdr.VolumeName, rctx.VolumeName) == 0 ||
1414                  (dev->vol && strcmp(dev->vol->vol_name, rctx.VolumeName) == 0);
1415          if (!ok) {
1416             Mmsg(jcr->errmsg, _("3607 JobId=%u wants Vol=\"%s\" drive has Vol=\"%s\" on drive %s.\n"), 
1417                jcr->JobId, rctx.VolumeName, dev->VolHdr.VolumeName, 
1418                dev->print_name());
1419             queue_reserve_message(jcr);
1420             Dmsg4(dbglvl, "jid=%u not OK: dev have=%s resvol=%s want=%s\n",
1421                   (int)jcr->JobId, dev->VolHdr.VolumeName, 
1422                   dev->vol?dev->vol->vol_name:"*none*", rctx.VolumeName);
1423             return 0;
1424          }
1425          if (is_volume_in_use(dcr)) {
1426             return 0;              /* fail if volume on another drive */
1427          }
1428       }
1429    }
1430
1431    /* Check for unused autochanger drive */
1432    if (rctx.autochanger_only && !dev->is_busy() &&
1433        dev->VolHdr.VolumeName[0] == 0) {
1434       /* Device is available but not yet reserved, reserve it for us */
1435       Dmsg2(dbglvl, "jid=%u OK Res Unused autochanger %s.\n",
1436          jcr->JobId, dev->print_name());
1437       bstrncpy(dev->pool_name, dcr->pool_name, sizeof(dev->pool_name));
1438       bstrncpy(dev->pool_type, dcr->pool_type, sizeof(dev->pool_type));
1439       return 1;                       /* reserve drive */
1440    }
1441
1442    /*
1443     * Handle the case that there are no writers
1444     */
1445    if (dev->num_writers == 0) {
1446       /* Now check if there are any reservations on the drive */
1447       if (dev->reserved_device) {           
1448          if (!is_max_jobs_ok(dcr)) {
1449             return 0;
1450          }
1451          return is_pool_ok(dcr);
1452       } else if (dev->can_append()) {
1453          if (is_pool_ok(dcr)) {
1454             return 1; 
1455          } else {
1456             /* Changing pool, unload old tape if any in drive */
1457             Dmsg1(dbglvl, "jid=%u OK dev: num_writers=0, not reserved, pool change, unload changer\n",
1458                 (int)jcr->JobId);
1459             unload_autochanger(dcr, 0);
1460          }
1461       }
1462       /* Device is available but not yet reserved, reserve it for us */
1463       Dmsg2(dbglvl, "jid=%u OK Dev avail reserved %s\n", jcr->JobId, dev->print_name());
1464       bstrncpy(dev->pool_name, dcr->pool_name, sizeof(dev->pool_name));
1465       bstrncpy(dev->pool_type, dcr->pool_type, sizeof(dev->pool_type));
1466       return 1;                       /* reserve drive */
1467    }
1468
1469    /*
1470     * Check if the device is in append mode with writers (i.e.
1471     *  available if pool is the same).
1472     */
1473    if (dev->can_append() || dev->num_writers > 0) {
1474       if (!is_max_jobs_ok(dcr)) {
1475          return 0;
1476       }
1477       return is_pool_ok(dcr);
1478    } else {
1479       Pmsg1(000, _("Logic error!!!! JobId=%u Should not get here.\n"), (int)jcr->JobId);
1480       Mmsg(jcr->errmsg, _("3910 JobId=%u Logic error!!!! drive %s Should not get here.\n"),
1481             jcr->JobId, dev->print_name());
1482       queue_reserve_message(jcr);
1483       Jmsg0(jcr, M_FATAL, 0, _("Logic error!!!! Should not get here.\n"));
1484       return -1;                      /* error, should not get here */
1485    }
1486    Mmsg(jcr->errmsg, _("3911 JobId=%u failed reserve drive %s.\n"), 
1487          jcr->JobId, dev->print_name());
1488    queue_reserve_message(jcr);
1489    Dmsg2(dbglvl, "jid=%u failed: No reserve %s\n", jcr->JobId, dev->print_name());
1490    return 0;
1491 }
1492
1493
1494
1495
1496 /*
1497  * Queue a reservation error or failure message for this jcr
1498  */
1499 static void queue_reserve_message(JCR *jcr)
1500 {
1501    int i;   
1502    alist *msgs;
1503    char *msg;
1504
1505    jcr->lock();
1506
1507    msgs = jcr->reserve_msgs;
1508    if (!msgs) {
1509       goto bail_out;
1510    }
1511    /*
1512     * Look for duplicate message.  If found, do
1513     * not insert
1514     */
1515    for (i=msgs->size()-1; i >= 0; i--) {
1516       msg = (char *)msgs->get(i);
1517       if (!msg) {
1518          goto bail_out;
1519       }
1520       /* Comparison based on 4 digit message number */
1521       if (strncmp(msg, jcr->errmsg, 4) == 0) {
1522          goto bail_out;
1523       }
1524    }      
1525    /* Message unique, so insert it */
1526    jcr->reserve_msgs->push(bstrdup(jcr->errmsg));
1527
1528 bail_out:
1529    jcr->unlock();
1530 }
1531
1532 /*
1533  * Send any reservation messages queued for this jcr
1534  */
1535 void send_drive_reserve_messages(JCR *jcr, void sendit(const char *msg, int len, void *sarg), void *arg)
1536 {
1537    int i;
1538    alist *msgs;
1539    char *msg;
1540
1541    jcr->lock();
1542    msgs = jcr->reserve_msgs;
1543    if (!msgs || msgs->size() == 0) {
1544       goto bail_out;
1545    }
1546    for (i=msgs->size()-1; i >= 0; i--) {
1547       msg = (char *)msgs->get(i);
1548       if (msg) {
1549          sendit("   ", 3, arg);
1550          sendit(msg, strlen(msg), arg);
1551       } else {
1552          break;
1553       }
1554    }
1555
1556 bail_out:
1557    jcr->unlock();
1558 }
1559
1560 /*
1561  * Pop and release any reservations messages
1562  */
1563 static void pop_reserve_messages(JCR *jcr)
1564 {
1565    alist *msgs;
1566    char *msg;
1567
1568    jcr->lock();
1569    msgs = jcr->reserve_msgs;
1570    if (!msgs) {
1571       goto bail_out;
1572    }
1573    while ((msg = (char *)msgs->pop())) {
1574       free(msg);
1575    }
1576 bail_out:
1577    jcr->unlock();
1578 }
1579
1580 /*
1581  * Also called from acquire.c 
1582  */
1583 void release_reserve_messages(JCR *jcr)
1584 {
1585    pop_reserve_messages(jcr);
1586    jcr->lock();
1587    if (!jcr->reserve_msgs) {
1588       goto bail_out;
1589    }
1590    delete jcr->reserve_msgs;
1591    jcr->reserve_msgs = NULL;
1592
1593 bail_out:
1594    jcr->unlock();
1595 }