]> git.sur5r.net Git - bacula/bacula/blob - bacula/src/stored/reserve.c
Update copyrights
[bacula/bacula] / bacula / src / stored / reserve.c
1 /*
2    Bacula® - The Network Backup Solution
3
4    Copyright (C) 2000-2008 Free Software Foundation Europe e.V.
5
6    The main author of Bacula is Kern Sibbald, with contributions from
7    many others, a complete list can be found in the file AUTHORS.
8    This program is Free Software; you can redistribute it and/or
9    modify it under the terms of version two of the GNU General Public
10    License as published by the Free Software Foundation and included
11    in the file LICENSE.
12
13    This program is distributed in the hope that it will be useful, but
14    WITHOUT ANY WARRANTY; without even the implied warranty of
15    MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE. See the GNU
16    General Public License for more details.
17
18    You should have received a copy of the GNU General Public License
19    along with this program; if not, write to the Free Software
20    Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA
21    02110-1301, USA.
22
23    Bacula® is a registered trademark of John Walker.
24    The licensor of Bacula is the Free Software Foundation Europe
25    (FSFE), Fiduciary Program, Sumatrastrasse 25, 8006 Zürich,
26    Switzerland, email:ftf@fsfeurope.org.
27 */
28 /*
29  *   Drive reservation functions for Storage Daemon
30  *
31  *   Kern Sibbald, MM
32  *
33  *   Split from job.c and acquire.c June 2005
34  *
35  *   Version $Id$
36  *
37  */
38
39 #include "bacula.h"
40 #include "stored.h"
41
42 const int dbglvl =  50;
43
44 static dlist *vol_list = NULL;
45 static brwlock_t reservation_lock;
46 static brwlock_t vol_list_lock;
47
48 /* Forward referenced functions */
49 static int can_reserve_drive(DCR *dcr, RCTX &rctx);
50 static int reserve_device(RCTX &rctx);
51 static bool reserve_device_for_read(DCR *dcr);
52 static bool reserve_device_for_append(DCR *dcr, RCTX &rctx);
53 static bool use_storage_cmd(JCR *jcr);
54 static void queue_reserve_message(JCR *jcr);
55 static void pop_reserve_messages(JCR *jcr);
56
57 /* Requests from the Director daemon */
58 static char use_storage[]  = "use storage=%127s media_type=%127s "
59    "pool_name=%127s pool_type=%127s append=%d copy=%d stripe=%d\n";
60 static char use_device[]  = "use device=%127s\n";
61
62 /* Responses sent to Director daemon */
63 static char OK_device[] = "3000 OK use device device=%s\n";
64 static char NO_device[] = "3924 Device \"%s\" not in SD Device resources.\n";
65 static char BAD_use[]   = "3913 Bad use command: %s\n";
66
67 bool use_cmd(JCR *jcr) 
68 {
69    /*
70     * Get the device, media, and pool information
71     */
72    if (!use_storage_cmd(jcr)) {
73       set_jcr_job_status(jcr, JS_ErrorTerminated);
74       memset(jcr->sd_auth_key, 0, strlen(jcr->sd_auth_key));
75       return false;
76    }
77    return true;
78 }
79
80 static int my_compare(void *item1, void *item2)
81 {
82    return strcmp(((VOLRES *)item1)->vol_name, ((VOLRES *)item2)->vol_name);
83 }
84
85 /*
86  * This allows a given thread to recursively call lock_reservations.
87  *   It must, of course, call unlock_... the same number of times.
88  */
89 void init_reservations_lock()
90 {
91    int errstat;
92    if ((errstat=rwl_init(&reservation_lock)) != 0) {
93       berrno be;
94       Emsg1(M_ABORT, 0, _("Unable to initialize reservation lock. ERR=%s\n"),
95             be.bstrerror(errstat));
96    }
97
98    if ((errstat=rwl_init(&vol_list_lock)) != 0) {
99       berrno be;
100       Emsg1(M_ABORT, 0, _("Unable to initialize volume list lock. ERR=%s\n"),
101             be.bstrerror(errstat));
102    }
103 }
104
105 void term_reservations_lock()
106 {
107    rwl_destroy(&reservation_lock);
108    rwl_destroy(&vol_list_lock);
109 }
110
111 int reservations_lock_count = 0;
112
113 /* This applies to a drive and to Volumes */
114 void _lock_reservations()
115 {
116    int errstat;
117    reservations_lock_count++;
118    if ((errstat=rwl_writelock(&reservation_lock)) != 0) {
119       berrno be;
120       Emsg2(M_ABORT, 0, "rwl_writelock failure. stat=%d: ERR=%s\n",
121            errstat, be.bstrerror(errstat));
122    }
123 }
124
125 void _unlock_reservations()
126 {
127    int errstat;
128    reservations_lock_count--;
129    if ((errstat=rwl_writeunlock(&reservation_lock)) != 0) {
130       berrno be;
131       Emsg2(M_ABORT, 0, "rwl_writeunlock failure. stat=%d: ERR=%s\n",
132            errstat, be.bstrerror(errstat));
133    }
134 }
135
136 int vol_list_lock_count = 0;
137
138 /* 
139  * This allows a given thread to recursively call to lock_volumes()
140  */
141 void _lock_volumes()
142 {
143    int errstat;
144    vol_list_lock_count++;
145    if ((errstat=rwl_writelock(&vol_list_lock)) != 0) {
146       berrno be;
147       Emsg2(M_ABORT, 0, "rwl_writelock failure. stat=%d: ERR=%s\n",
148            errstat, be.bstrerror(errstat));
149    }
150 }
151
152 void _unlock_volumes()
153 {
154    int errstat;
155    vol_list_lock_count--;
156    if ((errstat=rwl_writeunlock(&vol_list_lock)) != 0) {
157       berrno be;
158       Emsg2(M_ABORT, 0, "rwl_writeunlock failure. stat=%d: ERR=%s\n",
159            errstat, be.bstrerror(errstat));
160    }
161 }
162
163
164 /*
165  * List Volumes -- this should be moved to status.c
166  */
167 enum {
168    debug_lock = true,
169    debug_nolock = false
170 };
171
172 static void debug_list_volumes(const char *imsg)
173 {
174    VOLRES *vol;
175    POOL_MEM msg(PM_MESSAGE);
176
177    lock_volumes();
178    foreach_dlist(vol, vol_list) {
179       if (vol->dev) {
180          Mmsg(msg, "List from %s: %s at %p on device %s\n", imsg, 
181               vol->vol_name, vol->vol_name, vol->dev->print_name());
182       } else {
183          Mmsg(msg, "List from %s: %s at %p no dev\n", imsg, vol->vol_name, vol->vol_name);
184       }
185       Dmsg1(dbglvl, "%s", msg.c_str());
186    }
187
188 #ifdef xxx
189    DEVICE *dev = NULL;
190    foreach_dlist(vol, vol_list) {
191       if (vol->dev == dev) {
192          Dmsg0(dbglvl, "Two Volumes on same device.\n");
193          ASSERT(0);
194          dev = vol->dev;
195       }
196    }
197 #endif
198
199 // Dmsg2(dbglvl, "List from %s: %d volumes\n", imsg, count);
200    unlock_volumes();
201 }
202
203
204 /*
205  * List Volumes -- this should be moved to status.c
206  */
207 void list_volumes(void sendit(const char *msg, int len, void *sarg), void *arg)
208 {
209    VOLRES *vol;
210    POOL_MEM msg(PM_MESSAGE);
211    int len;
212
213    lock_volumes();
214    foreach_dlist(vol, vol_list) {
215       DEVICE *dev = vol->dev;
216       if (dev) {
217          len = Mmsg(msg, "%s on device %s\n", vol->vol_name, dev->print_name());
218          sendit(msg.c_str(), len, arg);
219          len = Mmsg(msg, "    Reader=%d writers=%d reserved=%d released=%d\n", 
220             dev->can_read()?1:0, dev->num_writers, dev->reserved_device, vol->released);
221          sendit(msg.c_str(), len, arg);
222       } else {
223          len = Mmsg(msg, "%s no device. released=%d\n", vol->vol_name, vol->released);
224          sendit(msg.c_str(), len, arg);
225       }
226    }
227    unlock_volumes();
228 }
229
230 /*
231  * Create a Volume item to put in the Volume list
232  *   Ensure that the device points to it.
233  */
234 static VOLRES *new_vol_item(DCR *dcr, const char *VolumeName)
235 {
236    VOLRES *vol;
237    vol = (VOLRES *)malloc(sizeof(VOLRES));
238    memset(vol, 0, sizeof(VOLRES));
239    vol->vol_name = bstrdup(VolumeName);
240    vol->dev = dcr->dev;
241    Dmsg3(dbglvl, "new Vol=%s at %p dev=%s\n",
242          VolumeName, vol->vol_name, vol->dev->print_name());
243    return vol;
244 }
245
246 static void free_vol_item(VOLRES *vol)
247 {
248    free(vol->vol_name);
249    if (vol->dev) {
250       vol->dev->vol = NULL;
251    }
252    free(vol);
253 }
254
255
256 /*
257  * Put a new Volume entry in the Volume list. This
258  *  effectively reserves the volume so that it will
259  *  not be mounted again.
260  *
261  * If the device has any current volume associated with it,
262  *  and it is a different Volume, and the device is not busy,
263  *  we release the old Volume item and insert the new one.
264  * 
265  * It is assumed that the device is free and locked so that
266  *  we can change the device structure.
267  *
268  * Some details of the Volume list handling:
269  *
270  *  1. The Volume list entry must be attached to the drive (rather than 
271  *       attached to a job as it currently is. I.e. the drive that "owns" 
272  *       the volume (reserved, in use, mounted)
273  *       must point to the volume (still to be maintained in a list).
274  *
275  *  2. The Volume is entered in the list when a drive is reserved.  
276  *
277  *  3. When a drive is in use, the device code must appropriately update the
278  *      volume name as it changes (currently the list is static -- an entry is
279  *      removed when the Volume is no longer reserved, in use or mounted).  
280  *      The new code must keep the same list entry as long as the drive
281  *       has any volume associated with it but the volume name in the list
282  *       must be updated when the drive has a different volume mounted.
283  *
284  *  4. A job that has reserved a volume, can un-reserve the volume, and if the 
285  *      volume is not mounted, and not reserved, and not in use, it will be
286  *      removed from the list.
287  *
288  *  5. If a job wants to reserve a drive with a different Volume from the one on
289  *      the drive, it can re-use the drive for the new Volume.
290  *
291  *  6. If a job wants a Volume that is in a different drive, it can either use the
292  *      other drive or take the volume, only if the other drive is not in use or
293  *      not reserved.
294  *
295  *  One nice aspect of this is that the reserve use count and the writer use count 
296  *  already exist and are correctly programmed and will need no changes -- use 
297  *  counts are always very tricky.
298  *
299  *  The old code had a concept of "reserving" a Volume, but was changed 
300  *  to reserving and using a drive.  A volume is must be attached to (owned by) a 
301  *  drive and can move from drive to drive or be unused given certain specific 
302  *  conditions of the drive.  The key is that the drive must "own" the Volume.  
303  *  The old code had the job (dcr) owning the volume (more or less).  The job was
304  *  to change the insertion and removal of the volumes from the list to be based 
305  *  on the drive rather than the job.  
306  *
307  *  Return: VOLRES entry on success
308  *          NULL volume busy on another drive
309  */
310 VOLRES *reserve_volume(DCR *dcr, const char *VolumeName)
311 {
312    VOLRES *vol, *nvol;
313    DEVICE *dev = dcr->dev;
314
315    ASSERT(dev != NULL);
316
317    Dmsg1(dbglvl, "reserve_volume %s\n", VolumeName);
318    /* 
319     * We lock the reservations system here to ensure
320     *  when adding a new volume that no newly scheduled
321     *  job can reserve it.
322     */
323    lock_volumes();
324    debug_list_volumes("begin reserve_volume");
325    /* 
326     * First, remove any old volume attached to this device as it
327     *  is no longer used.
328     */
329    if (dev->vol) {
330       vol = dev->vol;
331       /*
332        * Make sure we don't remove the current volume we are inserting
333        *  because it was probably inserted by another job, or it
334        *  is not being used and is marked as released.
335        */
336       if (strcmp(vol->vol_name, VolumeName) == 0) {
337          Dmsg1(dbglvl, "OK, vol=%s on device.\n", VolumeName);
338          vol->released = false;         /* retake vol if released previously */
339          goto get_out;                  /* Volume already on this device */
340       } else {
341          /* Don't release a volume if it is in use */
342          if (!vol->released) {
343             Dmsg1(dbglvl, "Cannot free vol=%s. It is not released.\n", vol->vol_name);
344             vol = NULL;                  /* vol in use */
345             goto get_out;
346          }
347          Dmsg2(dbglvl, "reserve_vol free vol=%s at %p\n", vol->vol_name, vol->vol_name);
348          unload_autochanger(dcr, -1);   /* unload the volume */
349          free_volume(dev);
350          debug_list_volumes("reserve_vol free");
351       }
352    }
353
354    /* Create a new Volume entry */
355    nvol = new_vol_item(dcr, VolumeName);
356
357    /*
358     * Now try to insert the new Volume
359     */
360    vol = (VOLRES *)vol_list->binary_insert(nvol, my_compare);
361    if (vol != nvol) {
362       Dmsg2(dbglvl, "Found vol=%s dev-same=%d\n", vol->vol_name, dev==vol->dev);
363       /*
364        * At this point, a Volume with this name already is in the list,
365        *   so we simply release our new Volume entry. Note, this should
366        *   only happen if we are moving the volume from one drive to another.
367        */
368       Dmsg2(dbglvl, "reserve_vol free-tmp vol=%s at %p\n", 
369             vol->vol_name, vol->vol_name);
370       /*
371        * Clear dev pointer so that free_vol_item() doesn't 
372        *  take away our volume. 
373        */
374       nvol->dev = NULL;                   /* don't zap dev entry */
375       free_vol_item(nvol);
376
377       /* Check if we are trying to use the Volume on a different drive */
378       if (dev != vol->dev) {
379          /* Caller wants to switch Volume to another device */
380          if (!vol->dev->is_busy()) {
381             /* OK to move it -- I'm not sure this will work */
382             Dmsg3(dbglvl, "==== Swap vol=%s from dev=%s to %s\n", VolumeName,
383                vol->dev->print_name(), dev->print_name());
384             vol->dev->vol = NULL;         /* take vol from old drive */
385             vol->dev->VolHdr.VolumeName[0] = 0;
386             vol->dev = dev;               /* point vol at new drive */
387             dev->vol = vol;               /* point dev at vol */
388             dev->VolHdr.VolumeName[0] = 0;
389          } else {
390             Dmsg3(dbglvl, "Volume busy could not swap vol=%s from dev=%s to %s\n", 
391                VolumeName, vol->dev->print_name(), dev->print_name());
392             vol = NULL;                /* device busy */
393             goto get_out;
394          }
395       }
396    }
397    dev->vol = vol;
398
399 get_out:
400    if (vol) {
401       vol->released = false;
402    }
403    debug_list_volumes("end new volume");
404    unlock_volumes();
405    return vol;
406 }
407
408 /* 
409  * Switch from current device to given device  
410  *   (not yet used) 
411  */
412 void switch_device(DCR *dcr, DEVICE *dev)
413 {
414    // lock_reservations();
415    DCR save_dcr;
416
417    dev->dlock();
418    memcpy(&save_dcr, dcr, sizeof(save_dcr));
419    clean_device(dcr);                  /* clean up the dcr */
420
421    dcr->dev = dev;                     /* get new device pointer */
422    Jmsg(dcr->jcr, M_INFO, 0, _("Device switch. New device %s chosen.\n"),
423       dcr->dev->print_name());
424
425    bstrncpy(dcr->VolumeName, save_dcr.VolumeName, sizeof(dcr->VolumeName));
426    bstrncpy(dcr->media_type, save_dcr.media_type, sizeof(dcr->media_type));
427    dcr->VolCatInfo.Slot = save_dcr.VolCatInfo.Slot;
428    bstrncpy(dcr->pool_name, save_dcr.pool_name, sizeof(dcr->pool_name));
429    bstrncpy(dcr->pool_type, save_dcr.pool_type, sizeof(dcr->pool_type));
430    bstrncpy(dcr->dev_name, save_dcr.dev_name, sizeof(dcr->dev_name));
431
432    dev->reserved_device++;
433    dcr->reserved_device = true;
434
435    dev->dunlock();
436 }
437
438 /*
439  * Search for a Volume name in the Volume list.
440  *
441  *  Returns: VOLRES entry on success
442  *           NULL if the Volume is not in the list
443  */
444 VOLRES *find_volume(DCR *dcr)
445 {
446    VOLRES vol, *fvol;
447    /* Do not lock reservations here */
448    lock_volumes();
449    vol.vol_name = bstrdup(dcr->VolumeName);
450    fvol = (VOLRES *)vol_list->binary_search(&vol, my_compare);
451    free(vol.vol_name);
452    Dmsg2(dbglvl, "find_vol=%s found=%d\n", dcr->VolumeName, fvol!=NULL);
453    debug_list_volumes("find_volume");
454    unlock_volumes();
455    return fvol;
456 }
457
458 /* 
459  * Remove any reservation from a drive and tell the system
460  *  that the volume is unused at least by us.
461  */
462 void unreserve_device(DCR *dcr)
463 {
464    DEVICE *dev = dcr->dev;
465    if (dcr->reserved_device) {
466       dcr->reserved_device = false;
467       dev->reserved_device--;
468       Dmsg2(dbglvl, "Dec reserve=%d dev=%s\n", dev->reserved_device, dev->print_name());
469       dcr->reserved_device = false;
470       /* If we set read mode in reserving, remove it */
471       if (dev->can_read()) {
472          dev->clear_read();
473       }
474       if (dev->num_writers < 0) {
475          Jmsg1(dcr->jcr, M_ERROR, 0, _("Hey! num_writers=%d!!!!\n"), dev->num_writers);
476          dev->num_writers = 0;
477       }
478    }
479    volume_unused(dcr);
480 }
481
482 /*  
483  * Free a Volume from the Volume list if it is no longer used
484  *   Note, for tape drives we want to remember where the Volume
485  *   was when last used, so rather than free the volume entry,
486  *   we simply mark it "released" so when the drive is really
487  *   needed for another volume, we can reuse it.
488  *
489  *  Returns: true if the Volume found and "removed" from the list
490  *           false if the Volume is not in the list or is in use
491  */
492 bool volume_unused(DCR *dcr)
493 {
494    DEVICE *dev = dcr->dev;
495
496    if (dev->vol == NULL) {
497       Dmsg1(dbglvl, "vol_unused: no vol on %s\n", dev->print_name());
498       debug_list_volumes("null vol cannot unreserve_volume");
499       return false;
500    }
501
502    if (dev->is_busy()) {
503       Dmsg1(dbglvl, "vol_unused: busy on %s\n", dev->print_name());
504       debug_list_volumes("dev busy cannot unreserve_volume");
505       return false;
506    }
507
508    /*  
509     * If this is a tape, we do not free the volume, rather we wait
510     *  until the autoloader unloads it, or until another tape is
511     *  explicitly read in this drive. This allows the SD to remember
512     *  where the tapes are or last were.
513     */
514    dev->vol->released = true;
515    if (dev->is_tape() || dev->is_autochanger()) {
516       return true;
517    } else {
518       /*
519        * Note, this frees the volume reservation entry, but the 
520        *   file descriptor remains open with the OS.
521        */
522       return free_volume(dev);
523    }
524 }
525
526 /*
527  * Unconditionally release the volume entry
528  */
529 bool free_volume(DEVICE *dev)
530 {
531    VOLRES *vol;
532
533    if (dev->vol == NULL) {
534       Dmsg1(dbglvl, "No vol on dev %s\n", dev->print_name());
535       return false;
536    }
537    lock_volumes();
538    vol = dev->vol;
539    dev->vol = NULL;
540    vol_list->remove(vol);
541    Dmsg2(dbglvl, "free_volume %s dev=%s\n", vol->vol_name, dev->print_name());
542    free_vol_item(vol);
543    debug_list_volumes("free_volume");
544    unlock_volumes();
545    return vol != NULL;
546 }
547
548       
549 /* Create the Volume list */
550 void create_volume_list()
551 {
552    VOLRES *vol = NULL;
553    if (vol_list == NULL) {
554       vol_list = New(dlist(vol, &vol->link));
555    }
556 }
557
558 /* Release all Volumes from the list */
559 void free_volume_list()
560 {
561    VOLRES *vol;
562    if (!vol_list) {
563       return;
564    }
565    lock_volumes();
566    foreach_dlist(vol, vol_list) {
567       if (vol->dev) {
568          Dmsg2(dbglvl, "free vol_list Volume=%s dev=%s\n", vol->vol_name, vol->dev->print_name());
569       } else {
570          Dmsg1(dbglvl, "free vol_list Volume=%s No dev\n", vol->vol_name);
571       }
572       free(vol->vol_name);
573       vol->vol_name = NULL;
574    }
575    delete vol_list;
576    vol_list = NULL;
577    unlock_volumes();
578 }
579
580 bool is_volume_in_use(DCR *dcr)
581 {
582    VOLRES *vol = find_volume(dcr);
583    if (!vol) {
584       Dmsg1(dbglvl, "Vol=%s not in use.\n", dcr->VolumeName);
585       return false;                   /* vol not in list */
586    }
587    ASSERT(vol->dev != NULL);
588
589    if (dcr->dev == vol->dev) {        /* same device OK */
590       Dmsg1(dbglvl, "Vol=%s on same dev.\n", dcr->VolumeName);
591       return false;
592    } else {
593       Dmsg3(dbglvl, "Vol=%s on %s we have %s\n", dcr->VolumeName,
594             vol->dev->print_name(), dcr->dev->print_name());
595    }
596    if (!vol->dev->is_busy()) {
597       Dmsg2(dbglvl, "Vol=%s dev=%s not busy.\n", dcr->VolumeName, vol->dev->print_name());
598       return false;
599    } else {
600       Dmsg2(dbglvl, "Vol=%s dev=%s busy.\n", dcr->VolumeName, vol->dev->print_name());
601    }
602    Dmsg2(dbglvl, "Vol=%s in use by %s.\n", dcr->VolumeName, vol->dev->print_name());
603    return true;
604 }
605
606
607 /*
608  * We get the following type of information:
609  *
610  * use storage=xxx media_type=yyy pool_name=xxx pool_type=yyy append=1 copy=0 strip=0
611  *  use device=zzz
612  *  use device=aaa
613  *  use device=bbb
614  * use storage=xxx media_type=yyy pool_name=xxx pool_type=yyy append=0 copy=0 strip=0
615  *  use device=bbb
616  *
617  */
618 static bool use_storage_cmd(JCR *jcr)
619 {
620    POOL_MEM store_name, dev_name, media_type, pool_name, pool_type;
621    BSOCK *dir = jcr->dir_bsock;
622    int append;
623    bool ok;       
624    int Copy, Stripe;
625    DIRSTORE *store;
626    RCTX rctx;
627    alist *dirstore;
628
629    memset(&rctx, 0, sizeof(RCTX));
630    rctx.jcr = jcr;
631    /*
632     * If there are multiple devices, the director sends us
633     *   use_device for each device that it wants to use.
634     */
635    dirstore = New(alist(10, not_owned_by_alist));
636    jcr->reserve_msgs = New(alist(10, not_owned_by_alist));  
637    do {
638       Dmsg1(dbglvl, "<dird: %s", dir->msg);
639       ok = sscanf(dir->msg, use_storage, store_name.c_str(), 
640                   media_type.c_str(), pool_name.c_str(), 
641                   pool_type.c_str(), &append, &Copy, &Stripe) == 7;
642       if (!ok) {
643          break;
644       }
645       if (append) {
646          jcr->write_store = dirstore;
647       } else {
648          jcr->read_store = dirstore;
649       }
650       rctx.append = append;
651       unbash_spaces(store_name);
652       unbash_spaces(media_type);
653       unbash_spaces(pool_name);
654       unbash_spaces(pool_type);
655       store = new DIRSTORE;
656       dirstore->append(store);
657       memset(store, 0, sizeof(DIRSTORE));
658       store->device = New(alist(10));
659       bstrncpy(store->name, store_name, sizeof(store->name));
660       bstrncpy(store->media_type, media_type, sizeof(store->media_type));
661       bstrncpy(store->pool_name, pool_name, sizeof(store->pool_name));
662       bstrncpy(store->pool_type, pool_type, sizeof(store->pool_type));
663       store->append = append;
664
665       /* Now get all devices */
666       while (dir->recv() >= 0) {
667          Dmsg1(dbglvl, "<dird device: %s", dir->msg);
668          ok = sscanf(dir->msg, use_device, dev_name.c_str()) == 1;
669          if (!ok) {
670             break;
671          }
672          unbash_spaces(dev_name);
673          store->device->append(bstrdup(dev_name.c_str()));
674       }
675    }  while (ok && dir->recv() >= 0);
676
677    /* Developer debug code */
678    char *device_name;
679    if (debug_level >= dbglvl) {
680       foreach_alist(store, dirstore) {
681          Dmsg5(dbglvl, "Storage=%s media_type=%s pool=%s pool_type=%s append=%d\n", 
682             store->name, store->media_type, store->pool_name, 
683             store->pool_type, store->append);
684          foreach_alist(device_name, store->device) {
685             Dmsg1(dbglvl, "     Device=%s\n", device_name);
686          }
687       }
688    }
689
690    init_jcr_device_wait_timers(jcr);
691    jcr->dcr = new_dcr(jcr, NULL, NULL);         /* get a dcr */
692    if (!jcr->dcr) {
693       BSOCK *dir = jcr->dir_bsock;
694       dir->fsend(_("3939 Could not get dcr\n"));
695       Dmsg1(dbglvl, ">dird: %s", dir->msg);
696       ok = false;
697    }
698    /*                    
699     * At this point, we have a list of all the Director's Storage
700     *  resources indicated for this Job, which include Pool, PoolType,
701     *  storage name, and Media type.     
702     * Then for each of the Storage resources, we have a list of
703     *  device names that were given.
704     *
705     * Wiffle through them and find one that can do the backup.
706     */
707    if (ok) {
708       int wait_for_device_retries = 0;  
709       int repeat = 0;
710       bool fail = false;
711       rctx.notify_dir = true;
712
713       lock_reservations();
714       for ( ; !fail && !job_canceled(jcr); ) {
715          pop_reserve_messages(jcr);
716          rctx.suitable_device = false;
717          rctx.have_volume = false;
718          rctx.VolumeName[0] = 0;
719          rctx.any_drive = false;
720          if (!jcr->PreferMountedVols) {
721             /*
722              * Here we try to find a drive that is not used.
723              * This will maximize the use of available drives.
724              *
725              */
726             rctx.num_writers = 20000000;   /* start with impossible number */
727             rctx.low_use_drive = NULL;
728             rctx.PreferMountedVols = false;                
729             rctx.exact_match = false;
730             rctx.autochanger_only = true;
731             Dmsg5(dbglvl, "PrefMnt=%d exact=%d suitable=%d chgronly=%d any=%d\n",
732                rctx.PreferMountedVols, rctx.exact_match, rctx.suitable_device,
733                rctx.autochanger_only, rctx.any_drive);
734             if ((ok = find_suitable_device_for_job(jcr, rctx))) {
735                break;
736             }
737             /* Look through all drives possibly for low_use drive */
738             if (rctx.low_use_drive) {
739                rctx.try_low_use_drive = true;
740                if ((ok = find_suitable_device_for_job(jcr, rctx))) {
741                   break;
742                }
743                rctx.try_low_use_drive = false;
744             }
745             rctx.autochanger_only = false;
746             Dmsg5(dbglvl, "PrefMnt=%d exact=%d suitable=%d chgronly=%d any=%d\n",
747                rctx.PreferMountedVols, rctx.exact_match, rctx.suitable_device,
748                rctx.autochanger_only, rctx.any_drive);
749             if ((ok = find_suitable_device_for_job(jcr, rctx))) {
750                break;
751             }
752          }
753          /*
754           * Now we look for a drive that may or may not be in
755           *  use.
756           */
757          /* Look for an exact Volume match all drives */
758          rctx.PreferMountedVols = true;
759          rctx.exact_match = true;
760          rctx.autochanger_only = false;
761          Dmsg5(dbglvl, "PrefMnt=%d exact=%d suitable=%d chgronly=%d any=%d\n",
762             rctx.PreferMountedVols, rctx.exact_match, rctx.suitable_device,
763             rctx.autochanger_only, rctx.any_drive);
764          if ((ok = find_suitable_device_for_job(jcr, rctx))) {
765             break;
766          }
767          /* Look for any mounted drive */
768          rctx.exact_match = false;
769          Dmsg5(dbglvl, "PrefMnt=%d exact=%d suitable=%d chgronly=%d any=%d\n",
770             rctx.PreferMountedVols, rctx.exact_match, rctx.suitable_device,
771             rctx.autochanger_only, rctx.any_drive);
772          if ((ok = find_suitable_device_for_job(jcr, rctx))) {
773             break;
774          }
775          /* Try any drive */
776          rctx.any_drive = true;
777          Dmsg5(dbglvl, "PrefMnt=%d exact=%d suitable=%d chgronly=%d any=%d\n",
778             rctx.PreferMountedVols, rctx.exact_match, rctx.suitable_device,
779             rctx.autochanger_only, rctx.any_drive);
780          if ((ok = find_suitable_device_for_job(jcr, rctx))) {
781             break;
782          }
783          /* Keep reservations locked *except* during wait_for_device() */
784          unlock_reservations();
785          /*     
786           * The idea of looping on repeat a few times it to ensure
787           * that if there is some subtle timing problem between two
788           * jobs, we will simply try again, and most likely succeed.
789           * This can happen if one job reserves a drive or finishes using
790           * a drive at the same time a second job wants it.
791           */
792          if (repeat++ > 1) {              /* try algorithm 3 times */
793             bmicrosleep(30, 0);           /* wait a bit */
794             Dmsg0(dbglvl, "repeat reserve algorithm\n");
795          } else if (!rctx.suitable_device || !wait_for_device(jcr, wait_for_device_retries)) {
796             Dmsg0(dbglvl, "Fail. !suitable_device || !wait_for_device\n");
797             fail = true;
798          }   
799          lock_reservations();
800          dir->signal(BNET_HEARTBEAT);  /* Inform Dir that we are alive */
801       }
802       unlock_reservations();
803       if (!ok) {
804          /*
805           * If we get here, there are no suitable devices available, which
806           *  means nothing configured.  If a device is suitable but busy
807           *  with another Volume, we will not come here.
808           */
809          unbash_spaces(dir->msg);
810          pm_strcpy(jcr->errmsg, dir->msg);
811          Jmsg(jcr, M_INFO, 0, _("Failed command: %s\n"), jcr->errmsg);
812          Jmsg(jcr, M_FATAL, 0, _("\n"
813             "     Device \"%s\" with MediaType \"%s\" requested by DIR not found in SD Device resources.\n"),
814               dev_name.c_str(), media_type.c_str());
815          dir->fsend(NO_device, dev_name.c_str());
816
817          Dmsg1(dbglvl, ">dird: %s", dir->msg);
818       }
819    } else {
820       unbash_spaces(dir->msg);
821       pm_strcpy(jcr->errmsg, dir->msg);
822       Jmsg(jcr, M_FATAL, 0, _("Failed command: %s\n"), jcr->errmsg);
823       dir->fsend(BAD_use, jcr->errmsg);
824       Dmsg1(dbglvl, ">dird: %s", dir->msg);
825    }
826
827    release_reserve_messages(jcr);
828    return ok;
829 }
830
831
832 /*
833  * Walk through the autochanger resources and check if
834  *  the volume is in one of them.
835  * 
836  * Returns:  true  if volume is in device
837  *           false otherwise
838  */
839 static bool is_vol_in_autochanger(RCTX &rctx, VOLRES *vol)
840 {
841    AUTOCHANGER *changer = vol->dev->device->changer_res;
842
843    /* Find resource, and make sure we were able to open it */
844    if (strcmp(rctx.device_name, changer->hdr.name) == 0) {
845       Dmsg1(dbglvl, "Found changer device %s\n", vol->dev->device->hdr.name);
846       return true;
847    }  
848    Dmsg1(dbglvl, "Incorrect changer device %s\n", changer->hdr.name);
849    return false;
850 }
851
852 /*
853  * Search for a device suitable for this job.
854  */
855 bool find_suitable_device_for_job(JCR *jcr, RCTX &rctx)
856 {
857    bool ok = false;
858    DIRSTORE *store;
859    char *device_name;
860    alist *dirstore;
861    DCR *dcr = jcr->dcr;
862
863    if (rctx.append) {
864       dirstore = jcr->write_store;
865    } else {
866       dirstore = jcr->read_store;
867    }
868    Dmsg4(dbglvl, "PrefMnt=%d exact=%d suitable=%d chgronly=%d\n",
869       rctx.PreferMountedVols, rctx.exact_match, rctx.suitable_device,
870       rctx.autochanger_only);
871
872    /* 
873     * If the appropriate conditions of this if are met, namely that
874     *  we are appending and the user wants mounted drive (or we
875     *  force try a mounted drive because they are all busy), we
876     *  start by looking at all the Volumes in the volume list.
877     */
878    if (!vol_list->empty() && rctx.append && rctx.PreferMountedVols) {
879       dlist *temp_vol_list, *save_vol_list;
880       VOLRES *vol = NULL;
881       lock_volumes();
882       Dmsg0(dbglvl, "lock volumes\n");                           
883
884       /*  
885        * Create a temporary copy of the volume list.  We do this,
886        *   to avoid having the volume list locked during the
887        *   call to reserve_device(), which would cause a deadlock.
888        * Note, we may want to add an update counter on the vol_list
889        *   so that if it is modified while we are traversing the copy
890        *   we can take note and act accordingly (probably redo the 
891        *   search at least a few times).
892        */
893       Dmsg0(dbglvl, "duplicate vol list\n");
894       temp_vol_list = New(dlist(vol, &vol->link));
895       foreach_dlist(vol, vol_list) {
896          VOLRES *nvol;
897          VOLRES *tvol = (VOLRES *)malloc(sizeof(VOLRES));
898          memset(tvol, 0, sizeof(VOLRES));
899          tvol->vol_name = bstrdup(vol->vol_name);
900          tvol->dev = vol->dev;
901          nvol = (VOLRES *)temp_vol_list->binary_insert(tvol, my_compare);
902          if (tvol != nvol) {
903             tvol->dev = NULL;                   /* don't zap dev entry */
904             free_vol_item(tvol);
905             Pmsg0(000, "Logic error. Duplicating vol list hit duplicate.\n");
906             Jmsg(jcr, M_WARNING, 0, "Logic error. Duplicating vol list hit duplicate.\n");
907          }
908       }
909       Dmsg0(dbglvl, "unlock volumes\n");
910       unlock_volumes();
911
912       /* Look through reserved volumes for one we can use */
913       Dmsg0(dbglvl, "look for vol in vol list\n");
914       foreach_dlist(vol, temp_vol_list) {
915          if (!vol->dev) {
916             Dmsg1(dbglvl, "vol=%s no dev\n", vol->vol_name);
917             continue;
918          }
919          /* Check with Director if this Volume is OK */
920          bstrncpy(dcr->VolumeName, vol->vol_name, sizeof(dcr->VolumeName));
921          if (!dir_get_volume_info(dcr, GET_VOL_INFO_FOR_WRITE)) {
922             continue;
923          }
924
925          Dmsg1(dbglvl, "vol=%s OK for this job\n", vol->vol_name);
926          foreach_alist(store, dirstore) {
927             int stat;
928             rctx.store = store;
929             foreach_alist(device_name, store->device) {
930                /* Found a device, try to use it */
931                rctx.device_name = device_name;
932                rctx.device = vol->dev->device;
933
934                if (vol->dev->is_autochanger()) {
935                   Dmsg1(dbglvl, "vol=%s is in changer\n", vol->vol_name);
936                   if (!is_vol_in_autochanger(rctx, vol)) {
937                      continue;
938                   }
939                } else if (strcmp(device_name, vol->dev->device->hdr.name) != 0) {
940                   Dmsg2(dbglvl, "device=%s not suitable want %s\n",
941                         vol->dev->device->hdr.name, device_name);
942                   continue;
943                }
944
945                bstrncpy(rctx.VolumeName, vol->vol_name, sizeof(rctx.VolumeName));
946                rctx.have_volume = true;
947                /* Try reserving this device and volume */
948                Dmsg2(dbglvl, "try vol=%s on device=%s\n", rctx.VolumeName, device_name);
949                stat = reserve_device(rctx);
950                if (stat == 1) {             /* found available device */
951                   Dmsg1(dbglvl, "Suitable device found=%s\n", device_name);
952                   ok = true;
953                   break;
954                } else if (stat == 0) {      /* device busy */
955                   Dmsg1(dbglvl, "Suitable device=%s, busy: not use\n", device_name);
956                } else {
957                   /* otherwise error */
958                   Dmsg0(dbglvl, "No suitable device found.\n");
959                }
960                rctx.have_volume = false;
961             }
962             if (ok) {
963                break;
964             }
965          }
966          if (ok) {
967             break;
968          }
969       } /* end for loop over reserved volumes */
970
971       Dmsg0(dbglvl, "lock volumes\n");
972       lock_volumes();
973       save_vol_list = vol_list;
974       vol_list = temp_vol_list;
975       free_volume_list();                  /* release temp_vol_list */
976       vol_list = save_vol_list;
977       Dmsg0(dbglvl, "deleted temp vol list\n");
978       Dmsg0(dbglvl, "unlock volumes\n");
979       unlock_volumes();
980       debug_list_volumes("=== After free temp table\n");
981    }
982    if (ok) {
983       Dmsg1(dbglvl, "got vol %s from in-use vols list\n", rctx.VolumeName);
984       return true;
985    }
986
987    /* 
988     * No reserved volume we can use, so now search for an available device.  
989     *
990     * For each storage device that the user specified, we
991     *  search and see if there is a resource for that device.
992     */
993    foreach_alist(store, dirstore) {
994       rctx.store = store;
995       foreach_alist(device_name, store->device) {
996          int stat;
997          rctx.device_name = device_name;
998          stat = search_res_for_device(rctx); 
999          if (stat == 1) {             /* found available device */
1000             Dmsg1(dbglvl, "available device found=%s\n", device_name);
1001             ok = true;
1002             break;
1003          } else if (stat == 0) {      /* device busy */
1004             Dmsg1(dbglvl, "Suitable device=%s, busy: not use\n", device_name);
1005          } else {
1006             /* otherwise error */
1007             Dmsg0(dbglvl, "No suitable device found.\n");
1008          }
1009       }
1010       if (ok) {
1011          break;
1012       }
1013    }
1014    return ok;
1015 }
1016
1017 /*
1018  * Search for a particular storage device with particular storage
1019  *  characteristics (MediaType).
1020  */
1021 int search_res_for_device(RCTX &rctx) 
1022 {
1023    AUTOCHANGER *changer;
1024    int stat;
1025
1026    Dmsg1(dbglvl, "search res for %s\n", rctx.device_name);
1027    /* Look through Autochangers first */
1028    foreach_res(changer, R_AUTOCHANGER) {
1029       Dmsg1(dbglvl, "Try match changer res=%s\n", changer->hdr.name);
1030       /* Find resource, and make sure we were able to open it */
1031       if (strcmp(rctx.device_name, changer->hdr.name) == 0) {
1032          /* Try each device in this AutoChanger */
1033          foreach_alist(rctx.device, changer->device) {
1034             Dmsg1(dbglvl, "Try changer device %s\n", rctx.device->hdr.name);
1035             stat = reserve_device(rctx);
1036             if (stat != 1) {             /* try another device */
1037                continue;
1038             }
1039             /* Debug code */
1040             if (rctx.store->append == SD_APPEND) {
1041                Dmsg2(dbglvl, "Device %s reserved=%d for append.\n", 
1042                   rctx.device->hdr.name, rctx.jcr->dcr->dev->reserved_device);
1043             } else {
1044                Dmsg2(dbglvl, "Device %s reserved=%d for read.\n", 
1045                   rctx.device->hdr.name, rctx.jcr->read_dcr->dev->reserved_device);
1046             }
1047             return stat;
1048          }
1049       }
1050    }
1051
1052    /* Now if requested look through regular devices */
1053    if (!rctx.autochanger_only) {
1054       foreach_res(rctx.device, R_DEVICE) {
1055          Dmsg1(dbglvl, "Try match res=%s\n", rctx.device->hdr.name);
1056          /* Find resource, and make sure we were able to open it */
1057          if (strcmp(rctx.device_name, rctx.device->hdr.name) == 0) {
1058             stat = reserve_device(rctx);
1059             if (stat != 1) {             /* try another device */
1060                continue;
1061             }
1062             /* Debug code */
1063             if (rctx.store->append == SD_APPEND) {
1064                Dmsg2(dbglvl, "Device %s reserved=%d for append.\n", 
1065                   rctx.device->hdr.name, rctx.jcr->dcr->dev->reserved_device);
1066             } else {
1067                Dmsg2(dbglvl, "Device %s reserved=%d for read.\n", 
1068                   rctx.device->hdr.name, rctx.jcr->read_dcr->dev->reserved_device);
1069             }
1070             return stat;
1071          }
1072       }
1073    }
1074    return -1;                    /* nothing found */
1075 }
1076
1077 /*
1078  *  Try to reserve a specific device.
1079  *
1080  *  Returns: 1 -- OK, have DCR
1081  *           0 -- must wait
1082  *          -1 -- fatal error
1083  */
1084 static int reserve_device(RCTX &rctx)
1085 {
1086    bool ok;
1087    DCR *dcr;
1088    const int name_len = MAX_NAME_LENGTH;
1089
1090    /* Make sure MediaType is OK */
1091    Dmsg2(dbglvl, "chk MediaType device=%s request=%s\n",
1092          rctx.device->media_type, rctx.store->media_type);
1093    if (strcmp(rctx.device->media_type, rctx.store->media_type) != 0) {
1094       return -1;
1095    }
1096
1097    /* Make sure device exists -- i.e. we can stat() it */
1098    if (!rctx.device->dev) {
1099       rctx.device->dev = init_dev(rctx.jcr, rctx.device);
1100    }
1101    if (!rctx.device->dev) {
1102       if (rctx.device->changer_res) {
1103         Jmsg(rctx.jcr, M_WARNING, 0, _("\n"
1104            "     Device \"%s\" in changer \"%s\" requested by DIR could not be opened or does not exist.\n"),
1105              rctx.device->hdr.name, rctx.device_name);
1106       } else {
1107          Jmsg(rctx.jcr, M_WARNING, 0, _("\n"
1108             "     Device \"%s\" requested by DIR could not be opened or does not exist.\n"),
1109               rctx.device_name);
1110       }
1111       return -1;  /* no use waiting */
1112    }  
1113
1114    rctx.suitable_device = true;
1115    Dmsg1(dbglvl, "try reserve %s\n", rctx.device->hdr.name);
1116    rctx.jcr->dcr = dcr = new_dcr(rctx.jcr, rctx.jcr->dcr, rctx.device->dev);
1117    if (!dcr) {
1118       BSOCK *dir = rctx.jcr->dir_bsock;
1119       dir->fsend(_("3926 Could not get dcr for device: %s\n"), rctx.device_name);
1120       Dmsg1(dbglvl, ">dird: %s", dir->msg);
1121       return -1;
1122    }
1123    bstrncpy(dcr->pool_name, rctx.store->pool_name, name_len);
1124    bstrncpy(dcr->pool_type, rctx.store->pool_type, name_len);
1125    bstrncpy(dcr->media_type, rctx.store->media_type, name_len);
1126    bstrncpy(dcr->dev_name, rctx.device_name, name_len);
1127    if (rctx.store->append == SD_APPEND) {
1128       Dmsg2(dbglvl, "have_vol=%d vol=%s\n", rctx.have_volume, rctx.VolumeName);                                   
1129       ok = reserve_device_for_append(dcr, rctx);
1130       if (!ok) {
1131          goto bail_out;
1132       }
1133
1134       rctx.jcr->dcr = dcr;
1135       Dmsg5(dbglvl, "Reserved=%d dev_name=%s mediatype=%s pool=%s ok=%d\n",
1136                dcr->dev->reserved_device,
1137                dcr->dev_name, dcr->media_type, dcr->pool_name, ok);
1138       if (!rctx.have_volume) {
1139          dcr->any_volume = true;
1140          if (dir_find_next_appendable_volume(dcr)) {
1141             bstrncpy(rctx.VolumeName, dcr->VolumeName, sizeof(rctx.VolumeName));
1142             Dmsg1(dbglvl, "looking for Volume=%s\n", rctx.VolumeName);
1143             rctx.have_volume = true;
1144          } else {
1145             Dmsg0(dbglvl, "No next volume found\n");
1146             rctx.have_volume = false;
1147             rctx.VolumeName[0] = 0;
1148             /*
1149              * If there is at least one volume that is valid and in use,
1150              *   but we get here, check if we are running with prefers
1151              *   non-mounted drives.  In that case, we have selected a
1152              *   non-used drive and our one and only volume is mounted
1153              *   elsewhere, so we bail out and retry using that drive.
1154              */
1155             if (dcr->volume_in_use && !rctx.PreferMountedVols) {
1156                rctx.PreferMountedVols = true;
1157                if (dcr->VolumeName[0]) {
1158                   volume_unused(dcr);
1159                }
1160                goto bail_out;
1161             }
1162             /*
1163              * Note. Under some circumstances, the Director can hand us
1164              *  a Volume name that is no the same as the one on the current
1165              *  drive, and in that case, the call above to find the next
1166              *  volume will fail because in attempting to reserve the Volume
1167              *  the code will realize that we already have a tape mounted,
1168              *  and it will fail.  This *should* only happen if there are 
1169              *  writers, thus the following test.  In that case, we simply
1170              *  bail out, and continue waiting, rather than plunging on
1171              *  and hoping that the operator can resolve the problem. 
1172              */
1173             if (dcr->dev->num_writers != 0) {
1174                if (dcr->VolumeName[0]) {
1175                   volume_unused(dcr);
1176                }
1177                goto bail_out;
1178             }
1179          }
1180       }
1181    } else {
1182       ok = reserve_device_for_read(dcr);
1183       if (ok) {
1184          rctx.jcr->read_dcr = dcr;
1185          Dmsg5(dbglvl, "Read reserved=%d dev_name=%s mediatype=%s pool=%s ok=%d\n",
1186                dcr->dev->reserved_device,
1187                dcr->dev_name, dcr->media_type, dcr->pool_name, ok);
1188       }
1189    }
1190    if (!ok) {
1191       goto bail_out;
1192    }
1193    if (rctx.notify_dir) {
1194       POOL_MEM dev_name;
1195       BSOCK *dir = rctx.jcr->dir_bsock;
1196       pm_strcpy(dev_name, rctx.device->hdr.name);
1197       bash_spaces(dev_name);
1198       ok = dir->fsend(OK_device, dev_name.c_str());  /* Return real device name */
1199       Dmsg1(dbglvl, ">dird: %s", dir->msg);
1200    } else {
1201       ok = true;
1202    }
1203    return ok ? 1 : -1;
1204
1205 bail_out:
1206    rctx.have_volume = false;
1207 // free_dcr(dcr);
1208    Dmsg0(dbglvl, "Not OK.\n");
1209    return 0;
1210 }
1211
1212 /*
1213  * We "reserve" the drive by setting the ST_READ bit. No one else
1214  *  should touch the drive until that is cleared.
1215  *  This allows the DIR to "reserve" the device before actually
1216  *  starting the job. 
1217  */
1218 static bool reserve_device_for_read(DCR *dcr)
1219 {
1220    DEVICE *dev = dcr->dev;
1221    JCR *jcr = dcr->jcr;
1222    bool ok = false;
1223
1224    ASSERT(dcr);
1225
1226    dev->dlock();  
1227
1228    if (is_device_unmounted(dev)) {             
1229       Dmsg1(dbglvl, "Device %s is BLOCKED due to user unmount.\n", dev->print_name());
1230       Mmsg(jcr->errmsg, _("3601 JobId=%u device %s is BLOCKED due to user unmount.\n"),
1231            jcr->JobId, dev->print_name());
1232       queue_reserve_message(jcr);
1233       goto bail_out;
1234    }
1235
1236    if (dev->is_busy()) {
1237       Dmsg4(dbglvl, "Device %s is busy ST_READ=%d num_writers=%d reserved=%d.\n", 
1238          dev->print_name(),
1239          dev->state & ST_READ?1:0, dev->num_writers, dev->reserved_device);
1240       Mmsg(jcr->errmsg, _("3602 JobId=%u device %s is busy (already reading/writing).\n"),
1241             jcr->JobId, dev->print_name());
1242       queue_reserve_message(jcr);
1243       goto bail_out;
1244    }
1245
1246    dev->clear_append();
1247    dev->set_read();
1248    ok = true;
1249    dev->reserved_device++;
1250    Dmsg3(dbglvl, "Inc reserve=%d dev=%s %p\n", dev->reserved_device, dev->print_name(), dev);
1251    dcr->reserved_device = true;
1252
1253 bail_out:
1254    dev->dunlock();
1255    return ok;
1256 }
1257
1258
1259 /*
1260  * We reserve the device for appending by incrementing the 
1261  *  reserved_device. We do virtually all the same work that
1262  *  is done in acquire_device_for_append(), but we do
1263  *  not attempt to mount the device. This routine allows
1264  *  the DIR to reserve multiple devices before *really* 
1265  *  starting the job. It also permits the SD to refuse 
1266  *  certain devices (not up, ...).
1267  *
1268  * Note, in reserving a device, if the device is for the
1269  *  same pool and the same pool type, then it is acceptable.
1270  *  The Media Type has already been checked. If we are
1271  *  the first tor reserve the device, we put the pool
1272  *  name and pool type in the device record.
1273  */
1274 static bool reserve_device_for_append(DCR *dcr, RCTX &rctx)
1275 {
1276    JCR *jcr = dcr->jcr;
1277    DEVICE *dev = dcr->dev;
1278    bool ok = false;
1279
1280    ASSERT(dcr);
1281
1282    dev->dlock();
1283
1284    /* If device is being read, we cannot write it */
1285    if (dev->can_read()) {
1286       Mmsg(jcr->errmsg, _("3603 JobId=%u device %s is busy reading.\n"), 
1287          jcr->JobId, dev->print_name());
1288       Dmsg1(dbglvl, "%s", jcr->errmsg);
1289       queue_reserve_message(jcr);
1290       goto bail_out;
1291    }
1292
1293    /* If device is unmounted, we are out of luck */
1294    if (is_device_unmounted(dev)) {
1295       Mmsg(jcr->errmsg, _("3604 JobId=%u device %s is BLOCKED due to user unmount.\n"), 
1296          jcr->JobId, dev->print_name());
1297       Dmsg1(dbglvl, "%s", jcr->errmsg);
1298       queue_reserve_message(jcr);
1299       goto bail_out;
1300    }
1301
1302    Dmsg1(dbglvl, "reserve_append device is %s\n", dev->print_name());
1303
1304    /* Now do detailed tests ... */
1305    if (can_reserve_drive(dcr, rctx) != 1) {
1306       Dmsg0(dbglvl, "can_reserve_drive!=1\n");
1307       goto bail_out;
1308    }
1309
1310    dev->reserved_device++;
1311    Dmsg3(dbglvl, "Inc reserve=%d dev=%s %p\n", dev->reserved_device, 
1312       dev->print_name(), dev);
1313    dcr->reserved_device = true;
1314    ok = true;
1315
1316 bail_out:
1317    dev->dunlock();
1318    return ok;
1319 }
1320
1321 static int is_pool_ok(DCR *dcr)
1322 {
1323    DEVICE *dev = dcr->dev;
1324    JCR *jcr = dcr->jcr;
1325
1326    /* Now check if we want the same Pool and pool type */
1327    if (strcmp(dev->pool_name, dcr->pool_name) == 0 &&
1328        strcmp(dev->pool_type, dcr->pool_type) == 0) {
1329       /* OK, compatible device */
1330       Dmsg1(dbglvl, "OK dev: %s num_writers=0, reserved, pool matches\n", dev->print_name());
1331       return 1;
1332    } else {
1333       /* Drive Pool not suitable for us */
1334       Mmsg(jcr->errmsg, _(
1335 "3608 JobId=%u wants Pool=\"%s\" but have Pool=\"%s\" nreserve=%d on drive %s.\n"), 
1336             (uint32_t)jcr->JobId, dcr->pool_name, dev->pool_name,
1337             dev->reserved_device, dev->print_name());
1338       queue_reserve_message(jcr);
1339       Dmsg2(dbglvl, "failed: busy num_writers=0, reserved, pool=%s wanted=%s\n",
1340          dev->pool_name, dcr->pool_name);
1341    }
1342    return 0;
1343 }
1344
1345 static bool is_max_jobs_ok(DCR *dcr) 
1346 {
1347    DEVICE *dev = dcr->dev;
1348    JCR *jcr = dcr->jcr;
1349
1350    Dmsg4(dbglvl, "MaxJobs=%d Jobs=%d reserves=%d Vol=%s\n",
1351          dcr->VolCatInfo.VolCatMaxJobs,
1352          dcr->VolCatInfo.VolCatJobs, dev->reserved_device,
1353          dcr->VolumeName);
1354    if (dcr->VolCatInfo.VolCatMaxJobs > 0 && dcr->VolCatInfo.VolCatMaxJobs <=
1355         (dcr->VolCatInfo.VolCatJobs + dev->reserved_device)) {
1356       /* Max Job Vols depassed or already reserved */
1357       Mmsg(jcr->errmsg, _("3610 JobId=%u Volume max jobs exceeded on drive %s.\n"), 
1358             (uint32_t)jcr->JobId, dev->print_name());
1359       queue_reserve_message(jcr);
1360       Dmsg1(dbglvl, "reserve dev failed: %s", jcr->errmsg);
1361       return false;                /* wait */
1362    }
1363    return true;
1364 }
1365
1366 /*
1367  * Returns: 1 if drive can be reserved
1368  *          0 if we should wait
1369  *         -1 on error or impossibility
1370  */
1371 static int can_reserve_drive(DCR *dcr, RCTX &rctx) 
1372 {
1373    DEVICE *dev = dcr->dev;
1374    JCR *jcr = dcr->jcr;
1375
1376    Dmsg5(dbglvl, "PrefMnt=%d exact=%d suitable=%d chgronly=%d any=%d\n",
1377          rctx.PreferMountedVols, rctx.exact_match, rctx.suitable_device,
1378          rctx.autochanger_only, rctx.any_drive);
1379
1380    /* Check for max jobs on this Volume */
1381    if (!is_max_jobs_ok(dcr)) {
1382       return 0;
1383    }
1384
1385    /* setting any_drive overrides PreferMountedVols flag */
1386    if (!rctx.any_drive) {
1387       /*
1388        * When PreferMountedVols is set, we keep track of the 
1389        *  drive in use that has the least number of writers, then if
1390        *  no unmounted drive is found, we try that drive. This   
1391        *  helps spread the load to the least used drives.  
1392        */
1393       if (rctx.try_low_use_drive && dev == rctx.low_use_drive) {
1394          Dmsg2(dbglvl, "OK dev=%s == low_drive=%s.\n",
1395             dev->print_name(), rctx.low_use_drive->print_name());
1396          return 1;
1397       }
1398       /* If he wants a free drive, but this one is busy, no go */
1399       if (!rctx.PreferMountedVols && dev->is_busy()) {
1400          /* Save least used drive */
1401          if ((dev->num_writers + dev->reserved_device) < rctx.num_writers) {
1402             rctx.num_writers = dev->num_writers + dev->reserved_device;
1403             rctx.low_use_drive = dev;
1404             Dmsg2(dbglvl, "set low use drive=%s num_writers=%d\n", 
1405                dev->print_name(), rctx.num_writers);
1406          } else {
1407             Dmsg1(dbglvl, "not low use num_writers=%d\n", dev->num_writers+dev->reserved_device);
1408          }
1409          Dmsg0(dbglvl, "failed: !prefMnt && busy.\n");
1410          Mmsg(jcr->errmsg, _("3605 JobId=%u wants free drive but device %s is busy.\n"), 
1411             jcr->JobId, dev->print_name());
1412          queue_reserve_message(jcr);
1413          return 0;
1414       }
1415
1416       /* Check for prefer mounted volumes */
1417       if (rctx.PreferMountedVols && !dev->vol && dev->is_tape()) {
1418          Mmsg(jcr->errmsg, _("3606 JobId=%u prefers mounted drives, but drive %s has no Volume.\n"), 
1419             jcr->JobId, dev->print_name());
1420          queue_reserve_message(jcr);
1421          Dmsg0(dbglvl, "failed: want mounted -- no vol\n");
1422          return 0;                 /* No volume mounted */
1423       }
1424
1425       /* Check for exact Volume name match */
1426       /* ***FIXME*** for Disk, we can accept any volume that goes with this
1427        *    drive.
1428        */
1429       if (rctx.exact_match && rctx.have_volume) {
1430          bool ok;
1431          Dmsg5(dbglvl, "PrefMnt=%d exact=%d suitable=%d chgronly=%d any=%d\n",
1432                rctx.PreferMountedVols, rctx.exact_match, rctx.suitable_device,
1433                rctx.autochanger_only, rctx.any_drive);
1434          Dmsg4(dbglvl, "have_vol=%d have=%s resvol=%s want=%s\n",
1435                   rctx.have_volume, dev->VolHdr.VolumeName, 
1436                   dev->vol?dev->vol->vol_name:"*none*", rctx.VolumeName);
1437          ok = strcmp(dev->VolHdr.VolumeName, rctx.VolumeName) == 0 ||
1438                  (dev->vol && strcmp(dev->vol->vol_name, rctx.VolumeName) == 0);
1439          if (!ok) {
1440             Mmsg(jcr->errmsg, _("3607 JobId=%u wants Vol=\"%s\" drive has Vol=\"%s\" on drive %s.\n"), 
1441                jcr->JobId, rctx.VolumeName, dev->VolHdr.VolumeName, 
1442                dev->print_name());
1443             queue_reserve_message(jcr);
1444             Dmsg3(dbglvl, "not OK: dev have=%s resvol=%s want=%s\n",
1445                   dev->VolHdr.VolumeName, dev->vol?dev->vol->vol_name:"*none*", rctx.VolumeName);
1446             return 0;
1447          }
1448          if (is_volume_in_use(dcr)) {
1449             return 0;              /* fail if volume on another drive */
1450          }
1451       }
1452    }
1453
1454    /* Check for unused autochanger drive */
1455    if (rctx.autochanger_only && !dev->is_busy() &&
1456        dev->VolHdr.VolumeName[0] == 0) {
1457       /* Device is available but not yet reserved, reserve it for us */
1458       Dmsg1(dbglvl, "OK Res Unused autochanger %s.\n", dev->print_name());
1459       bstrncpy(dev->pool_name, dcr->pool_name, sizeof(dev->pool_name));
1460       bstrncpy(dev->pool_type, dcr->pool_type, sizeof(dev->pool_type));
1461       return 1;                       /* reserve drive */
1462    }
1463
1464    /*
1465     * Handle the case that there are no writers
1466     */
1467    if (dev->num_writers == 0) {
1468       /* Now check if there are any reservations on the drive */
1469       if (dev->reserved_device) {           
1470          return is_pool_ok(dcr);
1471       } else if (dev->can_append()) {
1472          if (is_pool_ok(dcr)) {
1473             return 1; 
1474          } else {
1475             /* Changing pool, unload old tape if any in drive */
1476             Dmsg0(dbglvl, "OK dev: num_writers=0, not reserved, pool change, unload changer\n");
1477             unload_autochanger(dcr, 0);
1478          }
1479       }
1480       /* Device is available but not yet reserved, reserve it for us */
1481       Dmsg1(dbglvl, "OK Dev avail reserved %s\n", dev->print_name());
1482       bstrncpy(dev->pool_name, dcr->pool_name, sizeof(dev->pool_name));
1483       bstrncpy(dev->pool_type, dcr->pool_type, sizeof(dev->pool_type));
1484       return 1;                       /* reserve drive */
1485    }
1486
1487    /*
1488     * Check if the device is in append mode with writers (i.e.
1489     *  available if pool is the same).
1490     */
1491    if (dev->can_append() || dev->num_writers > 0) {
1492       return is_pool_ok(dcr);
1493    } else {
1494       Pmsg1(000, _("Logic error!!!! JobId=%u Should not get here.\n"), (int)jcr->JobId);
1495       Mmsg(jcr->errmsg, _("3910 JobId=%u Logic error!!!! drive %s Should not get here.\n"),
1496             jcr->JobId, dev->print_name());
1497       queue_reserve_message(jcr);
1498       Jmsg0(jcr, M_FATAL, 0, _("Logic error!!!! Should not get here.\n"));
1499       return -1;                      /* error, should not get here */
1500    }
1501    Mmsg(jcr->errmsg, _("3911 JobId=%u failed reserve drive %s.\n"), 
1502          jcr->JobId, dev->print_name());
1503    queue_reserve_message(jcr);
1504    Dmsg1(dbglvl, "failed: No reserve %s\n", dev->print_name());
1505    return 0;
1506 }
1507
1508
1509
1510
1511 /*
1512  * Queue a reservation error or failure message for this jcr
1513  */
1514 static void queue_reserve_message(JCR *jcr)
1515 {
1516    int i;   
1517    alist *msgs;
1518    char *msg;
1519
1520    jcr->lock();
1521
1522    msgs = jcr->reserve_msgs;
1523    if (!msgs) {
1524       goto bail_out;
1525    }
1526    /*
1527     * Look for duplicate message.  If found, do
1528     * not insert
1529     */
1530    for (i=msgs->size()-1; i >= 0; i--) {
1531       msg = (char *)msgs->get(i);
1532       if (!msg) {
1533          goto bail_out;
1534       }
1535       /* Comparison based on 4 digit message number */
1536       if (strncmp(msg, jcr->errmsg, 4) == 0) {
1537          goto bail_out;
1538       }
1539    }      
1540    /* Message unique, so insert it */
1541    jcr->reserve_msgs->push(bstrdup(jcr->errmsg));
1542
1543 bail_out:
1544    jcr->unlock();
1545 }
1546
1547 /*
1548  * Send any reservation messages queued for this jcr
1549  */
1550 void send_drive_reserve_messages(JCR *jcr, void sendit(const char *msg, int len, void *sarg), void *arg)
1551 {
1552    int i;
1553    alist *msgs;
1554    char *msg;
1555
1556    jcr->lock();
1557    msgs = jcr->reserve_msgs;
1558    if (!msgs || msgs->size() == 0) {
1559       goto bail_out;
1560    }
1561    for (i=msgs->size()-1; i >= 0; i--) {
1562       msg = (char *)msgs->get(i);
1563       if (msg) {
1564          sendit("   ", 3, arg);
1565          sendit(msg, strlen(msg), arg);
1566       } else {
1567          break;
1568       }
1569    }
1570
1571 bail_out:
1572    jcr->unlock();
1573 }
1574
1575 /*
1576  * Pop and release any reservations messages
1577  */
1578 static void pop_reserve_messages(JCR *jcr)
1579 {
1580    alist *msgs;
1581    char *msg;
1582
1583    jcr->lock();
1584    msgs = jcr->reserve_msgs;
1585    if (!msgs) {
1586       goto bail_out;
1587    }
1588    while ((msg = (char *)msgs->pop())) {
1589       free(msg);
1590    }
1591 bail_out:
1592    jcr->unlock();
1593 }
1594
1595 /*
1596  * Also called from acquire.c 
1597  */
1598 void release_reserve_messages(JCR *jcr)
1599 {
1600    pop_reserve_messages(jcr);
1601    jcr->lock();
1602    if (!jcr->reserve_msgs) {
1603       goto bail_out;
1604    }
1605    delete jcr->reserve_msgs;
1606    jcr->reserve_msgs = NULL;
1607
1608 bail_out:
1609    jcr->unlock();
1610 }