]> git.sur5r.net Git - bacula/bacula/blob - bacula/src/stored/reserve.c
kes Tweak the swap Volume from one drive to another code so that
[bacula/bacula] / bacula / src / stored / reserve.c
1 /*
2    Bacula® - The Network Backup Solution
3
4    Copyright (C) 2000-2008 Free Software Foundation Europe e.V.
5
6    The main author of Bacula is Kern Sibbald, with contributions from
7    many others, a complete list can be found in the file AUTHORS.
8    This program is Free Software; you can redistribute it and/or
9    modify it under the terms of version two of the GNU General Public
10    License as published by the Free Software Foundation and included
11    in the file LICENSE.
12
13    This program is distributed in the hope that it will be useful, but
14    WITHOUT ANY WARRANTY; without even the implied warranty of
15    MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE. See the GNU
16    General Public License for more details.
17
18    You should have received a copy of the GNU General Public License
19    along with this program; if not, write to the Free Software
20    Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA
21    02110-1301, USA.
22
23    Bacula® is a registered trademark of John Walker.
24    The licensor of Bacula is the Free Software Foundation Europe
25    (FSFE), Fiduciary Program, Sumatrastrasse 25, 8006 Zürich,
26    Switzerland, email:ftf@fsfeurope.org.
27 */
28 /*
29  *   Drive reservation functions for Storage Daemon
30  *
31  *   Kern Sibbald, MM
32  *
33  *   Split from job.c and acquire.c June 2005
34  *
35  *   Version $Id$
36  *
37  */
38
39 #include "bacula.h"
40 #include "stored.h"
41
42 const int dbglvl =  50;
43
44 static dlist *vol_list = NULL;
45 static brwlock_t reservation_lock;
46 static brwlock_t vol_list_lock;
47
48 /* Forward referenced functions */
49 static int can_reserve_drive(DCR *dcr, RCTX &rctx);
50 static int reserve_device(RCTX &rctx);
51 static bool reserve_device_for_read(DCR *dcr);
52 static bool reserve_device_for_append(DCR *dcr, RCTX &rctx);
53 static bool use_storage_cmd(JCR *jcr);
54 static void queue_reserve_message(JCR *jcr);
55 static void pop_reserve_messages(JCR *jcr);
56 //void switch_device(DCR *dcr, DEVICE *dev);
57
58 /* Requests from the Director daemon */
59 static char use_storage[]  = "use storage=%127s media_type=%127s "
60    "pool_name=%127s pool_type=%127s append=%d copy=%d stripe=%d\n";
61 static char use_device[]  = "use device=%127s\n";
62
63 /* Responses sent to Director daemon */
64 static char OK_device[] = "3000 OK use device device=%s\n";
65 static char NO_device[] = "3924 Device \"%s\" not in SD Device resources.\n";
66 static char BAD_use[]   = "3913 Bad use command: %s\n";
67
68 bool use_cmd(JCR *jcr) 
69 {
70    /*
71     * Get the device, media, and pool information
72     */
73    if (!use_storage_cmd(jcr)) {
74       set_jcr_job_status(jcr, JS_ErrorTerminated);
75       memset(jcr->sd_auth_key, 0, strlen(jcr->sd_auth_key));
76       return false;
77    }
78    return true;
79 }
80
81 static int my_compare(void *item1, void *item2)
82 {
83    return strcmp(((VOLRES *)item1)->vol_name, ((VOLRES *)item2)->vol_name);
84 }
85
86 /*
87  * This allows a given thread to recursively call lock_reservations.
88  *   It must, of course, call unlock_... the same number of times.
89  */
90 void init_reservations_lock()
91 {
92    int errstat;
93    if ((errstat=rwl_init(&reservation_lock)) != 0) {
94       berrno be;
95       Emsg1(M_ABORT, 0, _("Unable to initialize reservation lock. ERR=%s\n"),
96             be.bstrerror(errstat));
97    }
98
99    if ((errstat=rwl_init(&vol_list_lock)) != 0) {
100       berrno be;
101       Emsg1(M_ABORT, 0, _("Unable to initialize volume list lock. ERR=%s\n"),
102             be.bstrerror(errstat));
103    }
104 }
105
106 void term_reservations_lock()
107 {
108    rwl_destroy(&reservation_lock);
109    rwl_destroy(&vol_list_lock);
110 }
111
112 int reservations_lock_count = 0;
113
114 /* This applies to a drive and to Volumes */
115 void _lock_reservations()
116 {
117    int errstat;
118    reservations_lock_count++;
119    if ((errstat=rwl_writelock(&reservation_lock)) != 0) {
120       berrno be;
121       Emsg2(M_ABORT, 0, "rwl_writelock failure. stat=%d: ERR=%s\n",
122            errstat, be.bstrerror(errstat));
123    }
124 }
125
126 void _unlock_reservations()
127 {
128    int errstat;
129    reservations_lock_count--;
130    if ((errstat=rwl_writeunlock(&reservation_lock)) != 0) {
131       berrno be;
132       Emsg2(M_ABORT, 0, "rwl_writeunlock failure. stat=%d: ERR=%s\n",
133            errstat, be.bstrerror(errstat));
134    }
135 }
136
137 int vol_list_lock_count = 0;
138
139 /* 
140  * This allows a given thread to recursively call to lock_volumes()
141  */
142 void _lock_volumes()
143 {
144    int errstat;
145    vol_list_lock_count++;
146    if ((errstat=rwl_writelock(&vol_list_lock)) != 0) {
147       berrno be;
148       Emsg2(M_ABORT, 0, "rwl_writelock failure. stat=%d: ERR=%s\n",
149            errstat, be.bstrerror(errstat));
150    }
151 }
152
153 void _unlock_volumes()
154 {
155    int errstat;
156    vol_list_lock_count--;
157    if ((errstat=rwl_writeunlock(&vol_list_lock)) != 0) {
158       berrno be;
159       Emsg2(M_ABORT, 0, "rwl_writeunlock failure. stat=%d: ERR=%s\n",
160            errstat, be.bstrerror(errstat));
161    }
162 }
163
164
165 /*
166  * List Volumes -- this should be moved to status.c
167  */
168 enum {
169    debug_lock = true,
170    debug_nolock = false
171 };
172
173 static void debug_list_volumes(const char *imsg)
174 {
175    VOLRES *vol;
176    POOL_MEM msg(PM_MESSAGE);
177
178    lock_volumes();
179    foreach_dlist(vol, vol_list) {
180       if (vol->dev) {
181          Mmsg(msg, "List %s: %s in_use=%d on device %s\n", imsg, 
182               vol->vol_name, vol->is_in_use(), vol->dev->print_name());
183       } else {
184          Mmsg(msg, "List %s: %s in_use=%d no dev\n", imsg, vol->vol_name, 
185               vol->is_in_use());
186       }
187       Dmsg1(dbglvl, "%s", msg.c_str());
188    }
189
190 #ifdef xxx
191    DEVICE *dev = NULL;
192    foreach_dlist(vol, vol_list) {
193       if (vol->dev == dev) {
194          Dmsg0(dbglvl, "Two Volumes on same device.\n");
195          ASSERT(0);
196          dev = vol->dev;
197       }
198    }
199 #endif
200
201    unlock_volumes();
202 }
203
204
205 /*
206  * List Volumes -- this should be moved to status.c
207  */
208 void list_volumes(void sendit(const char *msg, int len, void *sarg), void *arg)
209 {
210    VOLRES *vol;
211    POOL_MEM msg(PM_MESSAGE);
212    int len;
213
214    lock_volumes();
215    foreach_dlist(vol, vol_list) {
216       DEVICE *dev = vol->dev;
217       if (dev) {
218          len = Mmsg(msg, "%s on device %s\n", vol->vol_name, dev->print_name());
219          sendit(msg.c_str(), len, arg);
220          len = Mmsg(msg, "    Reader=%d writers=%d devres=%d volinuse=%d\n", 
221             dev->can_read()?1:0, dev->num_writers, dev->num_reserved(),   
222             vol->is_in_use());
223          sendit(msg.c_str(), len, arg);
224       } else {
225          len = Mmsg(msg, "%s no device. volinuse= %d\n", vol->vol_name, 
226             vol->is_in_use());
227          sendit(msg.c_str(), len, arg);
228       }
229    }
230    unlock_volumes();
231 }
232
233 /*
234  * Create a Volume item to put in the Volume list
235  *   Ensure that the device points to it.
236  */
237 static VOLRES *new_vol_item(DCR *dcr, const char *VolumeName)
238 {
239    VOLRES *vol;
240    vol = (VOLRES *)malloc(sizeof(VOLRES));
241    memset(vol, 0, sizeof(VOLRES));
242    vol->vol_name = bstrdup(VolumeName);
243    vol->dev = dcr->dev;
244    Dmsg3(dbglvl, "new Vol=%s at %p dev=%s\n",
245          VolumeName, vol->vol_name, vol->dev->print_name());
246    return vol;
247 }
248
249 static void free_vol_item(VOLRES *vol)
250 {
251    DEVICE *dev = NULL;
252
253    free(vol->vol_name);
254    if (vol->dev) {
255       dev = vol->dev;
256    }
257    free(vol);
258    if (dev) {
259       dev->vol = NULL;
260    }
261 }
262
263 /*
264  * Put a new Volume entry in the Volume list. This
265  *  effectively reserves the volume so that it will
266  *  not be mounted again.
267  *
268  * If the device has any current volume associated with it,
269  *  and it is a different Volume, and the device is not busy,
270  *  we release the old Volume item and insert the new one.
271  * 
272  * It is assumed that the device is free and locked so that
273  *  we can change the device structure.
274  *
275  * Some details of the Volume list handling:
276  *
277  *  1. The Volume list entry must be attached to the drive (rather than 
278  *       attached to a job as it currently is. I.e. the drive that "owns" 
279  *       the volume (in use, mounted)
280  *       must point to the volume (still to be maintained in a list).
281  *
282  *  2. The Volume is entered in the list when a drive is reserved.  
283  *
284  *  3. When a drive is in use, the device code must appropriately update the
285  *      volume name as it changes (currently the list is static -- an entry is
286  *      removed when the Volume is no longer reserved, in use or mounted).  
287  *      The new code must keep the same list entry as long as the drive
288  *       has any volume associated with it but the volume name in the list
289  *       must be updated when the drive has a different volume mounted.
290  *
291  *  4. A job that has reserved a volume, can un-reserve the volume, and if the 
292  *      volume is not mounted, and not reserved, and not in use, it will be
293  *      removed from the list.
294  *
295  *  5. If a job wants to reserve a drive with a different Volume from the one on
296  *      the drive, it can re-use the drive for the new Volume.
297  *
298  *  6. If a job wants a Volume that is in a different drive, it can either use the
299  *      other drive or take the volume, only if the other drive is not in use or
300  *      not reserved.
301  *
302  *  One nice aspect of this is that the reserve use count and the writer use count 
303  *  already exist and are correctly programmed and will need no changes -- use 
304  *  counts are always very tricky.
305  *
306  *  The old code had a concept of "reserving" a Volume, but was changed 
307  *  to reserving and using a drive.  A volume is must be attached to (owned by) a 
308  *  drive and can move from drive to drive or be unused given certain specific 
309  *  conditions of the drive.  The key is that the drive must "own" the Volume.  
310  *  The old code had the job (dcr) owning the volume (more or less).  The job was
311  *  to change the insertion and removal of the volumes from the list to be based 
312  *  on the drive rather than the job.  
313  *
314  *  Return: VOLRES entry on success
315  *          NULL volume busy on another drive
316  */
317 VOLRES *reserve_volume(DCR *dcr, const char *VolumeName)
318 {
319    VOLRES *vol, *nvol;
320    DEVICE * volatile dev = dcr->dev;
321
322    ASSERT(dev != NULL);
323
324    Dmsg2(dbglvl, "enter reserve_volume=%s drive=%s\n", VolumeName, 
325       dcr->dev->print_name());
326    /* 
327     * We lock the reservations system here to ensure
328     *  when adding a new volume that no newly scheduled
329     *  job can reserve it.
330     */
331    lock_volumes();
332    debug_list_volumes("begin reserve_volume");
333    /* 
334     * First, remove any old volume attached to this device as it
335     *  is no longer used.
336     */
337    if (dev->vol) {
338       vol = dev->vol;
339       Dmsg4(dbglvl, "Vol attached=%s, newvol=%s volinuse=%d on %s\n",
340          vol->vol_name, VolumeName, vol->is_in_use(), dev->print_name());
341       /*
342        * Make sure we don't remove the current volume we are inserting
343        *  because it was probably inserted by another job, or it
344        *  is not being used and is marked as not reserved.
345        */
346       if (strcmp(vol->vol_name, VolumeName) == 0) {
347          Dmsg2(dbglvl, "=== set reserved vol=%s dev=%s\n", VolumeName,
348                vol->dev->print_name());
349          vol->set_in_use();             /* retake vol if released previously */
350          dcr->reserved_volume = true;   /* reserved volume */
351          goto get_out;                  /* Volume already on this device */
352       } else {
353          /* Don't release a volume if it was reserved by someone other than us */
354          if (vol->is_in_use() && !dcr->reserved_volume) { 
355             Dmsg1(dbglvl, "Cannot free vol=%s. It is reserved.\n", vol->vol_name);
356             vol = NULL;                  /* vol in use */
357             goto get_out;
358          }
359          Dmsg2(dbglvl, "reserve_vol free vol=%s at %p\n", vol->vol_name, vol->vol_name);
360          free_volume(dev);
361          dev->set_unload();             /* have to unload current volume */
362          debug_list_volumes("reserve_vol free");
363       }
364    }
365
366    /* Create a new Volume entry */
367    nvol = new_vol_item(dcr, VolumeName);
368
369    /*
370     * Now try to insert the new Volume
371     */
372    vol = (VOLRES *)vol_list->binary_insert(nvol, my_compare);
373    if (vol != nvol) {
374       Dmsg2(dbglvl, "Found vol=%s dev-same=%d\n", vol->vol_name, dev==vol->dev);
375       /*
376        * At this point, a Volume with this name already is in the list,
377        *   so we simply release our new Volume entry. Note, this should
378        *   only happen if we are moving the volume from one drive to another.
379        */
380       Dmsg2(dbglvl, "reserve_vol free-tmp vol=%s at %p\n", 
381             vol->vol_name, vol->vol_name);
382       /*
383        * Clear dev pointer so that free_vol_item() doesn't 
384        *  take away our volume. 
385        */
386       nvol->dev = NULL;                  /* don't zap dev entry */
387       free_vol_item(nvol);
388
389       /* Check if we are trying to use the Volume on a different drive */
390       if (dev != vol->dev) {
391          /* Caller wants to switch Volume to another device */
392          if (!vol->dev->is_busy() && !vol->is_swapping()) {
393             Dmsg3(dbglvl, "==== Swap vol=%s from dev=%s to %s\n", 
394                VolumeName, vol->dev->print_name(), dev->print_name());
395             free_volume(dev);            /* free any volume attached to our drive */
396             vol->dev->set_unload();      /* unload our drive */
397             vol->set_swapping();         /* swap from other drive */
398             dev->swap_dev = vol->dev;    /* remember to get this vol */
399             vol->dev->set_load();        /* then reload on our drive */
400             vol->dev->vol = NULL;        /* remove volume from other drive */
401             vol->dev = dev;              /* point it at our drive */
402             dev->vol = vol;              /* point our drive at it */
403             Dmsg3(dbglvl, "==== Swap vol=%s from dev=%s to %s\n", 
404                VolumeName, vol->dev->print_name(), dev->print_name());
405          } else {
406             Dmsg3(dbglvl, "==== Swap not possible Vol busy vol=%s from dev=%s to %s\n", 
407                VolumeName, vol->dev->print_name(), dev->print_name());
408             vol = NULL;                  /* device busy */
409             goto get_out;
410          }
411       } else {
412          dev->vol = vol;
413       }
414    } else {
415       dev->vol = vol;                    /* point to newly inserted volume */
416    }
417
418 get_out:
419    if (vol) {
420       Dmsg2(dbglvl, "=== set in_use. vol=%s dev=%s\n", vol->vol_name,
421             vol->dev->print_name());
422       vol->set_in_use();
423       dcr->reserved_volume = true;
424    }
425    debug_list_volumes("end new volume");
426    unlock_volumes();
427    return vol;
428 }
429
430 /* 
431  * Switch from current device to given device  
432  *   (not yet used) 
433  */
434 #ifdef xxx
435 void switch_device(DCR *dcr, DEVICE *dev)
436 {
437    DCR save_dcr;
438
439    dev->dlock();
440    memcpy(&save_dcr, dcr, sizeof(save_dcr));
441    clean_device(dcr);                  /* clean up the dcr */
442
443    dcr->dev = dev;                     /* get new device pointer */
444    Jmsg(dcr->jcr, M_INFO, 0, _("Device switch. New device %s chosen.\n"),
445       dcr->dev->print_name());
446
447    bstrncpy(dcr->VolumeName, save_dcr.VolumeName, sizeof(dcr->VolumeName));
448    bstrncpy(dcr->media_type, save_dcr.media_type, sizeof(dcr->media_type));
449    dcr->VolCatInfo.Slot = save_dcr.VolCatInfo.Slot;
450    bstrncpy(dcr->pool_name, save_dcr.pool_name, sizeof(dcr->pool_name));
451    bstrncpy(dcr->pool_type, save_dcr.pool_type, sizeof(dcr->pool_type));
452    bstrncpy(dcr->dev_name, dev->dev_name, sizeof(dcr->dev_name));
453
454 // dcr->set_reserved();
455
456    dev->dunlock();
457 }
458 #endif
459
460 /*
461  * Search for a Volume name in the Volume list.
462  *
463  *  Returns: VOLRES entry on success
464  *           NULL if the Volume is not in the list
465  */
466 VOLRES *find_volume(const char *VolumeName) 
467 {
468    VOLRES vol, *fvol;
469    /* Do not lock reservations here */
470    lock_volumes();
471    vol.vol_name = bstrdup(VolumeName);
472    fvol = (VOLRES *)vol_list->binary_search(&vol, my_compare);
473    free(vol.vol_name);
474    Dmsg2(dbglvl, "find_vol=%s found=%d\n", VolumeName, fvol!=NULL);
475    debug_list_volumes("find_volume");
476    unlock_volumes();
477    return fvol;
478 }
479
480 void DCR::set_reserved()
481 {
482    m_reserved = true;
483    Dmsg2(dbglvl, "Inc reserve=%d dev=%s\n", dev->num_reserved(), dev->print_name());
484    dev->inc_reserved();
485 }
486
487 void DCR::clear_reserved()
488 {
489    if (m_reserved) {
490       m_reserved = false;
491       dev->dec_reserved();
492       Dmsg2(dbglvl, "Dec reserve=%d dev=%s\n", dev->num_reserved(), dev->print_name());
493    }
494 }
495
496 /* 
497  * Remove any reservation from a drive and tell the system
498  *  that the volume is unused at least by us.
499  */
500 void DCR::unreserve_device()
501 {
502    lock_volumes();
503    if (is_reserved()) {
504       clear_reserved();
505       reserved_volume = false;
506       /* If we set read mode in reserving, remove it */
507       if (dev->can_read()) {
508          dev->clear_read();
509       }
510       if (dev->num_writers < 0) {
511          Jmsg1(jcr, M_ERROR, 0, _("Hey! num_writers=%d!!!!\n"), dev->num_writers);
512          dev->num_writers = 0;
513       }
514       if (dev->num_reserved() == 0 && dev->num_writers == 0) {
515          volume_unused(this);
516       }
517    }
518    unlock_volumes();
519 }
520
521 /*  
522  * Free a Volume from the Volume list if it is no longer used
523  *   Note, for tape drives we want to remember where the Volume
524  *   was when last used, so rather than free the volume entry,
525  *   we simply mark it "not reserved" so when the drive is really
526  *   needed for another volume, we can reuse it.
527  *
528  *  Returns: true if the Volume found and "removed" from the list
529  *           false if the Volume is not in the list or is in use
530  */
531 bool volume_unused(DCR *dcr)
532 {
533    DEVICE *dev = dcr->dev;
534
535    if (!dev->vol) {
536       Dmsg1(dbglvl, "vol_unused: no vol on %s\n", dev->print_name());
537       debug_list_volumes("null vol cannot unreserve_volume");
538       return false;
539    }
540    if (dev->vol->is_swapping()) {
541       Dmsg1(dbglvl, "vol_unused: vol being swapped on %s\n", dev->print_name());
542       debug_list_volumes("swapping vol cannot unreserve_volume");
543       return false;
544    }
545
546 #ifdef xxx
547    if (dev->is_busy()) {
548       Dmsg1(dbglvl, "vol_unused: busy on %s\n", dev->print_name());
549       debug_list_volumes("dev busy cannot unreserve_volume");
550       return false;
551    }
552 #endif
553 #ifdef xxx
554    if (dev->num_writers > 0 || dev->num_reserved() > 0) {
555       ASSERT(0);
556    }
557 #endif
558
559    /*  
560     * If this is a tape, we do not free the volume, rather we wait
561     *  until the autoloader unloads it, or until another tape is
562     *  explicitly read in this drive. This allows the SD to remember
563     *  where the tapes are or last were.
564     */
565    Dmsg4(dbglvl, "=== set not reserved vol=%s num_writers=%d dev_reserved=%d dev=%s\n",
566       dev->vol->vol_name, dev->num_writers, dev->num_reserved(), dev->print_name());
567    dev->vol->clear_in_use();
568    if (dev->is_tape() || dev->is_autochanger()) {
569       return true;
570    } else {
571       /*
572        * Note, this frees the volume reservation entry, but the 
573        *   file descriptor remains open with the OS.
574        */
575       return free_volume(dev);
576    }
577 }
578
579 /*
580  * Unconditionally release the volume entry
581  */
582 bool free_volume(DEVICE *dev)
583 {
584    VOLRES *vol;
585
586    if (dev->vol == NULL) {
587       Dmsg1(dbglvl, "No vol on dev %s\n", dev->print_name());
588       return false;
589    }
590    lock_volumes();
591    vol = dev->vol;
592    dev->vol = NULL;
593    vol_list->remove(vol);
594    Dmsg2(dbglvl, "=== free_volume %s dev=%s\n", vol->vol_name, dev->print_name());
595    free_vol_item(vol);
596    debug_list_volumes("free_volume");
597    unlock_volumes();
598    return true;
599 }
600
601       
602 /* Create the Volume list */
603 void create_volume_list()
604 {
605    VOLRES *vol = NULL;
606    if (vol_list == NULL) {
607       vol_list = New(dlist(vol, &vol->link));
608    }
609 }
610
611 /* Release all Volumes from the list */
612 void free_volume_list()
613 {
614    VOLRES *vol;
615    if (!vol_list) {
616       return;
617    }
618    lock_volumes();
619    foreach_dlist(vol, vol_list) {
620       if (vol->dev) {
621          Dmsg2(dbglvl, "free vol_list Volume=%s dev=%s\n", vol->vol_name, vol->dev->print_name());
622       } else {
623          Dmsg1(dbglvl, "free vol_list Volume=%s No dev\n", vol->vol_name);
624       }
625       free(vol->vol_name);
626       vol->vol_name = NULL;
627    }
628    delete vol_list;
629    vol_list = NULL;
630    unlock_volumes();
631 }
632
633 bool DCR::can_i_use_volume()
634 {
635    bool rtn = true;
636    VOLRES *vol;
637
638    lock_volumes();
639    vol = find_volume(VolumeName);
640    if (!vol) {
641       Dmsg1(dbglvl, "Vol=%s not in use.\n", VolumeName);
642       goto get_out;                   /* vol not in list */
643    }
644    ASSERT(vol->dev != NULL);
645
646    if (dev == vol->dev) {        /* same device OK */
647       Dmsg1(dbglvl, "Vol=%s on same dev.\n", VolumeName);
648       goto get_out;
649    } else {
650       Dmsg3(dbglvl, "Vol=%s on %s we have %s\n", VolumeName,
651             vol->dev->print_name(), dev->print_name());
652    }
653    /* ***FIXME*** check this ... */
654    if (!vol->dev->is_busy()) {
655       Dmsg2(dbglvl, "Vol=%s dev=%s not busy.\n", VolumeName, vol->dev->print_name());
656       goto get_out;
657    } else {
658       Dmsg2(dbglvl, "Vol=%s dev=%s busy.\n", VolumeName, vol->dev->print_name());
659    }
660    Dmsg2(dbglvl, "Vol=%s in use by %s.\n", VolumeName, vol->dev->print_name());
661    rtn = false;
662
663 get_out:
664    unlock_volumes();
665    return rtn;
666
667 }
668
669
670 /*
671  * We get the following type of information:
672  *
673  * use storage=xxx media_type=yyy pool_name=xxx pool_type=yyy append=1 copy=0 strip=0
674  *  use device=zzz
675  *  use device=aaa
676  *  use device=bbb
677  * use storage=xxx media_type=yyy pool_name=xxx pool_type=yyy append=0 copy=0 strip=0
678  *  use device=bbb
679  *
680  */
681 static bool use_storage_cmd(JCR *jcr)
682 {
683    POOL_MEM store_name, dev_name, media_type, pool_name, pool_type;
684    BSOCK *dir = jcr->dir_bsock;
685    int append;
686    bool ok;       
687    int Copy, Stripe;
688    DIRSTORE *store;
689    RCTX rctx;
690    alist *dirstore;
691
692    memset(&rctx, 0, sizeof(RCTX));
693    rctx.jcr = jcr;
694    /*
695     * If there are multiple devices, the director sends us
696     *   use_device for each device that it wants to use.
697     */
698    dirstore = New(alist(10, not_owned_by_alist));
699    jcr->reserve_msgs = New(alist(10, not_owned_by_alist));  
700    do {
701       Dmsg1(dbglvl, "<dird: %s", dir->msg);
702       ok = sscanf(dir->msg, use_storage, store_name.c_str(), 
703                   media_type.c_str(), pool_name.c_str(), 
704                   pool_type.c_str(), &append, &Copy, &Stripe) == 7;
705       if (!ok) {
706          break;
707       }
708       if (append) {
709          jcr->write_store = dirstore;
710       } else {
711          jcr->read_store = dirstore;
712       }
713       rctx.append = append;
714       unbash_spaces(store_name);
715       unbash_spaces(media_type);
716       unbash_spaces(pool_name);
717       unbash_spaces(pool_type);
718       store = new DIRSTORE;
719       dirstore->append(store);
720       memset(store, 0, sizeof(DIRSTORE));
721       store->device = New(alist(10));
722       bstrncpy(store->name, store_name, sizeof(store->name));
723       bstrncpy(store->media_type, media_type, sizeof(store->media_type));
724       bstrncpy(store->pool_name, pool_name, sizeof(store->pool_name));
725       bstrncpy(store->pool_type, pool_type, sizeof(store->pool_type));
726       store->append = append;
727
728       /* Now get all devices */
729       while (dir->recv() >= 0) {
730          Dmsg1(dbglvl, "<dird device: %s", dir->msg);
731          ok = sscanf(dir->msg, use_device, dev_name.c_str()) == 1;
732          if (!ok) {
733             break;
734          }
735          unbash_spaces(dev_name);
736          store->device->append(bstrdup(dev_name.c_str()));
737       }
738    }  while (ok && dir->recv() >= 0);
739
740    /* Developer debug code */
741    char *device_name;
742    if (debug_level >= dbglvl) {
743       foreach_alist(store, dirstore) {
744          Dmsg5(dbglvl, "Storage=%s media_type=%s pool=%s pool_type=%s append=%d\n", 
745             store->name, store->media_type, store->pool_name, 
746             store->pool_type, store->append);
747          foreach_alist(device_name, store->device) {
748             Dmsg1(dbglvl, "     Device=%s\n", device_name);
749          }
750       }
751    }
752
753    init_jcr_device_wait_timers(jcr);
754    jcr->dcr = new_dcr(jcr, NULL, NULL);         /* get a dcr */
755    if (!jcr->dcr) {
756       BSOCK *dir = jcr->dir_bsock;
757       dir->fsend(_("3939 Could not get dcr\n"));
758       Dmsg1(dbglvl, ">dird: %s", dir->msg);
759       ok = false;
760    }
761    /*                    
762     * At this point, we have a list of all the Director's Storage
763     *  resources indicated for this Job, which include Pool, PoolType,
764     *  storage name, and Media type.     
765     * Then for each of the Storage resources, we have a list of
766     *  device names that were given.
767     *
768     * Wiffle through them and find one that can do the backup.
769     */
770    if (ok) {
771       int wait_for_device_retries = 0;  
772       int repeat = 0;
773       bool fail = false;
774       rctx.notify_dir = true;
775
776       lock_reservations();
777       for ( ; !fail && !job_canceled(jcr); ) {
778          pop_reserve_messages(jcr);
779          rctx.suitable_device = false;
780          rctx.have_volume = false;
781          rctx.VolumeName[0] = 0;
782          rctx.any_drive = false;
783          if (!jcr->PreferMountedVols) {
784             /*
785              * Here we try to find a drive that is not used.
786              * This will maximize the use of available drives.
787              *
788              */
789             rctx.num_writers = 20000000;   /* start with impossible number */
790             rctx.low_use_drive = NULL;
791             rctx.PreferMountedVols = false;                
792             rctx.exact_match = false;
793             rctx.autochanger_only = true;
794             Dmsg5(dbglvl, "PrefMnt=%d exact=%d suitable=%d chgronly=%d any=%d\n",
795                rctx.PreferMountedVols, rctx.exact_match, rctx.suitable_device,
796                rctx.autochanger_only, rctx.any_drive);
797             if ((ok = find_suitable_device_for_job(jcr, rctx))) {
798                break;
799             }
800             /* Look through all drives possibly for low_use drive */
801             if (rctx.low_use_drive) {
802                rctx.try_low_use_drive = true;
803                if ((ok = find_suitable_device_for_job(jcr, rctx))) {
804                   break;
805                }
806                rctx.try_low_use_drive = false;
807             }
808             rctx.autochanger_only = false;
809             Dmsg5(dbglvl, "PrefMnt=%d exact=%d suitable=%d chgronly=%d any=%d\n",
810                rctx.PreferMountedVols, rctx.exact_match, rctx.suitable_device,
811                rctx.autochanger_only, rctx.any_drive);
812             if ((ok = find_suitable_device_for_job(jcr, rctx))) {
813                break;
814             }
815          }
816          /*
817           * Now we look for a drive that may or may not be in
818           *  use.
819           */
820          /* Look for an exact Volume match all drives */
821          rctx.PreferMountedVols = true;
822          rctx.exact_match = true;
823          rctx.autochanger_only = false;
824          Dmsg5(dbglvl, "PrefMnt=%d exact=%d suitable=%d chgronly=%d any=%d\n",
825             rctx.PreferMountedVols, rctx.exact_match, rctx.suitable_device,
826             rctx.autochanger_only, rctx.any_drive);
827          if ((ok = find_suitable_device_for_job(jcr, rctx))) {
828             break;
829          }
830          /* Look for any mounted drive */
831          rctx.exact_match = false;
832          Dmsg5(dbglvl, "PrefMnt=%d exact=%d suitable=%d chgronly=%d any=%d\n",
833             rctx.PreferMountedVols, rctx.exact_match, rctx.suitable_device,
834             rctx.autochanger_only, rctx.any_drive);
835          if ((ok = find_suitable_device_for_job(jcr, rctx))) {
836             break;
837          }
838          /* Try any drive */
839          rctx.any_drive = true;
840          Dmsg5(dbglvl, "PrefMnt=%d exact=%d suitable=%d chgronly=%d any=%d\n",
841             rctx.PreferMountedVols, rctx.exact_match, rctx.suitable_device,
842             rctx.autochanger_only, rctx.any_drive);
843          if ((ok = find_suitable_device_for_job(jcr, rctx))) {
844             break;
845          }
846          /* Keep reservations locked *except* during wait_for_device() */
847          unlock_reservations();
848          /*     
849           * The idea of looping on repeat a few times it to ensure
850           * that if there is some subtle timing problem between two
851           * jobs, we will simply try again, and most likely succeed.
852           * This can happen if one job reserves a drive or finishes using
853           * a drive at the same time a second job wants it.
854           */
855          if (repeat++ > 1) {              /* try algorithm 3 times */
856             bmicrosleep(30, 0);           /* wait a bit */
857             Dmsg0(dbglvl, "repeat reserve algorithm\n");
858          } else if (!rctx.suitable_device || !wait_for_device(jcr, wait_for_device_retries)) {
859             Dmsg0(dbglvl, "Fail. !suitable_device || !wait_for_device\n");
860             fail = true;
861          }   
862          lock_reservations();
863          dir->signal(BNET_HEARTBEAT);  /* Inform Dir that we are alive */
864       }
865       unlock_reservations();
866       if (!ok) {
867          /*
868           * If we get here, there are no suitable devices available, which
869           *  means nothing configured.  If a device is suitable but busy
870           *  with another Volume, we will not come here.
871           */
872          unbash_spaces(dir->msg);
873          pm_strcpy(jcr->errmsg, dir->msg);
874          Jmsg(jcr, M_INFO, 0, _("Failed command: %s\n"), jcr->errmsg);
875          Jmsg(jcr, M_FATAL, 0, _("\n"
876             "     Device \"%s\" with MediaType \"%s\" requested by DIR not found in SD Device resources.\n"),
877               dev_name.c_str(), media_type.c_str());
878          dir->fsend(NO_device, dev_name.c_str());
879
880          Dmsg1(dbglvl, ">dird: %s", dir->msg);
881       }
882    } else {
883       unbash_spaces(dir->msg);
884       pm_strcpy(jcr->errmsg, dir->msg);
885       Jmsg(jcr, M_FATAL, 0, _("Failed command: %s\n"), jcr->errmsg);
886       dir->fsend(BAD_use, jcr->errmsg);
887       Dmsg1(dbglvl, ">dird: %s", dir->msg);
888    }
889
890    release_reserve_messages(jcr);
891    return ok;
892 }
893
894
895 /*
896  * Walk through the autochanger resources and check if
897  *  the volume is in one of them.
898  * 
899  * Returns:  true  if volume is in device
900  *           false otherwise
901  */
902 static bool is_vol_in_autochanger(RCTX &rctx, VOLRES *vol)
903 {
904    AUTOCHANGER *changer = vol->dev->device->changer_res;
905
906    /* Find resource, and make sure we were able to open it */
907    if (strcmp(rctx.device_name, changer->hdr.name) == 0) {
908       Dmsg1(dbglvl, "Found changer device %s\n", vol->dev->device->hdr.name);
909       return true;
910    }  
911    Dmsg1(dbglvl, "Incorrect changer device %s\n", changer->hdr.name);
912    return false;
913 }
914
915 /*
916  * Search for a device suitable for this job.
917  * Note, this routine sets sets rctx.suitable_device if any 
918  *   device exists within the SD.  The device may not be actually
919  *   useable.
920  * It also returns if it finds a useable device.  
921  */
922 bool find_suitable_device_for_job(JCR *jcr, RCTX &rctx)
923 {
924    bool ok = false;
925    DIRSTORE *store;
926    char *device_name;
927    alist *dirstore;
928    DCR *dcr = jcr->dcr;
929
930    if (rctx.append) {
931       dirstore = jcr->write_store;
932    } else {
933       dirstore = jcr->read_store;
934    }
935    Dmsg4(dbglvl, "PrefMnt=%d exact=%d suitable=%d chgronly=%d\n",
936       rctx.PreferMountedVols, rctx.exact_match, rctx.suitable_device,
937       rctx.autochanger_only);
938
939    /* 
940     * If the appropriate conditions of this if are met, namely that
941     *  we are appending and the user wants mounted drive (or we
942     *  force try a mounted drive because they are all busy), we
943     *  start by looking at all the Volumes in the volume list.
944     */
945    if (!vol_list->empty() && rctx.append && rctx.PreferMountedVols) {
946       dlist *temp_vol_list, *save_vol_list;
947       VOLRES *vol = NULL;
948       lock_volumes();
949       Dmsg0(dbglvl, "lock volumes\n");                           
950
951       /*  
952        * Create a temporary copy of the volume list.  We do this,
953        *   to avoid having the volume list locked during the
954        *   call to reserve_device(), which would cause a deadlock.
955        * Note, we may want to add an update counter on the vol_list
956        *   so that if it is modified while we are traversing the copy
957        *   we can take note and act accordingly (probably redo the 
958        *   search at least a few times).
959        */
960       Dmsg0(dbglvl, "duplicate vol list\n");
961       temp_vol_list = New(dlist(vol, &vol->link));
962       foreach_dlist(vol, vol_list) {
963          VOLRES *nvol;
964          VOLRES *tvol = (VOLRES *)malloc(sizeof(VOLRES));
965          memset(tvol, 0, sizeof(VOLRES));
966          tvol->vol_name = bstrdup(vol->vol_name);
967          tvol->dev = vol->dev;
968          nvol = (VOLRES *)temp_vol_list->binary_insert(tvol, my_compare);
969          if (tvol != nvol) {
970             tvol->dev = NULL;                   /* don't zap dev entry */
971             free_vol_item(tvol);
972             Pmsg0(000, "Logic error. Duplicating vol list hit duplicate.\n");
973             Jmsg(jcr, M_WARNING, 0, "Logic error. Duplicating vol list hit duplicate.\n");
974          }
975       }
976       Dmsg0(dbglvl, "unlock volumes\n");
977       unlock_volumes();
978
979       /* Look through reserved volumes for one we can use */
980       Dmsg0(dbglvl, "look for vol in vol list\n");
981       foreach_dlist(vol, temp_vol_list) {
982          if (!vol->dev) {
983             Dmsg1(dbglvl, "vol=%s no dev\n", vol->vol_name);
984             continue;
985          }
986          /* Check with Director if this Volume is OK */
987          bstrncpy(dcr->VolumeName, vol->vol_name, sizeof(dcr->VolumeName));
988          if (!dir_get_volume_info(dcr, GET_VOL_INFO_FOR_WRITE)) {
989             continue;
990          }
991
992          Dmsg1(dbglvl, "vol=%s OK for this job\n", vol->vol_name);
993          foreach_alist(store, dirstore) {
994             int stat;
995             rctx.store = store;
996             foreach_alist(device_name, store->device) {
997                /* Found a device, try to use it */
998                rctx.device_name = device_name;
999                rctx.device = vol->dev->device;
1000
1001                if (vol->dev->is_autochanger()) {
1002                   Dmsg1(dbglvl, "vol=%s is in changer\n", vol->vol_name);
1003                   if (!is_vol_in_autochanger(rctx, vol)) {
1004                      continue;
1005                   }
1006                } else if (strcmp(device_name, vol->dev->device->hdr.name) != 0) {
1007                   Dmsg2(dbglvl, "device=%s not suitable want %s\n",
1008                         vol->dev->device->hdr.name, device_name);
1009                   continue;
1010                }
1011
1012                bstrncpy(rctx.VolumeName, vol->vol_name, sizeof(rctx.VolumeName));
1013                rctx.have_volume = true;
1014                /* Try reserving this device and volume */
1015                Dmsg2(dbglvl, "try vol=%s on device=%s\n", rctx.VolumeName, device_name);
1016                stat = reserve_device(rctx);
1017                if (stat == 1) {             /* found available device */
1018                   Dmsg1(dbglvl, "Suitable device found=%s\n", device_name);
1019                   ok = true;
1020                   break;
1021                } else if (stat == 0) {      /* device busy */
1022                   Dmsg1(dbglvl, "Suitable device=%s, busy: not use\n", device_name);
1023                } else {
1024                   /* otherwise error */
1025                   Dmsg0(dbglvl, "No suitable device found.\n");
1026                }
1027                rctx.have_volume = false;
1028                rctx.VolumeName[0] = 0;
1029             }
1030             if (ok) {
1031                break;
1032             }
1033          }
1034          if (ok) {
1035             break;
1036          }
1037       } /* end for loop over reserved volumes */
1038
1039       Dmsg0(dbglvl, "lock volumes\n");
1040       lock_volumes();
1041       save_vol_list = vol_list;
1042       vol_list = temp_vol_list;
1043       free_volume_list();                  /* release temp_vol_list */
1044       vol_list = save_vol_list;
1045       Dmsg0(dbglvl, "deleted temp vol list\n");
1046       Dmsg0(dbglvl, "unlock volumes\n");
1047       unlock_volumes();
1048       debug_list_volumes("=== After free temp table\n");
1049    }
1050    if (ok) {
1051       Dmsg1(dbglvl, "Usable dev found. Vol=%s from in-use vols list\n", rctx.VolumeName);
1052       return true;
1053    }
1054
1055    /* 
1056     * No reserved volume we can use, so now search for an available device.  
1057     *
1058     * For each storage device that the user specified, we
1059     *  search and see if there is a resource for that device.
1060     */
1061    foreach_alist(store, dirstore) {
1062       rctx.store = store;
1063       foreach_alist(device_name, store->device) {
1064          int stat;
1065          rctx.device_name = device_name;
1066          stat = search_res_for_device(rctx); 
1067          if (stat == 1) {             /* found available device */
1068             Dmsg1(dbglvl, "available device found=%s\n", device_name);
1069             ok = true;
1070             break;
1071          } else if (stat == 0) {      /* device busy */
1072             Dmsg1(dbglvl, "No usable device=%s, busy: not use\n", device_name);
1073          } else {
1074             /* otherwise error */
1075             Dmsg0(dbglvl, "No usable device found.\n");
1076          }
1077       }
1078       if (ok) {
1079          break;
1080       }
1081    }
1082    if (ok) {
1083       Dmsg1(dbglvl, "Usable dev found. Vol=%s\n", rctx.VolumeName);
1084    }
1085    return ok;
1086 }
1087
1088 /*
1089  * Search for a particular storage device with particular storage
1090  *  characteristics (MediaType).
1091  */
1092 int search_res_for_device(RCTX &rctx) 
1093 {
1094    AUTOCHANGER *changer;
1095    int stat;
1096
1097    Dmsg1(dbglvl, "search res for %s\n", rctx.device_name);
1098    /* Look through Autochangers first */
1099    foreach_res(changer, R_AUTOCHANGER) {
1100       Dmsg1(dbglvl, "Try match changer res=%s\n", changer->hdr.name);
1101       /* Find resource, and make sure we were able to open it */
1102       if (strcmp(rctx.device_name, changer->hdr.name) == 0) {
1103          /* Try each device in this AutoChanger */
1104          foreach_alist(rctx.device, changer->device) {
1105             Dmsg1(dbglvl, "Try changer device %s\n", rctx.device->hdr.name);
1106             stat = reserve_device(rctx);
1107             if (stat != 1) {             /* try another device */
1108                continue;
1109             }
1110             /* Debug code */
1111             if (rctx.store->append == SD_APPEND) {
1112                Dmsg2(dbglvl, "Device %s reserved=%d for append.\n", 
1113                   rctx.device->hdr.name, rctx.jcr->dcr->dev->num_reserved());
1114             } else {
1115                Dmsg2(dbglvl, "Device %s reserved=%d for read.\n", 
1116                   rctx.device->hdr.name, rctx.jcr->read_dcr->dev->num_reserved());
1117             }
1118             return stat;
1119          }
1120       }
1121    }
1122
1123    /* Now if requested look through regular devices */
1124    if (!rctx.autochanger_only) {
1125       foreach_res(rctx.device, R_DEVICE) {
1126          Dmsg1(dbglvl, "Try match res=%s\n", rctx.device->hdr.name);
1127          /* Find resource, and make sure we were able to open it */
1128          if (strcmp(rctx.device_name, rctx.device->hdr.name) == 0) {
1129             stat = reserve_device(rctx);
1130             if (stat != 1) {             /* try another device */
1131                continue;
1132             }
1133             /* Debug code */
1134             if (rctx.store->append == SD_APPEND) {
1135                Dmsg2(dbglvl, "Device %s reserved=%d for append.\n", 
1136                   rctx.device->hdr.name, rctx.jcr->dcr->dev->num_reserved());
1137             } else {
1138                Dmsg2(dbglvl, "Device %s reserved=%d for read.\n", 
1139                   rctx.device->hdr.name, rctx.jcr->read_dcr->dev->num_reserved());
1140             }
1141             return stat;
1142          }
1143       }
1144    }
1145    return -1;                    /* nothing found */
1146 }
1147
1148 /*
1149  *  Try to reserve a specific device.
1150  *
1151  *  Returns: 1 -- OK, have DCR
1152  *           0 -- must wait
1153  *          -1 -- fatal error
1154  */
1155 static int reserve_device(RCTX &rctx)
1156 {
1157    bool ok;
1158    DCR *dcr;
1159    const int name_len = MAX_NAME_LENGTH;
1160
1161    /* Make sure MediaType is OK */
1162    Dmsg2(dbglvl, "chk MediaType device=%s request=%s\n",
1163          rctx.device->media_type, rctx.store->media_type);
1164    if (strcmp(rctx.device->media_type, rctx.store->media_type) != 0) {
1165       return -1;
1166    }
1167
1168    /* Make sure device exists -- i.e. we can stat() it */
1169    if (!rctx.device->dev) {
1170       rctx.device->dev = init_dev(rctx.jcr, rctx.device);
1171    }
1172    if (!rctx.device->dev) {
1173       if (rctx.device->changer_res) {
1174         Jmsg(rctx.jcr, M_WARNING, 0, _("\n"
1175            "     Device \"%s\" in changer \"%s\" requested by DIR could not be opened or does not exist.\n"),
1176              rctx.device->hdr.name, rctx.device_name);
1177       } else {
1178          Jmsg(rctx.jcr, M_WARNING, 0, _("\n"
1179             "     Device \"%s\" requested by DIR could not be opened or does not exist.\n"),
1180               rctx.device_name);
1181       }
1182       return -1;  /* no use waiting */
1183    }  
1184
1185    rctx.suitable_device = true;
1186    Dmsg1(dbglvl, "try reserve %s\n", rctx.device->hdr.name);
1187    rctx.jcr->dcr = dcr = new_dcr(rctx.jcr, rctx.jcr->dcr, rctx.device->dev);
1188    if (!dcr) {
1189       BSOCK *dir = rctx.jcr->dir_bsock;
1190       dir->fsend(_("3926 Could not get dcr for device: %s\n"), rctx.device_name);
1191       Dmsg1(dbglvl, ">dird: %s", dir->msg);
1192       return -1;
1193    }
1194    bstrncpy(dcr->pool_name, rctx.store->pool_name, name_len);
1195    bstrncpy(dcr->pool_type, rctx.store->pool_type, name_len);
1196    bstrncpy(dcr->media_type, rctx.store->media_type, name_len);
1197    bstrncpy(dcr->dev_name, rctx.device_name, name_len);
1198    if (rctx.store->append == SD_APPEND) {
1199       Dmsg2(dbglvl, "call reserve for append: have_vol=%d vol=%s\n", rctx.have_volume, rctx.VolumeName);                                   
1200       ok = reserve_device_for_append(dcr, rctx);
1201       if (!ok) {
1202          goto bail_out;
1203       }
1204
1205       rctx.jcr->dcr = dcr;
1206       Dmsg5(dbglvl, "Reserved=%d dev_name=%s mediatype=%s pool=%s ok=%d\n",
1207                dcr->dev->num_reserved(),
1208                dcr->dev_name, dcr->media_type, dcr->pool_name, ok);
1209       Dmsg3(dbglvl, "Vol=%s num_writers=%d, have_vol=%d\n", 
1210          rctx.VolumeName, dcr->dev->num_writers, rctx.have_volume);
1211       if (rctx.have_volume) {
1212          Dmsg0(dbglvl, "Call reserve_volume\n");
1213          if (reserve_volume(dcr, rctx.VolumeName)) {
1214             Dmsg1(dbglvl, "Reserved vol=%s\n", rctx.VolumeName);
1215          } else {
1216             Dmsg1(dbglvl, "Could not reserve vol=%s\n", rctx.VolumeName);
1217             goto bail_out;
1218          }
1219       } else {
1220          dcr->any_volume = true;
1221          Dmsg0(dbglvl, "no vol, call find_next_appendable_vol.\n");
1222          if (dir_find_next_appendable_volume(dcr)) {
1223             bstrncpy(rctx.VolumeName, dcr->VolumeName, sizeof(rctx.VolumeName));
1224             rctx.have_volume = true;
1225             Dmsg1(dbglvl, "looking for Volume=%s\n", rctx.VolumeName);
1226          } else {
1227             Dmsg0(dbglvl, "No next volume found\n");
1228             rctx.have_volume = false;
1229             rctx.VolumeName[0] = 0;
1230             /*
1231              * If there is at least one volume that is valid and in use,
1232              *   but we get here, check if we are running with prefers
1233              *   non-mounted drives.  In that case, we have selected a
1234              *   non-used drive and our one and only volume is mounted
1235              *   elsewhere, so we bail out and retry using that drive.
1236              */
1237             if (dcr->found_in_use() && !rctx.PreferMountedVols) {
1238                rctx.PreferMountedVols = true;
1239                if (dcr->VolumeName[0]) {
1240                   dcr->unreserve_device();
1241                }
1242                goto bail_out;
1243             }
1244             /*
1245              * Note. Under some circumstances, the Director can hand us
1246              *  a Volume name that is not the same as the one on the current
1247              *  drive, and in that case, the call above to find the next
1248              *  volume will fail because in attempting to reserve the Volume
1249              *  the code will realize that we already have a tape mounted,
1250              *  and it will fail.  This *should* only happen if there are 
1251              *  writers, thus the following test.  In that case, we simply
1252              *  bail out, and continue waiting, rather than plunging on
1253              *  and hoping that the operator can resolve the problem. 
1254              */
1255             if (dcr->dev->num_writers != 0) {
1256                if (dcr->VolumeName[0]) {
1257                   dcr->unreserve_device();
1258                }
1259                goto bail_out;
1260             }
1261          }
1262       }
1263    } else {
1264       ok = reserve_device_for_read(dcr);
1265       if (ok) {
1266          rctx.jcr->read_dcr = dcr;
1267          Dmsg5(dbglvl, "Read reserved=%d dev_name=%s mediatype=%s pool=%s ok=%d\n",
1268                dcr->dev->num_reserved(),
1269                dcr->dev_name, dcr->media_type, dcr->pool_name, ok);
1270       }
1271    }
1272    if (!ok) {
1273       goto bail_out;
1274    }
1275
1276    if (rctx.notify_dir) {
1277       POOL_MEM dev_name;
1278       BSOCK *dir = rctx.jcr->dir_bsock;
1279       pm_strcpy(dev_name, rctx.device->hdr.name);
1280       bash_spaces(dev_name);
1281       ok = dir->fsend(OK_device, dev_name.c_str());  /* Return real device name */
1282       Dmsg1(dbglvl, ">dird: %s", dir->msg);
1283    } else {
1284       ok = true;
1285    }
1286    return ok ? 1 : -1;
1287
1288 bail_out:
1289    rctx.have_volume = false;
1290    rctx.VolumeName[0] = 0;
1291    Dmsg0(dbglvl, "Not OK.\n");
1292    return 0;
1293 }
1294
1295 /*
1296  * We "reserve" the drive by setting the ST_READ bit. No one else
1297  *  should touch the drive until that is cleared.
1298  *  This allows the DIR to "reserve" the device before actually
1299  *  starting the job. 
1300  */
1301 static bool reserve_device_for_read(DCR *dcr)
1302 {
1303    DEVICE *dev = dcr->dev;
1304    JCR *jcr = dcr->jcr;
1305    bool ok = false;
1306
1307    ASSERT(dcr);
1308
1309    dev->dlock();  
1310
1311    if (is_device_unmounted(dev)) {             
1312       Dmsg1(dbglvl, "Device %s is BLOCKED due to user unmount.\n", dev->print_name());
1313       Mmsg(jcr->errmsg, _("3601 JobId=%u device %s is BLOCKED due to user unmount.\n"),
1314            jcr->JobId, dev->print_name());
1315       queue_reserve_message(jcr);
1316       goto bail_out;
1317    }
1318
1319    if (dev->is_busy()) {
1320       Dmsg4(dbglvl, "Device %s is busy ST_READ=%d num_writers=%d reserved=%d.\n", 
1321          dev->print_name(),
1322          dev->state & ST_READ?1:0, dev->num_writers, dev->num_reserved());
1323       Mmsg(jcr->errmsg, _("3602 JobId=%u device %s is busy (already reading/writing).\n"),
1324             jcr->JobId, dev->print_name());
1325       queue_reserve_message(jcr);
1326       goto bail_out;
1327    }
1328
1329    dev->clear_append();
1330    dev->set_read();
1331    ok = true;
1332    dcr->set_reserved();
1333
1334 bail_out:
1335    dev->dunlock();
1336    return ok;
1337 }
1338
1339
1340 /*
1341  * We reserve the device for appending by incrementing the 
1342  *  reserved_device. We do virtually all the same work that
1343  *  is done in acquire_device_for_append(), but we do
1344  *  not attempt to mount the device. This routine allows
1345  *  the DIR to reserve multiple devices before *really* 
1346  *  starting the job. It also permits the SD to refuse 
1347  *  certain devices (not up, ...).
1348  *
1349  * Note, in reserving a device, if the device is for the
1350  *  same pool and the same pool type, then it is acceptable.
1351  *  The Media Type has already been checked. If we are
1352  *  the first tor reserve the device, we put the pool
1353  *  name and pool type in the device record.
1354  */
1355 static bool reserve_device_for_append(DCR *dcr, RCTX &rctx)
1356 {
1357    JCR *jcr = dcr->jcr;
1358    DEVICE *dev = dcr->dev;
1359    bool ok = false;
1360
1361    ASSERT(dcr);
1362
1363    dev->dlock();
1364
1365    /* If device is being read, we cannot write it */
1366    if (dev->can_read()) {
1367       Mmsg(jcr->errmsg, _("3603 JobId=%u device %s is busy reading.\n"), 
1368          jcr->JobId, dev->print_name());
1369       Dmsg1(dbglvl, "%s", jcr->errmsg);
1370       queue_reserve_message(jcr);
1371       goto bail_out;
1372    }
1373
1374    /* If device is unmounted, we are out of luck */
1375    if (is_device_unmounted(dev)) {
1376       Mmsg(jcr->errmsg, _("3604 JobId=%u device %s is BLOCKED due to user unmount.\n"), 
1377          jcr->JobId, dev->print_name());
1378       Dmsg1(dbglvl, "%s", jcr->errmsg);
1379       queue_reserve_message(jcr);
1380       goto bail_out;
1381    }
1382
1383    Dmsg1(dbglvl, "reserve_append device is %s\n", dev->print_name());
1384
1385    /* Now do detailed tests ... */
1386    if (can_reserve_drive(dcr, rctx) != 1) {
1387       Dmsg0(dbglvl, "can_reserve_drive!=1\n");
1388       goto bail_out;
1389    }
1390
1391    dcr->set_reserved();
1392    ok = true;
1393
1394 bail_out:
1395    dev->dunlock();
1396    return ok;
1397 }
1398
1399 static int is_pool_ok(DCR *dcr)
1400 {
1401    DEVICE *dev = dcr->dev;
1402    JCR *jcr = dcr->jcr;
1403
1404    /* Now check if we want the same Pool and pool type */
1405    if (strcmp(dev->pool_name, dcr->pool_name) == 0 &&
1406        strcmp(dev->pool_type, dcr->pool_type) == 0) {
1407       /* OK, compatible device */
1408       Dmsg1(dbglvl, "OK dev: %s num_writers=0, reserved, pool matches\n", dev->print_name());
1409       return 1;
1410    } else {
1411       /* Drive Pool not suitable for us */
1412       Mmsg(jcr->errmsg, _(
1413 "3608 JobId=%u wants Pool=\"%s\" but have Pool=\"%s\" nreserve=%d on drive %s.\n"), 
1414             (uint32_t)jcr->JobId, dcr->pool_name, dev->pool_name,
1415             dev->num_reserved(), dev->print_name());
1416       queue_reserve_message(jcr);
1417       Dmsg2(dbglvl, "failed: busy num_writers=0, reserved, pool=%s wanted=%s\n",
1418          dev->pool_name, dcr->pool_name);
1419    }
1420    return 0;
1421 }
1422
1423 static bool is_max_jobs_ok(DCR *dcr) 
1424 {
1425    DEVICE *dev = dcr->dev;
1426    JCR *jcr = dcr->jcr;
1427
1428    Dmsg5(dbglvl, "MaxJobs=%d Jobs=%d reserves=%d Status=%s Vol=%s\n",
1429          dcr->VolCatInfo.VolCatMaxJobs,
1430          dcr->VolCatInfo.VolCatJobs, dev->num_reserved(),
1431          dcr->VolCatInfo.VolCatStatus,
1432          dcr->VolumeName);
1433    if (strcmp(dcr->VolCatInfo.VolCatStatus, "Recycle") == 0) {
1434       return true;
1435    }
1436    if (dcr->VolCatInfo.VolCatMaxJobs > 0 && dcr->VolCatInfo.VolCatMaxJobs <=
1437         (dcr->VolCatInfo.VolCatJobs + dev->num_reserved())) {
1438       /* Max Job Vols depassed or already reserved */
1439       Mmsg(jcr->errmsg, _("3610 JobId=%u Volume max jobs exceeded on drive %s.\n"), 
1440             (uint32_t)jcr->JobId, dev->print_name());
1441       queue_reserve_message(jcr);
1442       Dmsg1(dbglvl, "reserve dev failed: %s", jcr->errmsg);
1443       return false;                /* wait */
1444    }
1445    return true;
1446 }
1447
1448 /*
1449  * Returns: 1 if drive can be reserved
1450  *          0 if we should wait
1451  *         -1 on error or impossibility
1452  */
1453 static int can_reserve_drive(DCR *dcr, RCTX &rctx) 
1454 {
1455    DEVICE *dev = dcr->dev;
1456    JCR *jcr = dcr->jcr;
1457
1458    Dmsg5(dbglvl, "PrefMnt=%d exact=%d suitable=%d chgronly=%d any=%d\n",
1459          rctx.PreferMountedVols, rctx.exact_match, rctx.suitable_device,
1460          rctx.autochanger_only, rctx.any_drive);
1461
1462    /* Check for max jobs on this Volume */
1463    if (!is_max_jobs_ok(dcr)) {
1464       return 0;
1465    }
1466
1467    /* setting any_drive overrides PreferMountedVols flag */
1468    if (!rctx.any_drive) {
1469       /*
1470        * When PreferMountedVols is set, we keep track of the 
1471        *  drive in use that has the least number of writers, then if
1472        *  no unmounted drive is found, we try that drive. This   
1473        *  helps spread the load to the least used drives.  
1474        */
1475       if (rctx.try_low_use_drive && dev == rctx.low_use_drive) {
1476          Dmsg2(dbglvl, "OK dev=%s == low_drive=%s.\n",
1477             dev->print_name(), rctx.low_use_drive->print_name());
1478          return 1;
1479       }
1480       /* If he wants a free drive, but this one is busy, no go */
1481       if (!rctx.PreferMountedVols && dev->is_busy()) {
1482          /* Save least used drive */
1483          if ((dev->num_writers + dev->num_reserved()) < rctx.num_writers) {
1484             rctx.num_writers = dev->num_writers + dev->num_reserved();
1485             rctx.low_use_drive = dev;
1486             Dmsg2(dbglvl, "set low use drive=%s num_writers=%d\n", 
1487                dev->print_name(), rctx.num_writers);
1488          } else {
1489             Dmsg1(dbglvl, "not low use num_writers=%d\n", dev->num_writers+dev->num_reserved());
1490          }
1491          Dmsg0(dbglvl, "failed: !prefMnt && busy.\n");
1492          Mmsg(jcr->errmsg, _("3605 JobId=%u wants free drive but device %s is busy.\n"), 
1493             jcr->JobId, dev->print_name());
1494          queue_reserve_message(jcr);
1495          return 0;
1496       }
1497
1498       /* Check for prefer mounted volumes */
1499       if (rctx.PreferMountedVols && !dev->vol && dev->is_tape()) {
1500          Mmsg(jcr->errmsg, _("3606 JobId=%u prefers mounted drives, but drive %s has no Volume.\n"), 
1501             jcr->JobId, dev->print_name());
1502          queue_reserve_message(jcr);
1503          Dmsg0(dbglvl, "failed: want mounted -- no vol\n");
1504          return 0;                 /* No volume mounted */
1505       }
1506
1507       /* Check for exact Volume name match */
1508       /* ***FIXME*** for Disk, we can accept any volume that goes with this
1509        *    drive.
1510        */
1511       if (rctx.exact_match && rctx.have_volume) {
1512          bool ok;
1513          Dmsg5(dbglvl, "PrefMnt=%d exact=%d suitable=%d chgronly=%d any=%d\n",
1514                rctx.PreferMountedVols, rctx.exact_match, rctx.suitable_device,
1515                rctx.autochanger_only, rctx.any_drive);
1516          Dmsg4(dbglvl, "have_vol=%d have=%s resvol=%s want=%s\n",
1517                   rctx.have_volume, dev->VolHdr.VolumeName, 
1518                   dev->vol?dev->vol->vol_name:"*none*", rctx.VolumeName);
1519          ok = strcmp(dev->VolHdr.VolumeName, rctx.VolumeName) == 0 ||
1520                  (dev->vol && strcmp(dev->vol->vol_name, rctx.VolumeName) == 0);
1521          if (!ok) {
1522             Mmsg(jcr->errmsg, _("3607 JobId=%u wants Vol=\"%s\" drive has Vol=\"%s\" on drive %s.\n"), 
1523                jcr->JobId, rctx.VolumeName, dev->VolHdr.VolumeName, 
1524                dev->print_name());
1525             queue_reserve_message(jcr);
1526             Dmsg3(dbglvl, "not OK: dev have=%s resvol=%s want=%s\n",
1527                   dev->VolHdr.VolumeName, dev->vol?dev->vol->vol_name:"*none*", rctx.VolumeName);
1528             return 0;
1529          }
1530          if (!dcr->can_i_use_volume()) {
1531             return 0;              /* fail if volume on another drive */
1532          }
1533       }
1534    }
1535
1536    /* Check for unused autochanger drive */
1537    if (rctx.autochanger_only && !dev->is_busy() &&
1538        dev->VolHdr.VolumeName[0] == 0) {
1539       /* Device is available but not yet reserved, reserve it for us */
1540       Dmsg1(dbglvl, "OK Res Unused autochanger %s.\n", dev->print_name());
1541       bstrncpy(dev->pool_name, dcr->pool_name, sizeof(dev->pool_name));
1542       bstrncpy(dev->pool_type, dcr->pool_type, sizeof(dev->pool_type));
1543       return 1;                       /* reserve drive */
1544    }
1545
1546    /*
1547     * Handle the case that there are no writers
1548     */
1549    if (dev->num_writers == 0) {
1550       /* Now check if there are any reservations on the drive */
1551       if (dev->num_reserved()) {           
1552          return is_pool_ok(dcr);
1553       } else if (dev->can_append()) {
1554          if (is_pool_ok(dcr)) {
1555             return 1; 
1556          } else {
1557             /* Changing pool, unload old tape if any in drive */
1558             Dmsg0(dbglvl, "OK dev: num_writers=0, not reserved, pool change, unload changer\n");
1559             /* ***FIXME*** use set_unload() */
1560             unload_autochanger(dcr, 0);
1561          }
1562       }
1563       /* Device is available but not yet reserved, reserve it for us */
1564       Dmsg1(dbglvl, "OK Dev avail reserved %s\n", dev->print_name());
1565       bstrncpy(dev->pool_name, dcr->pool_name, sizeof(dev->pool_name));
1566       bstrncpy(dev->pool_type, dcr->pool_type, sizeof(dev->pool_type));
1567       return 1;                       /* reserve drive */
1568    }
1569
1570    /*
1571     * Check if the device is in append mode with writers (i.e.
1572     *  available if pool is the same).
1573     */
1574    if (dev->can_append() || dev->num_writers > 0) {
1575       return is_pool_ok(dcr);
1576    } else {
1577       Pmsg1(000, _("Logic error!!!! JobId=%u Should not get here.\n"), (int)jcr->JobId);
1578       Mmsg(jcr->errmsg, _("3910 JobId=%u Logic error!!!! drive %s Should not get here.\n"),
1579             jcr->JobId, dev->print_name());
1580       queue_reserve_message(jcr);
1581       Jmsg0(jcr, M_FATAL, 0, _("Logic error!!!! Should not get here.\n"));
1582       return -1;                      /* error, should not get here */
1583    }
1584    Mmsg(jcr->errmsg, _("3911 JobId=%u failed reserve drive %s.\n"), 
1585          jcr->JobId, dev->print_name());
1586    queue_reserve_message(jcr);
1587    Dmsg1(dbglvl, "failed: No reserve %s\n", dev->print_name());
1588    return 0;
1589 }
1590
1591
1592
1593
1594 /*
1595  * Queue a reservation error or failure message for this jcr
1596  */
1597 static void queue_reserve_message(JCR *jcr)
1598 {
1599    int i;   
1600    alist *msgs;
1601    char *msg;
1602
1603    jcr->lock();
1604
1605    msgs = jcr->reserve_msgs;
1606    if (!msgs) {
1607       goto bail_out;
1608    }
1609    /*
1610     * Look for duplicate message.  If found, do
1611     * not insert
1612     */
1613    for (i=msgs->size()-1; i >= 0; i--) {
1614       msg = (char *)msgs->get(i);
1615       if (!msg) {
1616          goto bail_out;
1617       }
1618       /* Comparison based on 4 digit message number */
1619       if (strncmp(msg, jcr->errmsg, 4) == 0) {
1620          goto bail_out;
1621       }
1622    }      
1623    /* Message unique, so insert it */
1624    jcr->reserve_msgs->push(bstrdup(jcr->errmsg));
1625
1626 bail_out:
1627    jcr->unlock();
1628 }
1629
1630 /*
1631  * Send any reservation messages queued for this jcr
1632  */
1633 void send_drive_reserve_messages(JCR *jcr, void sendit(const char *msg, int len, void *sarg), void *arg)
1634 {
1635    int i;
1636    alist *msgs;
1637    char *msg;
1638
1639    jcr->lock();
1640    msgs = jcr->reserve_msgs;
1641    if (!msgs || msgs->size() == 0) {
1642       goto bail_out;
1643    }
1644    for (i=msgs->size()-1; i >= 0; i--) {
1645       msg = (char *)msgs->get(i);
1646       if (msg) {
1647          sendit("   ", 3, arg);
1648          sendit(msg, strlen(msg), arg);
1649       } else {
1650          break;
1651       }
1652    }
1653
1654 bail_out:
1655    jcr->unlock();
1656 }
1657
1658 /*
1659  * Pop and release any reservations messages
1660  */
1661 static void pop_reserve_messages(JCR *jcr)
1662 {
1663    alist *msgs;
1664    char *msg;
1665
1666    jcr->lock();
1667    msgs = jcr->reserve_msgs;
1668    if (!msgs) {
1669       goto bail_out;
1670    }
1671    while ((msg = (char *)msgs->pop())) {
1672       free(msg);
1673    }
1674 bail_out:
1675    jcr->unlock();
1676 }
1677
1678 /*
1679  * Also called from acquire.c 
1680  */
1681 void release_reserve_messages(JCR *jcr)
1682 {
1683    pop_reserve_messages(jcr);
1684    jcr->lock();
1685    if (!jcr->reserve_msgs) {
1686       goto bail_out;
1687    }
1688    delete jcr->reserve_msgs;
1689    jcr->reserve_msgs = NULL;
1690
1691 bail_out:
1692    jcr->unlock();
1693 }