]> git.sur5r.net Git - bacula/bacula/blob - bacula/src/dird/job.c
Add SSL connections to database (PostgreSQL) open code
[bacula/bacula] / bacula / src / dird / job.c
1 /*
2    Bacula(R) - The Network Backup Solution
3
4    Copyright (C) 2000-2017 Kern Sibbald
5
6    The original author of Bacula is Kern Sibbald, with contributions
7    from many others, a complete list can be found in the file AUTHORS.
8
9    You may use this file and others of this release according to the
10    license defined in the LICENSE file, which includes the Affero General
11    Public License, v3.0 ("AGPLv3") and some additional permissions and
12    terms pursuant to its AGPLv3 Section 7.
13
14    This notice must be preserved when any source code is
15    conveyed and/or propagated.
16
17    Bacula(R) is a registered trademark of Kern Sibbald.
18 */
19 /*
20  *   Bacula Director Job processing routines
21  *
22  *     Kern Sibbald, October MM
23  */
24
25 #include "bacula.h"
26 #include "dird.h"
27
28 /* Forward referenced subroutines */
29 static void *job_thread(void *arg);
30 static void job_monitor_watchdog(watchdog_t *self);
31 static void job_monitor_destructor(watchdog_t *self);
32 static bool job_check_maxwaittime(JCR *jcr);
33 static bool job_check_maxruntime(JCR *jcr);
34 static bool job_check_maxrunschedtime(JCR *jcr);
35
36 /* Imported subroutines */
37 extern void term_scheduler();
38 extern void term_ua_server();
39
40 /* Imported variables */
41
42 jobq_t job_queue;
43
44 void init_job_server(int max_workers)
45 {
46    int stat;
47    watchdog_t *wd;
48
49    if ((stat = jobq_init(&job_queue, max_workers, job_thread)) != 0) {
50       berrno be;
51       Emsg1(M_ABORT, 0, _("Could not init job queue: ERR=%s\n"), be.bstrerror(stat));
52    }
53    wd = new_watchdog();
54    wd->callback = job_monitor_watchdog;
55    wd->destructor = job_monitor_destructor;
56    wd->one_shot = false;
57    wd->interval = 60;
58    wd->data = new_control_jcr("*JobMonitor*", JT_SYSTEM);
59    register_watchdog(wd);
60 }
61
62 void term_job_server()
63 {
64    jobq_destroy(&job_queue);          /* ignore any errors */
65 }
66
67 /*
68  * Run a job -- typically called by the scheduler, but may also
69  *              be called by the UA (Console program).
70  *
71  *  Returns: 0 on failure
72  *           JobId on success
73  *
74  */
75 JobId_t run_job(JCR *jcr)
76 {
77    int stat;
78    if (setup_job(jcr)) {
79       Dmsg0(200, "Add jrc to work queue\n");
80       /* Queue the job to be run */
81       if ((stat = jobq_add(&job_queue, jcr)) != 0) {
82          berrno be;
83          Jmsg(jcr, M_FATAL, 0, _("Could not add job queue: ERR=%s\n"), be.bstrerror(stat));
84          return 0;
85       }
86       return jcr->JobId;
87    }
88    return 0;
89 }
90
91 bool setup_job(JCR *jcr)
92 {
93    int errstat;
94
95    jcr->lock();
96    Dsm_check(100);
97    init_msg(jcr, jcr->messages, job_code_callback_director);
98
99    /* Initialize termination condition variable */
100    if ((errstat = pthread_cond_init(&jcr->term_wait, NULL)) != 0) {
101       berrno be;
102       Jmsg1(jcr, M_FATAL, 0, _("Unable to init job cond variable: ERR=%s\n"), be.bstrerror(errstat));
103       jcr->unlock();
104       goto bail_out;
105    }
106    jcr->term_wait_inited = true;
107
108    create_unique_job_name(jcr, jcr->job->name());
109    jcr->setJobStatus(JS_Created);
110    jcr->unlock();
111
112    /*
113     * Open database
114     */
115    Dmsg0(100, "Open database\n");
116    jcr->db = db_init_database(jcr, jcr->catalog->db_driver, jcr->catalog->db_name,
117                 jcr->catalog->db_user, jcr->catalog->db_password,
118                 jcr->catalog->db_address, jcr->catalog->db_port,
119                 jcr->catalog->db_socket, jcr->catalog->db_ssl_mode,
120                 jcr->catalog->db_ssl_key, jcr->catalog->db_ssl_cert,
121                 jcr->catalog->db_ssl_ca, jcr->catalog->db_ssl_capath, 
122                 jcr->catalog->db_ssl_cipher,
123                 jcr->catalog->mult_db_connections,
124                 jcr->catalog->disable_batch_insert);
125    if (!jcr->db || !db_open_database(jcr, jcr->db)) {
126       Jmsg(jcr, M_FATAL, 0, _("Could not open database \"%s\".\n"),
127                  jcr->catalog->db_name);
128       if (jcr->db) {
129          Jmsg(jcr, M_FATAL, 0, "%s", db_strerror(jcr->db));
130          db_close_database(jcr, jcr->db);
131          jcr->db = NULL;
132       }
133       goto bail_out;
134    }
135
136    Dmsg0(150, "DB opened\n");
137    if (!jcr->fname) {
138       jcr->fname = get_pool_memory(PM_FNAME);
139    }
140    if (!jcr->pool_source) {
141       jcr->pool_source = get_pool_memory(PM_MESSAGE);
142       pm_strcpy(jcr->pool_source, _("unknown source"));
143    }
144    if (!jcr->next_pool_source) {
145       jcr->next_pool_source = get_pool_memory(PM_MESSAGE);
146       pm_strcpy(jcr->next_pool_source, _("unknown source"));
147    }
148
149    if (jcr->JobReads()) {
150       if (!jcr->rpool_source) {
151          jcr->rpool_source = get_pool_memory(PM_MESSAGE);
152          pm_strcpy(jcr->rpool_source, _("unknown source"));
153       }
154    }
155
156    /*
157     * Create Job record
158     */
159    init_jcr_job_record(jcr);
160    if (!get_or_create_client_record(jcr)) {
161       goto bail_out;
162    }
163
164    if (!db_create_job_record(jcr, jcr->db, &jcr->jr)) {
165       Jmsg(jcr, M_FATAL, 0, "%s", db_strerror(jcr->db));
166       goto bail_out;
167    }
168    jcr->JobId = jcr->jr.JobId;
169    Dmsg4(100, "Created job record JobId=%d Name=%s Type=%c Level=%c\n",
170        jcr->JobId, jcr->Job, jcr->jr.JobType, jcr->jr.JobLevel);
171
172    generate_daemon_event(jcr, "JobStart");
173    new_plugins(jcr);                  /* instantiate plugins for this jcr */
174    generate_plugin_event(jcr, bDirEventJobStart);
175
176    if (job_canceled(jcr)) {
177       goto bail_out;
178    }
179
180    if (jcr->JobReads() && !jcr->rstorage) {
181       if (jcr->job->storage) {
182          copy_rwstorage(jcr, jcr->job->storage, _("Job resource"));
183       } else {
184          copy_rwstorage(jcr, jcr->job->pool->storage, _("Pool resource"));
185       }
186    }
187    if (!jcr->JobReads()) {
188       free_rstorage(jcr);
189    }
190
191    /*
192     * Now, do pre-run stuff, like setting job level (Inc/diff, ...)
193     *  this allows us to setup a proper job start record for restarting
194     *  in case of later errors.
195     */
196    switch (jcr->getJobType()) {
197    case JT_BACKUP:
198       if (!do_backup_init(jcr)) {
199          backup_cleanup(jcr, JS_ErrorTerminated);
200          goto bail_out;
201       }
202       break;
203    case JT_VERIFY:
204       if (!do_verify_init(jcr)) {
205          verify_cleanup(jcr, JS_ErrorTerminated);
206          goto bail_out;
207       }
208       break;
209    case JT_RESTORE:
210       if (!do_restore_init(jcr)) {
211          restore_cleanup(jcr, JS_ErrorTerminated);
212          goto bail_out;
213       }
214       break;
215    case JT_ADMIN:
216       if (!do_admin_init(jcr)) {
217          admin_cleanup(jcr, JS_ErrorTerminated);
218          goto bail_out;
219       }
220       break;
221    case JT_COPY:
222    case JT_MIGRATE:
223       if (!do_mac_init(jcr)) {
224          mac_cleanup(jcr, JS_ErrorTerminated, JS_ErrorTerminated);
225          goto bail_out;
226       }
227       break;
228    default:
229       Pmsg1(0, _("Unimplemented job type: %d\n"), jcr->getJobType());
230       jcr->setJobStatus(JS_ErrorTerminated);
231       goto bail_out;
232    }
233
234    generate_plugin_event(jcr, bDirEventJobInit);
235    Dsm_check(100);
236    return true;
237
238 bail_out:
239    return false;
240 }
241
242 /*
243  * Setup a job for a resume command
244  */
245 static bool setup_resume_job(JCR *jcr, JOB_DBR *jr)
246 {
247    int errstat;
248    jcr->lock();
249    Dsm_check(100);
250    init_msg(jcr, jcr->messages);
251
252    /* Initialize termination condition variable */
253    if ((errstat = pthread_cond_init(&jcr->term_wait, NULL)) != 0) {
254       berrno be;
255       Jmsg1(jcr, M_FATAL, 0, _("Unable to init job cond variable: ERR=%s\n"), be.bstrerror(errstat));
256       jcr->unlock();
257       goto bail_out;
258    }
259    jcr->term_wait_inited = true;
260
261    jcr->setJobStatus(JS_Created);
262    jcr->unlock();
263
264    /*
265     * Open database
266     */
267    Dmsg0(100, "Open database\n");
268    jcr->db = db_init_database(jcr, jcr->catalog->db_driver, jcr->catalog->db_name,
269                               jcr->catalog->db_user, jcr->catalog->db_password,
270                               jcr->catalog->db_address, jcr->catalog->db_port,
271                               jcr->catalog->db_socket, jcr->catalog->db_ssl_mode,
272                               jcr->catalog->db_ssl_key, jcr->catalog->db_ssl_cert,
273                               jcr->catalog->db_ssl_ca, jcr->catalog->db_ssl_capath, 
274                               jcr->catalog->db_ssl_cipher,
275                               jcr->catalog->mult_db_connections,
276                               jcr->catalog->disable_batch_insert);
277    if (!jcr->db || !db_open_database(jcr, jcr->db)) {
278       Jmsg(jcr, M_FATAL, 0, _("Could not open database \"%s\".\n"),
279                  jcr->catalog->db_name);
280       if (jcr->db) {
281          Jmsg(jcr, M_FATAL, 0, "%s", db_strerror(jcr->db));
282          db_close_database(jcr, jcr->db);
283          jcr->db = NULL;
284       }
285       goto bail_out;
286    }
287    Dmsg0(100, "DB opened\n");
288    if (!jcr->fname) {
289       jcr->fname = get_pool_memory(PM_FNAME);
290    }
291    if (!jcr->pool_source) {
292       jcr->pool_source = get_pool_memory(PM_MESSAGE);
293       pm_strcpy(jcr->pool_source, _("unknown source"));
294    }
295    if (!jcr->next_pool_source) {
296       jcr->next_pool_source = get_pool_memory(PM_MESSAGE);
297       pm_strcpy(jcr->next_pool_source, _("unknown source"));
298    }
299
300
301    /*
302     * Setup Job record.  Make sure original job is Incomplete.
303     */
304    memcpy(&jcr->jr, jr, sizeof(JOB_DBR));
305    jcr->sched_time = jcr->jr.SchedTime;
306    jcr->start_time = jcr->jr.StartTime;
307    jcr->jr.EndTime = 0;               /* perhaps rescheduled, clear it */
308    jcr->setJobType(jcr->jr.JobType);
309    jcr->setJobLevel(jcr->jr.JobLevel);
310    jcr->JobId = jcr->jr.JobId;
311    if (!get_or_create_client_record(jcr)) {
312       Dmsg0(100, "Could not create client record.\n");
313       goto bail_out;
314    }
315
316    Dmsg6(100, "Got job record JobId=%d Job=%s Name=%s Type=%c Level=%c Status=%c\n",
317        jcr->jr.JobId, jcr->jr.Job, jcr->jr.Name, jcr->jr.JobType, jcr->jr.JobLevel,
318        jcr->jr.JobStatus);
319    if (jcr->jr.JobStatus != JS_Incomplete) {
320       /* ***FIXME*** add error message */
321       Dmsg1(100, "Job is not an Incomplete: status=%c\n", jcr->jr.JobStatus);
322       goto bail_out;
323    }
324    bstrncpy(jcr->Job, jcr->jr.Job, sizeof(jcr->Job));
325    jcr->setJobType(jcr->jr.JobType);
326    jcr->setJobLevel(jcr->jr.JobLevel);
327
328    generate_daemon_event(jcr, "JobStart");
329    new_plugins(jcr);                  /* instantiate plugins for this jcr */
330    generate_plugin_event(jcr, bDirEventJobStart);
331
332    if (job_canceled(jcr)) {
333       Dmsg0(100, "Oops. Job canceled\n");
334       goto bail_out;
335    }
336
337    /* Re-run the old job */
338    jcr->rerunning = true;
339
340    /*
341     * Now, do pre-run stuff, like setting job level (Inc/diff, ...)
342     *  this allows us to setup a proper job start record for restarting
343     *  in case of later errors.
344     */
345    switch (jcr->getJobType()) {
346    case JT_BACKUP:
347       if (!do_backup_init(jcr)) {
348          backup_cleanup(jcr, JS_ErrorTerminated);
349          goto bail_out;
350       }
351       break;
352    default:
353       Pmsg1(0, _("Unimplemented job type: %d\n"), jcr->getJobType());
354       jcr->setJobStatus(JS_ErrorTerminated);
355       goto bail_out;
356    }
357
358    generate_plugin_event(jcr, bDirEventJobInit);
359    Dsm_check(100);
360    return true;
361
362 bail_out:
363    return false;
364 }
365
366 JobId_t resume_job(JCR *jcr, JOB_DBR *jr)
367 {
368    int stat;
369    if (setup_resume_job(jcr, jr)) {
370       Dmsg0(200, "Add jrc to work queue\n");
371       /* Queue the job to be run */
372       if ((stat = jobq_add(&job_queue, jcr)) != 0) {
373          berrno be;
374          Jmsg(jcr, M_FATAL, 0, _("Could not add job queue: ERR=%s\n"), be.bstrerror(stat));
375          return 0;
376       }
377       return jcr->JobId;
378    }
379    return 0;
380 }
381
382
383
384 void update_job_end(JCR *jcr, int TermCode)
385 {
386    dequeue_messages(jcr);             /* display any queued messages */
387    jcr->setJobStatus(TermCode);
388    update_job_end_record(jcr);
389 }
390
391 /*
392  * This is the engine called by jobq.c:jobq_add() when we were pulled
393  *  from the work queue.
394  *  At this point, we are running in our own thread and all
395  *    necessary resources are allocated -- see jobq.c
396  */
397 static void *job_thread(void *arg)
398 {
399    JCR *jcr = (JCR *)arg;
400
401    pthread_detach(pthread_self());
402    Dsm_check(100);
403
404    Dmsg0(200, "=====Start Job=========\n");
405    jcr->setJobStatus(JS_Running);   /* this will be set only if no error */
406    jcr->start_time = time(NULL);      /* set the real start time */
407    jcr->jr.StartTime = jcr->start_time;
408
409    if (jcr->job->MaxStartDelay != 0 && jcr->job->MaxStartDelay <
410        (utime_t)(jcr->start_time - jcr->sched_time)) {
411       jcr->setJobStatus(JS_Canceled);
412       Jmsg(jcr, M_FATAL, 0, _("Job canceled because max start delay time exceeded.\n"));
413    }
414
415    if (job_check_maxrunschedtime(jcr)) {
416       jcr->setJobStatus(JS_Canceled);
417       Jmsg(jcr, M_FATAL, 0, _("Job canceled because max run sched time exceeded.\n"));
418    }
419
420    /* TODO : check if it is used somewhere */
421    if (jcr->job->RunScripts == NULL) {
422       Dmsg0(200, "Warning, job->RunScripts is empty\n");
423       jcr->job->RunScripts = New(alist(10, not_owned_by_alist));
424    }
425
426    if (!db_update_job_start_record(jcr, jcr->db, &jcr->jr)) {
427       Jmsg(jcr, M_FATAL, 0, "%s", db_strerror(jcr->db));
428    }
429
430    /* Run any script BeforeJob on dird */
431    run_scripts(jcr, jcr->job->RunScripts, "BeforeJob");
432
433    /*
434     * We re-update the job start record so that the start
435     *  time is set after the run before job.  This avoids
436     *  that any files created by the run before job will
437     *  be saved twice.  They will be backed up in the current
438     *  job, but not in the next one unless they are changed.
439     *  Without this, they will be backed up in this job and
440     *  in the next job run because in that case, their date
441     *   is after the start of this run.
442     */
443    jcr->start_time = time(NULL);
444    jcr->jr.StartTime = jcr->start_time;
445    if (!db_update_job_start_record(jcr, jcr->db, &jcr->jr)) {
446       Jmsg(jcr, M_FATAL, 0, "%s", db_strerror(jcr->db));
447    }
448    generate_plugin_event(jcr, bDirEventJobRun);
449
450    switch (jcr->getJobType()) {
451    case JT_BACKUP:
452       if (!job_canceled(jcr) && do_backup(jcr)) {
453          do_autoprune(jcr);
454       } else {
455          backup_cleanup(jcr, JS_ErrorTerminated);
456       }
457       break;
458    case JT_VERIFY:
459       if (!job_canceled(jcr) && do_verify(jcr)) {
460          do_autoprune(jcr);
461       } else {
462          verify_cleanup(jcr, JS_ErrorTerminated);
463       }
464       break;
465    case JT_RESTORE:
466       if (!job_canceled(jcr) && do_restore(jcr)) {
467          do_autoprune(jcr);
468       } else {
469          restore_cleanup(jcr, JS_ErrorTerminated);
470       }
471       break;
472    case JT_ADMIN:
473       if (!job_canceled(jcr) && do_admin(jcr)) {
474          do_autoprune(jcr);
475       } else {
476          admin_cleanup(jcr, JS_ErrorTerminated);
477       }
478       break;
479    case JT_COPY:
480    case JT_MIGRATE:
481       if (!job_canceled(jcr) && do_mac(jcr)) {
482          do_autoprune(jcr);
483       } else {
484          mac_cleanup(jcr, JS_ErrorTerminated, JS_ErrorTerminated);
485       }
486       break;
487    default:
488       Pmsg1(0, _("Unimplemented job type: %d\n"), jcr->getJobType());
489       break;
490    }
491
492    run_scripts(jcr, jcr->job->RunScripts, "AfterJob");
493
494    /* Send off any queued messages */
495    if (jcr->msg_queue && jcr->msg_queue->size() > 0) {
496       dequeue_messages(jcr);
497    }
498
499    generate_daemon_event(jcr, "JobEnd");
500    generate_plugin_event(jcr, bDirEventJobEnd);
501    Dmsg1(50, "======== End Job stat=%c ==========\n", jcr->JobStatus);
502    Dsm_check(100);
503    return NULL;
504 }
505
506 void sd_msg_thread_send_signal(JCR *jcr, int sig)
507 {
508    jcr->lock();
509    if (  !jcr->sd_msg_thread_done
510        && jcr->SD_msg_chan_started
511        && !pthread_equal(jcr->SD_msg_chan, pthread_self()))
512    {
513       Dmsg1(800, "Send kill to SD msg chan jid=%d\n", jcr->JobId);
514       pthread_kill(jcr->SD_msg_chan, sig);
515    }
516    jcr->unlock();
517 }
518
519 static bool cancel_file_daemon_job(UAContext *ua, const char *cmd, JCR *jcr)
520 {
521    CLIENT *old_client;
522
523    if (!jcr->client) {
524       Dmsg0(100, "No client to cancel\n");
525       return false;
526    }
527    old_client = ua->jcr->client;
528    ua->jcr->client = jcr->client;
529    if (!connect_to_file_daemon(ua->jcr, 10, FDConnectTimeout, 1)) {
530       ua->error_msg(_("Failed to connect to File daemon.\n"));
531       ua->jcr->client = old_client;
532       return false;
533    }
534    Dmsg3(10, "Connected to file daemon %s for cancel ua.jcr=%p jcr=%p\n",
535          ua->jcr->client->name(), ua->jcr, jcr);
536    BSOCK *fd = ua->jcr->file_bsock;
537    fd->fsend("%s Job=%s\n", cmd, jcr->Job);
538    while (fd->recv() >= 0) {
539       ua->send_msg("%s", fd->msg);
540    }
541    fd->signal(BNET_TERMINATE);
542    free_bsock(ua->jcr->file_bsock);
543    ua->jcr->client = old_client;
544    return true;
545 }
546
547 static bool cancel_sd_job(UAContext *ua, const char *cmd, JCR *jcr)
548 {
549    if (jcr->store_bsock) {
550       if (jcr->rstorage) {
551          copy_wstorage(ua->jcr, jcr->rstorage, _("Job resource"));
552       } else {
553          copy_wstorage(ua->jcr, jcr->wstorage, _("Job resource"));
554       }
555    } else {
556       USTORE store;
557       if (jcr->rstorage) {
558          store.store = jcr->rstore;
559       } else {
560          store.store = jcr->wstore;
561       }
562       set_wstorage(ua->jcr, &store);
563    }
564
565    if (!ua->jcr->wstore) {
566       ua->error_msg(_("Failed to select Storage daemon.\n"));
567       return false;
568    }
569
570    if (!connect_to_storage_daemon(ua->jcr, 10, SDConnectTimeout, 1)) {
571       ua->error_msg(_("Failed to connect to Storage daemon.\n"));
572       return false;
573    }
574
575    Dmsg3(10, "Connected to storage daemon %s for cancel ua.jcr=%p jcr=%p\n",
576          ua->jcr->wstore->name(), ua->jcr, jcr);
577
578    BSOCK *sd = ua->jcr->store_bsock;
579    sd->fsend("%s Job=%s\n", cmd, jcr->Job);
580    while (sd->recv() >= 0) {
581       ua->send_msg("%s", sd->msg);
582    }
583    sd->signal(BNET_TERMINATE);
584    free_bsock(ua->jcr->store_bsock);
585    return true;
586 }
587
588 /* The FD is not connected, so we try to complete JCR fields and send
589  * the cancel command.
590  */
591 int cancel_inactive_job(UAContext *ua)
592 {
593    CLIENT_DBR cr;
594    JOB_DBR    jr;
595    int        i;
596    USTORE     store;
597    CLIENT    *client;
598    JCR       *jcr = new_jcr(sizeof(JCR), dird_free_jcr);
599
600    memset(&jr, 0, sizeof(jr));
601    memset(&cr, 0, sizeof(cr));
602
603    if ((i = find_arg_with_value(ua, "jobid")) > 0) {
604       jr.JobId = str_to_int64(ua->argv[i]);
605
606    } else if ((i = find_arg_with_value(ua, "ujobid")) > 0) {
607       bstrncpy(jr.Job, ua->argv[i], sizeof(jr.Job));
608
609    } else {
610       ua->error_msg(_("jobid/ujobid argument not found.\n"));
611       goto bail_out;
612    }
613
614    if (!open_client_db(ua)) {
615       goto bail_out;
616    }
617
618    if (!db_get_job_record(ua->jcr, ua->db, &jr)) {
619       ua->error_msg(_("Job %ld/%s not found in database.\n"), jr.JobId, jr.Job);
620       goto bail_out;
621    }
622
623    if (!acl_access_ok(ua, Job_ACL, jr.Name)) {
624       ua->error_msg(_("Job %s is not accessible from this console\n"), jr.Name);
625       goto bail_out;
626    }
627
628    cr.ClientId = jr.ClientId;
629    if (!cr.ClientId || !db_get_client_record(ua->jcr, ua->db, &cr)) {
630       ua->error_msg(_("Client %ld not found in database.\n"), jr.ClientId);
631       goto bail_out;
632    }
633
634    if (acl_access_client_ok(ua, cr.Name, jr.JobType)) {
635       client = (CLIENT *)GetResWithName(R_CLIENT, cr.Name);
636       if (client) {
637          jcr->client = client;
638       } else {
639          Jmsg1(jcr, M_FATAL, 0, _("Client resource \"%s\" does not exist.\n"), cr.Name);
640          goto bail_out;
641       }
642    } else {
643       goto bail_out;
644    }
645
646    jcr->JobId = jr.JobId;
647    bstrncpy(jcr->Job, jr.Job, sizeof(jcr->Job));
648
649    cancel_file_daemon_job(ua, "cancel", jcr);
650
651    /* At this time, we can't really guess the storage name from
652     * the job record
653     */
654    store.store = get_storage_resource(ua, false/*no default*/, true/*unique*/);
655    if (!store.store) {
656       goto bail_out;
657    }
658
659    set_wstorage(jcr, &store);
660    cancel_sd_job(ua, "cancel", jcr);
661
662 bail_out:
663    jcr->JobId = 0;
664    free_jcr(jcr);
665    return 1;
666 }
667
668 /*
669  * Cancel a job -- typically called by the UA (Console program), but may also
670  *              be called by the job watchdog.
671  *
672  *  Returns: true  if cancel appears to be successful
673  *           false on failure. Message sent to ua->jcr.
674  */
675 bool
676 cancel_job(UAContext *ua, JCR *jcr, int wait,  bool cancel)
677 {
678    char ed1[50];
679    int32_t old_status = jcr->JobStatus;
680    int status;
681    const char *reason, *cmd;
682
683    Dmsg3(10, "cancel_job jcr=%p jobid=%d use_count\n", jcr, jcr->JobId, jcr->use_count());
684
685    if (cancel) {
686       status = JS_Canceled;
687       reason = _("canceled");
688       cmd = NT_("cancel");
689    } else {
690       status = JS_Incomplete;
691       reason = _("stopped");
692       cmd = NT_("stop");
693       jcr->RescheduleIncompleteJobs = false; /* do not restart */
694    }
695
696    jcr->setJobStatus(status);
697
698    switch (old_status) {
699    case JS_Created:
700    case JS_WaitJobRes:
701    case JS_WaitClientRes:
702    case JS_WaitStoreRes:
703    case JS_WaitPriority:
704    case JS_WaitMaxJobs:
705    case JS_WaitStartTime:
706    case JS_WaitDevice:
707       ua->info_msg(_("JobId %s, Job %s marked to be %s.\n"),
708               edit_uint64(jcr->JobId, ed1), jcr->Job,
709               reason);
710       jobq_remove(&job_queue, jcr); /* attempt to remove it from queue */
711       break;
712
713    default:
714
715       /* Cancel File daemon */
716       if (jcr->file_bsock) {
717          btimer_t *tid;
718          /* do not return now, we want to try to cancel the sd */
719          tid = start_bsock_timer(jcr->file_bsock, 120);
720          cancel_file_daemon_job(ua, cmd, jcr);
721          stop_bsock_timer(tid);
722       }
723
724       /* We test file_bsock because the previous operation can take
725        * several minutes
726        */
727       if (jcr->file_bsock && cancel) {
728          jcr->file_bsock->set_terminated();
729          jcr->my_thread_send_signal(TIMEOUT_SIGNAL);
730       }
731
732       /* Cancel Storage daemon */
733       if (jcr->store_bsock) {
734          btimer_t *tid;
735          /* do not return now, we want to try to cancel the sd socket */
736          tid = start_bsock_timer(jcr->store_bsock, 120);
737          cancel_sd_job(ua, cmd, jcr);
738          stop_bsock_timer(tid);
739       }
740
741       /* We test file_bsock because the previous operation can take
742        * several minutes
743        */
744       if (jcr->store_bsock && cancel) {
745          jcr->store_bsock->set_timed_out();
746          jcr->store_bsock->set_terminated();
747          sd_msg_thread_send_signal(jcr, TIMEOUT_SIGNAL);
748          jcr->my_thread_send_signal(TIMEOUT_SIGNAL);
749       }
750
751       /* Cancel Copy/Migration Storage daemon */
752       if (jcr->wjcr) {
753          /* The wjcr is valid until we call free_jcr(jcr) */
754          JCR *wjcr = jcr->wjcr;
755
756          if (wjcr->store_bsock) {
757              btimer_t *tid;
758             /* do not return now, we want to try to cancel the sd socket */
759             tid = start_bsock_timer(wjcr->store_bsock, 120);
760             cancel_sd_job(ua, cmd, wjcr);
761             stop_bsock_timer(tid);
762          }
763          /* We test store_bsock because the previous operation can take
764           * several minutes
765           */
766          if (wjcr->store_bsock && cancel) {
767             wjcr->store_bsock->set_timed_out();
768             wjcr->store_bsock->set_terminated();
769             sd_msg_thread_send_signal(wjcr, TIMEOUT_SIGNAL);
770             wjcr->my_thread_send_signal(TIMEOUT_SIGNAL);
771          }
772       }
773       break;
774    }
775
776    return true;
777 }
778
779 void cancel_storage_daemon_job(JCR *jcr)
780 {
781    if (jcr->sd_canceled) {
782       return;                   /* cancel only once */
783    }
784
785    UAContext *ua = new_ua_context(jcr);
786    JCR *control_jcr = new_control_jcr("*JobCancel*", JT_SYSTEM);
787    BSOCK *sd;
788
789    ua->jcr = control_jcr;
790    if (jcr->store_bsock) {
791       if (!ua->jcr->wstorage) {
792          if (jcr->rstorage) {
793             copy_wstorage(ua->jcr, jcr->rstorage, _("Job resource"));
794          } else {
795             copy_wstorage(ua->jcr, jcr->wstorage, _("Job resource"));
796          }
797       } else {
798          USTORE store;
799          if (jcr->rstorage) {
800             store.store = jcr->rstore;
801          } else {
802             store.store = jcr->wstore;
803          }
804          set_wstorage(ua->jcr, &store);
805       }
806
807       if (!connect_to_storage_daemon(ua->jcr, 10, SDConnectTimeout, 1)) {
808          goto bail_out;
809       }
810       Dmsg0(200, "Connected to storage daemon\n");
811       sd = ua->jcr->store_bsock;
812       sd->fsend("cancel Job=%s\n", jcr->Job);
813       while (sd->recv() >= 0) {
814       }
815       sd->signal(BNET_TERMINATE);
816       free_bsock(ua->jcr->store_bsock);
817       jcr->sd_canceled = true;
818       jcr->store_bsock->set_timed_out();
819       jcr->store_bsock->set_terminated();
820       sd_msg_thread_send_signal(jcr, TIMEOUT_SIGNAL);
821       jcr->my_thread_send_signal(TIMEOUT_SIGNAL);
822    }
823 bail_out:
824    free_jcr(control_jcr);
825    free_ua_context(ua);
826 }
827
828 static void job_monitor_destructor(watchdog_t *self)
829 {
830    JCR *control_jcr = (JCR *)self->data;
831
832    free_jcr(control_jcr);
833 }
834
835 extern "C" void *cancel_thread(void *arg)
836 {
837    JCR *jcr = (JCR *)arg;
838    UAContext *ua;
839    JCR *control_jcr;
840
841    pthread_detach(pthread_self());
842    ua = new_ua_context(jcr);
843    control_jcr = new_control_jcr("*CancelThread*", JT_SYSTEM);
844    ua->jcr = control_jcr;
845
846    Dmsg3(400, "Cancelling JCR %p JobId=%d (%s)\n", jcr, jcr->JobId, jcr->Job);
847    cancel_job(ua, jcr, 120);
848    Dmsg2(400, "Have cancelled JCR %p JobId=%d\n", jcr, jcr->JobId);
849
850    free_ua_context(ua);
851    free_jcr(control_jcr);
852    free_jcr(jcr);
853    return NULL;
854 }
855
856 static void job_monitor_watchdog(watchdog_t *wd)
857 {
858    JCR *jcr;
859
860    Dsm_check(100);
861    Dmsg1(800, "job_monitor_watchdog %p called\n", wd);
862
863    foreach_jcr(jcr) {
864       bool cancel = false;
865
866       if (jcr->JobId == 0 || job_canceled(jcr) || jcr->no_maxtime) {
867          Dmsg2(800, "Skipping JCR=%p Job=%s\n", jcr, jcr->Job);
868          continue;
869       }
870
871       /* check MaxWaitTime */
872       if (job_check_maxwaittime(jcr)) {
873          jcr->setJobStatus(JS_Canceled);
874          Qmsg(jcr, M_FATAL, 0, _("Max wait time exceeded. Job canceled.\n"));
875          cancel = true;
876       /* check MaxRunTime */
877       } else if (job_check_maxruntime(jcr)) {
878          jcr->setJobStatus(JS_Canceled);
879          Qmsg(jcr, M_FATAL, 0, _("Max run time exceeded. Job canceled.\n"));
880          cancel = true;
881       /* check MaxRunSchedTime */
882       } else if (job_check_maxrunschedtime(jcr)) {
883          jcr->setJobStatus(JS_Canceled);
884          Qmsg(jcr, M_FATAL, 0, _("Max run sched time exceeded. Job canceled.\n"));
885          cancel = true;
886       }
887
888       if (cancel) {
889          pthread_t thid;
890          int status;
891          jcr->inc_use_count();
892          if ((status=pthread_create(&thid, NULL, cancel_thread, (void *)jcr)) != 0) {
893             berrno be;
894             Jmsg1(jcr, M_WARNING, 0, _("Cannot create cancel thread: ERR=%s\n"), be.bstrerror(status));
895             free_jcr(jcr);
896          }
897       }
898    }
899    /* Keep reference counts correct */
900    endeach_jcr(jcr);
901 }
902
903 /*
904  * Check if the maxwaittime has expired and it is possible
905  *  to cancel the job.
906  */
907 static bool job_check_maxwaittime(JCR *jcr)
908 {
909    bool cancel = false;
910    JOB *job = jcr->job;
911    utime_t current=0;
912
913    if (!job_waiting(jcr)) {
914       return false;
915    }
916
917    if (jcr->wait_time) {
918       current = watchdog_time - jcr->wait_time;
919    }
920
921    Dmsg2(200, "check maxwaittime %u >= %u\n",
922          current + jcr->wait_time_sum, job->MaxWaitTime);
923    if (job->MaxWaitTime != 0 &&
924        (current + jcr->wait_time_sum) >= job->MaxWaitTime) {
925       cancel = true;
926    }
927
928    return cancel;
929 }
930
931 /*
932  * Check if maxruntime has expired and if the job can be
933  *   canceled.
934  */
935 static bool job_check_maxruntime(JCR *jcr)
936 {
937    bool cancel = false;
938    JOB *job = jcr->job;
939    utime_t run_time;
940
941    if (job_canceled(jcr) || !jcr->job_started) {
942       return false;
943    }
944    if (jcr->job->MaxRunTime == 0 && job->FullMaxRunTime == 0 &&
945        job->IncMaxRunTime == 0 && job->DiffMaxRunTime == 0) {
946       return false;
947    }
948    run_time = watchdog_time - jcr->start_time;
949    Dmsg7(200, "check_maxruntime %llu-%u=%llu >= %llu|%llu|%llu|%llu\n",
950          watchdog_time, jcr->start_time, run_time, job->MaxRunTime, job->FullMaxRunTime,
951          job->IncMaxRunTime, job->DiffMaxRunTime);
952
953    if (jcr->getJobLevel() == L_FULL && job->FullMaxRunTime != 0 &&
954          run_time >= job->FullMaxRunTime) {
955       Dmsg0(200, "check_maxwaittime: FullMaxcancel\n");
956       cancel = true;
957    } else if (jcr->getJobLevel() == L_DIFFERENTIAL && job->DiffMaxRunTime != 0 &&
958          run_time >= job->DiffMaxRunTime) {
959       Dmsg0(200, "check_maxwaittime: DiffMaxcancel\n");
960       cancel = true;
961    } else if (jcr->getJobLevel() == L_INCREMENTAL && job->IncMaxRunTime != 0 &&
962          run_time >= job->IncMaxRunTime) {
963       Dmsg0(200, "check_maxwaittime: IncMaxcancel\n");
964       cancel = true;
965    } else if (job->MaxRunTime > 0 && run_time >= job->MaxRunTime) {
966       Dmsg0(200, "check_maxwaittime: Maxcancel\n");
967       cancel = true;
968    }
969
970    return cancel;
971 }
972
973 /*
974  * Check if MaxRunSchedTime has expired and if the job can be
975  *   canceled.
976  */
977 static bool job_check_maxrunschedtime(JCR *jcr)
978 {
979    if (jcr->MaxRunSchedTime == 0 || job_canceled(jcr)) {
980       return false;
981    }
982    if ((watchdog_time - jcr->initial_sched_time) < jcr->MaxRunSchedTime) {
983       Dmsg3(200, "Job %p (%s) with MaxRunSchedTime %d not expired\n",
984             jcr, jcr->Job, jcr->MaxRunSchedTime);
985       return false;
986    }
987
988    return true;
989 }
990
991 /*
992  * Get or create a Pool record with the given name.
993  * Returns: 0 on error
994  *          poolid if OK
995  */
996 DBId_t get_or_create_pool_record(JCR *jcr, char *pool_name)
997 {
998    POOL_DBR pr;
999
1000    memset(&pr, 0, sizeof(pr));
1001    bstrncpy(pr.Name, pool_name, sizeof(pr.Name));
1002    Dmsg1(110, "get_or_create_pool=%s\n", pool_name);
1003
1004    while (!db_get_pool_record(jcr, jcr->db, &pr)) { /* get by Name */
1005       /* Try to create the pool */
1006       if (create_pool(jcr, jcr->db, jcr->pool, POOL_OP_CREATE) < 0) {
1007          Jmsg(jcr, M_FATAL, 0, _("Cannot create pool \"%s\" in database. ERR=%s"), pr.Name,
1008             db_strerror(jcr->db));
1009          return 0;
1010       } else {
1011          Jmsg(jcr, M_INFO, 0, _("Created database record for Pool \"%s\".\n"), pr.Name);
1012       }
1013    }
1014    return pr.PoolId;
1015 }
1016
1017 /*
1018  * Check for duplicate jobs.
1019  *  Returns: true  if current job should continue
1020  *           false if current job should terminate
1021  */
1022 bool allow_duplicate_job(JCR *jcr)
1023 {
1024    JOB *job = jcr->job;
1025    JCR *djcr;                /* possible duplicate job */
1026
1027    /* Is AllowDuplicateJobs is set or is duplicate checking
1028     *  disabled for this job? */
1029    if (job->AllowDuplicateJobs || jcr->IgnoreDuplicateJobChecking) {
1030       return true;
1031    }
1032    Dmsg0(800, "Enter allow_duplicate_job\n");
1033    /*
1034     * After this point, we do not want to allow any duplicate
1035     * job to run.
1036     */
1037
1038    foreach_jcr(djcr) {
1039       if (jcr == djcr || djcr->is_internal_job() || !djcr->job) {
1040          continue;                   /* do not cancel this job or consoles */
1041       }
1042       /* Does Job has the IgnoreDuplicateJobChecking flag set,
1043        * if so do not check it against other jobs */
1044       if (djcr->IgnoreDuplicateJobChecking) {
1045          continue;
1046       }
1047       if ((strcmp(job->name(), djcr->job->name()) == 0) &&
1048           djcr->getJobType() == jcr->getJobType()) /* A duplicate is about the same name and the same type */
1049       {
1050          bool cancel_dup = false;
1051          bool cancel_me = false;
1052          if (job->DuplicateJobProximity > 0) {
1053             utime_t now = (utime_t)time(NULL);
1054             if ((now - djcr->start_time) > job->DuplicateJobProximity) {
1055                continue;               /* not really a duplicate */
1056             }
1057          }
1058          if (job->CancelLowerLevelDuplicates &&
1059              djcr->getJobType() == 'B' && jcr->getJobType() == 'B') {
1060             switch (jcr->getJobLevel()) {
1061             case L_FULL:
1062                if (djcr->getJobLevel() == L_DIFFERENTIAL ||
1063                    djcr->getJobLevel() == L_INCREMENTAL) {
1064                   cancel_dup = true;
1065                }
1066                break;
1067             case L_DIFFERENTIAL:
1068                if (djcr->getJobLevel() == L_INCREMENTAL) {
1069                   cancel_dup = true;
1070                }
1071                if (djcr->getJobLevel() == L_FULL) {
1072                   cancel_me = true;
1073                }
1074                break;
1075             case L_INCREMENTAL:
1076                if (djcr->getJobLevel() == L_FULL ||
1077                    djcr->getJobLevel() == L_DIFFERENTIAL) {
1078                   cancel_me = true;
1079                }
1080             }
1081             /*
1082              * cancel_dup will be done below
1083              */
1084             if (cancel_me) {
1085               /* Zap current job */
1086               jcr->setJobStatus(JS_Canceled);
1087               Jmsg(jcr, M_FATAL, 0, _("JobId %d already running. Duplicate job not allowed.\n"),
1088                  djcr->JobId);
1089               break;     /* get out of foreach_jcr */
1090             }
1091          }
1092          /* Cancel one of the two jobs (me or dup) */
1093          /* If CancelQueuedDuplicates is set do so only if job is queued */
1094          if (job->CancelQueuedDuplicates) {
1095              switch (djcr->JobStatus) {
1096              case JS_Created:
1097              case JS_WaitJobRes:
1098              case JS_WaitClientRes:
1099              case JS_WaitStoreRes:
1100              case JS_WaitPriority:
1101              case JS_WaitMaxJobs:
1102              case JS_WaitStartTime:
1103              case JS_WaitDevice:
1104                 cancel_dup = true;  /* cancel queued duplicate */
1105                 break;
1106              default:
1107                 break;
1108              }
1109          }
1110          if (cancel_dup || job->CancelRunningDuplicates) {
1111             /* Zap the duplicated job djcr */
1112             UAContext *ua = new_ua_context(jcr);
1113             Jmsg(jcr, M_INFO, 0, _("Cancelling duplicate JobId=%d.\n"), djcr->JobId);
1114             cancel_job(ua, djcr, 60);
1115             bmicrosleep(0, 500000);
1116             djcr->setJobStatus(JS_Canceled);
1117             cancel_job(ua, djcr, 60);
1118             free_ua_context(ua);
1119             Dmsg2(800, "Cancel dup %p JobId=%d\n", djcr, djcr->JobId);
1120          } else {
1121              /* Zap current job */
1122             jcr->setJobStatus(JS_Canceled);
1123             Jmsg(jcr, M_FATAL, 0, _("JobId %d already running. Duplicate job not allowed.\n"),
1124                djcr->JobId);
1125             Dmsg2(800, "Cancel me %p JobId=%d\n", jcr, jcr->JobId);
1126          }
1127          Dmsg4(800, "curJobId=%d use_cnt=%d dupJobId=%d use_cnt=%d\n",
1128                jcr->JobId, jcr->use_count(), djcr->JobId, djcr->use_count());
1129          break;                 /* did our work, get out of foreach loop */
1130       }
1131    }
1132    endeach_jcr(djcr);
1133
1134    return true;
1135 }
1136
1137 /*
1138  * Apply pool overrides to get the storage properly setup.
1139  */
1140 bool apply_wstorage_overrides(JCR *jcr, POOL *opool)
1141 {
1142    const char *source;
1143
1144    Dmsg1(100, "Original pool=%s\n", opool->name());
1145    if (jcr->cmdline_next_pool_override) {
1146       /* Can be Command line or User input */
1147       source = NPRT(jcr->next_pool_source);
1148    } else if (jcr->run_next_pool_override) {
1149       pm_strcpy(jcr->next_pool_source, _("Run NextPool override"));
1150       pm_strcpy(jcr->pool_source, _("Run NextPool override"));
1151       source = _("Run NextPool override");
1152    } else if (jcr->job->next_pool) {
1153       /* Use Job Next Pool */
1154       jcr->next_pool = jcr->job->next_pool;
1155       pm_strcpy(jcr->next_pool_source, _("Job's NextPool resource"));
1156       pm_strcpy(jcr->pool_source, _("Job's NextPool resource"));
1157       source = _("Job's NextPool resource");
1158    } else {
1159       /* Default to original pool->NextPool */
1160       jcr->next_pool = opool->NextPool;
1161       Dmsg1(100, "next_pool=%p\n", jcr->next_pool);
1162       if (jcr->next_pool) {
1163          Dmsg1(100, "Original pool next Pool = %s\n", NPRT(jcr->next_pool->name()));
1164       }
1165       pm_strcpy(jcr->next_pool_source, _("Job Pool's NextPool resource"));
1166       pm_strcpy(jcr->pool_source, _("Job Pool's NextPool resource"));
1167       source = _("Pool's NextPool resource");
1168    }
1169
1170    /*
1171     * If the original backup pool has a NextPool, make sure a
1172     * record exists in the database.
1173     */
1174    if (jcr->next_pool) {
1175       jcr->jr.PoolId = get_or_create_pool_record(jcr, jcr->next_pool->name());
1176       if (jcr->jr.PoolId == 0) {
1177          return false;
1178       }
1179    }
1180
1181    if (!set_mac_wstorage(NULL, jcr, jcr->pool, jcr->next_pool, source)) {
1182       return false;
1183    }
1184
1185    /* Set write pool and source. Not read pool is in rpool. */
1186    jcr->pool = jcr->next_pool;
1187    pm_strcpy(jcr->pool_source, source);
1188
1189    return true;
1190 }
1191
1192
1193 void apply_pool_overrides(JCR *jcr)
1194 {
1195    bool pool_override = false;
1196
1197    if (jcr->run_pool_override) {
1198       pm_strcpy(jcr->pool_source, _("Run Pool override"));
1199    }
1200    /*
1201     * Apply any level related Pool selections
1202     */
1203    switch (jcr->getJobLevel()) {
1204    case L_FULL:
1205       if (jcr->full_pool) {
1206          jcr->pool = jcr->full_pool;
1207          pool_override = true;
1208          if (jcr->run_full_pool_override) {
1209             pm_strcpy(jcr->pool_source, _("Run FullPool override"));
1210          } else {
1211             pm_strcpy(jcr->pool_source, _("Job FullPool override"));
1212          }
1213       }
1214       break;
1215    case L_INCREMENTAL:
1216       if (jcr->inc_pool) {
1217          jcr->pool = jcr->inc_pool;
1218          pool_override = true;
1219          if (jcr->run_inc_pool_override) {
1220             pm_strcpy(jcr->pool_source, _("Run IncPool override"));
1221          } else {
1222             pm_strcpy(jcr->pool_source, _("Job IncPool override"));
1223          }
1224       }
1225       break;
1226    case L_DIFFERENTIAL:
1227       if (jcr->diff_pool) {
1228          jcr->pool = jcr->diff_pool;
1229          pool_override = true;
1230          if (jcr->run_diff_pool_override) {
1231             pm_strcpy(jcr->pool_source, _("Run DiffPool override"));
1232          } else {
1233             pm_strcpy(jcr->pool_source, _("Job DiffPool override"));
1234          }
1235       }
1236       break;
1237    }
1238    /* Update catalog if pool overridden */
1239    if (pool_override && jcr->pool->catalog) {
1240       jcr->catalog = jcr->pool->catalog;
1241       pm_strcpy(jcr->catalog_source, _("Pool resource"));
1242    }
1243 }
1244
1245
1246 /*
1247  * Get or create a Client record for this Job
1248  */
1249 bool get_or_create_client_record(JCR *jcr)
1250 {
1251    CLIENT_DBR cr;
1252
1253    if (!jcr->client) {
1254       Jmsg(jcr, M_FATAL, 0, _("No Client specified.\n"));
1255       return false;
1256    }
1257    memset(&cr, 0, sizeof(cr));
1258    bstrncpy(cr.Name, jcr->client->hdr.name, sizeof(cr.Name));
1259    cr.AutoPrune = jcr->client->AutoPrune;
1260    cr.FileRetention = jcr->client->FileRetention;
1261    cr.JobRetention = jcr->client->JobRetention;
1262    if (!jcr->client_name) {
1263       jcr->client_name = get_pool_memory(PM_NAME);
1264    }
1265    pm_strcpy(jcr->client_name, jcr->client->hdr.name);
1266    if (!db_create_client_record(jcr, jcr->db, &cr)) {
1267       Jmsg(jcr, M_FATAL, 0, _("Could not create Client record. ERR=%s\n"),
1268          db_strerror(jcr->db));
1269       return false;
1270    }
1271    jcr->jr.ClientId = cr.ClientId;
1272    if (cr.Uname[0]) {
1273       if (!jcr->client_uname) {
1274          jcr->client_uname = get_pool_memory(PM_NAME);
1275       }
1276       pm_strcpy(jcr->client_uname, cr.Uname);
1277    }
1278    Dmsg2(100, "Created Client %s record %d\n", jcr->client->hdr.name,
1279       jcr->jr.ClientId);
1280    return true;
1281 }
1282
1283 /*
1284  * Get or Create FileSet record
1285  */
1286 bool get_or_create_fileset_record(JCR *jcr)
1287 {
1288    FILESET_DBR fsr;
1289
1290    memset(&fsr, 0, sizeof(FILESET_DBR));
1291    bstrncpy(fsr.FileSet, jcr->fileset->hdr.name, sizeof(fsr.FileSet));
1292    if (jcr->fileset->have_MD5) {
1293       struct MD5Context md5c;
1294       unsigned char digest[MD5HashSize];
1295       memcpy(&md5c, &jcr->fileset->md5c, sizeof(md5c));
1296       MD5Final(digest, &md5c);
1297       /*
1298        * Keep the flag (last arg) set to false otherwise old FileSets will
1299        * get new MD5 sums and the user will get Full backups on everything
1300        */
1301       bin_to_base64(fsr.MD5, sizeof(fsr.MD5), (char *)digest, MD5HashSize, false);
1302       bstrncpy(jcr->fileset->MD5, fsr.MD5, sizeof(jcr->fileset->MD5));
1303    } else {
1304       Jmsg(jcr, M_WARNING, 0, _("FileSet MD5 digest not found.\n"));
1305    }
1306    if (!jcr->fileset->ignore_fs_changes ||
1307        !db_get_fileset_record(jcr, jcr->db, &fsr)) {
1308       if (!db_create_fileset_record(jcr, jcr->db, &fsr)) {
1309          Jmsg(jcr, M_ERROR, 0, _("Could not create FileSet \"%s\" record. ERR=%s\n"),
1310             fsr.FileSet, db_strerror(jcr->db));
1311          return false;
1312       }
1313    }
1314    jcr->jr.FileSetId = fsr.FileSetId;
1315    bstrncpy(jcr->FSCreateTime, fsr.cCreateTime, sizeof(jcr->FSCreateTime));
1316    Dmsg2(119, "Created FileSet %s record %u\n", jcr->fileset->hdr.name,
1317       jcr->jr.FileSetId);
1318    return true;
1319 }
1320
1321 void init_jcr_job_record(JCR *jcr)
1322 {
1323    jcr->jr.SchedTime = jcr->sched_time;
1324    jcr->jr.StartTime = jcr->start_time;
1325    jcr->jr.EndTime = 0;               /* perhaps rescheduled, clear it */
1326    jcr->jr.JobType = jcr->getJobType();
1327    jcr->jr.JobLevel = jcr->getJobLevel();
1328    jcr->jr.JobStatus = jcr->JobStatus;
1329    jcr->jr.JobId = jcr->JobId;
1330    bstrncpy(jcr->jr.Name, jcr->job->name(), sizeof(jcr->jr.Name));
1331    bstrncpy(jcr->jr.Job, jcr->Job, sizeof(jcr->jr.Job));
1332 }
1333
1334 /*
1335  * Write status and such in DB
1336  */
1337 void update_job_end_record(JCR *jcr)
1338 {
1339    jcr->jr.EndTime = time(NULL);
1340    jcr->end_time = jcr->jr.EndTime;
1341    jcr->jr.JobId = jcr->JobId;
1342    jcr->jr.JobStatus = jcr->JobStatus;
1343    jcr->jr.JobFiles = jcr->JobFiles;
1344    jcr->jr.JobBytes = jcr->JobBytes;
1345    jcr->jr.ReadBytes = jcr->ReadBytes;
1346    jcr->jr.VolSessionId = jcr->VolSessionId;
1347    jcr->jr.VolSessionTime = jcr->VolSessionTime;
1348    jcr->jr.JobErrors = jcr->JobErrors + jcr->SDErrors;
1349    jcr->jr.HasBase = jcr->HasBase;
1350    if (!db_update_job_end_record(jcr, jcr->db, &jcr->jr)) {
1351       Jmsg(jcr, M_WARNING, 0, _("Error updating job record. %s"),
1352          db_strerror(jcr->db));
1353    }
1354 }
1355
1356 /*
1357  * Takes base_name and appends (unique) current
1358  *   date and time to form unique job name.
1359  *
1360  *  Note, the seconds are actually a sequence number. This
1361  *   permits us to start a maximum fo 59 unique jobs a second, which
1362  *   should be sufficient.
1363  *
1364  *  Returns: unique job name in jcr->Job
1365  *    date/time in jcr->start_time
1366  */
1367 void create_unique_job_name(JCR *jcr, const char *base_name)
1368 {
1369    /* Job start mutex */
1370    static pthread_mutex_t mutex = PTHREAD_MUTEX_INITIALIZER;
1371    static time_t last_start_time = 0;
1372    static int seq = 0;
1373    time_t now = time(NULL);
1374    struct tm tm;
1375    char dt[MAX_TIME_LENGTH];
1376    char name[MAX_NAME_LENGTH];
1377    char *p;
1378    int len;
1379    int local_seq;
1380
1381    /* Guarantee unique start time -- maximum one per second, and
1382     * thus unique Job Name
1383     */
1384    P(mutex);                          /* lock creation of jobs */
1385    seq++;
1386    if (seq > 59) {                    /* wrap as if it is seconds */
1387       seq = 0;
1388       while (now == last_start_time) {
1389          bmicrosleep(0, 500000);
1390          now = time(NULL);
1391       }
1392    }
1393    last_start_time = now;
1394    local_seq = seq;
1395    V(mutex);                          /* allow creation of jobs */
1396    jcr->start_time = now;
1397    /* Form Unique JobName */
1398    (void)localtime_r(&now, &tm);
1399    /* Use only characters that are permitted in Windows filenames */
1400    strftime(dt, sizeof(dt), "%Y-%m-%d_%H.%M.%S", &tm);
1401    len = strlen(dt) + 5;   /* dt + .%02d EOS */
1402    bstrncpy(name, base_name, sizeof(name));
1403    name[sizeof(name)-len] = 0;          /* truncate if too long */
1404    bsnprintf(jcr->Job, sizeof(jcr->Job), "%s.%s_%02d", name, dt, local_seq); /* add date & time */
1405    /* Convert spaces into underscores */
1406    for (p=jcr->Job; *p; p++) {
1407       if (*p == ' ') {
1408          *p = '_';
1409       }
1410    }
1411    Dmsg2(100, "JobId=%u created Job=%s\n", jcr->JobId, jcr->Job);
1412 }
1413
1414 /* Called directly from job rescheduling */
1415 void dird_free_jcr_pointers(JCR *jcr)
1416 {
1417    /* Close but do not free bsock packets */
1418    if (jcr->file_bsock) {
1419       Dmsg0(200, "Close File bsock\n");
1420       jcr->file_bsock->close();
1421    }
1422    if (jcr->store_bsock) {
1423       Dmsg0(200, "Close Store bsock\n");
1424       jcr->store_bsock->close();
1425    }
1426
1427    bfree_and_null(jcr->sd_auth_key);
1428    bfree_and_null(jcr->where);
1429    bfree_and_null(jcr->RestoreBootstrap);
1430    jcr->cached_attribute = false;
1431    bfree_and_null(jcr->ar);
1432
1433    free_and_null_pool_memory(jcr->JobIds);
1434    free_and_null_pool_memory(jcr->client_uname);
1435    free_and_null_pool_memory(jcr->attr);
1436    free_and_null_pool_memory(jcr->fname);
1437    free_and_null_pool_memory(jcr->media_type);
1438 }
1439
1440 /*
1441  * Free the Job Control Record if no one is still using it.
1442  *  Called from main free_jcr() routine in src/lib/jcr.c so
1443  *  that we can do our Director specific cleanup of the jcr.
1444  */
1445 void dird_free_jcr(JCR *jcr)
1446 {
1447    Dmsg0(200, "Start dird free_jcr\n");
1448
1449    dird_free_jcr_pointers(jcr);
1450    if (jcr->wjcr) {
1451       free_jcr(jcr->wjcr);
1452       jcr->wjcr = NULL;
1453    }
1454    /* Free bsock packets */
1455    free_bsock(jcr->file_bsock);
1456    free_bsock(jcr->store_bsock);
1457    if (jcr->term_wait_inited) {
1458       pthread_cond_destroy(&jcr->term_wait);
1459       jcr->term_wait_inited = false;
1460    }
1461    if (jcr->db_batch) {
1462       db_close_database(jcr, jcr->db_batch);
1463       jcr->db_batch = NULL;
1464       jcr->batch_started = false;
1465    }
1466    if (jcr->db) {
1467       db_close_database(jcr, jcr->db);
1468       jcr->db = NULL;
1469    }
1470
1471    free_and_null_pool_memory(jcr->stime);
1472    free_and_null_pool_memory(jcr->fname);
1473    free_and_null_pool_memory(jcr->pool_source);
1474    free_and_null_pool_memory(jcr->next_pool_source);
1475    free_and_null_pool_memory(jcr->catalog_source);
1476    free_and_null_pool_memory(jcr->rpool_source);
1477    free_and_null_pool_memory(jcr->wstore_source);
1478    free_and_null_pool_memory(jcr->rstore_source);
1479    free_and_null_pool_memory(jcr->next_vol_list);
1480    free_and_null_pool_memory(jcr->component_fname);
1481
1482    /* Delete lists setup to hold storage pointers */
1483    free_rwstorage(jcr);
1484
1485    jcr->job_end_push.destroy();
1486
1487    if (jcr->JobId != 0)
1488       write_state_file(director->working_directory, "bacula-dir", get_first_port_host_order(director->DIRaddrs));
1489
1490    if (jcr->plugin_config) {
1491       free_plugin_config_items(jcr->plugin_config);
1492       delete jcr->plugin_config;
1493       jcr->plugin_config = NULL;
1494    }
1495    free_plugins(jcr);                 /* release instantiated plugins */
1496
1497    garbage_collect_memory_pool();
1498
1499    Dmsg0(200, "End dird free_jcr\n");
1500 }
1501
1502 /*
1503  * The Job storage definition must be either in the Job record
1504  *  or in the Pool record.  The Pool record overrides the Job
1505  *  record.
1506  */
1507 void get_job_storage(USTORE *store, JOB *job, RUN *run)
1508 {
1509    if (run && run->pool && run->pool->storage) {
1510       store->store = (STORE *)run->pool->storage->first();
1511       pm_strcpy(store->store_source, _("Run pool override"));
1512       return;
1513    }
1514    if (run && run->storage) {
1515       store->store = run->storage;
1516       pm_strcpy(store->store_source, _("Run storage override"));
1517       return;
1518    }
1519    if (job->pool->storage) {
1520       store->store = (STORE *)job->pool->storage->first();
1521       pm_strcpy(store->store_source, _("Pool resource"));
1522    } else {
1523       store->store = (STORE *)job->storage->first();
1524       pm_strcpy(store->store_source, _("Job resource"));
1525    }
1526 }
1527
1528 /*
1529  * Set some defaults in the JCR necessary to
1530  * run. These items are pulled from the job
1531  * definition as defaults, but can be overridden
1532  * later either by the Run record in the Schedule resource,
1533  * or by the Console program.
1534  */
1535 void set_jcr_defaults(JCR *jcr, JOB *job)
1536 {
1537    jcr->job = job;
1538    jcr->setJobType(job->JobType);
1539    jcr->JobStatus = JS_Created;
1540
1541    switch (jcr->getJobType()) {
1542    case JT_ADMIN:
1543       jcr->setJobLevel(L_NONE);
1544       break;
1545    default:
1546       jcr->setJobLevel(job->JobLevel);
1547       break;
1548    }
1549    if (!jcr->next_vol_list) {
1550       jcr->next_vol_list = get_pool_memory(PM_FNAME);
1551    }
1552    if (!jcr->fname) {
1553       jcr->fname = get_pool_memory(PM_FNAME);
1554    }
1555    if (!jcr->pool_source) {
1556       jcr->pool_source = get_pool_memory(PM_MESSAGE);
1557    }
1558    if (!jcr->next_pool_source) {
1559       jcr->next_pool_source = get_pool_memory(PM_MESSAGE);
1560    }
1561    if (!jcr->catalog_source) {
1562       jcr->catalog_source = get_pool_memory(PM_MESSAGE);
1563    }
1564
1565    jcr->JobPriority = job->Priority;
1566    /* Copy storage definitions -- deleted in dir_free_jcr above */
1567    if (job->storage) {
1568       copy_rwstorage(jcr, job->storage, _("Job resource"));
1569    } else {
1570       copy_rwstorage(jcr, job->pool->storage, _("Pool resource"));
1571    }
1572    jcr->client = job->client;
1573    ASSERT2(jcr->client, "jcr->client==NULL!!!");
1574    if (!jcr->client_name) {
1575       jcr->client_name = get_pool_memory(PM_NAME);
1576    }
1577    pm_strcpy(jcr->client_name, jcr->client->name());
1578    jcr->pool = job->pool;
1579    pm_strcpy(jcr->pool_source, _("Job resource"));
1580    if (job->next_pool) {
1581       /* Use Job's Next Pool */
1582       jcr->next_pool = job->next_pool;
1583       pm_strcpy(jcr->next_pool_source, _("Job's NextPool resource"));
1584    } else {
1585       /* Default to original pool->NextPool */
1586       jcr->next_pool = job->pool->NextPool;
1587       pm_strcpy(jcr->next_pool_source, _("Job Pool's NextPool resource"));
1588    }
1589    jcr->full_pool = job->full_pool;
1590    jcr->inc_pool = job->inc_pool;
1591    jcr->diff_pool = job->diff_pool;
1592    if (job->pool->catalog) {
1593       jcr->catalog = job->pool->catalog;
1594       pm_strcpy(jcr->catalog_source, _("Pool resource"));
1595    } else {
1596       jcr->catalog = job->client->catalog;
1597       pm_strcpy(jcr->catalog_source, _("Client resource"));
1598    }
1599    jcr->fileset = job->fileset;
1600    jcr->accurate = job->accurate;
1601    jcr->messages = job->messages;
1602    jcr->spool_data = job->spool_data;
1603    jcr->spool_size = job->spool_size;
1604    jcr->write_part_after_job = job->write_part_after_job;
1605    jcr->MaxRunSchedTime = job->MaxRunSchedTime;
1606    if (jcr->RestoreBootstrap) {
1607       free(jcr->RestoreBootstrap);
1608       jcr->RestoreBootstrap = NULL;
1609    }
1610    /* This can be overridden by Console program */
1611    if (job->RestoreBootstrap) {
1612       jcr->RestoreBootstrap = bstrdup(job->RestoreBootstrap);
1613    }
1614    /* This can be overridden by Console program */
1615    jcr->verify_job = job->verify_job;
1616    /* If no default level given, set one */
1617    if (jcr->getJobLevel() == 0) {
1618       switch (jcr->getJobType()) {
1619       case JT_VERIFY:
1620          jcr->setJobLevel(L_VERIFY_CATALOG);
1621          break;
1622       case JT_BACKUP:
1623          jcr->setJobLevel(L_INCREMENTAL);
1624          break;
1625       case JT_RESTORE:
1626       case JT_ADMIN:
1627          jcr->setJobLevel(L_NONE);
1628          break;
1629       default:
1630          jcr->setJobLevel(L_FULL);
1631          break;
1632       }
1633    }
1634 }
1635
1636 /*
1637  * Copy the storage definitions from an alist to the JCR
1638  */
1639 void copy_rwstorage(JCR *jcr, alist *storage, const char *where)
1640 {
1641    if (jcr->JobReads()) {
1642       copy_rstorage(jcr, storage, where);
1643    }
1644    copy_wstorage(jcr, storage, where);
1645 }
1646
1647
1648 /* Set storage override.  Releases any previous storage definition */
1649 void set_rwstorage(JCR *jcr, USTORE *store)
1650 {
1651    if (!store) {
1652       Jmsg(jcr, M_FATAL, 0, _("No storage specified.\n"));
1653       return;
1654    }
1655    if (jcr->JobReads()) {
1656       set_rstorage(jcr, store);
1657    }
1658    set_wstorage(jcr, store);
1659 }
1660
1661 void free_rwstorage(JCR *jcr)
1662 {
1663    free_rstorage(jcr);
1664    free_wstorage(jcr);
1665 }
1666
1667 /*
1668  * Copy the storage definitions from an alist to the JCR
1669  */
1670 void copy_rstorage(JCR *jcr, alist *storage, const char *where)
1671 {
1672    if (storage) {
1673       STORE *st;
1674       if (jcr->rstorage) {
1675          delete jcr->rstorage;
1676       }
1677       jcr->rstorage = New(alist(10, not_owned_by_alist));
1678       foreach_alist(st, storage) {
1679          jcr->rstorage->append(st);
1680       }
1681       if (!jcr->rstore_source) {
1682          jcr->rstore_source = get_pool_memory(PM_MESSAGE);
1683       }
1684       pm_strcpy(jcr->rstore_source, where);
1685       if (jcr->rstorage) {
1686          jcr->rstore = (STORE *)jcr->rstorage->first();
1687       }
1688    }
1689 }
1690
1691
1692 /* Set storage override.  Remove all previous storage */
1693 void set_rstorage(JCR *jcr, USTORE *store)
1694 {
1695    STORE *storage;
1696
1697    if (!store->store) {
1698       return;
1699    }
1700    if (jcr->rstorage) {
1701       free_rstorage(jcr);
1702    }
1703    if (!jcr->rstorage) {
1704       jcr->rstorage = New(alist(10, not_owned_by_alist));
1705    }
1706    jcr->rstore = store->store;
1707    if (!jcr->rstore_source) {
1708       jcr->rstore_source = get_pool_memory(PM_MESSAGE);
1709    }
1710    pm_strcpy(jcr->rstore_source, store->store_source);
1711    foreach_alist(storage, jcr->rstorage) {
1712       if (store->store == storage) {
1713          return;
1714       }
1715    }
1716    /* Store not in list, so add it */
1717    jcr->rstorage->prepend(store->store);
1718 }
1719
1720 void free_rstorage(JCR *jcr)
1721 {
1722    if (jcr->rstorage) {
1723       delete jcr->rstorage;
1724       jcr->rstorage = NULL;
1725    }
1726    jcr->rstore = NULL;
1727 }
1728
1729 /*
1730  * Copy the storage definitions from an alist to the JCR
1731  */
1732 void copy_wstorage(JCR *jcr, alist *storage, const char *where)
1733 {
1734    if (storage) {
1735       STORE *st;
1736       if (jcr->wstorage) {
1737          delete jcr->wstorage;
1738       }
1739       jcr->wstorage = New(alist(10, not_owned_by_alist));
1740       foreach_alist(st, storage) {
1741          Dmsg1(100, "wstorage=%s\n", st->name());
1742          jcr->wstorage->append(st);
1743       }
1744       if (!jcr->wstore_source) {
1745          jcr->wstore_source = get_pool_memory(PM_MESSAGE);
1746       }
1747       pm_strcpy(jcr->wstore_source, where);
1748       if (jcr->wstorage) {
1749          jcr->wstore = (STORE *)jcr->wstorage->first();
1750          Dmsg2(100, "wstore=%s where=%s\n", jcr->wstore->name(), jcr->wstore_source);
1751       }
1752    }
1753 }
1754
1755
1756 /* Set storage override. Remove all previous storage */
1757 void set_wstorage(JCR *jcr, USTORE *store)
1758 {
1759    STORE *storage;
1760
1761    if (!store->store) {
1762       return;
1763    }
1764    if (jcr->wstorage) {
1765       free_wstorage(jcr);
1766    }
1767    if (!jcr->wstorage) {
1768       jcr->wstorage = New(alist(10, not_owned_by_alist));
1769    }
1770    jcr->wstore = store->store;
1771    if (!jcr->wstore_source) {
1772       jcr->wstore_source = get_pool_memory(PM_MESSAGE);
1773    }
1774    pm_strcpy(jcr->wstore_source, store->store_source);
1775    Dmsg2(50, "wstore=%s where=%s\n", jcr->wstore->name(), jcr->wstore_source);
1776    foreach_alist(storage, jcr->wstorage) {
1777       if (store->store == storage) {
1778          return;
1779       }
1780    }
1781    /* Store not in list, so add it */
1782    jcr->wstorage->prepend(store->store);
1783 }
1784
1785 void free_wstorage(JCR *jcr)
1786 {
1787    if (jcr->wstorage) {
1788       delete jcr->wstorage;
1789       jcr->wstorage = NULL;
1790    }
1791    jcr->wstore = NULL;
1792 }
1793
1794 void create_clones(JCR *jcr)
1795 {
1796    /*
1797     * Fire off any clone jobs (run directives)
1798     */
1799    Dmsg2(900, "cloned=%d run_cmds=%p\n", jcr->cloned, jcr->job->run_cmds);
1800    if (!jcr->cloned && jcr->job->run_cmds) {
1801       char *runcmd;
1802       JOB *job = jcr->job;
1803       POOLMEM *cmd = get_pool_memory(PM_FNAME);
1804       UAContext *ua = new_ua_context(jcr);
1805       ua->batch = true;
1806       foreach_alist(runcmd, job->run_cmds) {
1807          cmd = edit_job_codes(jcr, cmd, runcmd, "", job_code_callback_director);
1808          Mmsg(ua->cmd, "run %s cloned=yes", cmd);
1809          Dmsg1(900, "=============== Clone cmd=%s\n", ua->cmd);
1810          parse_ua_args(ua);                 /* parse command */
1811          int stat = run_cmd(ua, ua->cmd);
1812          if (stat == 0) {
1813             Jmsg(jcr, M_ERROR, 0, _("Could not start clone job: \"%s\".\n"),
1814                  ua->cmd);
1815          } else {
1816             Jmsg(jcr, M_INFO, 0, _("Clone JobId %d started.\n"), stat);
1817          }
1818       }
1819       free_ua_context(ua);
1820       free_pool_memory(cmd);
1821    }
1822 }
1823
1824 /*
1825  * Given: a JobId  and FileIndex
1826  *  this subroutine writes a bsr file to restore that job.
1827  * Returns: -1 on error
1828  *           number of files if OK
1829  */
1830 int create_restore_bootstrap_file(JCR *jcr, JobId_t jobid, int findex1, int findex2)
1831 {
1832    RESTORE_CTX rx;
1833    UAContext *ua;
1834    int files;
1835
1836    memset(&rx, 0, sizeof(rx));
1837    rx.JobIds = (char *)"";
1838
1839    rx.bsr_list = create_bsr_list(jobid, findex1, findex2);
1840
1841    ua = new_ua_context(jcr);
1842    if (!complete_bsr(ua, rx.bsr_list)) {
1843       files = -1;
1844       goto bail_out;
1845    }
1846
1847    jcr->ExpectedFiles = write_bsr_file(ua, rx);
1848    if (jcr->ExpectedFiles == 0) {
1849       files = 0;
1850       goto bail_out;
1851    }
1852    free_ua_context(ua);
1853    free_bsr(rx.bsr_list);
1854    jcr->needs_sd = true;
1855    return jcr->ExpectedFiles;
1856
1857 bail_out:
1858    free_ua_context(ua);
1859    free_bsr(rx.bsr_list);
1860    return files;
1861 }
1862
1863 /*
1864  * Given: a JobId in jcr->previous_jr.JobId,
1865  *  this subroutine writes a bsr file to restore that job.
1866  * Returns: -1 on error
1867  *           number of files if OK
1868  */
1869 int create_restore_bootstrap_file(JCR *jcr)
1870 {
1871    return create_restore_bootstrap_file(jcr, jcr->previous_jr.JobId, 1, jcr->previous_jr.JobFiles);
1872 }
1873
1874 /* TODO: redirect command ouput to job log */
1875 bool run_console_command(JCR *jcr, const char *cmd)
1876 {
1877    UAContext *ua;
1878    bool ok;
1879    JCR *ljcr = new_control_jcr("-RunScript-", JT_CONSOLE);
1880    ua = new_ua_context(ljcr);
1881    /* run from runscript and check if commands are authorized */
1882    ua->runscript = true;
1883    Mmsg(ua->cmd, "%s", cmd);
1884    Dmsg1(100, "Console command: %s\n", ua->cmd);
1885    parse_ua_args(ua);
1886    if (ua->argc > 0 && ua->argk[0][0] == '.') {
1887       ok = do_a_dot_command(ua);
1888    } else {
1889      ok = do_a_command(ua);
1890    }
1891    close_db(ua);
1892    free_ua_context(ua);
1893    free_jcr(ljcr);
1894    return ok;
1895 }