]> git.sur5r.net Git - bacula/bacula/blob - bacula/src/filed/job.c
Fix: clock diff, Dan's patch, Nic's patch, segfault
[bacula/bacula] / bacula / src / filed / job.c
1 /*
2  *  Bacula File Daemon Job processing
3  *
4  *    Kern Sibbald, October MM
5  *
6  *   Version $Id$
7  *
8  */
9 /*
10    Copyright (C) 2000-2003 Kern Sibbald and John Walker
11
12    This program is free software; you can redistribute it and/or
13    modify it under the terms of the GNU General Public License as
14    published by the Free Software Foundation; either version 2 of
15    the License, or (at your option) any later version.
16
17    This program is distributed in the hope that it will be useful,
18    but WITHOUT ANY WARRANTY; without even the implied warranty of
19    MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE. See the GNU
20    General Public License for more details.
21
22    You should have received a copy of the GNU General Public
23    License along with this program; if not, write to the Free
24    Software Foundation, Inc., 59 Temple Place - Suite 330, Boston,
25    MA 02111-1307, USA.
26
27  */
28
29 #include "bacula.h"
30 #include "filed.h"
31
32 extern char my_name[];
33 extern CLIENT *me;                    /* our client resource */
34                         
35 /* Imported functions */
36 extern int status_cmd(JCR *jcr);
37                                    
38 /* Forward referenced functions */
39 static int backup_cmd(JCR *jcr);
40 static int bootstrap_cmd(JCR *jcr);
41 static int cancel_cmd(JCR *jcr);
42 static int setdebug_cmd(JCR *jcr);
43 static int estimate_cmd(JCR *jcr);
44 static int exclude_cmd(JCR *jcr);
45 static int hello_cmd(JCR *jcr);
46 static int job_cmd(JCR *jcr);
47 static int include_cmd(JCR *jcr);
48 static int level_cmd(JCR *jcr);
49 static int verify_cmd(JCR *jcr);
50 static int restore_cmd(JCR *jcr);
51 static int storage_cmd(JCR *jcr);
52 static int session_cmd(JCR *jcr);
53 static int response(JCR *jcr, BSOCK *sd, char *resp, char *cmd);
54 static void filed_free_jcr(JCR *jcr);
55 static int open_sd_read_session(JCR *jcr);
56 static int send_bootstrap_file(JCR *jcr);
57 static int runbefore_cmd(JCR *jcr);
58 static int runafter_cmd(JCR *jcr);
59 static int run_cmd(JCR *jcr, char *cmd, char *name);
60
61
62 /* Exported functions */
63
64 struct s_cmds {
65    char *cmd;
66    int (*func)(JCR *);
67 };
68
69 /*  
70  * The following are the recognized commands from the Director. 
71  */
72 static struct s_cmds cmds[] = {
73    {"backup",       backup_cmd},
74    {"cancel",       cancel_cmd},
75    {"setdebug=",    setdebug_cmd},
76    {"estimate",     estimate_cmd},
77    {"exclude",      exclude_cmd},
78    {"Hello",        hello_cmd},
79    {"include",      include_cmd},
80    {"JobId=",       job_cmd},
81    {"level = ",     level_cmd},
82    {"restore",      restore_cmd},
83    {"session",      session_cmd},
84    {"status",       status_cmd},
85    {"storage ",     storage_cmd},
86    {"verify",       verify_cmd},
87    {"bootstrap",    bootstrap_cmd},
88    {"RunBeforeJob", runbefore_cmd},
89    {"RunAfterJob",  runafter_cmd},
90    {NULL,       NULL}                  /* list terminator */
91 };
92
93 /* Commands received from director that need scanning */
94 static char jobcmd[]      = "JobId=%d Job=%127s SDid=%d SDtime=%d Authorization=%100s";
95 static char storaddr[]    = "storage address=%s port=%d ssl=%d\n";
96 static char sessioncmd[]  = "session %127s %ld %ld %ld %ld %ld %ld\n";
97 static char restorecmd[]  = "restore replace=%c prelinks=%d where=%s\n";
98 static char restorecmd1[] = "restore replace=%c prelinks=%d where=\n";
99 static char verifycmd[]   = "verify level=%30s\n";
100 static char estimatecmd[] = "estimate listing=%d\n";
101 static char runbefore[]   = "RunBeforeJob %s\n";
102 static char runafter[]    = "RunAfterJob %s\n";
103
104 /* Responses sent to Director */
105 static char errmsg[]      = "2999 Invalid command\n";
106 static char no_auth[]     = "2998 No Authorization\n";
107 static char OKinc[]       = "2000 OK include\n";
108 static char OKest[]       = "2000 OK estimate files=%u bytes=%s\n";
109 static char OKexc[]       = "2000 OK exclude\n";
110 static char OKlevel[]     = "2000 OK level\n";
111 static char OKbackup[]    = "2000 OK backup\n";
112 static char OKbootstrap[] = "2000 OK bootstrap\n";
113 static char OKverify[]    = "2000 OK verify\n";
114 static char OKrestore[]   = "2000 OK restore\n";
115 static char OKsession[]   = "2000 OK session\n";
116 static char OKstore[]     = "2000 OK storage\n";
117 static char OKjob[]       = "2000 OK Job " HOST_OS "," DISTNAME "," DISTVER;
118 static char OKsetdebug[]  = "2000 OK setdebug=%d\n";
119 static char BADjob[]      = "2901 Bad Job\n";
120 static char EndJob[]      = "2800 End Job TermCode=%d JobFiles=%u ReadBytes=%s JobBytes=%s Errors=%u\n";
121 static char OKRunBefore[] = "2000 OK RunBefore\n";
122 static char OKRunAfter[]  = "2000 OK RunAfter\n";
123
124 /* Responses received from Storage Daemon */
125 static char OK_end[]       = "3000 OK end\n";
126 static char OK_close[]     = "3000 OK close Status = %d\n";
127 static char OK_open[]      = "3000 OK open ticket = %d\n";
128 static char OK_data[]      = "3000 OK data\n";
129 static char OK_append[]    = "3000 OK append data\n";
130 static char OKSDbootstrap[] = "3000 OK bootstrap\n";
131
132
133 /* Commands sent to Storage Daemon */
134 static char append_open[]  = "append open session\n";
135 static char append_data[]  = "append data %d\n";
136 static char append_end[]   = "append end session %d\n";
137 static char append_close[] = "append close session %d\n";
138 static char read_open[]    = "read open session = %s %ld %ld %ld %ld %ld %ld\n";
139 static char read_data[]    = "read data %d\n";
140 static char read_close[]   = "read close session %d\n";
141
142 /* 
143  * Accept requests from a Director
144  *
145  * NOTE! We are running as a separate thread
146  *
147  * Send output one line
148  * at a time followed by a zero length transmission.
149  *
150  * Return when the connection is terminated or there
151  * is an error.
152  *
153  * Basic task here is:
154  *   Authenticate Director (during Hello command).
155  *   Accept commands one at a time from the Director
156  *     and execute them.
157  *
158  */
159 void *handle_client_request(void *dirp)
160 {
161    int i, found, quit;
162    JCR *jcr;
163    BSOCK *dir = (BSOCK *)dirp;
164
165    jcr = new_jcr(sizeof(JCR), filed_free_jcr); /* create JCR */
166    jcr->dir_bsock = dir;
167    jcr->ff = init_find_files();
168    jcr->start_time = time(NULL);
169    jcr->last_fname = get_pool_memory(PM_FNAME);
170    jcr->last_fname[0] = 0;
171    jcr->client_name = get_memory(strlen(my_name) + 1);
172    pm_strcpy(&jcr->client_name, my_name);
173    dir->jcr = jcr;
174    enable_backup_privileges(NULL, 1 /* ignore_errors */);
175
176    /**********FIXME******* add command handler error code */
177
178    for (quit=0; !quit;) {
179
180       /* Read command */
181       if (bnet_recv(dir) < 0) {
182          break;                       /* connection terminated */
183       }
184       dir->msg[dir->msglen] = 0;
185       Dmsg1(100, "<dird: %s", dir->msg);
186       found = FALSE;
187       for (i=0; cmds[i].cmd; i++) {
188          if (strncmp(cmds[i].cmd, dir->msg, strlen(cmds[i].cmd)) == 0) {
189             if (!jcr->authenticated && cmds[i].func != hello_cmd) {
190                bnet_fsend(dir, no_auth);
191                break;
192             }
193             found = TRUE;                /* indicate command found */
194             if (!cmds[i].func(jcr)) {    /* do command */
195                quit = TRUE;              /* error or fully terminated,  get out */
196                Dmsg0(20, "Command error or Job done.\n");
197             }
198             break;
199          }
200       }
201       if (!found) {                   /* command not found */
202          bnet_fsend(dir, errmsg);
203          quit = TRUE;
204          break;
205       }
206    }
207
208    /* Inform Storage daemon that we are done */
209    if (jcr->store_bsock) {
210       bnet_sig(jcr->store_bsock, BNET_TERMINATE);
211    }
212
213    if (jcr->RunAfterJob && !job_canceled(jcr)) {
214       run_cmd(jcr, jcr->RunAfterJob, "ClientRunAfterJob");
215    }
216
217    /* Inform Director that we are done */
218    bnet_sig(dir, BNET_TERMINATE);
219
220    Dmsg0(100, "Calling term_find_files\n");
221    term_find_files((FF_PKT *)jcr->ff);
222    Dmsg0(100, "Done with term_find_files\n");
223    free_jcr(jcr);                     /* destroy JCR record */
224    Dmsg0(100, "Done with free_jcr\n");
225    return NULL;
226 }
227
228 /*
229  * Hello from Director he must identify himself and provide his 
230  *  password.
231  */
232 static int hello_cmd(JCR *jcr)
233 {
234    Dmsg0(120, "Calling Authenticate\n");
235    if (!authenticate_director(jcr)) {
236       return 0;
237    }
238    Dmsg0(120, "OK Authenticate\n");
239    jcr->authenticated = TRUE;
240    return 1;
241 }
242
243 /*
244  * Cancel a Job
245  */
246 static int cancel_cmd(JCR *jcr)
247 {
248    BSOCK *dir = jcr->dir_bsock;
249    char Job[MAX_NAME_LENGTH];
250    JCR *cjcr;
251
252    if (sscanf(dir->msg, "cancel Job=%127s", Job) == 1) {
253       if (!(cjcr=get_jcr_by_full_name(Job))) {
254          bnet_fsend(dir, "2901 Job %s not found.\n", Job);
255       } else {
256          if (cjcr->store_bsock) {
257             P(cjcr->mutex);
258             cjcr->store_bsock->timed_out = 1;
259             cjcr->store_bsock->terminated = 1;
260 #ifndef HAVE_CYGWIN
261             pthread_kill(cjcr->my_thread_id, TIMEOUT_SIGNAL);
262 #endif
263             V(cjcr->mutex);
264          }
265          set_jcr_job_status(cjcr, JS_Canceled);
266          free_jcr(cjcr);
267          bnet_fsend(dir, "2001 Job %s marked to be canceled.\n", Job);
268       }
269    } else {
270       bnet_fsend(dir, "2902 Error scanning cancel command.\n");
271    }
272    bnet_sig(dir, BNET_EOD);
273    return 1;
274 }
275
276
277 /*
278  * Set debug level as requested by the Director
279  *
280  */
281 static int setdebug_cmd(JCR *jcr)
282 {
283    BSOCK *dir = jcr->dir_bsock;
284    int level;
285
286    Dmsg1(110, "setdebug_cmd: %s", dir->msg);
287    if (sscanf(dir->msg, "setdebug=%d", &level) != 1 || level < 0) {
288       pm_strcpy(&jcr->errmsg, dir->msg);
289       bnet_fsend(dir, "2991 Bad setdebug command: %s\n", jcr->errmsg);
290       return 0;   
291    }
292    debug_level = level;
293    return bnet_fsend(dir, OKsetdebug, level);
294 }
295
296
297 static int estimate_cmd(JCR *jcr)
298 {
299    BSOCK *dir = jcr->dir_bsock;
300    char ed2[50];
301
302    if (sscanf(dir->msg, estimatecmd, &jcr->listing) != 1) {
303       pm_strcpy(&jcr->errmsg, dir->msg);
304       Jmsg(jcr, M_FATAL, 0, _("Bad estimate command: %s"), jcr->errmsg);
305       bnet_fsend(dir, "2992 Bad estimate command.\n");
306       return 0;
307    }
308    make_estimate(jcr);
309    bnet_fsend(dir, OKest, jcr->num_files_examined, 
310       edit_uint64_with_commas(jcr->JobBytes, ed2));
311    bnet_sig(dir, BNET_EOD);
312    return 1;
313 }
314
315 /*
316  * Get JobId and Storage Daemon Authorization key from Director
317  */
318 static int job_cmd(JCR *jcr)
319 {
320    BSOCK *dir = jcr->dir_bsock;
321    POOLMEM *sd_auth_key;
322
323    sd_auth_key = get_memory(dir->msglen);
324    if (sscanf(dir->msg, jobcmd,  &jcr->JobId, jcr->Job,  
325               &jcr->VolSessionId, &jcr->VolSessionTime,
326               sd_auth_key) != 5) {
327       pm_strcpy(&jcr->errmsg, dir->msg);
328       Jmsg(jcr, M_FATAL, 0, _("Bad Job Command: %s"), jcr->errmsg);
329       bnet_fsend(dir, BADjob);
330       free_pool_memory(sd_auth_key);
331       return 0;
332    }
333    jcr->sd_auth_key = bstrdup(sd_auth_key);
334    free_pool_memory(sd_auth_key);
335    Dmsg2(120, "JobId=%d Auth=%s\n", jcr->JobId, jcr->sd_auth_key);
336    return bnet_fsend(dir, OKjob);
337 }
338
339 static int runbefore_cmd(JCR *jcr)
340 {
341    int stat;
342    BSOCK *dir = jcr->dir_bsock;
343    POOLMEM *cmd = get_memory(dir->msglen+1);
344
345    Dmsg1(100, "runbefore_cmd: %s", dir->msg);
346    if (sscanf(dir->msg, runbefore, cmd) != 1) {
347       pm_strcpy(&jcr->errmsg, dir->msg);
348       Jmsg1(jcr, M_FATAL, 0, _("Bad RunBeforeJob command: %s\n"), jcr->errmsg);
349       bnet_fsend(dir, "2905 Bad RunBeforeJob command.\n");
350       free_memory(cmd);
351       return 0;
352    }
353    unbash_spaces(cmd);
354
355    /* Run the command now */
356    stat = run_cmd(jcr, cmd, "ClientRunBeforeJob");
357    free_memory(cmd);
358    if (stat) {
359       bnet_fsend(dir, OKRunBefore);
360       return 1;
361    } else {
362       bnet_fsend(dir, "2905 Bad RunBeforeJob command.\n");
363       return 0;
364    }
365 }
366
367 static int runafter_cmd(JCR *jcr)
368 {
369    BSOCK *dir = jcr->dir_bsock;
370    POOLMEM *msg = get_memory(dir->msglen+1);
371
372    Dmsg1(100, "runafter_cmd: %s", dir->msg);
373    if (sscanf(dir->msg, runafter, msg) != 1) {
374       pm_strcpy(&jcr->errmsg, dir->msg);
375       Jmsg1(jcr, M_FATAL, 0, _("Bad RunAfter command: %s\n"), jcr->errmsg);
376       bnet_fsend(dir, "2905 Bad RunAfterJob command.\n");
377       free_memory(msg);
378       return 0;
379    }
380    unbash_spaces(msg);
381    if (jcr->RunAfterJob) {
382       free_pool_memory(jcr->RunAfterJob);
383    }
384    jcr->RunAfterJob = get_pool_memory(PM_FNAME);
385    pm_strcpy(&jcr->RunAfterJob, msg);
386    free_pool_memory(msg);
387    return bnet_fsend(dir, OKRunAfter);
388 }
389
390 static int run_cmd(JCR *jcr, char *cmd, char *name)
391 {
392    POOLMEM *ecmd = get_pool_memory(PM_FNAME);
393    int status;
394    BPIPE *bpipe;
395    char line[MAXSTRING];
396    
397    ecmd = edit_job_codes(jcr, ecmd, cmd, "");
398    bpipe = open_bpipe(ecmd, 0, "r");
399    free_pool_memory(ecmd);
400    while (fgets(line, sizeof(line), bpipe->rfd)) {
401       Jmsg(jcr, M_INFO, 0, _("%s: %s"), name, line);
402    }
403    status = close_bpipe(bpipe);
404    if (status != 0) {
405       Jmsg(jcr, M_FATAL, 0, _("%s returned non-zero status=%d\n"), name,
406          status);
407       set_jcr_job_status(jcr, JS_FatalError);
408       return 0;
409    }
410    return 1;
411 }
412
413
414 #define INC_LIST 0
415 #define EXC_LIST 1
416
417 static void add_fname_to_list(JCR *jcr, char *fname, int list)
418 {
419    char *p, *q;
420    BPIPE *bpipe;
421    POOLMEM *fn;
422    FILE *ffd;
423    char buf[1000];
424    int optlen;
425    int stat;
426
427    /* Skip leading options -- currently ignored */
428    for (p=fname; *p && *p != ' '; p++)
429       { }
430    /* Skip spaces, and q points to first space */
431    for (q=NULL; *p && *p == ' '; p++) {
432       if (!q) {
433          q = p;
434       }
435    }
436
437    switch (*p) {
438    case '|':
439       fn = get_pool_memory(PM_FNAME);
440       fn = edit_job_codes(jcr, fn, p, "");
441       bpipe = open_bpipe(fn, 0, "r");
442       free_pool_memory(fn);
443       if (!bpipe) {
444          Jmsg(jcr, M_FATAL, 0, _("Cannot run program: %s. ERR=%s\n"),
445             p, strerror(errno));
446          return;
447       }
448       /* Copy File options */
449       if (list == INC_LIST) {
450          *q = 0;                      /* terminate options */
451          strcpy(buf, fname);
452          strcat(buf, " ");
453          optlen = strlen(buf);
454       } else {
455          optlen = 0;
456       }
457       while (fgets(buf+optlen, sizeof(buf)-optlen, bpipe->rfd)) {
458          strip_trailing_junk(buf);
459          if (list == INC_LIST) {
460             add_fname_to_include_list((FF_PKT *)jcr->ff, 1, buf);
461          } else {
462             add_fname_to_exclude_list((FF_PKT *)jcr->ff, buf);
463          }
464       }
465       if ((stat=close_bpipe(bpipe)) != 0) {
466          Jmsg(jcr, M_FATAL, 0, _("Error running program: %s. RtnStat=%d ERR=%s\n"),
467             p, stat, strerror(errno));
468          return;
469       }
470       break;
471    case '<':
472       p++;                      /* skip over < */
473       if ((ffd = fopen(p, "r")) == NULL) {
474          Jmsg(jcr, M_FATAL, 0, _("Cannot open %s file: %s. ERR=%s\n"),
475             list==INC_LIST?"included":"excluded", p, strerror(errno));
476          return;
477       }
478       /* Copy File options */
479       if (list == INC_LIST) {
480          *q = 0;                      /* terminate options */
481          strcpy(buf, fname);
482          strcat(buf, " ");
483          optlen = strlen(buf);
484       } else {
485          optlen = 0;
486       }
487       while (fgets(buf+optlen, sizeof(buf)-optlen, ffd)) {
488          strip_trailing_junk(buf);
489          if (list == INC_LIST) {
490             add_fname_to_include_list((FF_PKT *)jcr->ff, 1, buf);
491          } else {
492             add_fname_to_exclude_list((FF_PKT *)jcr->ff, buf);
493          }
494       }
495       fclose(ffd);
496       break;
497    default:
498       if (list == INC_LIST) {
499          add_fname_to_include_list((FF_PKT *)jcr->ff, 1, fname);
500       } else {
501          add_fname_to_exclude_list((FF_PKT *)jcr->ff, p);
502       }
503       break;
504    }
505 }
506
507 /* 
508  * 
509  * Get list of files/directories to include from Director
510  *
511  */
512 static int include_cmd(JCR *jcr)
513 {
514    BSOCK *dir = jcr->dir_bsock;
515
516    while (bnet_recv(dir) >= 0) {
517       dir->msg[dir->msglen] = 0;
518       strip_trailing_junk(dir->msg);
519       Dmsg1(010, "include file: %s\n", dir->msg);
520       add_fname_to_list(jcr, dir->msg, INC_LIST);
521    }
522
523    return bnet_fsend(dir, OKinc);
524 }
525
526 /*
527  * Get list of files to exclude from Director
528  *
529  */
530 static int exclude_cmd(JCR *jcr)
531 {
532    BSOCK *dir = jcr->dir_bsock;
533
534    while (bnet_recv(dir) >= 0) {
535       dir->msg[dir->msglen] = 0;
536       strip_trailing_junk(dir->msg);
537       add_fname_to_list(jcr, dir->msg, EXC_LIST);
538       Dmsg1(110, "<dird: exclude file %s\n", dir->msg);
539    }
540
541    return bnet_fsend(dir, OKexc);
542 }
543
544
545 static int bootstrap_cmd(JCR *jcr)
546 {
547    BSOCK *dir = jcr->dir_bsock;
548    POOLMEM *fname = get_pool_memory(PM_FNAME);
549    FILE *bs;
550
551    if (jcr->RestoreBootstrap) {
552       unlink(jcr->RestoreBootstrap);
553       free_pool_memory(jcr->RestoreBootstrap);
554    }
555    Mmsg(&fname, "%s/%s.%s.bootstrap", me->working_directory, me->hdr.name,
556       jcr->Job);
557    Dmsg1(400, "bootstrap=%s\n", fname);
558    jcr->RestoreBootstrap = fname;
559    bs = fopen(fname, "a+");           /* create file */
560    if (!bs) {
561       /* 
562        * Suck up what he is sending to us so that he will then
563        *   read our error message.
564        */
565       while (bnet_recv(dir) >= 0)
566         {  }
567
568       Jmsg(jcr, M_FATAL, 0, _("Could not create bootstrap file %s: ERR=%s\n"),
569          jcr->RestoreBootstrap, strerror(errno));
570       free_pool_memory(jcr->RestoreBootstrap);
571       jcr->RestoreBootstrap = NULL;
572       set_jcr_job_status(jcr, JS_ErrorTerminated);
573       return 0;
574    }
575
576    while (bnet_recv(dir) >= 0) {
577        Dmsg1(200, "filed<dird: bootstrap file %s\n", dir->msg);
578        fputs(dir->msg, bs);
579    }
580    fclose(bs);
581
582    return bnet_fsend(dir, OKbootstrap);
583 }
584
585
586 /*
587  * Get backup level from Director
588  *
589  */
590 static int level_cmd(JCR *jcr)
591 {
592    BSOCK *dir = jcr->dir_bsock;
593    POOLMEM *level, *buf = NULL;
594    struct tm tm;
595    time_t mtime;
596    int mtime_only;
597
598    level = get_memory(dir->msglen+1);
599    Dmsg1(110, "level_cmd: %s", dir->msg);
600    if (sscanf(dir->msg, "level = %s ", level) != 1) {
601       goto bail_out;
602    }
603    /* Base backup requested? */
604    if (strcmp(level, "base") == 0) {
605       jcr->JobLevel = L_BASE;
606    /* Full backup requested? */ 
607    } else if (strcmp(level, "full") == 0) {
608       jcr->JobLevel = L_FULL;
609    /* 
610     * Backup requested since <date> <time>
611     *  This form is also used for incremental and differential
612     *  This code is deprecated.  See since_utime for new code.
613     */
614    } else if (strcmp(level, "since") == 0) {
615       jcr->JobLevel = L_SINCE;
616       if (sscanf(dir->msg, "level = since %d-%d-%d %d:%d:%d mtime_only=%d", 
617                  &tm.tm_year, &tm.tm_mon, &tm.tm_mday,
618                  &tm.tm_hour, &tm.tm_min, &tm.tm_sec, &mtime_only) != 7) {
619          goto bail_out;
620       }
621       tm.tm_year -= 1900;
622       tm.tm_mon  -= 1;
623       tm.tm_wday = tm.tm_yday = 0;              
624       tm.tm_isdst = -1;
625       mtime = mktime(&tm);
626       Dmsg2(100, "Got since time: %s mtime_only=%d\n", ctime(&mtime), mtime_only);
627       jcr->incremental = 1;           /* set incremental or decremental backup */
628       jcr->mtime = mtime;             /* set since time */
629       jcr->mtime_only = mtime_only;   /* and what to compare */
630    /*
631     * We get his UTC since time, then sync the clocks and correct it
632     *   to agree with our clock.
633     */
634    } else if (strcmp(level, "since_utime") == 0) {
635       buf = get_memory(dir->msglen+1);
636       utime_t since_time, adj;
637       btime_t his_time, bt_start, rt=0, bt_adj=0;
638       jcr->JobLevel = L_SINCE;
639       if (sscanf(dir->msg, "level = since_utime %s mtime_only=%d", 
640                  buf, &mtime_only) != 2) { 
641          goto bail_out;
642       }
643       since_time = str_to_uint64(buf);  /* this is the since time */
644       char ed1[50], ed2[50];
645       /* 
646        * Sync clocks by polling him for the time. We take        
647        *   10 samples of his time throwing out the first two.
648        */
649       for (int i=0; i<10; i++) {
650          bt_start = get_current_btime();
651          bnet_sig(dir, BNET_BTIME);   /* poll for time */
652          if (bnet_recv(dir) <= 0) {   /* get response */
653             goto bail_out;
654          }
655          if (sscanf(dir->msg, "btime %s", buf) != 1) {
656             goto bail_out;
657          }
658          if (i < 2) {                 /* toss first two results */
659             continue;
660          }
661          his_time = str_to_uint64(buf);
662          rt = get_current_btime() - bt_start; /* compute round trip time */
663          bt_adj -= his_time - bt_start - rt/2;
664          Dmsg2(100, "rt=%s adj=%s\n", edit_uint64(rt, ed1), edit_uint64(bt_adj, ed2));
665       }
666
667       bt_adj = bt_adj / 8;            /* compute average time */
668       Dmsg2(100, "rt=%s adj=%s\n", edit_uint64(rt, ed1), edit_uint64(bt_adj, ed2));
669       adj = btime_to_utime(bt_adj);
670       since_time += adj;              /* adjust for clock difference */
671       if (adj != 0) {
672          Jmsg(jcr, M_INFO, 0, _("Since time adjusted by %d seconds.\n"), adj);
673       }
674       bnet_sig(dir, BNET_EOD);
675
676       Dmsg2(100, "adj = %d since_time=%d\n", (int)adj, (int)since_time);
677       jcr->incremental = 1;           /* set incremental or decremental backup */
678       jcr->mtime = since_time;        /* set since time */
679       jcr->mtime_only = mtime_only;   /* and what to compare */
680    } else {
681       Jmsg1(jcr, M_FATAL, 0, "Unknown backup level: %s\n", level);
682       free_memory(level);
683       return 0;
684    }
685    free_memory(level);
686    if (buf) {
687       free_memory(buf);
688    }
689    return bnet_fsend(dir, OKlevel);
690
691 bail_out:
692    pm_strcpy(&jcr->errmsg, dir->msg);
693    Jmsg1(jcr, M_FATAL, 0, _("Bad level command: %s\n"), jcr->errmsg);
694    free_memory(level);
695    if (buf) {
696       free_memory(buf);
697    }
698    return 0;
699 }
700
701 /*
702  * Get session parameters from Director -- this is for a Restore command
703  */
704 static int session_cmd(JCR *jcr)
705 {
706    BSOCK *dir = jcr->dir_bsock;
707
708    Dmsg1(100, "SessionCmd: %s", dir->msg);
709    if (sscanf(dir->msg, sessioncmd, jcr->VolumeName,
710               &jcr->VolSessionId, &jcr->VolSessionTime,
711               &jcr->StartFile, &jcr->EndFile, 
712               &jcr->StartBlock, &jcr->EndBlock) != 7) {
713       pm_strcpy(&jcr->errmsg, dir->msg);
714       Jmsg(jcr, M_FATAL, 0, "Bad session command: %s", jcr->errmsg);
715       return 0;
716    }
717
718    return bnet_fsend(dir, OKsession);
719 }
720
721 /*
722  * Get address of storage daemon from Director
723  *
724  */
725 static int storage_cmd(JCR *jcr)
726 {
727    int stored_port;                /* storage daemon port */
728    int enable_ssl;                 /* enable ssl to sd */
729    BSOCK *dir = jcr->dir_bsock;
730    BSOCK *sd;                         /* storage daemon bsock */
731
732    Dmsg1(100, "StorageCmd: %s", dir->msg);
733    if (sscanf(dir->msg, storaddr, &jcr->stored_addr, &stored_port, &enable_ssl) != 3) {
734       pm_strcpy(&jcr->errmsg, dir->msg);
735       Jmsg(jcr, M_FATAL, 0, _("Bad storage command: %s"), jcr->errmsg);
736       return 0;
737    }
738    Dmsg3(110, "Open storage: %s:%d ssl=%d\n", jcr->stored_addr, stored_port, enable_ssl);
739    /* Open command communications with Storage daemon */
740    /* Try to connect for 1 hour at 10 second intervals */
741    sd = bnet_connect(jcr, 10, me->SDConnectTimeout, _("Storage daemon"), 
742                      jcr->stored_addr, NULL, stored_port, 1);
743    if (sd == NULL) {
744       Jmsg(jcr, M_FATAL, 0, _("Failed to connect to Storage daemon: %s:%d\n"),
745           jcr->stored_addr, stored_port);
746       return 0;
747    }
748
749    jcr->store_bsock = sd;
750
751    bnet_fsend(sd, "Hello Start Job %s\n", jcr->Job);
752    if (!authenticate_storagedaemon(jcr)) {
753       Jmsg(jcr, M_FATAL, 0, _("Failed to authenticate Storage daemon.\n"));
754       return 0;
755    }
756    Dmsg0(110, "Authenticated with SD.\n");
757
758    /* Send OK to Director */
759    return bnet_fsend(dir, OKstore);
760 }
761
762
763 /*  
764  * Do a backup. For now, we handle only Full and Incremental.
765  */
766 static int backup_cmd(JCR *jcr)
767
768    BSOCK *dir = jcr->dir_bsock;
769    BSOCK *sd = jcr->store_bsock;
770    int ok = 0;
771    int SDJobStatus;
772    char ed1[50], ed2[50];
773
774    set_jcr_job_status(jcr, JS_Blocked);
775    jcr->JobType = JT_BACKUP;
776    Dmsg1(100, "begin backup ff=%p\n", (FF_PKT *)jcr->ff);
777
778    if (sd == NULL) {
779       Jmsg(jcr, M_FATAL, 0, _("Cannot contact Storage daemon\n"));
780       goto cleanup;
781    }
782
783    bnet_fsend(dir, OKbackup);
784    Dmsg1(110, "bfiled>dird: %s", dir->msg);
785
786    /* 
787     * Send Append Open Session to Storage daemon
788     */
789    bnet_fsend(sd, append_open);
790    Dmsg1(110, ">stored: %s", sd->msg);
791    /* 
792     * Expect to receive back the Ticket number
793     */
794    if (bget_msg(sd) >= 0) {
795       Dmsg1(110, "<stored: %s", sd->msg);
796       if (sscanf(sd->msg, OK_open, &jcr->Ticket) != 1) {
797          Jmsg(jcr, M_FATAL, 0, _("Bad response to append open: %s\n"), sd->msg);
798          goto cleanup;
799       }
800       Dmsg1(110, "Got Ticket=%d\n", jcr->Ticket);
801    } else {
802       Jmsg(jcr, M_FATAL, 0, _("Bad response from stored to open command\n"));
803       goto cleanup;
804    }
805
806    /* 
807     * Send Append data command to Storage daemon
808     */
809    bnet_fsend(sd, append_data, jcr->Ticket);
810    Dmsg1(110, ">stored: %s", sd->msg);
811
812    /* 
813     * Expect to get OK data 
814     */
815    Dmsg1(110, "<stored: %s", sd->msg);
816    if (!response(jcr, sd, OK_data, "Append Data")) {
817       goto cleanup;
818    }
819       
820    /*
821     * Send Files to Storage daemon
822     */
823    Dmsg1(110, "begin blast ff=%p\n", (FF_PKT *)jcr->ff);
824    if (!blast_data_to_storage_daemon(jcr, NULL)) {
825       set_jcr_job_status(jcr, JS_ErrorTerminated);
826       bnet_suppress_error_messages(sd, 1);
827    } else {
828       set_jcr_job_status(jcr, JS_Terminated);
829       if (jcr->JobStatus != JS_Terminated) {
830          bnet_suppress_error_messages(sd, 1);
831          goto cleanup;                /* bail out now */
832       }
833       /* 
834        * Expect to get response to append_data from Storage daemon
835        */
836       if (!response(jcr, sd, OK_append, "Append Data")) {
837          set_jcr_job_status(jcr, JS_ErrorTerminated);
838          goto cleanup;
839       }
840      
841       /* 
842        * Send Append End Data to Storage daemon
843        */
844       bnet_fsend(sd, append_end, jcr->Ticket);
845       /* Get end OK */
846       if (!response(jcr, sd, OK_end, "Append End")) {
847          set_jcr_job_status(jcr, JS_ErrorTerminated);
848          goto cleanup;
849       }
850
851       /*
852        * Send Append Close to Storage daemon
853        */
854       bnet_fsend(sd, append_close, jcr->Ticket);
855       while (bget_msg(sd) >= 0) {    /* stop on signal or error */
856          if (sscanf(sd->msg, OK_close, &SDJobStatus) == 1) {
857             ok = 1;
858             Dmsg2(200, "SDJobStatus = %d %c\n", SDJobStatus, (char)SDJobStatus);
859          }
860       }
861       if (!ok) {
862          Jmsg(jcr, M_FATAL, 0, _("Append Close with SD failed.\n"));
863          goto cleanup;
864       }
865       if (SDJobStatus != JS_Terminated) {
866          Jmsg(jcr, M_FATAL, 0, _("Bad status %d returned from Storage Daemon.\n"),
867             SDJobStatus);
868       }
869    }
870
871 cleanup:
872
873    bnet_fsend(dir, EndJob, jcr->JobStatus, jcr->JobFiles, 
874       edit_uint64(jcr->ReadBytes, ed1), 
875       edit_uint64(jcr->JobBytes, ed2), jcr->Errors);    
876
877    return 0;                          /* return and stop command loop */
878 }
879
880 /*  
881  * Do a Verify for Director
882  *
883  */
884 static int verify_cmd(JCR *jcr)
885
886    BSOCK *dir = jcr->dir_bsock;
887    BSOCK *sd  = jcr->store_bsock;
888    char level[100], ed1[50], ed2[50];
889
890    jcr->JobType = JT_VERIFY;
891    if (sscanf(dir->msg, verifycmd, level) != 1) {
892       bnet_fsend(dir, "2994 Bad verify command: %s\n", dir->msg);
893       return 0;   
894    }
895    if (strcasecmp(level, "init") == 0) {
896       jcr->JobLevel = L_VERIFY_INIT;
897    } else if (strcasecmp(level, "catalog") == 0){
898       jcr->JobLevel = L_VERIFY_CATALOG;
899    } else if (strcasecmp(level, "volume") == 0){
900       jcr->JobLevel = L_VERIFY_VOLUME_TO_CATALOG;
901    } else if (strcasecmp(level, "data") == 0){
902       jcr->JobLevel = L_VERIFY_DATA;
903    } else if (strcasecmp(level, "disk_to_catalog") == 0) {
904       jcr->JobLevel = L_VERIFY_DISK_TO_CATALOG;
905    } else {   
906       bnet_fsend(dir, "2994 Bad verify level: %s\n", dir->msg);
907       return 0;   
908    }
909
910    bnet_fsend(dir, OKverify);
911    Dmsg1(110, "bfiled>dird: %s", dir->msg);
912
913    switch (jcr->JobLevel) {
914    case L_VERIFY_INIT:
915    case L_VERIFY_CATALOG:
916       do_verify(jcr);
917       break;
918    case L_VERIFY_VOLUME_TO_CATALOG:
919       if (!open_sd_read_session(jcr)) {
920          return 0;
921       }
922       start_dir_heartbeat(jcr);
923       do_verify_volume(jcr);
924       stop_dir_heartbeat(jcr);
925       /* 
926        * Send Close session command to Storage daemon
927        */
928       bnet_fsend(sd, read_close, jcr->Ticket);
929       Dmsg1(130, "bfiled>stored: %s", sd->msg);
930
931       /* ****FIXME**** check response */
932       bget_msg(sd);                      /* get OK */
933
934       /* Inform Storage daemon that we are done */
935       bnet_sig(sd, BNET_TERMINATE);
936
937       break;
938    case L_VERIFY_DISK_TO_CATALOG:
939       do_verify(jcr);
940       break;
941    default:
942       bnet_fsend(dir, "2994 Bad verify level: %s\n", dir->msg);
943       return 0; 
944    }
945
946    bnet_sig(dir, BNET_EOD);
947
948    /* Send termination status back to Dir */
949    bnet_fsend(dir, EndJob, jcr->JobStatus, jcr->JobFiles, 
950       edit_uint64(jcr->ReadBytes, ed1), 
951       edit_uint64(jcr->JobBytes, ed2), jcr->Errors);    
952
953    /* Inform Director that we are done */
954    bnet_sig(dir, BNET_TERMINATE);
955    return 0;                          /* return and terminate command loop */
956 }
957
958 /*  
959  * Do a Restore for Director
960  *
961  */
962 static int restore_cmd(JCR *jcr)
963
964    BSOCK *dir = jcr->dir_bsock;
965    BSOCK *sd = jcr->store_bsock;
966    POOLMEM *where;
967    int prefix_links;
968    char replace;
969    char ed1[50], ed2[50];
970
971    /*
972     * Scan WHERE (base directory for restore) from command
973     */
974    Dmsg0(150, "restore command\n");
975    /* Pickup where string */
976    where = get_memory(dir->msglen+1);
977    *where = 0;
978
979    if (sscanf(dir->msg, restorecmd, &replace, &prefix_links, where) != 3) {
980       if (sscanf(dir->msg, restorecmd1, &replace, &prefix_links) != 2) {
981          pm_strcpy(&jcr->errmsg, dir->msg);
982          Jmsg(jcr, M_FATAL, 0, _("Bad replace command. CMD=%s\n"), jcr->errmsg);
983          return 0;
984       }
985       *where = 0;
986    }
987    /* Turn / into nothing */
988    if (where[0] == '/' && where[1] == 0) {
989       where[0] = 0;
990    }
991       
992    Dmsg2(150, "Got replace %c, where=%s\n", replace, where);
993    unbash_spaces(where);
994    jcr->where = bstrdup(where);
995    free_pool_memory(where);
996    jcr->replace = replace;
997    jcr->prefix_links = prefix_links;
998
999    bnet_fsend(dir, OKrestore);
1000    Dmsg1(110, "bfiled>dird: %s", dir->msg);
1001
1002    jcr->JobType = JT_RESTORE;
1003
1004    set_jcr_job_status(jcr, JS_Blocked);
1005    if (!open_sd_read_session(jcr)) {
1006       set_jcr_job_status(jcr, JS_ErrorTerminated);
1007       goto bail_out;
1008    }
1009
1010    set_jcr_job_status(jcr, JS_Running);
1011
1012    /* 
1013     * Do restore of files and data
1014     */
1015    start_dir_heartbeat(jcr);
1016    do_restore(jcr);
1017    stop_dir_heartbeat(jcr);
1018    
1019    set_jcr_job_status(jcr, JS_Terminated);
1020    if (jcr->JobStatus != JS_Terminated) {
1021       bnet_suppress_error_messages(sd, 1);
1022    }
1023
1024    /* 
1025     * Send Close session command to Storage daemon
1026     */
1027    bnet_fsend(sd, read_close, jcr->Ticket);
1028    Dmsg1(130, "bfiled>stored: %s", sd->msg);
1029
1030    bget_msg(sd);                      /* get OK */
1031
1032    /* Inform Storage daemon that we are done */
1033    bnet_sig(sd, BNET_TERMINATE);
1034
1035 bail_out:
1036
1037    /* Send termination status back to Dir */
1038    bnet_fsend(dir, EndJob, jcr->JobStatus, jcr->JobFiles, 
1039       edit_uint64(jcr->ReadBytes, ed1), 
1040       edit_uint64(jcr->JobBytes, ed2), jcr->Errors);    
1041
1042    /* Inform Director that we are done */
1043    bnet_sig(dir, BNET_TERMINATE);
1044
1045    Dmsg0(130, "Done in job.c\n");
1046    return 0;                          /* return and terminate command loop */
1047 }
1048
1049 static int open_sd_read_session(JCR *jcr)
1050 {
1051    BSOCK *sd = jcr->store_bsock;
1052
1053    if (!sd) {
1054       Jmsg(jcr, M_FATAL, 0, _("Improper calling sequence.\n"));
1055       return 0;
1056    }
1057    Dmsg4(120, "VolSessId=%ld VolsessT=%ld SF=%ld EF=%ld\n",
1058       jcr->VolSessionId, jcr->VolSessionTime, jcr->StartFile, jcr->EndFile);
1059    Dmsg2(120, "JobId=%d vol=%s\n", jcr->JobId, "DummyVolume");
1060    /* 
1061     * Open Read Session with Storage daemon
1062     */
1063    bnet_fsend(sd, read_open, jcr->VolumeName,
1064       jcr->VolSessionId, jcr->VolSessionTime, jcr->StartFile, jcr->EndFile, 
1065       jcr->StartBlock, jcr->EndBlock);
1066    Dmsg1(110, ">stored: %s", sd->msg);
1067
1068    /* 
1069     * Get ticket number
1070     */
1071    if (bget_msg(sd) >= 0) {
1072       Dmsg1(110, "bfiled<stored: %s", sd->msg);
1073       if (sscanf(sd->msg, OK_open, &jcr->Ticket) != 1) {
1074          Jmsg(jcr, M_FATAL, 0, _("Bad response to SD read open: %s\n"), sd->msg);
1075          return 0;
1076       }
1077       Dmsg1(110, "bfiled: got Ticket=%d\n", jcr->Ticket);
1078    } else {
1079       Jmsg(jcr, M_FATAL, 0, _("Bad response from stored to read open command\n"));
1080       return 0;
1081    }
1082
1083    if (!send_bootstrap_file(jcr)) {
1084       return 0;
1085    }
1086
1087    /* 
1088     * Start read of data with Storage daemon
1089     */
1090    bnet_fsend(sd, read_data, jcr->Ticket);
1091    Dmsg1(110, ">stored: %s", sd->msg);
1092
1093    /* 
1094     * Get OK data
1095     */
1096    if (!response(jcr, sd, OK_data, "Read Data")) {
1097       return 0;
1098    }
1099    return 1;
1100 }
1101
1102 /* 
1103  * Destroy the Job Control Record and associated
1104  * resources (sockets).
1105  */
1106 static void filed_free_jcr(JCR *jcr) 
1107 {
1108    if (jcr->store_bsock) {
1109       bnet_close(jcr->store_bsock);
1110    }
1111    if (jcr->RestoreBootstrap) {
1112       unlink(jcr->RestoreBootstrap);
1113       free_pool_memory(jcr->RestoreBootstrap);
1114       jcr->RestoreBootstrap = NULL;
1115    }
1116    if (jcr->last_fname) {
1117       free_pool_memory(jcr->last_fname);
1118    }
1119    if (jcr->RunAfterJob) {
1120       free_pool_memory(jcr->RunAfterJob);
1121    }
1122    return;
1123 }
1124
1125 /*
1126  * Get response from Storage daemon to a command we
1127  * sent. Check that the response is OK.
1128  *
1129  *  Returns: 0 on failure
1130  *           1 on success
1131  */
1132 int response(JCR *jcr, BSOCK *sd, char *resp, char *cmd)
1133 {
1134    if (sd->errors) {
1135       return 0;
1136    }
1137    if (bget_msg(sd) > 0) {
1138       Dmsg0(110, sd->msg);
1139       if (strcmp(sd->msg, resp) == 0) {
1140          return 1;
1141       }
1142    } 
1143    if (job_canceled(jcr)) {
1144       return 0;                       /* if canceled avoid useless error messages */
1145    }
1146    if (is_bnet_error(sd)) {
1147       Jmsg2(jcr, M_FATAL, 0, _("Comm error with SD. bad response to %s. ERR=%s\n"),
1148          cmd, bnet_strerror(sd));
1149    } else {
1150       Jmsg3(jcr, M_FATAL, 0, _("Bad response to %s command. Wanted %s, got %s\n"),
1151          cmd, resp, sd->msg);
1152    }
1153    return 0;
1154 }
1155
1156 static int send_bootstrap_file(JCR *jcr)
1157 {
1158    FILE *bs;
1159    char buf[2000];
1160    BSOCK *sd = jcr->store_bsock;
1161    char *bootstrap = "bootstrap\n";
1162    int stat = 0;
1163
1164    Dmsg1(400, "send_bootstrap_file: %s\n", jcr->RestoreBootstrap);
1165    if (!jcr->RestoreBootstrap) {
1166       return 1;
1167    }
1168    bs = fopen(jcr->RestoreBootstrap, "r");
1169    if (!bs) {
1170       Jmsg(jcr, M_FATAL, 0, _("Could not open bootstrap file %s: ERR=%s\n"), 
1171          jcr->RestoreBootstrap, strerror(errno));
1172       set_jcr_job_status(jcr, JS_ErrorTerminated);
1173       goto bail_out;
1174    }
1175    pm_strcpy(&sd->msg, bootstrap);  
1176    sd->msglen = strlen(sd->msg);
1177    bnet_send(sd);
1178    while (fgets(buf, sizeof(buf), bs)) {
1179       sd->msglen = Mmsg(&sd->msg, "%s", buf);
1180       bnet_send(sd);       
1181    }
1182    bnet_sig(sd, BNET_EOD);
1183    fclose(bs);
1184    if (!response(jcr, sd, OKSDbootstrap, "Bootstrap")) {
1185       set_jcr_job_status(jcr, JS_ErrorTerminated);
1186       goto bail_out;
1187    }
1188    stat = 1;
1189
1190 bail_out:
1191    if (jcr->RestoreBootstrap) {
1192       unlink(jcr->RestoreBootstrap);
1193       free_pool_memory(jcr->RestoreBootstrap);
1194       jcr->RestoreBootstrap = NULL;
1195    }
1196
1197    return stat;
1198 }