]> git.sur5r.net Git - bacula/bacula/blob - bacula/src/dird/job.c
Basic Restore bootstrap implemented -- kes25Jun02
[bacula/bacula] / bacula / src / dird / job.c
1 /*
2  *
3  *   Bacula Director Job processing routines
4  *
5  *     Kern Sibbald, October MM
6  *
7  *    Version $Id$
8  */
9 /*
10    Copyright (C) 2000, 2001, 2002 Kern Sibbald and John Walker
11
12    This program is free software; you can redistribute it and/or
13    modify it under the terms of the GNU General Public License as
14    published by the Free Software Foundation; either version 2 of
15    the License, or (at your option) any later version.
16
17    This program is distributed in the hope that it will be useful,
18    but WITHOUT ANY WARRANTY; without even the implied warranty of
19    MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE. See the GNU
20    General Public License for more details.
21
22    You should have received a copy of the GNU General Public
23    License along with this program; if not, write to the Free
24    Software Foundation, Inc., 59 Temple Place - Suite 330, Boston,
25    MA 02111-1307, USA.
26
27  */
28
29 #include "bacula.h"
30 #include "dird.h"
31
32 /* Forward referenced subroutines */
33 static void job_thread(void *arg);
34
35 /* Exported subroutines */
36 void run_job(JCR *jcr);
37 void init_job_server(int max_workers);
38
39
40 /* Imported subroutines */
41 extern void term_scheduler();
42 extern void term_ua_server();
43 extern int do_backup(JCR *jcr);
44 extern int do_restore(JCR *jcr);
45 extern int do_verify(JCR *jcr);
46 extern void backup_cleanup(void);
47 extern void start_UA_server(int port);
48
49 /* Queue of jobs to be run */
50 static workq_t job_wq;                /* our job work queue */
51
52
53 void init_job_server(int max_workers)
54 {
55    int stat;
56
57    if ((stat = workq_init(&job_wq, max_workers, job_thread)) != 0) {
58       Emsg1(M_ABORT, 0, _("Could not init job work queue: ERR=%s\n"), strerror(stat));
59    }
60    return;
61 }
62
63 /*
64  * Run a job -- typically called by the scheduler, but may also
65  *              be called by the UA (Console program).
66  *
67  */
68 void run_job(JCR *jcr)
69 {
70    int stat, errstat;
71
72    init_msg(jcr, jcr->msgs);
73    create_unique_job_name(jcr, jcr->job->hdr.name);
74    jcr->jr.SchedTime = jcr->sched_time;
75    jcr->jr.StartTime = jcr->start_time;
76    jcr->jr.Type = jcr->JobType;
77    jcr->jr.Level = jcr->JobLevel;
78    strcpy(jcr->jr.Name, jcr->job->hdr.name);
79    strcpy(jcr->jr.Job, jcr->Job);
80
81    /* Initialize termination condition variable */
82    if ((errstat = pthread_cond_init(&jcr->term_wait, NULL)) != 0) {
83       Jmsg1(jcr, M_FATAL, 0, _("Unable to init job cond variable: ERR=%s\n"), strerror(errstat));
84       jcr->JobStatus = JS_ErrorTerminated;
85       free_jcr(jcr);
86       return;
87    }
88
89    /*
90     * Open database
91     */
92    Dmsg0(50, "Open database\n");
93    jcr->db=db_init_database(jcr->catalog->db_name, jcr->catalog->db_user,
94                             jcr->catalog->db_password);
95    if (!db_open_database(jcr->db)) {
96       Jmsg(jcr, M_FATAL, 0, "%s", db_strerror(jcr->db));
97       db_close_database(jcr->db);
98       jcr->JobStatus = JS_ErrorTerminated;
99       free_jcr(jcr);
100       return;
101    }
102    Dmsg0(50, "DB opened\n");
103
104
105    /*
106     * Create Job record  
107     */
108    jcr->jr.JobStatus = jcr->JobStatus;
109    if (!db_create_job_record(jcr->db, &jcr->jr)) {
110       Jmsg(jcr, M_FATAL, 0, "%s", db_strerror(jcr->db));
111       db_close_database(jcr->db);
112       jcr->JobStatus = JS_ErrorTerminated;
113       free_jcr(jcr);
114       return;
115    }
116    jcr->JobId = jcr->jr.JobId;
117    ASSERT(jcr->jr.JobId > 0);
118
119    Dmsg4(30, "Created job record JobId=%d Name=%s Type=%c Level=%c\n", 
120        jcr->JobId, jcr->Job, jcr->jr.Type, jcr->jr.Level);
121    Dmsg0(200, "Add jrc to work queue\n");
122
123
124    /* Queue the job to be run */
125    if ((stat = workq_add(&job_wq, (void *)jcr)) != 0) {
126       Emsg1(M_ABORT, 0, _("Could not add job to work queue: ERR=%s\n"), strerror(stat));
127    }
128    Dmsg0(200, "Done run_job()\n");
129 }
130
131 /* 
132  * This is the engine called by workq_add() when we were pulled                
133  *  from the work queue.
134  *  At this point, we are running in our own thread 
135  */
136 static void job_thread(void *arg)
137 {
138    time_t now;
139    JCR *jcr = (JCR *)arg;
140
141    time(&now);
142
143    Dmsg0(100, "=====Start Job=========\n");
144    jcr->start_time = now;             /* set the real start time */
145    if (jcr->job->MaxStartDelay != 0 && jcr->job->MaxStartDelay <
146        (btime_t)(jcr->start_time - jcr->sched_time)) {
147       Jmsg(jcr, M_FATAL, 0, _("Job cancelled because max delay time exceeded.\n"));
148       jcr->JobStatus = JS_ErrorTerminated;
149       update_job_end_record(jcr);
150    } else {
151
152       /* Run Job */
153       jcr->JobStatus = JS_Running;
154
155       switch (jcr->JobType) {
156          case JT_BACKUP:
157             do_backup(jcr);
158             if (jcr->JobStatus == JS_Terminated) {
159                do_autoprune(jcr);
160             }
161             break;
162          case JT_VERIFY:
163             do_verify(jcr);
164 //          do_autoprune(jcr);
165             break;
166          case JT_RESTORE:
167             do_restore(jcr);
168 //          do_autoprune(jcr);
169             break;
170          case JT_ADMIN:
171             /* No actual job */
172             do_autoprune(jcr);
173             break;
174          default:
175             Dmsg1(0, "Unimplemented job type: %d\n", jcr->JobType);
176             break;
177          }
178    }
179    Dmsg0(50, "Before free jcr\n");
180    free_jcr(jcr);
181    Dmsg0(50, "======== End Job ==========\n");
182 }
183
184 /*
185  * Get or create a Client record for this Job
186  */
187 int get_or_create_client_record(JCR *jcr)
188 {
189    CLIENT_DBR cr;
190
191    memset(&cr, 0, sizeof(cr));
192    strcpy(cr.Name, jcr->client->hdr.name);
193    cr.AutoPrune = jcr->client->AutoPrune;
194    cr.FileRetention = jcr->client->FileRetention;
195    cr.JobRetention = jcr->client->JobRetention;
196    if (jcr->client_name) {
197       free_pool_memory(jcr->client_name);
198    }
199    jcr->client_name = get_memory(strlen(jcr->client->hdr.name) + 1);
200    strcpy(jcr->client_name, jcr->client->hdr.name);
201    if (!db_create_client_record(jcr->db, &cr)) {
202       Jmsg(jcr, M_ERROR, 0, _("Could not create Client record. %s"), 
203          db_strerror(jcr->db));
204       return 0;
205    }
206    jcr->jr.ClientId = cr.ClientId;
207    Dmsg2(9, "Created Client %s record %d\n", jcr->client->hdr.name, 
208       jcr->jr.ClientId);
209    return 1;
210 }
211
212
213 /*
214  * Write status and such in DB
215  */
216 void update_job_end_record(JCR *jcr)
217 {
218    if (jcr->jr.EndTime == 0) {
219       jcr->jr.EndTime = time(NULL);
220    }
221    jcr->end_time = jcr->jr.EndTime;
222    jcr->jr.JobId = jcr->JobId;
223    jcr->jr.JobStatus = jcr->JobStatus;
224    jcr->jr.JobFiles = jcr->JobFiles;
225    jcr->jr.JobBytes = jcr->JobBytes;
226    jcr->jr.VolSessionId = jcr->VolSessionId;
227    jcr->jr.VolSessionTime = jcr->VolSessionTime;
228    if (!db_update_job_end_record(jcr->db, &jcr->jr)) {
229       Jmsg(jcr, M_WARNING, 0, _("Error updating job record. %s"), 
230          db_strerror(jcr->db));
231    }
232 }
233
234 /*
235  * Takes base_name and appends (unique) current
236  *   date and time to form unique job name.
237  *
238  *  Returns: unique job name in jcr->Job
239  *    date/time in jcr->start_time
240  */
241 void create_unique_job_name(JCR *jcr, char *base_name)
242 {
243    /* Job start mutex */
244    static pthread_mutex_t mutex = PTHREAD_MUTEX_INITIALIZER;
245    static time_t last_start_time = 0;
246    time_t now;
247    struct tm tm;
248    char dt[MAX_TIME_LENGTH];
249    char name[MAX_NAME_LENGTH];
250    char *p;
251
252    /* Guarantee unique start time -- maximum one per second, and
253     * thus unique Job Name 
254     */
255    P(mutex);                          /* lock creation of jobs */
256    time(&now);
257    while (now == last_start_time) {
258       sleep(1);
259       time(&now);
260    }
261    last_start_time = now;
262    V(mutex);                          /* allow creation of jobs */
263    jcr->start_time = now;
264    /* Form Unique JobName */
265    localtime_r(&now, &tm);
266    strftime(dt, sizeof(dt), "%Y-%m-%d.%H:%M:%S", &tm); 
267    strncpy(name, base_name, sizeof(name));
268    name[sizeof(name)-22] = 0;          /* truncate if too long */
269    sprintf(jcr->Job, "%s.%s", name, dt); /* add date & time */
270    /* Convert spaces into underscores */
271    for (p=jcr->Job; *p; p++) {
272       if (*p == ' ') {
273          *p = '_';
274       }
275    }
276 }
277
278 /*
279  * Free the Job Control Record if no one is still using it.
280  *  Called from main free_jcr() routine in src/lib/jcr.c so
281  *  that we can do our Director specific cleanup of the jcr.
282  */
283 void dird_free_jcr(JCR *jcr)
284 {
285    Dmsg0(200, "Start dird free_jcr\n");
286
287    if (jcr->file_bsock) {
288       Dmsg0(200, "Close File bsock\n");
289       bnet_close(jcr->file_bsock);
290    }
291    if (jcr->store_bsock) {
292       Dmsg0(200, "Close Store bsock\n");
293       bnet_close(jcr->store_bsock);
294    }
295    if (jcr->fname) {  
296       Dmsg0(200, "Free JCR fname\n");
297       free_pool_memory(jcr->fname);
298    }
299    if (jcr->stime) {
300       Dmsg0(200, "Free JCR stime\n");
301       free_pool_memory(jcr->stime);
302    }
303    if (jcr->db) {
304       Dmsg0(200, "Close DB\n");
305       db_close_database(jcr->db);
306    }
307    if (jcr->RestoreWhere) {
308       free(jcr->RestoreWhere);
309    }
310    if (jcr->RestoreBootstrap) {
311       free(jcr->RestoreBootstrap);
312    }
313    Dmsg0(200, "End dird free_jcr\n");
314 }
315
316 /*
317  * Set some defaults in the JCR necessary to
318  * run. These items are pulled from the job
319  * definition as defaults, but can be overridden
320  * later either by the Run record in the Schedule resource,
321  * or by the Console program.
322  */
323 void set_jcr_defaults(JCR *jcr, JOB *job)
324 {
325    jcr->job = job;
326    jcr->JobType = job->JobType;
327    jcr->JobLevel = job->level;
328    jcr->store = job->storage;
329    jcr->client = job->client;
330    if (jcr->client_name) {
331       free_pool_memory(jcr->client_name);
332    }
333    jcr->client_name = get_memory(strlen(jcr->client->hdr.name) + 1);
334    strcpy(jcr->client_name, jcr->client->hdr.name);
335    jcr->pool = job->pool;
336    jcr->catalog = job->client->catalog;
337    jcr->fileset = job->fs;
338    jcr->msgs = job->messages; 
339    if (jcr->RestoreBootstrap) {
340       free(jcr->RestoreBootstrap);
341    }
342    /* This can be overridden by Console program */
343    if (job->RestoreBootstrap) {
344       jcr->RestoreBootstrap = bstrdup(job->RestoreBootstrap);
345    }
346    /* If no default level given, set one */
347    if (jcr->JobLevel == 0) {
348       switch (jcr->JobType) {
349       case JT_VERIFY:
350          jcr->JobLevel = L_VERIFY_CATALOG;
351          break;
352       case JT_BACKUP:
353          jcr->JobLevel = L_INCREMENTAL;
354          break;
355       default:
356          break;
357       }
358    }
359 }