]> git.sur5r.net Git - bacula/bacula/blob - bacula/src/dird/msgchan.c
Update rescue disk to include mkinitrd
[bacula/bacula] / bacula / src / dird / msgchan.c
1 /*
2  *
3  *   Bacula Director -- msgchan.c -- handles the message channel
4  *    to the Storage daemon and the File daemon.
5  *
6  *     Kern Sibbald, August MM
7  *
8  *    This routine runs as a thread and must be thread reentrant.
9  *
10  *  Basic tasks done here:
11  *    Open a message channel with the Storage daemon
12  *      to authenticate ourself and to pass the JobId.
13  *    Create a thread to interact with the Storage daemon
14  *      who returns a job status and requests Catalog services, etc.
15  *
16  *   Version $Id$
17  */
18 /*
19    Copyright (C) 2000-2004 Kern Sibbald
20
21    This program is free software; you can redistribute it and/or
22    modify it under the terms of the GNU General Public License as
23    published by the Free Software Foundation; either version 2 of
24    the License, or (at your option) any later version.
25
26    This program is distributed in the hope that it will be useful,
27    but WITHOUT ANY WARRANTY; without even the implied warranty of
28    MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE. See the GNU
29    General Public License for more details.
30
31    You should have received a copy of the GNU General Public
32    License along with this program; if not, write to the Free
33    Software Foundation, Inc., 59 Temple Place - Suite 330, Boston,
34    MA 02111-1307, USA.
35
36  */
37
38 #include "bacula.h"
39 #include "dird.h"
40
41 /* Commands sent to Storage daemon */
42 static char jobcmd[]     = "JobId=%d job=%s job_name=%s client_name=%s \
43 type=%d level=%d FileSet=%s NoAttr=%d SpoolAttr=%d FileSetMD5=%s SpoolData=%d";
44 static char use_device[] = "use device=%s media_type=%s pool_name=%s pool_type=%s\n";
45
46 /* Response from Storage daemon */
47 static char OKjob[]      = "3000 OK Job SDid=%d SDtime=%d Authorization=%100s\n";
48 static char OK_device[]  = "3000 OK use device\n";
49
50 /* Storage Daemon requests */
51 static char Job_start[]  = "3010 Job %127s start\n";
52 static char Job_end[]    = 
53    "3099 Job %127s end JobStatus=%d JobFiles=%d JobBytes=%" lld "\n";
54 static char Job_status[] = "3012 Job %127s jobstatus %d\n";
55
56 /* Forward referenced functions */
57 extern "C" void *msg_thread(void *arg);
58
59 /*
60  * Establish a message channel connection with the Storage daemon
61  * and perform authentication. 
62  */
63 bool connect_to_storage_daemon(JCR *jcr, int retry_interval,    
64                               int max_retry_time, int verbose)
65 {
66    BSOCK *sd;
67    STORE *store = jcr->store;
68    if (!store) {
69       jcr->store = store = (STORE *)jcr->storage[0]->first();
70    }
71
72    /*
73     *  Open message channel with the Storage daemon   
74     */
75    Dmsg2(200, "bnet_connect to Storage daemon %s:%d\n", store->address,
76       store->SDport);
77    sd = bnet_connect(jcr, retry_interval, max_retry_time,
78           _("Storage daemon"), store->address, 
79           NULL, store->SDport, verbose);
80    if (sd == NULL) {
81       return false;
82    }
83    sd->res = (RES *)store;        /* save pointer to other end */
84    jcr->store_bsock = sd;
85
86    if (!authenticate_storage_daemon(jcr, store)) {
87       return false;
88    }
89    return true;
90 }
91
92 /*
93  * Start a job with the Storage daemon
94  */
95 int start_storage_daemon_job(JCR *jcr)
96 {
97    int status = 0;
98    STORE *storage;
99    BSOCK *sd;
100    char auth_key[100];
101    POOL_MEM device_name, pool_name, pool_type, media_type;
102    int i;
103
104    sd = jcr->store_bsock;
105    /*
106     * Now send JobId and permissions, and get back the authorization key.
107     */
108    bash_spaces(jcr->job->hdr.name);
109    bash_spaces(jcr->client->hdr.name);
110    bash_spaces(jcr->fileset->hdr.name);
111    if (jcr->fileset->MD5[0] == 0) {
112       strcpy(jcr->fileset->MD5, "**Dummy**");
113    }
114    bnet_fsend(sd, jobcmd, jcr->JobId, jcr->Job, jcr->job->hdr.name, 
115               jcr->client->hdr.name, jcr->JobType, jcr->JobLevel, 
116               jcr->fileset->hdr.name, !jcr->pool->catalog_files,
117               jcr->job->SpoolAttributes, jcr->fileset->MD5, jcr->spool_data);
118    Dmsg1(200, "Jobcmd=%s\n", sd->msg);
119    unbash_spaces(jcr->job->hdr.name);
120    unbash_spaces(jcr->client->hdr.name);
121    unbash_spaces(jcr->fileset->hdr.name);
122    if (bget_dirmsg(sd) > 0) {
123        Dmsg1(110, "<stored: %s", sd->msg);
124        if (sscanf(sd->msg, OKjob, &jcr->VolSessionId, 
125                   &jcr->VolSessionTime, &auth_key) != 3) {
126           Dmsg1(100, "BadJob=%s\n", sd->msg);
127           Jmsg(jcr, M_FATAL, 0, _("Storage daemon rejected Job command: %s\n"), sd->msg);
128           return 0;
129        } else {
130           jcr->sd_auth_key = bstrdup(auth_key);
131           Dmsg1(150, "sd_auth_key=%s\n", jcr->sd_auth_key);
132        }
133    } else {
134       Jmsg(jcr, M_FATAL, 0, _("<stored: bad response to Job command: %s\n"),
135          bnet_strerror(sd));
136       return 0;
137    }
138
139    /*
140     * Send use device = xxx media = yyy pool = zzz
141     */
142
143    for (i=0; i < MAX_STORE; i++) {
144       /* 
145        * if storage[0] == NULL, storage was manually overridden in
146        *   a Console run command.
147        */
148       if (jcr->storage[i]) {
149          storage = (STORE *)jcr->storage[i]->first();
150       } else {
151          if (i == 0) {
152             storage = jcr->store;
153          } else {
154             continue;
155          }
156       }
157       pm_strcpy(device_name, storage->dev_name);
158       pm_strcpy(media_type, storage->media_type);
159       pm_strcpy(pool_type, jcr->pool->pool_type);
160       pm_strcpy(pool_name, jcr->pool->hdr.name);
161       bash_spaces(device_name);
162       bash_spaces(media_type);
163       bash_spaces(pool_type);
164       bash_spaces(pool_name);
165       bnet_fsend(sd, use_device, device_name.c_str(), 
166                  media_type.c_str(), pool_name.c_str(), pool_type.c_str());
167       Dmsg1(110, ">stored: %s", sd->msg);
168       status = response(jcr, sd, OK_device, "Use Device", NO_DISPLAY);
169       if (!status) {
170          pm_strcpy(pool_type, sd->msg); /* save message */
171          Jmsg(jcr, M_FATAL, 0, _("\n"
172             "     Storage daemon didn't accept Device \"%s\" because:\n     %s"),
173             device_name.c_str(), pool_type.c_str()/* sd->msg */);
174       }
175    }
176    return status;
177 }
178
179 /* 
180  * Start a thread to handle Storage daemon messages and
181  *  Catalog requests.
182  */
183 int start_storage_daemon_message_thread(JCR *jcr)
184 {
185    int status;
186    pthread_t thid;
187
188    P(jcr->mutex);
189    jcr->use_count++;                  /* mark in use by msg thread */
190    jcr->sd_msg_thread_done = false;
191    jcr->SD_msg_chan = 0;
192    V(jcr->mutex);
193    Dmsg0(100, "Start SD msg_thread.\n");
194    if ((status=pthread_create(&thid, NULL, msg_thread, (void *)jcr)) != 0) {
195       Jmsg1(jcr, M_ABORT, 0, _("Cannot create message thread: %s\n"), strerror(status));
196    }         
197    Dmsg0(100, "SD msg_thread started.\n");
198    /* Wait for thread to start */
199    while (jcr->SD_msg_chan == 0) {
200       bmicrosleep(0, 50);
201    }  
202    return 1;
203 }
204
205 extern "C" void msg_thread_cleanup(void *arg)
206 {
207    JCR *jcr = (JCR *)arg;
208    Dmsg0(200, "End msg_thread\n");
209    db_end_transaction(jcr, jcr->db);       /* terminate any open transaction */
210    P(jcr->mutex);
211    jcr->sd_msg_thread_done = true;
212    pthread_cond_broadcast(&jcr->term_wait); /* wakeup any waiting threads */
213    jcr->SD_msg_chan = 0;
214    V(jcr->mutex);
215    free_jcr(jcr);                     /* release jcr */
216 }
217
218 /*
219  * Handle the message channel (i.e. requests from the
220  *  Storage daemon).
221  * Note, we are running in a separate thread.
222  */
223 extern "C"
224 void *msg_thread(void *arg)
225 {
226    JCR *jcr = (JCR *)arg;
227    BSOCK *sd;
228    int JobStatus;
229    char Job[MAX_NAME_LENGTH];
230    uint32_t JobFiles;
231    uint64_t JobBytes;
232    int stat;
233
234    pthread_detach(pthread_self());
235    jcr->SD_msg_chan = pthread_self();
236    pthread_cleanup_push(msg_thread_cleanup, arg);
237    sd = jcr->store_bsock;
238
239    /* Read the Storage daemon's output.
240     */
241    Dmsg0(100, "Start msg_thread loop\n");
242    while ((stat=bget_dirmsg(sd)) >= 0) {
243       Dmsg1(200, "<stored: %s", sd->msg);
244       if (sscanf(sd->msg, Job_start, &Job) == 1) {
245          continue;
246       }
247       if (sscanf(sd->msg, Job_end, &Job, &JobStatus, &JobFiles,
248                  &JobBytes) == 4) {
249          jcr->SDJobStatus = JobStatus; /* termination status */
250          jcr->SDJobFiles = JobFiles;
251          jcr->SDJobBytes = JobBytes;
252          break;
253       }     
254       if (sscanf(sd->msg, Job_status, &Job, &JobStatus) == 2) {
255          jcr->SDJobStatus = JobStatus; /* current status */
256          continue;
257       }
258    }
259    if (is_bnet_error(sd)) {                   
260       jcr->SDJobStatus = JS_ErrorTerminated;
261    }
262    pthread_cleanup_pop(1);
263    return NULL;
264 }
265
266 void wait_for_storage_daemon_termination(JCR *jcr)
267 {
268    int cancel_count = 0;
269    /* Now wait for Storage daemon to terminate our message thread */
270    set_jcr_job_status(jcr, JS_WaitSD);
271    P(jcr->mutex);
272    while (!jcr->sd_msg_thread_done) {
273       struct timeval tv;
274       struct timezone tz;
275       struct timespec timeout;
276
277       gettimeofday(&tv, &tz);
278       timeout.tv_nsec = 0;
279       timeout.tv_sec = tv.tv_sec + 10; /* wait 10 seconds */
280       Dmsg0(300, "I'm waiting for message thread termination.\n");
281       pthread_cond_timedwait(&jcr->term_wait, &jcr->mutex, &timeout);
282       if (job_canceled(jcr)) {
283          cancel_count++;
284       }
285       /* Give SD 30 seconds to clean up after cancel */
286       if (cancel_count == 3) {
287          break;
288       }
289    }
290    V(jcr->mutex);
291    set_jcr_job_status(jcr, JS_Terminated);
292 }