]> git.sur5r.net Git - bacula/bacula/blobdiff - bacula/src/stored/block.c
Fix for reused thread ids by FreeBSD + qfill command
[bacula/bacula] / bacula / src / stored / block.c
index ce3c9234895559606989ca5c4ae3fe3fd0b68e41..a9dac5700909041bcf5b3bbaaf4c638f2a0fc906 100644 (file)
@@ -9,7 +9,7 @@
  *
  */
 /*
-   Copyright (C) 2000, 2001, 2002 Kern Sibbald and John Walker
+   Copyright (C) 2000-2003 Kern Sibbald and John Walker
 
    This program is free software; you can redistribute it and/or
    modify it under the terms of the GNU General Public License as
@@ -144,7 +144,8 @@ void empty_block(DEV_BLOCK *block)
    block->binbuf = WRITE_BLKHDR_LENGTH;
    block->bufp = block->buf + block->binbuf;
    block->read_len = 0;
-   block->failed_write = FALSE;
+   block->write_failed = false;
+   block->block_read = false;
 }
 
 /*
@@ -256,8 +257,8 @@ static int unser_block_header(DEVICE *dev, DEV_BLOCK *block)
       if (BlockCheckSum != CheckSum) {
          Dmsg2(00, "Block checksum mismatch: calc=%x blk=%x\n", BlockCheckSum,
            CheckSum);
-         Mmsg2(&dev->errmsg, _("Block checksum mismatch: calc=%x blk=%x\n"), BlockCheckSum,
-           CheckSum);
+         Mmsg3(&dev->errmsg, _("Block checksum mismatch in block %u: calc=%x blk=%x\n"), 
+           (unsigned)BlockNumber, BlockCheckSum, CheckSum);
         return 0;
       }
    }
@@ -290,7 +291,7 @@ int write_block_to_device(JCR *jcr, DEVICE *dev, DEV_BLOCK *block)
  */
 int write_block_to_dev(JCR *jcr, DEVICE *dev, DEV_BLOCK *block)
 {
-   size_t stat = 0;
+   ssize_t stat = 0;
    uint32_t wlen;                    /* length to write */
    int hit_max1, hit_max2;
    int ok;
@@ -304,6 +305,7 @@ int write_block_to_dev(JCR *jcr, DEVICE *dev, DEV_BLOCK *block)
    /* dump_block(block, "before write"); */
    if (dev->state & ST_WEOT) {
       Dmsg0(100, "return write_block_to_dev with ST_WEOT\n");
+      Jmsg(jcr, M_FATAL, 0,  _("Cannot write block. Device at EOM.\n"));
       return 0;
    }
    wlen = block->binbuf;
@@ -345,50 +347,67 @@ int write_block_to_dev(JCR *jcr, DEVICE *dev, DEV_BLOCK *block)
        ((dev->VolCatInfo.VolCatBytes + block->binbuf)) >= dev->VolCatInfo.VolCatMaxBytes;
    if (hit_max1 || hit_max2) {  
       char ed1[50];
-      dev->state |= ST_WEOT;
+      uint64_t max_cap;
       Dmsg0(10, "==== Output bytes Triggered medium max capacity.\n");
       if (hit_max1) {
-         Mmsg2(&dev->errmsg, _("Max. Volume capacity %s exceeded on device %s.\n"),
-           edit_uint64(dev->max_volume_size, ed1),  dev->dev_name);
+        max_cap = dev->max_volume_size;
       } else {
-         Mmsg2(&dev->errmsg, _("Max. Volume capacity %s exceeded on device %s.\n"),
-           edit_uint64(dev->VolCatInfo.VolCatMaxBytes, ed1),  dev->dev_name);
+        max_cap = dev->VolCatInfo.VolCatMaxBytes;
       }
-      block->failed_write = TRUE;
+      Jmsg(jcr, M_INFO, 0, _("User defined maximum volume capacity %s exceeded on device %s.\n"),
+           edit_uint64(max_cap, ed1),  dev->dev_name);
+      block->write_failed = true;
       dev->EndBlock = dev->block_num;
       dev->EndFile  = dev->file;
       weof_dev(dev, 1);              /* end the tape */
       weof_dev(dev, 1);              /* write second eof */
+      dev->state |= (ST_EOF | ST_EOT | ST_WEOT);
       return 0;
    }
 
+   /* Limit maximum File size on volume to user specified value */
+   if (dev->state & ST_TAPE) {
+      if ((dev->max_file_size > 0) && 
+         (dev->file_addr+block->binbuf) >= dev->max_file_size) {
+        if (weof_dev(dev, 1) != 0) {            /* write eof */
+            Jmsg(jcr, M_ERROR, 0, "%s", dev->errmsg);
+           /* Plunge on anyway -- if tape is bad we will die on write */
+        }
+      }
+   }
+
    dev->VolCatInfo.VolCatWrites++;
-   Dmsg1(500, "Write block of %u bytes\n", wlen);      
-   if ((uint32_t) (stat=write(dev->fd, block->buf, (size_t)wlen)) != wlen) {
+   Dmsg1(300, "Write block of %u bytes\n", wlen);      
+   if ((uint32_t)(stat=write(dev->fd, block->buf, (size_t)wlen)) != wlen) {
       /* We should check for errno == ENOSPC, BUT many 
-       * devices simply report EIO when it is full.
-       * with a little more thought we may be able to check
+       * devices simply report EIO when the volume is full.
+       * With a little more thought we may be able to check
        * capacity and distinguish real errors and EOT
        * conditions.  In any case, we probably want to
        * simulate an End of Medium.
        */
-      dev->state |= ST_EOF | ST_EOT | ST_WEOT;
-      clrerror_dev(dev, -1);
-
-      if (dev->dev_errno == 0) {
-        dev->dev_errno = ENOSPC;        /* out of space */
-      }
+      if (stat == -1) {
+        clrerror_dev(dev, -1);
+        if (dev->dev_errno == 0) {
+           dev->dev_errno = ENOSPC;        /* out of space */
+        }
+         Jmsg(jcr, M_ERROR, 0, _("Write error on device %s. ERR=%s.\n"), 
+           dev->dev_name, strerror(dev->dev_errno));
+      } else {
+       dev->dev_errno = ENOSPC;            /* out of space */
+         Jmsg3(jcr, M_INFO, 0, _("End of medium on device %s. Write of %u bytes got %d.\n"), 
+           dev->dev_name, wlen, stat);
+      }  
 
       Dmsg4(10, "=== Write error. size=%u rtn=%d  errno=%d: ERR=%s\n", 
         wlen, stat, dev->dev_errno, strerror(dev->dev_errno));
 
-      Mmsg4(&dev->errmsg, _("Write error on device %s. Write of %u bytes got %d. ERR=%s.\n"), 
-        dev->dev_name, wlen, stat, strerror(dev->dev_errno));
-      block->failed_write = TRUE;
+      block->write_failed = true;
       dev->EndBlock = dev->block_num;
       dev->EndFile  = dev->file;
       weof_dev(dev, 1);              /* end the tape */
       weof_dev(dev, 1);              /* write second eof */
+      dev->state |= (ST_EOF | ST_EOT | ST_WEOT);
        
       ok = TRUE;
 #define CHECK_LAST_BLOCK
@@ -399,7 +418,7 @@ int write_block_to_dev(JCR *jcr, DEVICE *dev, DEV_BLOCK *block)
        *   then re-read it and verify that the block number is
        *   correct.
        */
-      if (dev->state & ST_TAPE && dev->capabilities & CAP_BSR) {
+      if (dev->state & ST_TAPE && dev_cap(dev, CAP_BSR)) {
 
         /* Now back up over what we wrote and read the last block */
         if (bsf_dev(dev, 1) != 0 || bsf_dev(dev, 1) != 0) {
@@ -410,11 +429,20 @@ int write_block_to_dev(JCR *jcr, DEVICE *dev, DEV_BLOCK *block)
         if (ok && bsr_dev(dev, 1) != 0) {
            ok = FALSE;
             Jmsg(jcr, M_ERROR, 0, _("Back space record at EOT failed. ERR=%s\n"), strerror(dev->dev_errno));
+           /*
+            *  On FreeBSD systems, if the user got here, it is likely that his/her
+             *    tape drive is "frozen".  The correct thing to do is a 
+            *    rewind(), but if we do that, higher levels in cleaning up, will
+            *    most likely write the EOS record over the beginning of the
+            *    tape.  The rewind *is* done later in mount.c when another
+            *    tape is requested. Note, the clrerror_dev() call in bsr_dev()
+            *    calls ioctl(MTCERRSTAT), which *should* fix the problem.
+            */
         }
         if (ok) {
            DEV_BLOCK *lblock = new_block(dev);
            /* Note, this can destroy dev->errmsg */
-           if (!read_block_from_dev(dev, lblock)) {
+           if (!read_block_from_dev(jcr, dev, lblock, NO_BLOCK_NUMBER_CHECK)) {
                Jmsg(jcr, M_ERROR, 0, _("Re-read last block at EOT failed. ERR=%s"), dev->errmsg);
            } else {
               if (lblock->BlockNumber+1 == block->BlockNumber) {
@@ -436,16 +464,9 @@ int write_block_to_dev(JCR *jcr, DEVICE *dev, DEV_BLOCK *block)
    dev->file_addr += wlen;
    dev->EndBlock = dev->block_num;
    dev->EndFile  = dev->file;
-
-   /* Limit maximum File size on volume to user specified value */
-   if (dev->state & ST_TAPE) {
-      if ((dev->max_file_size > 0) && dev->file_addr >= dev->max_file_size) {
-        weof_dev(dev, 1);               /* write eof */
-      }
-   }
-
    dev->block_num++;
    block->BlockNumber++;
+
    Dmsg2(190, "write_block: wrote block %d bytes=%d\n", dev->block_num,
       wlen);
    empty_block(block);
@@ -456,12 +477,12 @@ int write_block_to_dev(JCR *jcr, DEVICE *dev, DEV_BLOCK *block)
  * Read block with locking
  *
  */
-int read_block_from_device(DEVICE *dev, DEV_BLOCK *block)
+int read_block_from_device(JCR *jcr, DEVICE *dev, DEV_BLOCK *block, bool check_block_numbers)
 {
    int stat;
    Dmsg0(90, "Enter read_block_from_device\n");
    lock_device(dev);
-   stat = read_block_from_dev(dev, block);
+   stat = read_block_from_dev(jcr, dev, block, check_block_numbers);
    unlock_device(dev);
    Dmsg0(90, "Leave read_block_from_device\n");
    return stat;
@@ -472,10 +493,12 @@ int read_block_from_device(DEVICE *dev, DEV_BLOCK *block)
  *  the block header.  For a file, the block may be partially
  *  or completely in the current buffer.
  */
-int read_block_from_dev(DEVICE *dev, DEV_BLOCK *block)
+int read_block_from_dev(JCR *jcr, DEVICE *dev, DEV_BLOCK *block, bool check_block_numbers)
 {
-   size_t stat;
+   ssize_t stat;
    int looping;
+   uint32_t BlockNumber;
+   int retry = 0;
 
    looping = 0;
    Dmsg1(100, "Full read() in read_block_from_device() len=%d\n",
@@ -484,27 +507,40 @@ reread:
    if (looping > 1) {
       Mmsg1(&dev->errmsg, _("Block buffer size looping problem on device %s\n"),
         dev->dev_name);
+      Jmsg(jcr, M_ERROR, 0, "%s", dev->errmsg);
       block->read_len = 0;
       return 0;
    }
-   if ((stat=read(dev->fd, block->buf, (size_t)block->buf_len)) < 0) {
+   do {
+      stat = read(dev->fd, block->buf, (size_t)block->buf_len);
+      if (retry == 1) {
+        dev->VolCatInfo.VolCatErrors++;   
+      }
+   } while (stat == -1 && (errno == EINTR || errno == EIO) && retry++ < 11);
+   if (stat < 0) {
       Dmsg1(90, "Read device got: ERR=%s\n", strerror(errno));
       clrerror_dev(dev, -1);
       block->read_len = 0;
       Mmsg2(&dev->errmsg, _("Read error on device %s. ERR=%s.\n"), 
         dev->dev_name, strerror(dev->dev_errno));
+      Jmsg(jcr, M_ERROR, 0, "%s", dev->errmsg);
+      if (dev->state & ST_EOF) {  /* EOF just seen? */
+        dev->state |= ST_EOT;    /* yes, error => EOT */
+      }
       return 0;
    }
    Dmsg1(90, "Read device got %d bytes\n", stat);
    if (stat == 0) {            /* Got EOF ! */
       dev->block_num = block->read_len = 0;
       Mmsg1(&dev->errmsg, _("Read zero bytes on device %s.\n"), dev->dev_name);
-      if (dev->state & ST_EOF) { /* EOF alread read? */
+      if (dev->state & ST_EOF) { /* EOF already read? */
         dev->state |= ST_EOT;  /* yes, 2 EOFs => EOT */
+        block->read_len = 0;
         return 0;
       }
       dev->file++;             /* increment file */
       dev->state |= ST_EOF;    /* set EOF read */
+      block->read_len = 0;
       return 0;                /* return eof */
    }
    /* Continue here for successful read */
@@ -512,12 +548,15 @@ reread:
    if (block->read_len < BLKHDR2_LENGTH) {
       Mmsg2(&dev->errmsg, _("Very short block of %d bytes on device %s discarded.\n"), 
         block->read_len, dev->dev_name);
+      Jmsg(jcr, M_ERROR, 0, "%s", dev->errmsg);
       dev->state |= ST_SHORT;  /* set short block */
       block->read_len = block->binbuf = 0;
       return 0;                /* return error */
    }  
 
+   BlockNumber = block->BlockNumber + 1;
    if (!unser_block_header(dev, block)) {
+      block->read_len = 0;
       return 0;
    }
 
@@ -529,24 +568,25 @@ reread:
    if (block->block_len > block->buf_len) {
       Mmsg2(&dev->errmsg,  _("Block length %u is greater than buffer %u. Attempting recovery.\n"),
         block->block_len, block->buf_len);
-      Emsg0(M_WARNING, 0, dev->errmsg);
-      Dmsg1(000, "%s", dev->errmsg);
+      Jmsg(jcr, M_ERROR, 0, "%s", dev->errmsg);
+      Pmsg1(000, "%s", dev->errmsg);
       /* Attempt to reposition to re-read the block */
       if (dev->state & ST_TAPE) {
-         Dmsg0(000, "Backspace record for reread.\n");
-        if (bsf_dev(dev, 1) != 0) {
-           Emsg0(M_ERROR, 0, dev->errmsg);
+         Dmsg0(100, "Backspace record for reread.\n");
+        if (bsr_dev(dev, 1) != 0) {
+            Jmsg(jcr, M_ERROR, 0, "%s", dev->errmsg);
+           block->read_len = 0;
            return 0;
         }
       } else {
-         Dmsg0(000, "Seek to beginning of block for reread.\n");
+         Dmsg0(100, "Seek to beginning of block for reread.\n");
         off_t pos = lseek(dev->fd, (off_t)0, SEEK_CUR); /* get curr pos */
         pos -= block->read_len;
         lseek(dev->fd, pos, SEEK_SET);   
       }
-      Mmsg1(&dev->errmsg, _("Resetting buffer size to %u bytes.\n"), block->block_len);
-      Emsg0(M_WARNING, 0, dev->errmsg);
-      Dmsg1(000, "%s", dev->errmsg);
+      Mmsg1(&dev->errmsg, _("Setting block buffer size to %u bytes.\n"), block->block_len);
+      Jmsg(jcr, M_INFO, 0, "%s", dev->errmsg);
+      Pmsg1(000, "%s", dev->errmsg);
       /* Set new block length */
       dev->max_block_size = block->block_len;
       block->buf_len = block->block_len;
@@ -560,6 +600,7 @@ reread:
    if (block->block_len > block->read_len) {
       Mmsg2(&dev->errmsg, _("Short block of %d bytes on device %s discarded.\n"), 
         block->read_len, dev->dev_name);
+      Jmsg(jcr, M_ERROR, 0, "%s", dev->errmsg);
       dev->state |= ST_SHORT;  /* set short block */
       block->read_len = block->binbuf = 0;
       return 0;                /* return error */
@@ -567,6 +608,8 @@ reread:
 
    dev->state &= ~(ST_EOF|ST_SHORT); /* clear EOF and short block */
    dev->block_num++;
+   dev->VolCatInfo.VolCatReads++;   
+   dev->VolCatInfo.VolCatRBytes += block->read_len;
 
    /*
     * If we read a short block on disk,
@@ -591,5 +634,6 @@ reread:
    }
    Dmsg2(200, "Exit read_block read_len=%d block_len=%d\n",
       block->read_len, block->block_len);
+   block->block_read = true;
    return 1;
 }