]> git.sur5r.net Git - bacula/bacula/blobdiff - bacula/kernstodo
- Correct typo in Copyright
[bacula/bacula] / bacula / kernstodo
index f1a4b364ccb9ba9889968049d9c206bbe7fd2ef7..b64e7e9d0217f4309c26a752fd8a8cc90ebca305 100644 (file)
@@ -1,12 +1,12 @@
                     Kern's ToDo List
-                     28 April 2005
+                     04 July 2005
 
 Major development:      
 Project                     Developer
 =======                     =========                         
 TLS                         Landon Fuller
-Unicode in Win32            Thorsten Engel
-VSS                         Thorsten Engel (under consideration)
+Unicode in Win32            Thorsten Engel (done)
+VSS                         Thorsten Engel (in beta testing)
 Version 1.37                Kern (see below)
 ========================================================
 
@@ -16,22 +16,49 @@ Version 1.37                Kern (see below)
 #7   Single Job Writing to Multiple Storage Devices
      (probably not this version)
 
-##   Integrate web-bacula into a new Bacula project with
-     bimagemgr.
-##   Consider moving docs to their own project.
-##   Move rescue to its own project.
 ##   Create a new GUI chapter explaining all the GUI programs.
 
 Autochangers:
-- 3. Prevent two drives requesting the same Volume in any given
-     autochanger, by checking if a Volume is mounted on another drive
-     in an Autochanger.
-- 7. Implement new Console commands to allow offlining/reserving drives,
-     and possibly manipulating the autochanger (much asked for).
 -    Make "update slots" when pointing to Autochanger, remove
      all Volumes from other drives.  "update slots all-drives"?
 
+For 1.37:
+- update volume=xxx --- add status=Full
+- After rename
+  04-Jul 13:01 MainSD: Rufus.2005-07-04_01.05.02 Warning: Director wanted Volume 
+     "DLT-13Feb04".
+  Current Volume "DLT-04Jul05" not acceptable because:
+  1997 Volume "DLT-13Feb04" not in catalog.
+  04-Jul 13:01 MainSD: Please mount Volume "DLT-04Jul05" on Storage Device 
+     "HP DLT 80" (/dev/nst0) for Job Rufus.2005-07-04_01.05.02
+- Remove old spool files on startup.
+- Exclude SD spool/working directory.
+- Finish TLS implementation.
+- Refuse to prune last valid Full backup. Same goes for Catalog.
+- --without-openssl breaks at least on Solaris.
+- Python:
+  - Make a callback when Rerun failed levels is called.
+  - Give Python program access to Scheduled jobs.
+  - Add setting Volume State via Python.
+  - Python script to save with Python, not save, save with Bacula.
+  - Python script to do backup.
+  - What events?
+  - Change the Priority, Client, Storage, JobStatus (error) 
+    at the start of a job.
+- Why is SpoolDirectory = /home/bacula/spool;  not reported
+  as an error when writing a DVD?
+- Make bootstrap file handle multiple MediaTypes (SD)
+- Remove all old Device resource code in Dir and code to pass it
+  back in SD -- better, rework it to pass back device statistics.
+- Check locking of resources -- be sure to lock devices where previously
+  resources were locked. 
+- The last part is left in the spool dir.
+
 Document:
+- Port limiting -m in iptables to prevent DoS attacks
+  could cause broken pipes on Bacula.
+- Document that Bootstrap files can be written with cataloging
+  turned off.
 - Pruning with Admin job.
 - Add better documentation on how restores can be done
 - OS linux 2.4
@@ -51,35 +78,32 @@ Document:
 - Document PostgreSQL performance problems bug 131.
 - Document testing
 - Document that ChangerDevice is used for Alert command.
-
-For 1.37:
-- --without-openssl breaks at least on Solaris.
-- Move test for max wait time exceeded in job.c up -- Peter's idea.
-- Python:
-  - Make a callback when Rerun failed levels is called.
-  - Give Python program access to Scheduled jobs.
-  - Python script to save with Python, not save, save with Bacula.
-  - Python script to do backup.
-  - What events?
-  - Change the Priority, Client, Storage, JobStatus (error) 
-    at the start of a job.
-  - Make sure that Python has access to Client address/port so that
-    it can check if Clients are alive.
-
-- Implement "NewVolumeEachJob = yes|no" in Dir.
-- Implement Maximum Job Spool Size
-- Remove all old Device resource code in Dir and code to pass it
-  back in SD -- better, rework it to pass back device statistics.
-- Check locking of resources -- be sure to lock devices where previously
-  resources were locked. 
-- Add global lock on all devices when creating a device structure.
-- Fix the Rescue CDROM.
+- Document new CDROM directory.
+- Document Heartbeat Interval in the dealing with firewalls section.
+- Document the multiple-drive-changer.txt script.
 
 Maybe in 1.37:
+- In restore don't compare byte count on a raw device -- directory
+  entry does not contain bytes.
 - To mark files as deleted, run essentially a Verify to disk, and
   when a file is found missing (MarkId != JobId), then create
   a new File record with FileIndex == -1. This could be done
   by the FD at the same time as the backup.
+=== rate design
+  jcr->last_rate
+  jcr->last_runtime
+  MA = (last_MA * 3 + rate) / 4
+  rate = (bytes - last_bytes) / (runtime - last_runtime)
+- Max Vols limit in Pool off by one?
+- Implement Files/Bytes,... stats for restore job.
+- Implement Total Bytes Written, ... for restore job.
+- Despool attributes simultaneously with data in a separate
+  thread, rejoined at end of data spooling.
+- 7. Implement new Console commands to allow offlining/reserving drives,
+     and possibly manipulating the autochanger (much asked for).
+- Add start/end date editing in messages (%t %T, %e?) ...
+- Add ClientDefs similar to JobDefs.
+- Print more info when bextract -p accepts a bad block.
 - Fix FD JobType to be set before RunBeforeJob in FD.
 - Look at adding full Volume and Pool information to a Volume 
   label so that bscan can get *all* the info. 
@@ -91,26 +115,12 @@ Maybe in 1.37:
 - Each file on tape creates a JobMedia record. Peter has 4 million
   files spread over 10000 tape files and four tapes. A restore takes
   16 hours to build the restore list.
-- By the way: on page http://www.bacula.org/?page=tapedrives , at the 
-  bottom, the link to "Tape Testing Chapter" is broken. It goes to 
-  /html-manual/... while the others point to /rel-manual/...
-- Device resource needs the "name" of the SD.
-- Add and option to see if the file size changed during backup.
+- Add and option to check if the file size changed during backup.
 - Make sure SD deletes spool files on error exit.
 - Delete old spool files when SD starts.
 - When labeling tapes, if you enter 000026, Bacula uses
   the tape index rather than the Volume name 000026.
-- Max Vols limit in Pool off by one?
-- Require restore via the restore command or make a restore Job
-  get the bootstrap file.
-- Make bootstrap file handle multiple MediaTypes (SD)
 - Add offline tape command to Bacula console.
-- Document that Bootstrap files can be written with cataloging
-  turned off.
-- Upgrade to MySQL 4.1.1 See:  
-  http://dev.mysql.com/doc/mysql/en/Server_SQL_mode.html
-- Add client version to the Client name line that prints in
-  the Job report.
 - Bug: 
   Enter MediaId or Volume name: 32
   Enter new Volume name: DLT-20Dec04
@@ -127,7 +137,46 @@ Maybe in 1.37:
 - Bug: if a job is manually scheduled to run later, it does not appear
   in any status report and cannot be cancelled.
 
-Regression tests (Scott):
+==== Keeping track of deleted files ====
+     My "trick" for keeping track of deletions is the following.
+     Assuming the user turns on this option, after all the files
+     have been backed up, but before the job has terminated, the
+     FD will make a pass through all the files and send their
+     names to the DIR (*exactly* the same as what a Verify job
+     currently does).  This will probably be done at the same
+     time the files are being sent to the SD avoiding a second
+     pass.  The DIR will then compare that to what is stored in
+     the catalog.  Any files in the catalog but not in what the
+     FD sent will receive a catalog File entry that indicates
+     that at that point in time the file was deleted.
+
+     During a restore, any file initially picked up by some
+     backup (Full, ...) then subsequently having a File entry
+     marked "delete" will be removed from the tree, so will not
+     be restored.  If a file with the same name is later OK it
+     will be inserted in the tree -- this already happens.  All
+     will be consistent except for possible changes during the
+     running of the FD.
+
+     Since I'm on the subject, some of you may be wondering what
+     the utility of the in memory tree is if you are going to
+     restore everything (at least it comes up from time to time
+     on the list).  Well, it is still *very* useful because it
+     allows only the last item found for a particular filename
+     (full path) to be entered into the tree, and thus if a file
+     is backed up 10 times, only the last copy will be restored.
+     I recently (last Friday) restored a complete directory, and
+     the Full and all the Differential and Incremental backups
+     spanned 3 Volumes.  The first Volume was not even mounted
+     because all the files had been updated and hence backed up
+     since the Full backup was made.  In this case, the tree
+     saved me a *lot* of time.
+
+     Make sure this information is stored on the tape too so
+     that it can be restored directly from the tape.
+=====
+
+Regression tests:
 - Add Pool/Storage override regression test.
 - Add delete JobId to regression.
 - Add a regression test for dbcheck.  
@@ -239,10 +288,21 @@ Why:
     format string. Then I have the tape labeled automatically with weekday
     name in the correct language.
 ==========
+-  Yes, that is surely the case. I probably should turn those into Warning
+   errors. In addition, you just made me think that it might not be bad to
+   add an option to check the file size after backing up the file and
+   report if it changes. This would be done as an option because it would
+   add extra overhead.
+   Kern, good idea.  If you do do that, mention in the output: file 
+   shrunk, or file expanded, just to make it obvious to the user 
+   (without having to the refer to file size), just how the file size 
+   changed.
+   Would this option be for all file, or just one file?  Or a fileset?
 - Make output from status use html table tags for nicely 
   presenting in a browser.
 - Can one write tapes faster with 8192 byte block sizes?
-- Specify a single directory to restore.
 - Document security problems with the same password for everyone in
   rpm and Win32 releases.
 - Browse generations of files.
@@ -275,10 +335,6 @@ Cap: 200GB
   savings time changes.
 - Add a "real" timer to network connections.
 - Promote to Full = Time period 
-- Despool attributes simultaneously with data in a separate
-  thread, rejoined at end of data spooling.
-- Implement Files/Bytes,... stats for restore job.
-- Implement Total Bytes Written, ... for restore job.
 - Check dates entered by user for correctness (month/day/... ranges)
 - Compress restore Volume listing by date and first file.
 - Look at patches/bacula_db.b2z postgresql that loops during restore.
@@ -320,7 +376,9 @@ Documentation to do: (any release a little bit at a time)
 
 
 ===================================
-  
+- Add macro expansions in JobDefs.
+  Run Before Job = "SomeFile %{Level} %{Client}"
+  Write Bootstrap="/some/dir/%{JobName}_%{Client}.bsr"
 - Use non-blocking network I/O but if no data is available, use
   select().
 - Use gather write() for network I/O.
@@ -358,11 +416,6 @@ Documentation to do: (any release a little bit at a time)
   perhaps if password is undefined.
 - Implement "from ISO-date/time every x hours/days/weeks/months" in
   schedules.
-=== rate design
-  jcr->last_rate
-  jcr->last_runtime
-  MA = (last_MA * 3 + rate) / 4
-  rate = (bytes - last_bytes) / (runtime - last_runtime)
 
 ==== from Marc Schoechlin
 - the help-command should be more verbose
@@ -438,12 +491,6 @@ Documentation to do: (any release a little bit at a time)
 - Investigate adding Mac Resource Forks.
 - Finish work on Gnome restore GUI.
 - Fix "llist jobid=xx" where no fileset or client exists.
-- From Chris Hull:
-   it seems to be complaining about 12:00pm which should be a valid 12
-   hour time.  I changed the time to 11:59am and everything works fine.
-   Also 12:00am works fine.  0:00pm also works (which I don't think
-   should).  None of the values 12:00pm - 12:59pm work for that matter.
-- Add level to estimate command.
 - For each job type (Admin, Restore, ...) require only the really necessary
   fields.- Pass Director resource name as an option to the Console.
 - Add a "batch" mode to the Console (no unsolicited queries, ...).
@@ -455,7 +502,6 @@ Documentation to do: (any release a little bit at a time)
   did not exist.
 - Use SHA1 on authentication if possible.
 - See comtest-xxx.zip for Windows code to talk to USB.
-- Add Events and Perl scripting.
 - Add John's appended files:
    Appended = {     /files/server/logs/http/*log   }
    and such files would be treated as follows.On a FULL backup, they would
@@ -468,9 +514,6 @@ Documentation to do: (any release a little bit at a time)
    creation date of files, we can be evensmarter about this and not count
    entirely upon the length.On a restore, the full and all incrementals
    since it will beapplied in sequence to restore the file.  
-- Allow for optional cancelling of SD and FD in case DIR
-  gets a fatal error. Requested by Jesse Guardiani <jesse@wingnet.net>
-- Add "limit=n" for "list jobs"
 - Check new HAVE_WIN32 open bits.    
 - Check if the tape has moved before writing.  
 - Handling removable disks -- see below:
@@ -493,7 +536,6 @@ Documentation to do: (any release a little bit at a time)
   and form it from VolFile and VolBlock.
 - Make multiple restore jobs for multiple media types specifying 
   the proper storage type.
-- Implement MediaType keyword in bsr?   
 - Fix fast block rejection (stored/read_record.c:118). It passes a null
   pointer (rec) to try_repositioning().
 - Look at extracting Win data from BackupRead.
@@ -564,11 +606,6 @@ Documentation to do: (any release a little bit at a time)
    support for Oracle database ??
 ===
 - Look at adding SQL server and Exchange support for Windows. 
-- Each DVD-RAM disk would be a volume, just like each tape is 
-  a volume. It's a 4.7GB media with random access, but there's nothing about 
-  it that I can see that makes it so different than a tape from bacula's 
-  perspective. Why couldn't I back up to a bare floppy as a volume (ignoring 
-  the media capacity?)
 - Make dev->file and dev->block_num signed integers so that -1 can
   be an invalid value which happens with BSR.
 - Create VolAddr for disk files in place of VolFile and VolBlock. This
@@ -576,8 +613,6 @@ Documentation to do: (any release a little bit at a time)
 - Add progress of files/bytes to SD and FD.
 - Print warning message if FileId > 4 billion
 - do a "messages" before the first prompt in Console
-- Add a date and time stamp at the beginning of every line in the 
-  Job report (Volker Sauer).
 - Client does not show busy during Estimate command.
 - Implement Console mtx commands.
 - Implement a Mount Command and an Unmount Command where
@@ -608,9 +643,6 @@ Documentation to do: (any release a little bit at a time)
   an officially adopted standard, has survived peer
   review, and provides keys up to 256 bits.
 - Take a careful look at SetACL http://setacl.sourceforge.net     
-- Take a careful look at Level for the estimate command, maybe make
-  it a command line option.
-- Add Volume name to "I cannot write on this volume because"
 - Make tree walk routines like cd, ls, ... more user friendly
   by handling spaces better.
 - Make sure that Bacula rechecks the tape after the 20 min wait.
@@ -627,7 +659,6 @@ Documentation to do: (any release a little bit at a time)
     in the "short" pool to the "long" pool if this pool runs out of volume 
     space?
 - What to do about "list files job=xxx".
-- Make Dmsg look at global before calling subroutine.
 - Get and test MySQL 4.0
 - Look at how fuser works and /proc/PID/fd that is how Nic found the
   file descriptor leak in Bacula.
@@ -637,8 +668,6 @@ Documentation to do: (any release a little bit at a time)
 - If pool specified to label command and Label Format is specified,
   automatically generate the Volume name.
 - Why can't SQL do the filename sort for restore?
-- Look into Microsoft Volume Shadowcopy Service VSS for backing
-  up system state components (Active Directory, System Volume, ...)
 - Add ExhautiveRestoreSearch
 - Look at the possibility of loading only the necessary 
   data into the restore tree (i.e. do it one directory at a
@@ -655,24 +684,14 @@ Documentation to do: (any release a little bit at a time)
   Windows.
 - Implement migrate
 - Use autochanger to handle multiple devices.
-- Add SuSE install doc to list.
-- Check and rechedk "Invalid block number"
-- User wants to NOT backup up certain big files (email files).
-- Maybe remove multiple simultaneous devices code in SD.
 - On Windows with very long path names, it may be impossible to create 
   a file (and thus restore it) because the total length is too long.
   We must cd into the directory then create the file without the
   full path name.
 - Implement a Recycle command
-- Add client name to cram-md5 challenge so Director can immediately
-  verify if it is the correct client.
-- Audit all UA commands to ensure that we always prompt where possible.
-- Make bootstrap filename unique.
 - Test a second language e.g. french.
 - Start working on Base jobs.
 - Implement UnsavedFiles DB record.
-- Implement argc/argv for daemon command line scanning using table driven
-  stuff below.
 - From Phil Stracchino:
   It would probably be a per-client option, and would be called
   something like, say, "Automatically purge obsoleted jobs".  What it
@@ -683,26 +702,17 @@ Documentation to do: (any release a little bit at a time)
   all Differential and Incremental jobs obsoleted by that Full backup.
   This would let people minimize the number of tapes they're keeping on
   hand without having to master the art of retention times.
-- Implement a M_SECURITY message class.
 - When doing a Backup send all attributes back to the Director, who
   would then figure out what files have been deleted.
 - Currently in mount.c:236 the SD simply creates a Volume. It should have
   explicit permission to do so.  It should also mark the tape in error
   if there is an error.
-- SD Bytes Read is wrong.
-- Investigate doing RAW backup of Win32 partition.
 - Cancel waiting for Client connect in SD if FD goes away.
 
 - Implement timeout in response() when it should come quickly.
-- Implement console @echo command.
 - Implement a Slot priority (loaded/not loaded).
 - Implement "vacation" Incremental only saves.
-- Implement single pane restore (much like the Gftp panes).
-- Implement Automatic Mount even in operator wait.
 - Implement create "FileSet"?
-- Implement restore "current system", but take all files without
-  doing selection tree -- so that jobs without File records can
-  be restored.
 - Add prefixlinks to where or not where absolute links to FD.
 - Issue message to mount a new tape before the rewind.
 - Simplified client job initiation for portables.
@@ -732,7 +742,6 @@ Documentation to do: (any release a little bit at a time)
 - Priority job to go to top of list.
 - Why are save/restore of device different sizes (sparse?)   Yup! Fix it.
 - Implement some way for the Console to dynamically create a job.
-- Restore to a particular time -- e.g. before date, after date. 
 - Solaris -I on tar for include list
 - Need a verbose mode in restore, perhaps to bsr.
 - bscan without -v is too quiet -- perhaps show jobs.
@@ -740,22 +749,15 @@ Documentation to do: (any release a little bit at a time)
 - Check if we can increase Bacula FD priorty in Win2000
 - Make sure the MaxVolFiles is fully implemented in SD
 - Check if both CatalogFiles and UseCatalog are set to SD.
-- Figure out how to do a bare metal Windows restore
 - Possibly add email to Watchdog if drive is unmounted too
   long and a job is waiting on the drive.
 - After unmount, if restore job started, ask to mount.
-- Convert all %x substitution variables, which are hard to remember
-  and read to %(variable-name).  Idea from TMDA.
-- Remove NextId for SQLite. Optimize.
-- Move all SQL statements into a single location.
 - Add UA rc and history files.
 - put termcap (used by console) in ./configure and
   allow -with-termcap-dir.
 - Fix Autoprune for Volumes to respect need for full save.
-- Fix Win32 config file definition name on /install
 - Compare tape to Client files (attributes, or attributes and data) 
 - Make all database Ids 64 bit.
-- Write an applet for Linux.
 - Allow console commands to detach or run in background.
 - Fix status delay on storage daemon during rewind.
 - Add SD message variables to control operator wait time
@@ -1063,28 +1065,6 @@ Need:
 =============================================================
 
 
-Done: (see kernsdone for more)
-
-=== after 1.32c
-- John's Full save failed with 1.32c FD and 1.31 Dir no FD status,
-  and no error message.
-- Add fd and st as Console keywords.
-- Recycling volume with a Slot requires an operator intervention:
-    rufus-dir: Start Backup JobId 18, Job=kernsave.2003-11-01_21.23.52
-    rufus-dir: Pruned 1 Job on Volume Vol01 from catalog.
-    rufus-dir: There are no Jobs associated with Volume Vol01. Marking it purged.
-    rufus-dir: Recycled volume "Vol01"
-    rufus-sd: Please mount Volume "Vol01" on Storage Device "DDS-4" for Job kernsave.2003-11-01_21.23.52
-    Use "mount" command to release Job.
-- Implement Dan's bacula script (email of 26 Oct).
-- Add JobName= to VerifyToCatalog so that all verifies can be done at the end.
-- Edit the Client/Storage name into authentication failure messages.
-- Fix packet too big problem. This is most likely a Windows TCP stack 
-  problem.
-- Implement ClientRunBeforeJob and ClientRunAfterJob.
-- Implement forward spacing block/file: position_device(bsr) --
-  just before read_block_from_device();
-
 =====
    Multiple drive autochanger data:  see Alan Brown
    mtx -f xxx unloadStorage Element 1 is Already Full(drive 0 was empty)
@@ -1323,3 +1303,46 @@ Block Position: 0
   then list last 20 backups.
 - Finish implementation of passing all Storage and Device needs to
   the SD.
+- Move test for max wait time exceeded in job.c up -- Peter's idea.
+##   Consider moving docs to their own project.
+##   Move rescue to its own project.
+- Add client version to the Client name line that prints in
+  the Job report.
+- Fix the Rescue CDROM.
+- By the way: on page http://www.bacula.org/?page=tapedrives , at the 
+  bottom, the link to "Tape Testing Chapter" is broken. It goes to 
+  /html-manual/... while the others point to /rel-manual/...
+- Device resource needs the "name" of the SD.
+- Specify a single directory to restore.
+- Implement MediaType keyword in bsr?   
+- Add a date and time stamp at the beginning of every line in the 
+  Job report (Volker Sauer).
+- Add level to estimate command.
+- Add "limit=n" for "list jobs"
+- Make bootstrap filename unique.
+- Make Dmsg look at global before calling subroutine.
+- From Chris Hull:
+   it seems to be complaining about 12:00pm which should be a valid 12
+   hour time.  I changed the time to 11:59am and everything works fine.
+   Also 12:00am works fine.  0:00pm also works (which I don't think
+   should).  None of the values 12:00pm - 12:59pm work for that matter.
+- Require restore via the restore command or make a restore Job
+  get the bootstrap file.
+- Implement Maximum Job Spool Size
+- Fix 3993 error in SD. It forgets to look at autochanger
+  resource for device command, ...
+- 3. Prevent two drives requesting the same Volume in any given
+     autochanger, by checking if a Volume is mounted on another drive
+     in an Autochanger.
+- Upgrade to MySQL 4.1.12 See:  
+  http://dev.mysql.com/doc/mysql/en/Server_SQL_mode.html
+- Add # Job Level date to bsr file
+- Implement "PreferMountedVolumes = yes|no" in Job resource.
+##   Integrate web-bacula into a new Bacula project with
+     bimagemgr.
+- Cleaning tapes should have Status "Cleaning" rather than append.
+- Make sure that Python has access to Client address/port so that
+  it can check if Clients are alive.
+- Review all items in "restore".
+- Fix PostgreSQL GROUP BY problems in restore.
+- Fix PostgreSQL sql problems in bugs.