]> git.sur5r.net Git - bacula/bacula/blobdiff - bacula/src/lib/htable.c
Added support to htable for giving a hint on the number of pages to allocate for...
[bacula/bacula] / bacula / src / lib / htable.c
index 850a721060ed523416991a5af9783a74cb65a9ca..66f5040cb7a5041c03bd79c3c325aac1ccf428db 100644 (file)
@@ -1,12 +1,12 @@
 /*
    Bacula® - The Network Backup Solution
 
-   Copyright (C) 2003-2010 Free Software Foundation Europe e.V.
+   Copyright (C) 2003-2011 Free Software Foundation Europe e.V.
 
    The main author of Bacula is Kern Sibbald, with contributions from
    many others, a complete list can be found in the file AUTHORS.
    This program is Free Software; you can redistribute it and/or
-   modify it under the terms of version two of the GNU General Public
+   modify it under the terms of version three of the GNU Affero General Public
    License as published by the Free Software Foundation and included
    in the file LICENSE.
 
@@ -15,7 +15,7 @@
    MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE. See the GNU
    General Public License for more details.
 
-   You should have received a copy of the GNU General Public License
+   You should have received a copy of the GNU Affero General Public License
    along with this program; if not, write to the Free Software
    Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA
    02110-1301, USA.
 
 #include "bacula.h"
 
-#include "htable.h"
+#define PAGE_SIZE 4096
+#define MIN_PAGES 32
+#define MAX_PAGES 2400
+#define MIN_BUF_SIZE (MIN_PAGES * PAGE_SIZE) /* 128 Kb */
+#define MAX_BUF_SIZE (MAX_PAGES * PAGE_SIZE) /* approx 10MB */
 
 static const int dbglvl = 500;
 
@@ -58,7 +62,6 @@ static const int dbglvl = 500;
  *    htable
  */
 
-#ifdef BIG_MALLOC
 /*
  * This subroutine gets a big buffer.
  */
@@ -89,41 +92,31 @@ void htable::hash_big_free()
    }
 }
 
-#endif
-
 /*
  * Normal hash malloc routine that gets a 
  *  "small" buffer from the big buffer
  */
 char *htable::hash_malloc(int size)
 {
-#ifdef BIG_MALLOC
+   int mb_size;
    char *buf;
    int asize = BALIGN(size);
 
    if (mem_block->rem < asize) {
-      uint32_t mb_size;
-      if (total_size >= 1000000) {
-         mb_size = 1000000;
+      if (total_size >= (extend_length / 2)) {
+         mb_size = extend_length;
       } else {
-         mb_size = 100000;
+         mb_size = extend_length / 2;
       }
       malloc_big_buf(mb_size);
+      Dmsg1(100, "Created new big buffer of %ld bytes\n", mb_size);
    }
    mem_block->rem -= asize;
    buf = mem_block->mem;
    mem_block->mem += asize;
    return buf;
-#else 
-   total_size += size;
-   blocks++;
-   return (char *)malloc(size);
-#endif
 }
 
-
-
 /*
  * Create hash of key, stored in hash then
  *  create and return the pseudo random bucket index
@@ -132,25 +125,42 @@ void htable::hash_index(char *key)
 {
    hash = 0;
    for (char *p=key; *p; p++) {
-//    hash += (hash << 3) + (uint32_t)*p;
       hash +=  ((hash << 5) | (hash >> (sizeof(hash)*8-5))) + (uint32_t)*p;
    }
    /* Multiply by large prime number, take top bits, mask for remainder */
    index = ((hash * 1103515249) >> rshift) & mask;
-   Dmsg2(dbglvl, "Leave hash_index hash=0x%x index=%d\n", hash, index);
+   Dmsg2(dbglvl, "Leave hash_index hash=0x%llx index=%d\n", hash, index);
+}
+
+void htable::hash_index(uint32_t key)
+{
+   hash = key;
+   /* Multiply by large prime number, take top bits, mask for remainder */
+   index = ((hash * 1103515249) >> rshift) & mask;
+   Dmsg2(dbglvl, "Leave hash_index hash=0x%llx index=%d\n", hash, index);
+}
+
+void htable::hash_index(uint64_t key)
+{
+   hash = key;
+   /* Multiply by large prime number, take top bits, mask for remainder */
+   index = ((hash * 1103515249) >> rshift) & mask;
+   Dmsg2(dbglvl, "Leave hash_index hash=0x%llx index=%d\n", hash, index);
 }
 
 /*
  * tsize is the estimated number of entries in the hash table
  */
-htable::htable(void *item, void *link, int tsize)
+htable::htable(void *item, void *link, int tsize, int nr_pages)
 {
-   init(item, link, tsize);
+   init(item, link, tsize, nr_pages);
 }
 
-void htable::init(void *item, void *link, int tsize)
+void htable::init(void *item, void *link, int tsize, int nr_pages)
 {
    int pwr;
+   int pagesize;
+   int buffer_size;
 
    memset(this, 0, sizeof(htable));
    if (tsize < 31) {
@@ -161,15 +171,31 @@ void htable::init(void *item, void *link, int tsize)
       tsize >>= 1;
    }
    loffset = (char *)link - (char *)item;
-   mask = ~((~0)<<pwr);               /* 3 bits => table size = 8 */
+   mask = ~((~0) << pwr);             /* 3 bits => table size = 8 */
    rshift = 30 - pwr;                 /* start using bits 28, 29, 30 */
-   buckets = 1<<pwr;                  /* hash table size -- power of two */
+   buckets = 1 << pwr;                /* hash table size -- power of two */
    max_items = buckets * 4;           /* allow average 4 entries per chain */
    table = (hlink **)malloc(buckets * sizeof(hlink *));
    memset(table, 0, buckets * sizeof(hlink *));
-#ifdef BIG_MALLOC
-   malloc_big_buf(1000000);   /* ***FIXME*** need variable or some estimate */
+
+#ifdef HAVE_GETPAGESIZE
+   pagesize = getpagesize();
+#else
+   pagesize = PAGE_SIZE;
 #endif
+   if (nr_pages == 0) {
+      buffer_size = MAX_BUF_SIZE;
+   } else {
+      buffer_size = pagesize * nr_pages;
+      if (buffer_size > MAX_BUF_SIZE) {
+         buffer_size = MAX_BUF_SIZE;
+      } else if (buffer_size < MIN_BUF_SIZE) {
+         buffer_size = MIN_BUF_SIZE;
+      }
+   }
+   malloc_big_buf(buffer_size);
+   extend_length = buffer_size;
+   Dmsg1(100, "Allocated big buffer of %ld bytes\n", buffer_size);
 }
 
 uint32_t htable::size()
@@ -216,17 +242,19 @@ void htable::stats()
    }
    printf("buckets=%d num_items=%d max_items=%d\n", buckets, num_items, max_items);
    printf("max hits in a bucket = %d\n", max);
-#ifdef BIG_MALLOC
-   printf("total bytes malloced = %d\n", total_size);
+   printf("total bytes malloced = %lld\n", (long long int)total_size);
    printf("total blocks malloced = %d\n", blocks);
-#endif
 }
 
 void htable::grow_table()
 {
+   htable *big;
+   hlink *cur;
+   void *ni;
+
    Dmsg1(100, "Grow called old size = %d\n", buckets);
    /* Setup a bigger table */
-   htable *big = (htable *)malloc(sizeof(htable));
+   big = (htable *)malloc(sizeof(htable));
    memcpy(big, this, sizeof(htable));  /* start with original class data */
    big->loffset = loffset;
    big->mask = mask<<1 | 1;
@@ -249,9 +277,22 @@ void htable::grow_table()
     * to the next bucket.
     */
    for (void *item=first(); item; ) {
-      void *ni = ((hlink *)((char *)item+loffset))->next;  /* save link overwritten by insert */
-      Dmsg1(100, "Grow insert: %s\n", ((hlink *)((char *)item+loffset))->key);
-      big->insert(((hlink *)((char *)item+loffset))->key, item);
+      cur = (hlink *)((char *)item+loffset);
+      ni = cur->next; /* save link overwritten by insert */
+      switch (cur->key_type) {
+      case KEY_TYPE_CHAR:
+         Dmsg1(100, "Grow insert: %s\n", cur->key.char_key);
+         big->insert(cur->key.char_key, item);
+         break;
+      case KEY_TYPE_UINT32:
+         Dmsg1(100, "Grow insert: %ld\n", cur->key.uint32_key);
+         big->insert(cur->key.uint32_key, item);
+         break;
+      case KEY_TYPE_UINT64:
+         Dmsg1(100, "Grow insert: %ld\n", cur->key.uint64_key);
+         big->insert(cur->key.uint64_key, item);
+         break;
+      }
       if (ni) {
          item = (void *)((char *)ni-loffset);
       } else {
@@ -272,6 +313,7 @@ void htable::grow_table()
 bool htable::insert(char *key, void *item)
 {
    hlink *hp;
+
    if (lookup(key)) {
       return false;                   /* already exists */
    }
@@ -282,10 +324,11 @@ bool htable::insert(char *key, void *item)
       index, item, loffset);
    hp->next = table[index];
    hp->hash = hash;
-   hp->key = key;
+   hp->key_type = KEY_TYPE_CHAR;
+   hp->key.char_key = key;
    table[index] = hp;
-   Dmsg3(dbglvl, "Insert hp->next=%p hp->hash=0x%x hp->key=%s\n",
-      hp->next, hp->hash, hp->key);
+   Dmsg3(dbglvl, "Insert hp->next=%p hp->hash=0x%llx hp->key=%s\n",
+      hp->next, hp->hash, hp->key.char_key);
 
    if (++num_items >= max_items) {
       Dmsg2(dbglvl, "num_items=%d max_items=%d\n", num_items, max_items);
@@ -295,12 +338,95 @@ bool htable::insert(char *key, void *item)
    return true;
 }
 
+bool htable::insert(uint32_t key, void *item)
+{
+   hlink *hp;
+
+   if (lookup(key)) {
+      return false;                   /* already exists */
+   }
+   ASSERT(index < buckets);
+   Dmsg2(dbglvl, "Insert: hash=%p index=%d\n", hash, index);
+   hp = (hlink *)(((char *)item)+loffset);
+   Dmsg4(dbglvl, "Insert hp=%p index=%d item=%p offset=%u\n", hp,
+      index, item, loffset);
+   hp->next = table[index];
+   hp->hash = hash;
+   hp->key_type = KEY_TYPE_UINT32;
+   hp->key.uint32_key = key;
+   table[index] = hp;
+   Dmsg3(dbglvl, "Insert hp->next=%p hp->hash=0x%llx hp->key=%d\n",
+      hp->next, hp->hash, hp->key.uint32_key);
+
+   if (++num_items >= max_items) {
+      Dmsg2(dbglvl, "num_items=%d max_items=%d\n", num_items, max_items);
+      grow_table();
+   }
+   Dmsg3(dbglvl, "Leave insert index=%d num_items=%d key=%d\n", index, num_items, key);
+   return true;
+}
+
+bool htable::insert(uint64_t key, void *item)
+{
+   hlink *hp;
+
+   if (lookup(key)) {
+      return false;                   /* already exists */
+   }
+   ASSERT(index < buckets);
+   Dmsg2(dbglvl, "Insert: hash=%p index=%d\n", hash, index);
+   hp = (hlink *)(((char *)item)+loffset);
+   Dmsg4(dbglvl, "Insert hp=%p index=%d item=%p offset=%u\n", hp,
+      index, item, loffset);
+   hp->next = table[index];
+   hp->hash = hash;
+   hp->key_type = KEY_TYPE_UINT64;
+   hp->key.uint64_key = key;
+   table[index] = hp;
+   Dmsg3(dbglvl, "Insert hp->next=%p hp->hash=0x%llx hp->key=%ld\n",
+      hp->next, hp->hash, hp->key.uint64_key);
+
+   if (++num_items >= max_items) {
+      Dmsg2(dbglvl, "num_items=%d max_items=%d\n", num_items, max_items);
+      grow_table();
+   }
+   Dmsg3(dbglvl, "Leave insert index=%d num_items=%d key=%lld\n", index, num_items, key);
+   return true;
+}
+
 void *htable::lookup(char *key)
 {
    hash_index(key);
    for (hlink *hp=table[index]; hp; hp=(hlink *)hp->next) {
-//    Dmsg2(100, "hp=%p key=%s\n", hp, hp->key);
-      if (hash == hp->hash && strcmp(key, hp->key) == 0) {
+      ASSERT(hp->key_type == KEY_TYPE_CHAR);
+//    Dmsg2(100, "hp=%p key=%s\n", hp, hp->key.char_key);
+      if (hash == hp->hash && strcmp(key, hp->key.char_key) == 0) {
+         Dmsg1(dbglvl, "lookup return %p\n", ((char *)hp)-loffset);
+         return ((char *)hp)-loffset;
+      }
+   }
+   return NULL;
+}
+
+void *htable::lookup(uint32_t key)
+{
+   hash_index(key);
+   for (hlink *hp=table[index]; hp; hp=(hlink *)hp->next) {
+      ASSERT(hp->key_type == KEY_TYPE_UINT32);
+      if (hash == hp->hash && key == hp->key.uint32_key) {
+         Dmsg1(dbglvl, "lookup return %p\n", ((char *)hp)-loffset);
+         return ((char *)hp)-loffset;
+      }
+   }
+   return NULL;
+}
+
+void *htable::lookup(uint64_t key)
+{
+   hash_index(key);
+   for (hlink *hp=table[index]; hp; hp=(hlink *)hp->next) {
+      ASSERT(hp->key_type == KEY_TYPE_UINT64);
+      if (hash == hp->hash && key == hp->key.uint64_key) {
          Dmsg1(dbglvl, "lookup return %p\n", ((char *)hp)-loffset);
          return ((char *)hp)-loffset;
       }
@@ -353,21 +479,11 @@ void *htable::first()
 /* Destroy the table and its contents */
 void htable::destroy()
 {
-#ifdef BIG_MALLOC
    hash_big_free();
-#else
-   void *ni;
-   void *li = first();
-
-   while (li) {
-      ni = next();
-      free(li);
-      li=ni;
-   }
-#endif
 
    free(table);
    table = NULL;
+   garbage_collect_memory();
    Dmsg0(100, "Done destroy.\n");
 }
 
@@ -376,11 +492,19 @@ void htable::destroy()
 #ifdef TEST_PROGRAM
 
 struct MYJCR {
+#ifndef TEST_NON_CHAR
    char *key;
+#else
+   uint32_t key;
+#endif
    hlink link;
 };
 
+#ifndef TEST_SMALL_HTABLE
 #define NITEMS 5000000
+#else
+#define NITEMS 5000
+#endif
 
 int main()
 {
@@ -391,16 +515,25 @@ int main()
    int count = 0;
 
    jcrtbl = (htable *)malloc(sizeof(htable));
-   jcrtbl->init(jcr, &jcr->link, NITEMS);
 
+#ifndef TEST_SMALL_HTABLE
+   jcrtbl->init(jcr, &jcr->link, NITEMS);
+#else
+   jcrtbl->init(jcr, &jcr->link, NITEMS, 128);
+#endif
    Dmsg1(000, "Inserting %d items\n", NITEMS);
    for (int i=0; i<NITEMS; i++) {
+#ifndef TEST_NON_CHAR
       int len;
       len = sprintf(mkey, "This is htable item %d", i) + 1;
 
       jcr = (MYJCR *)jcrtbl->hash_malloc(sizeof(MYJCR));
       jcr->key = (char *)jcrtbl->hash_malloc(len);
       memcpy(jcr->key, mkey, len);
+#else
+      jcr = (MYJCR *)jcrtbl->hash_malloc(sizeof(MYJCR));
+      jcr->key = i;
+#endif
       Dmsg2(100, "link=%p jcr=%p\n", jcr->link, jcr);
 
       jcrtbl->insert(jcr->key, jcr);
@@ -411,15 +544,21 @@ int main()
    if (!(item = (MYJCR *)jcrtbl->lookup(save_jcr->key))) {
       printf("Bad news: %s not found.\n", save_jcr->key);
    } else {
+#ifndef TEST_NON_CHAR
       printf("Item 10's key is: %s\n", item->key);
+#else
+      printf("Item 10's key is: %ld\n", item->key);
+#endif
    }
 
    jcrtbl->stats();
    printf("Walk the hash table:\n");
    foreach_htable (jcr, jcrtbl) {
+#ifndef TEST_NON_CHAR
 //    printf("htable item = %s\n", jcr->key);
 #ifndef BIG_MALLOC
       free(jcr->key);
+#endif
 #endif
       count++;
    }