首页 > 代码库 > MySQL源码 数据结构hash

MySQL源码 数据结构hash

MySQL源码自定义了hash表,因为hash表具有O(1)的查询效率,所以,源码中大量使用了hash结构。下面就来看下hash表的定义:
【源代码文件include/hash.h mysys/hash.c】
 
typedef uint my_hash_value_type;
typedef uchar *(*my_hash_get_key)(const uchar *,size_t*,my_bool);
typedef void (*my_hash_free_key)(void *);
 
typedef struct st_hash {
  size_t key_offset,key_length;          /* Length of key if const length */
  size_t blength;
  ulong records;
  uint flags;
  DYNAMIC_ARRAY array;                    /* Place for hash_keys */
  my_hash_get_key get_key;
  void (*free)(void *);
  CHARSET_INFO *charset;
} HASH;
 
 
typedef struct st_hash_info {
  uint next;                         /* index to next key */
  uchar *data;                         /* data for current entry */
} HASH_LINK;
 
hash的特点:
     1. hash的每一个元素都存放在array动态数组中
     2. 给定一个key值,通过hash算法来计算它在array中的位置
     3. array中的元素存放的是hash_link对象,而使用hash表的对象必须自己申请内存,把地址存放在hash_link->data中
     4. 根据key获取一个元素hash_link->data时,需要强制转换成保存进去的类型。
     5. hash表虽然使用calc_hash来计算hash值,但会按照array的位置(hash_mask函数)来进行存放。
 
用一个图来表示下:
     
 
下面看下hash表的函数:
1.  _my_hash_init(HASH *hash, uint growth_size, CHARSET_INFO *charset,
              ulong size, size_t key_offset, size_t key_length,
              my_hash_get_key get_key,
              void (*free_element)(void*), uint flags)
 
hash:初始化一个hash表
growth_size:初始化hash->array的增长大小
get_key:需要自定义一个从record获取key的方法,然后hash表针对这个key计算hash
free_element:hash中的元素,只记录data的指针,需要自己定义free的方法
 
 
2. my_hash_free_elements(HASH *hash)
  根据hash->elements的值,从array的0到elements来释放hash_link中的data。
  最后hash->elements置为0。
 
3. my_hash_key(const HASH *hash, const uchar *record, size_t *length,
            my_bool first)
     根据record和hash中定义的get_key方法来获取key值。
 
4. my_hash_first(const HASH *hash, const uchar *key, size_t length,
                     HASH_SEARCH_STATE *current_record)
 
     根据key,length值来查找hash中的data。如果有hash冲突,就返回第一个。
 
5. my_hash_insert(HASH *info, const uchar *record)
     插入record到hash表中:
     1. 如果需要hash_unique,会先使用my_hash_search进行查询。
     2. 然后计算cacl_hash&&hash_mask来计算位置。
 
6. my_hash_element(HASH *hash, ulong idx)
     获取在hash表位置是idx的元素。
 
为完待续.....