首页 > 代码库 > 【源码】Hashtable源码剖析
【源码】Hashtable源码剖析
注:以下源码基于jdk1.7.0_11
Hashtable并没有去继承AbstractMap,而是选择继承了Dictionary类,Dictionary是个被废弃的抽象类,文档已经说得很清楚了:
这个类的方法如下(全是抽象方法):
上一篇分析了HashMap的源码,相信大家对HashMap都有了更深入的理解。本文将介绍Map集合的另一个常用类,Hashtable。
Hashtable出来的比HashMap早,HashMap 1.2才有,而Hashtable在1.0就已经出现了。HashMap和Hashtable实现原理基本一样,都是通过哈希表实现。而且两者处理冲突的方式也一样,都是通过链表法。下面我们就详细介绍下这个类。
首先看类声明:
public class Hashtable<K,V> extends Dictionary<K,V> implements Map<K,V>, Cloneable, java.io.Serializable
Hashtable并没有去继承AbstractMap,而是选择继承了Dictionary类,Dictionary是个被废弃的抽象类,文档已经说得很清楚了:
NOTE: This class is obsolete. New implementations should * implement the Map interface, rather than extending this class.
这个类的方法如下(全是抽象方法):
public abstract class Dictionary<K,V> { public Dictionary() { } abstract public int size(); abstract public boolean isEmpty(); abstract public Enumeration<K> keys(); abstract public Enumeration<V> elements(); abstract public V get(Object key); abstract public V put(K key, V value); abstract public V remove(Object key); }
没啥好说的,下面直接看Hashtable源码,首先依然是成员变量:
private transient Entry<K,V>[] table;//存储键值对对象的桶数组 /** * The total number of entries in the hash table. *键值对总数 */ private transient int count; /** * The table is rehashed when its size exceeds this threshold. (The * value of this field is (int)(capacity * loadFactor).) *容量的阈值,超过此容量将会导致扩容。值为容量*负载因子 */ private int threshold; /** * The load factor for the hashtable. *负载因子 */ private float loadFactor; /** * hashtable被改变的次数,用于快速失败机制 */ private transient int modCount = 0;
成员变量跟HashMap基本类似,但是HashMap更加规范,HashMap内部还定义了一些常量,比如默认的负载因子,默认的容量,最大容量等等。
接下来是构造器:
public Hashtable(int initialCapacity, float loadFactor) {//可指定初始容量和加载因子 if (initialCapacity < 0) throw new IllegalArgumentException("Illegal Capacity: "+ initialCapacity); if (loadFactor <= 0 || Float.isNaN(loadFactor)) throw new IllegalArgumentException("Illegal Load: "+loadFactor); if (initialCapacity==0) initialCapacity = 1;//初始容量最小值为1 this.loadFactor = loadFactor; table = new Entry[initialCapacity];//创建桶数组 threshold = (int)Math.min(initialCapacity * loadFactor, MAX_ARRAY_SIZE + 1);//初始化容量阈值 useAltHashing = sun.misc.VM.isBooted() && (initialCapacity >= Holder.ALTERNATIVE_HASHING_THRESHOLD); } /** * Constructs a new, empty hashtable with the specified initial capacity * and default load factor (0.75). */ public Hashtable(int initialCapacity) { this(initialCapacity, 0.75f);//默认负载因子为0.75 } public Hashtable() { this(11, 0.75f);//默认容量为11,负载因子为0.75 } /** * Constructs a new hashtable with the same mappings as the given * Map. The hashtable is created with an initial capacity sufficient to * hold the mappings in the given Map and a default load factor (0.75). */ public Hashtable(Map<? extends K, ? extends V> t) { this(Math.max(2*t.size(), 11), 0.75f); putAll(t); }
需注意的点:
1.Hashtable的默认容量为11,默认负载因子为0.75.(HashMap默认容量为16,默认负载因子也是0.75)
2.Hashtable的容量可以为任意整数,最小值为1,而HashMap的容量始终为2的n次方。
3.为避免扩容带来的性能问题,建议指定合理容量。
另外我们看到,Hashtable的编码相比较HashMap不是很规范,构造器中出现了硬编码,而HashMap中定义了常量。
跟HashMap一样,Hashtable内部也有一个静态类叫Entry,其实是个键值对对象,保存了键和值的引用。也可以理解为一个单链表的结点,因为其持有下一个Entry对象的引用:
private static class Entry<K,V> implements Map.Entry<K,V> {//键值对对象 int hash;//哈希值 final K key;//键 V value;//值 Entry<K,V> next;//指向下一个 protected Entry(int hash, K key, V value, Entry<K,V> next) { this.hash = hash; this.key = key; this.value = http://www.mamicode.com/value;>再次强调:HashMap和Hashtable存储的是键值对对象,而不是单独的键或值。明确了存储方式后,再看put和get方法:public synchronized V put(K key, V value) {//向哈希表中添加键值对 // Make sure the value is not null if (value =http://www.mamicode.com/= null) {//确保值不能为空>需注意的点:1.Hasbtable并不允许值和键为空(null),若为空,会抛空指针.大家可能奇怪,put方法在开始处仅对value进行判断,并未对key判断,这里我认为是设计者的疏忽。当然,这并不影响使用,因为当调用hash方法时,若key为空,依然会抛出空指针异常:private int hash(Object k) { if (useAltHashing) { if (k.getClass() == String.class) { return sun.misc.Hashing.stringHash32((String) k); } else { int h = hashSeed ^ k.hashCode(); h ^= (h >>> 20) ^ (h >>> 12); return h ^ (h >>> 7) ^ (h >>> 4); } } else { return k.hashCode();//此处可能抛空指针异常 } }2.HashMap计算索引的方式是h&(length-1),而Hashtable用的是模运算,效率上是低于HashMap的。3.另外Hashtable计算索引时将hash值先与上0x7FFFFFFF,这是为了保证hash值始终为正数。4.特别需要注意的是这个方法包括下面要讲的若干方法都加了synchronized关键字,也就意味着这个Hashtable是个线程安全的类,这也是它和HashMap最大的不同点.下面我们看下扩容方法rehash:protected void rehash() { int oldCapacity = table.length;//记录旧容量 Entry<K,V>[] oldMap = table;//记录旧的桶数组 // overflow-conscious code int newCapacity = (oldCapacity << 1) + 1;//新容量为老容量的2倍加1 if (newCapacity - MAX_ARRAY_SIZE > 0) { if (oldCapacity == MAX_ARRAY_SIZE)//容量不得超过约定的最大值 // Keep running with MAX_ARRAY_SIZE buckets return; newCapacity = MAX_ARRAY_SIZE; } Entry<K,V>[] newMap = new Entry[newCapacity];//创建新的数组 modCount++; threshold = (int)Math.min(newCapacity * loadFactor, MAX_ARRAY_SIZE + 1); boolean currentAltHashing = useAltHashing; useAltHashing = sun.misc.VM.isBooted() && (newCapacity >= Holder.ALTERNATIVE_HASHING_THRESHOLD); boolean rehash = currentAltHashing ^ useAltHashing; table = newMap; for (int i = oldCapacity ; i-- > 0 ;) {//转移键值对到新数组 for (Entry<K,V> old = oldMap[i] ; old != null ; ) { Entry<K,V> e = old; old = old.next; if (rehash) { e.hash = hash(e.key); } int index = (e.hash & 0x7FFFFFFF) % newCapacity; e.next = newMap[index]; newMap[index] = e; } } }Hashtable每次扩容,容量都为原来的2倍加2,而HashMap为原来的2倍。接下来分析get方法:public synchronized V get(Object key) {//根据键取出对应索引 Entry tab[] = table; int hash = hash(key);//先根据key计算hash值 int index = (hash & 0x7FFFFFFF) % tab.length;//再根据hash值找到索引 for (Entry<K,V> e = tab[index] ; e != null ; e = e.next) {//遍历entry链 if ((e.hash == hash) && e.key.equals(key)) {//若找到该键 return e.value;//返回对应的值 } } return null;//否则返回null }当然,如果你传的参数为null,是会抛空指针的。至此,最重要的部分已经讲完,下面再看一些常用的方法:public synchronized V remove(Object key) {//删除指定键值对 Entry tab[] = table; int hash = hash(key);//计算hash值 int index = (hash & 0x7FFFFFFF) % tab.length;//计算索引 for (Entry<K,V> e = tab[index], prev = null ; e != null ; prev = e, e = e.next) {//遍历entry链 if ((e.hash == hash) && e.key.equals(key)) {//找到指定键 modCount++; if (prev != null) {//修改相关指针 prev.next = e.next; } else { tab[index] = e.next; } count--; V oldValue = http://www.mamicode.com/e.value;>public synchronized void clear() {//清空桶数组 Entry tab[] = table; modCount++; for (int index = tab.length; --index >= 0; ) tab[index] = null;//直接置空 count = 0; }
下面是获取其键集(keySet)和键值集(entrySet)的方法:public Set<K> keySet() { if (keySet == null)//通过Collections的包装,返回的是线程安全的键集 keySet = Collections.synchronizedSet(new KeySet(), this); return keySet; } public Set<Map.Entry<K,V>> entrySet() { if (entrySet==null)//通过Collections的包装,返回的是线程安全的键值集 entrySet = Collections.synchronizedSet(new EntrySet(), this); return entrySet; }
这个KeySet和EntrySet是Hashtable的两个内部类:private class KeySet extends AbstractSet<K> { public Iterator<K> iterator() { return getIterator(KEYS); } public int size() { return count; } public boolean contains(Object o) { return containsKey(o); } public boolean remove(Object o) { return Hashtable.this.remove(o) != null; } public void clear() { Hashtable.this.clear(); } }总结:1.Hashtable是个线程安全的类(HashMap线程安全);2.Hasbtable并不允许值和键为空(null),若为空,会抛空指针(HashMap可以);3.Hashtable不允许键重复,若键重复,则新插入的值会覆盖旧值(同HashMap);4.Hashtable同样是通过链表法解决冲突;5.Hashtable根据hashcode计算索引时将hashcode值先与上0x7FFFFFFF,这是为了保证hash值始终为正数;6.Hashtable的容量为任意正数(最小为1),而HashMap的容量始终为2的n次方。Hashtable默认容量为 11,HashMap默认容量为 16;7.Hashtable每次扩容,新容量为旧容量的2倍加2,而HashMap为旧容量的2倍;8.Hashtable和HashMap默认负载因子都为0.75;
声明:以上内容来自用户投稿及互联网公开渠道收集整理发布,本网站不拥有所有权,未作人工编辑处理,也不承担相关法律责任,若内容有误或涉及侵权可进行投诉: 投诉/举报 工作人员会在5个工作日内联系你,一经查实,本站将立刻删除涉嫌侵权内容。