首页 > 代码库 > collection set
collection set
http://blog.csdn.net/humingfiy/article/details/7946408
Collection:List、Set
Map:HashMap、HashTable
如何在它们之间选择
一、Array ,Arrays
Java所有“存储及随机访问一连串对象”的做法,array是最有效率的一种。
1、
效率高,但容量固定且无法动态改变。
array还有一个缺点是,无法判断其中实际存有多少元素,length只是告诉我们array的容量。
2、Java中有一个Arrays类,专门用来操作array。
arrays中拥有一组static函数,
equals():比较两个array是否相等。array拥有相同元素个数,且所有对应元素两两相等。
fill():将值填入array中。
sort():用来对array进行排序。
binarySearch():在排好序的array中寻找元素。
System.arraycopy():array的复制。
二、Collection ,Map
若撰写程序时不知道究竟需要多少对象,需要在空间不足时自动扩增容量,则需要使用容器类库,array不适用。
1、Collection 和 Map的区别
容器内每个为之所存储的元素个数不同。
Collection类型者,每个位置只有一个元素。
Map类型者,持有 key-value pair,像个小型数据库。
2、各自旗下的子类关系
Collection
--List:将以特定次序存储元素。所以取出来的顺序可能和放入顺序不同。
--ArrayList / LinkedList / Vector
--Set : 不能含有重复的元素
--HashSet / TreeSet
Map
--HashMap
--HashTable
--TreeMap
3、其他特征
* List,Set,Map将持有对象一律视为Object型别。
* Collection、List、Set、Map都是接口,不能实例化。
继承自它们的 ArrayList, Vector, HashTable,HashMap是具象class,这些才可被实例化。
* vector容器确切知道它所持有的对象隶属什么型别。vector不进行边界检查。
三、Collections
Collections是针对集合类的一个帮助类。提供了一系列静态方法实现对各种集合的搜索、排序、线程完全化等操作。
相当于对Array进行类似操作的类——Arrays。
如,Collections.max(Collection coll); 取coll中最大的元素。
Collections.sort(List list);对list中元素排序
四、如何选择?
1、容器类和Array的区别、择取
* 容器类仅能持有对象引用(指向对象的指针),而不是将对象信息copy一份至数列某位置。
* 一旦将对象置入容器内,便损失了该对象的型别信息。
2、
* 在各种Lists中,最好的做法是以ArrayList作为缺省选择。当插入、删除频繁时,使用LinkedList();
Vector总是比ArrayList慢,所以要尽量避免使用。
* 在各种Sets中,HashSet通常优于HashTree(插入、查找)。只有当需要产生一个经过排序的序列,才用TreeSet。
HashTree存在的唯一理由:能够维护其内元素的排序状态。
* 在各种Maps中
HashMap用于快速查找。
* 当元素个数固定,用Array,因为Array效率是最高的。
结论:最常用的是ArrayList,HashSet,HashMap,Array。
注意:
1、Collection没有get()方法来取得某个元素。只能通过iterator()遍历元素。
2、Set和Collection拥有一模一样的接口。
3、List,可以通过get()方法来一次取出一个元素。使用数字来选择一堆对象中的一个,get(0)...。(add/get)
4、一般使用ArrayList。用LinkedList构造堆栈stack、队列queue。
5、Map用 put(k,v) /get(k),还可以使用containsKey()/containsValue()来检查其中是否含有某个key/value。
HashMap会利用对象的hashCode来快速找到key。
* hashing
哈希码就是将对象的信息经过一些转变形成一个独一无二的int值,这个值存储在一个array中。
我们都知道所有存储结构中,array查找速度是最快的。所以,可以加速查找。
发生碰撞时,让array指向多个values。即,数组每个位置上又生成一个梿表。
6、Map中元素,可以将key序列、value序列单独抽取出来。
使用keySet()抽取key序列,将map中的所有keys生成一个Set。
使用values()抽取value序列,将map中的所有values生成一个Collection。
为什么一个生成Set,一个生成Collection?那是因为,key总是独一无二的,value允许重复。
1.HashTable的方法是同步的,HashMap未经同步,所以在多线程场合要手动同步HashMap这个区别就像Vector和ArrayList一样。(最主要的区别)
2.HashTable不允许null值(key和value都不可以),HashMap允许null值(key和value都可以,只容许有一个null值的key,可以有多个null值的value)。
3.HashTable有一个contains(Object value),功能和containsValue(Object value)功能一样。
4.HashTable使用Enumeration,HashMap使用Iterator。
以上只是表面的不同,它们的实现也有很大的不同。
5.HashTable中hash数组默认大小是11,增加的方式是 old*2+1。HashMap中hash数组的默认大小是16,而且一定是2的指数。
6.哈希值的使用不同,HashTable直接使用对象的hashCode,代码是这样的:
int hash = key.hashCode();
int index = (hash & 0x7FFFFFFF) % tab.length;
而HashMap重新计算hash值,而且用与代替求模:
int hash = hash(k);
int i = indexFor(hash, table.length);
static int hash(Object x) { int h = x.hashCode(); h += ~(h << 9); h ^= (h >>> 14); h += (h << 4); h ^= (h >>> 10); return h; } static int indexFor(int h, int length) { return h & (length-1); } 以上只是一些比较突出的区别,当然他们的实现上还是有很多不同的,比如 HashMap对null的操作。 |
VECTOR是每个操作都同步的,如果你觉得集合中的数据安全性要求很高那就用VECTOR
ARRAYLIST并不是线程安全的,除了这点,跟VECTOR没什么差别,都是通过数组的方式来实现一个集合
LINKLIST跟ARRAYLIST的区别是,LINKLIST是用链表的方式实现的集合,所以在LIST的增、删、迭代等几个操作上,与ARRAYLIST速度有所差别。如果一个LIST需要频繁做删除操作的话应该选择LINKLIST,
ArrayList适合随机访问
LinkedList才是适合顺序访问的链 但是其元素的增减比ArrayList高.
特别介绍3:HashSet VSTreeSet
两者区别的形象展示:假设输入值的顺序为:1,4,3,1,用HashSet输出的顺序为:1,4,3(可能);用TreeSet输出的顺序为:1,3,4(如Windows的文件夹,不能重复,且有顺序)。
HashSet
此类实现 Set 接口,由哈希表(实际上是一个 HashMap实例)支持。它不保证集合的迭代顺序;特别是它不保证该顺序恒久不变。此类允许使用 null 元素。
此类为基本操作提供了稳定性能,这些基本操作包括 add、remove、contains 和size,假定哈希函数将这些元素正确地分布在桶中。对此集合进行迭代所需的时间与 HashSet 实例的大小(元素的数量)和底层HashMap实例(桶的数量)的“容量”的和成比例。因此,如果迭代性能很重要,则不要将初始容量设置得太高(或将加载因子设置得太低)。
注意:HashSet要重写hashCode和equals方法。
我们应该为要存放到散列表的各个对象定义hashCode()和equals();
import java.util.HashSet;
import java.util.Iterator;
public class HashSetTest{
public static voidmain(String[] args)
{
HashSet hs=new HashSet();
hs.add(new Student(1,"zhangsan"));
hs.add(new Student(2,"lishi"));
hs.add(new Student(3,"wangwu"));
hs.add(new Student(1,"zhangsan"));
Iterator it=hs.iterator();
while(it.hasNext())
{
System.out.println(it.next());
}
}
}
class Student //HashSet要重写hashCode和equals方法
{
int num;
String name;
Student(intnum,String name)
{
this.num=num;
this.name=name;
}
public StringtoString()
{
return "num :"+num+"name:"+name;
}
public inthashCode()
{
return num*name.hashCode();
}
public booleanequals(Object o)
{
Student s=(Student)o;
return num==s.num &&name.equals(s.name);
}
}
TreeSet
此类实现 Set 接口,该接口由 TreeMap 实例支持。此类保证排序后的 set按照升序排列元素,根据使用的构造方法不同,可能会按照元素的自然顺序 进行排序,或按照在创建 set时所提供的比较器进行排序。
是一个有序集合,元素中安升序排序,缺省是按照自然顺序进行排序,意味着TreeSet中元素要实现Comparable接口;
我们可以构造TreeSet对象时,传递实现了Comparator接口的比较器对象.
import java.util.*;
public class TreeSetTest{
public static voidmain(String[] args)
{
//TreeSet ts=new TreeSet();
TreeSet ts=new TreeSet(new Students.compareToStudent());
ts.add(new Students(2,"zhangshan"));
ts.add(new Students(3,"lishi"));
ts.add(new Students(1,"wangwu"));
ts.add(new Students(4,"maliu"));
Iterator it=ts.iterator();
while(it.hasNext())
{
System.out.println(it.next());
}
}
}
class Students implements Comparable
{
int num;
String name;
Students(intnum,String name)
{
this.num=num;
this.name=name;
}
static classcompareToStudent implementsComparator //定义一个内部类来实现比较器
{
public int compare(Object o1, Object o2) {
Students s1=(Students)o1;
Students s2=(Students)o2;
int rulst= s1.num > s2.num ? 1 :(s1.num==s2.num ? 0 :-1);
if(rulst==0)
{
rulst=s1.name.compareTo(s2.name);
}
return rulst;
}
}
public intcompareTo(Objecto) //写具体的比较方法
{
int result;
Students s=(Students)o;
result=num >s.num ? 1:(num==s.num ?0 : -1);
if(result==0)
{
result=name.compareTo(s.name);
}
return result;
}
public StringtoString()
{
return num+":"+name;
}
}
总结
HashSet是基于Hash算法实现的,其性能通常优于TreeSet,我们通常都应该使用HashSet,在我们需要排序的功能时,我门才使用TreeSet。