首页 > 代码库 > collection set

collection set

http://blog.csdn.net/humingfiy/article/details/7946408

 

Collection:List、Set
Map:HashMap、HashTable

如何在它们之间选择


一、Array ,Arrays

Java所有“存储及随机访问一连串对象”的做法,array是最有效率的一种。

1、
效率高,但容量固定且无法动态改变。
array还有一个缺点是,无法判断其中实际存有多少元素,length只是告诉我们array的容量。

2、Java中有一个Arrays类,专门用来操作array。
      arrays中拥有一组static函数,
equals():比较两个array是否相等。array拥有相同元素个数,且所有对应元素两两相等。
fill():将值填入array中。
sort():用来对array进行排序。
binarySearch():在排好序的array中寻找元素。
System.arraycopy():array的复制。


二、Collection ,Map

若撰写程序时不知道究竟需要多少对象,需要在空间不足时自动扩增容量,则需要使用容器类库,array不适用。

1、Collection 和 Map的区别

容器内每个为之所存储的元素个数不同。
Collection类型者,每个位置只有一个元素。
Map类型者,持有 key-value pair,像个小型数据库。

2、各自旗下的子类关系

Collection
     --List:将以特定次序存储元素。所以取出来的顺序可能和放入顺序不同。
           --ArrayList / LinkedList / Vector
      --Set : 不能含有重复的元素
           --HashSet / TreeSet
Map
      --HashMap
      --HashTable
      --TreeMap

3、其他特征

*    List,Set,Map将持有对象一律视为Object型别。
*    Collection、List、Set、Map都是接口,不能实例化。
     继承自它们的 ArrayList, Vector, HashTable,HashMap是具象class,这些才可被实例化。
*   vector容器确切知道它所持有的对象隶属什么型别。vector不进行边界检查。


三、Collections

Collections是针对集合类的一个帮助类。提供了一系列静态方法实现对各种集合的搜索、排序、线程完全化等操作。
相当于对Array进行类似操作的类——Arrays。
如,Collections.max(Collection coll); 取coll中最大的元素。
      Collections.sort(List list);对list中元素排序

四、如何选择?

1、容器类和Array的区别、择取
     *   容器类仅能持有对象引用(指向对象的指针),而不是将对象信息copy一份至数列某位置。
     *   一旦将对象置入容器内,便损失了该对象的型别信息。

2、
    *   在各种Lists中,最好的做法是以ArrayList作为缺省选择。当插入、删除频繁时,使用LinkedList();
      Vector总是比ArrayList慢,所以要尽量避免使用。
    *   在各种Sets中,HashSet通常优于HashTree(插入、查找)。只有当需要产生一个经过排序的序列,才用TreeSet。
      HashTree存在的唯一理由:能够维护其内元素的排序状态。
    *    在各种Maps中
       HashMap用于快速查找。
    *   当元素个数固定,用Array,因为Array效率是最高的。

结论:最常用的是ArrayList,HashSet,HashMap,Array。


注意:

1、Collection没有get()方法来取得某个元素。只能通过iterator()遍历元素。
2、Set和Collection拥有一模一样的接口。
3、List,可以通过get()方法来一次取出一个元素。使用数字来选择一堆对象中的一个,get(0)...。(add/get)
4、一般使用ArrayList。用LinkedList构造堆栈stack、队列queue。

5、Map用 put(k,v) /get(k),还可以使用containsKey()/containsValue()来检查其中是否含有某个key/value。
     HashMap会利用对象的hashCode来快速找到key。
    *   hashing
        哈希码就是将对象的信息经过一些转变形成一个独一无二的int值,这个值存储在一个array中。
        我们都知道所有存储结构中,array查找速度是最快的。所以,可以加速查找。
      
        发生碰撞时,让array指向多个values。即,数组每个位置上又生成一个梿表。

6、Map中元素,可以将key序列、value序列单独抽取出来。
使用keySet()抽取key序列,将map中的所有keys生成一个Set。
使用values()抽取value序列,将map中的所有values生成一个Collection。

为什么一个生成Set,一个生成Collection?那是因为,key总是独一无二的,value允许重复。

---------------------------------------------------------------------------------------
特别介绍1:HashTableVS HashMap
 
HashTable的应用非常广泛,HashMap是新框架中用来代替HashTable的类,也就是说建议使用HashMap,不要使用HashTable。
 
这里简单分析他们的区别。 
1.HashTable的方法是同步的,HashMap未经同步,所以在多线程场合要手动同步HashMap这个区别就像Vector和ArrayList一样。(最主要的区别)

2.HashTable不允许null值(key和value都不可以),HashMap允许null值(key和value都可以,只容许有一个null值的key,可以有多个null值的value)。

3.HashTable有一个contains(Object value),功能和containsValue(Object value)功能一样。

4.HashTable使用Enumeration,HashMap使用Iterator。

以上只是表面的不同,它们的实现也有很大的不同。

5.HashTable中hash数组默认大小是11,增加的方式是 old*2+1。HashMap中hash数组的默认大小是16,而且一定是2的指数。

6.哈希值的使用不同,HashTable直接使用对象的hashCode,代码是这样的:
int hash = key.hashCode();
int index = (hash & 0x7FFFFFFF) % tab.length;
而HashMap重新计算hash值,而且用与代替求模:
int hash = hash(k);
int i = indexFor(hash, table.length);
static int hash(Object x) {
   int h = x.hashCode();

  h += ~(h << 9);
  h ^= (h >>> 14);
  h += (h << 4);
  h ^= (h >>> 10);
   return h;
}
static int indexFor(int h, int length) {
   return h & (length-1);
}
以上只是一些比较突出的区别,当然他们的实现上还是有很多不同的,比如
HashMap对null的操作。
 
特别介绍2:ArrayList VS Vector VSLinkList

VECTOR是每个操作都同步的,如果你觉得集合中的数据安全性要求很高那就用VECTOR

ARRAYLIST并不是线程安全的,除了这点,跟VECTOR没什么差别,都是通过数组的方式来实现一个集合

LINKLIST跟ARRAYLIST的区别是,LINKLIST是用链表的方式实现的集合,所以在LIST的增、删、迭代等几个操作上,与ARRAYLIST速度有所差别。如果一个LIST需要频繁做删除操作的话应该选择LINKLIST,

ArrayList适合随机访问
LinkedList才是适合顺序访问的链 但是其元素的增减比ArrayList高.

特别介绍3:HashSet VSTreeSet

两者区别的形象展示:假设输入值的顺序为:1,4,3,1,用HashSet输出的顺序为:1,4,3(可能);用TreeSet输出的顺序为:1,3,4(如Windows的文件夹,不能重复,且有顺序)。

HashSet

此类实现 Set 接口,由哈希表(实际上是一个 HashMap实例)支持。它不保证集合的迭代顺序;特别是它不保证该顺序恒久不变。此类允许使用 null 元素。
此类为基本操作提供了稳定性能,这些基本操作包括 add、remove、contains 和size,假定哈希函数将这些元素正确地分布在桶中。对此集合进行迭代所需的时间与 HashSet 实例的大小(元素的数量)和底层HashMap实例(桶的数量)的“容量”的和成比例。因此,如果迭代性能很重要,则不要将初始容量设置得太高(或将加载因子设置得太低)。
注意:HashSet要重写hashCode和equals方法。

我们应该为要存放到散列表的各个对象定义hashCode()和equals();
import java.util.HashSet;
import java.util.Iterator;

public class HashSetTest{
         public static voidmain(String[] args)
        {
                HashSet hs=new HashSet();
                
                hs.add(new Student(1,"zhangsan"));
                hs.add(new Student(2,"lishi"));
                hs.add(new Student(3,"wangwu"));
                hs.add(new Student(1,"zhangsan"));
                
                Iterator it=hs.iterator();
                while(it.hasNext())
                {
                        System.out.println(it.next());
                }
        }
}
class Student        //HashSet要重写hashCode和equals方法
{
         int num;
         String name;
         Student(intnum,String name)
        {
                this.num=num;
                this.name=name;
        }
         public StringtoString()
        {
                return "num :"+num+"name:"+name;
        }
         public inthashCode()
        {
                return num*name.hashCode();
        }
         public booleanequals(Object o)
        {
                Student s=(Student)o;
                return num==s.num &&name.equals(s.name);
        }
}


TreeSet
此类实现 Set 接口,该接口由 TreeMap 实例支持。此类保证排序后的 set按照升序排列元素,根据使用的构造方法不同,可能会按照元素的自然顺序 进行排序,或按照在创建 set时所提供的比较器进行排序。
是一个有序集合,元素中安升序排序,缺省是按照自然顺序进行排序,意味着TreeSet中元素要实现Comparable接口;
我们可以构造TreeSet对象时,传递实现了Comparator接口的比较器对象.
import java.util.*;

public class TreeSetTest{
         public static voidmain(String[] args)
        {
                //TreeSet ts=new TreeSet();
                TreeSet ts=new TreeSet(new Students.compareToStudent());
                ts.add(new Students(2,"zhangshan"));
                ts.add(new Students(3,"lishi"));
                ts.add(new Students(1,"wangwu"));
                ts.add(new Students(4,"maliu"));
                
                Iterator it=ts.iterator();
                while(it.hasNext())
                {
                        System.out.println(it.next());
                }                
        }

}

class Students implements Comparable
{
         int num;
         String name;
         Students(intnum,String name)
        {
                this.num=num;
                this.name=name;
        }
         static classcompareToStudent implementsComparator        //定义一个内部类来实现比较器
        {
                public int compare(Object o1, Object o2) {
                        Students s1=(Students)o1;
                        Students s2=(Students)o2;
                        int rulst= s1.num > s2.num ? 1 :(s1.num==s2.num ? 0 :-1);
                        if(rulst==0)
                        {
                                rulst=s1.name.compareTo(s2.name);
                        }                
                        return rulst;
                }                
        }
         public intcompareTo(Objecto)                //写具体的比较方法
        {
                int result;
                Students s=(Students)o;
                result=num >s.num ? 1:(num==s.num ?0 : -1);
                if(result==0)
                {
                        result=name.compareTo(s.name);
                }
                return result;
        }
         public StringtoString()
        {
                return num+":"+name;
        }
}

总结
HashSet是基于Hash算法实现的,其性能通常优于TreeSet,我们通常都应该使用HashSet,在我们需要排序的功能时,我门才使用TreeSet。