首页 > 代码库 > Vector和Stack源码分析/List集合的总结

Vector和Stack源码分析/List集合的总结

    序言

        这篇文章算是在这list接口下的集合的最后一篇了,前面ArrayList、LinkedList都已经讲解完了,剩下就Vector和Vector的子类Stack啦。继续努力。一步一个脚印,

                                                        --WH

扩展

    学习vector,需要一些多线程的知识,这里比较杂,主要讲解一下等会会用到的

    1、锁机制:对象锁、方法锁、类锁

          对象锁就是方法锁:就是在一个类中的方法上加上synchronized关键字,这就是给这个方法加锁了。

          类锁:锁的是整个类,当有多个线程来声明这个类的对象的时候将会被阻塞,直到拥有这个类锁的对象被销毁或者主动释放了类锁。这个时候在被阻塞住的线程被挑选出一个占有该类锁,声明该类的对象。其他线程继续被阻塞住。例如:在类A上有关键字synchronized,那么就是给类A加了类锁,线程1第一个声明此类的实例,则线程1拿到了该类锁,线程2在想声明类A的对象,就会被阻塞。

    2、在本文中,使用的是方法锁。

    3、每个对象只有一把锁,有线程A,线程B,还有一个集合C类,线程A操作C拿到了集合中的锁(在集合C中有用synchronized关键字修饰的),并且还没有执行完,那么线程A就不会释放锁,当轮到线程B去操作集合C中的方法时 ,发现锁被人拿走了,所以线程B只能等待那个拿到锁的线程使用完,然后才能拿到锁进行相应的操作。

      这里只是简单的介绍了一种锁,这本篇文章中够用了,如果觉得不够,可以先去百度,或者查查关于多线程锁的问题

 

 

一、初始Vector(查看API文档)        

             技术分享

        截图一张供大家参考,通过阅读api,我们可以知道以下几点

          1、Vector是一个可变化长度的数组

          2、Vector增加长度通过的是capacity和capacityIncrement这两个变量,目前还不知道如何实现自动扩增的,等会源码分析

          3、Vector也可以获得iterator和listIterator这两个迭代器,并且他们发生的是fail-fast,而不是fail-safe,注意这里,不要觉得这个vector是线程安全就搞错了,具体分析在下面会说

          4、Vector是一个线程安全的类,如果使用需要线程安全就使用Vector,如果不需要,就使用arrayList

          5、Vector和ArrayList很类似,就少许的不一样,从它继承的类和实现的接口来看,跟arrayList一模一样。

    现在的版本已经是jdk1.7,还有更高的jdk1.8了,在开发中,建议不用vector,原因在文章的结束会有解释,如果需要线程安全的集合类直接用java.util.concurrent包下的类。

 

二、Vector的继承结构

         发两张图来压压惊,这个就不用过多的解释了吧,跟那个ArrayList的一模一样,如果不明白,可以去那里看清楚哦。

        http://www.cnblogs.com/whgk/p/6079212.html

        http://www.cnblogs.com/whgk/p/6081526.html#3560719

         技术分享

          技术分享

 

二、构造方法

      一共有四个构造方法。最后两个构造方法是collection Framwork的规范要写的构造方法。

          构造方法做的事:

              1、初始化存储元素的容器,也就是数组,elementData,

              2、初始化capacityIncrement的大小,默认是0,这个的作用就是扩展数组的时候,增长的大小,为0则每次扩展2倍

      技术分享

 

      Vector():空构造

   /**
     * Constructs an empty vector so that its internal data array
     * has size {@code 10} and its standard capacity increment is
     * zero.
     */
//看注释,这个是一个空的Vector构造方法,所以让他使用内置的数组,这里还不知道什么是内置的数组,看它调用了自身另外一个带一个参数的构造器
    public Vector() {
        this(10);
    }

 

      Vector(int)

    /**
     * Constructs an empty vector with the specified initial capacity and
     * with its capacity increment equal to zero.
     *
     * @param   initialCapacity   the initial capacity of the vector
     * @throws IllegalArgumentException if the specified initial capacity
     *         is negative
     */
//注释说,给空的cector构造器用和带有一个特定初始化容量用的,并且又调用了另外一个带两个参数的构造器,并且给容量增长值(capacityIncrement=0)为0,查看vector中的变量可以发现capacityIncrement是一个成员变量
    public Vector(int initialCapacity) {
        this(initialCapacity, 0);
    }

 

      Vector(int,int)

   /**
     * Constructs an empty vector with the specified initial capacity and
     * capacity increment.
     *
     * @param   initialCapacity     the initial capacity of the vector
     * @param   capacityIncrement   the amount by which the capacity is
     *                              increased when the vector overflows
     * @throws IllegalArgumentException if the specified initial capacity
     *         is negative
     */
//构建一个有特定的初始化容量和容量增长值的空的Vector,
    public Vector(int initialCapacity, int capacityIncrement) {
        super();//调用父类的构造,是个空构造
        if (initialCapacity < 0)//小于0,会报非法参数异常
            throw new IllegalArgumentException("Illegal Capacity: "+
                                               initialCapacity);
        this.elementData = http://www.mamicode.com/new Object[initialCapacity];//elementData是一个成员变量数组,初始化它,并给它初始化长度。默认就是10,除非自己给值。
        this.capacityIncrement = capacityIncrement;//capacityIncrement的意思是如果要扩增数组,每次增长该值,如果该值为0,那数组就变为两倍的原长度,这个之后会分析到
    }

 

      Vector(Collection<? extends E> c)

        之前对于这个只知道他的作用,但是原理不清楚,但是通过最近看数据结构与算法分析(java语言)这本书,知道了原来这个是叫做“带有限制的通配符”,现在就来讲一讲为什么需要这样做(Collection<? enxtends E>)?

          1、涉及到一个名词"协变",先说一下数组是协变的,什么意思呢?举个例子:Employee extends People、那么People p = new Employee();这个是可以得,那么我们就想,如果是People[] p = new Employee[5];是否可以呢,答案是可以得,原因就是数组是协变得,但是这会出现一个问题,就是如果Student extends People,那么People[] P = new Employee[5];然后P[0] = new Student(..); 这样的情况编译可以通过,但运行时就会报ArrayStoreException异常。这个例子就说明什么是协变,协变就是类型兼容,上面的Employee数组类型和People数组类型兼容,所以那样编译时能通过,不会报错。

          2、上面通过数组的例子讲解了“协变”,数组可以那样转换,那集合呢,如果一个方法的参数是collection<People>,那我们能不能传一个collection<Employee>的集合进去呢?大难是否定的,因为泛型集合不是协变得,也就是说它不能类型兼容,但是实际中,我们又需要让它们类型兼容,那怎么办呢,在jdk5中,就开始使用通配符来解决这个问题,就是通过collection<? extends People> 这样的形式来解决,当你传入的集合是People的子类时,那么就可以协变。

 

          通过上面的讲解,我们就可以知道,这个构造方法中的参数的意思是什么了?目的就是为了让泛型E的子类能够传进来,并且转换为泛型为E的集合来用,所以说注释中说什么返回一个集合的iterator,就是这个意思。

    /**
     * Constructs a vector containing the elements of the specified
     * collection, in the order they are returned by the collection‘s
     * iterator.
     *
     * @param c the collection whose elements are to be placed into this
     *       vector
     * @throws NullPointerException if the specified collection is null
     * @since   1.2
     */
//将集合c变为Vector,返回Vector的迭代器。
    public Vector(Collection<? extends E> c) {
        elementData = c.toArray();
        elementCount = elementData.length;
        // c.toArray might (incorrectly) not return Object[] (see 6260652)
        if (elementData.getClass() != Object[].class)
            elementData = Arrays.copyOf(elementData, elementCount, Object[].class);
    }

 

 

三、常用方法

      增删改查方法

      add()

  

    /**
     * Appends the specified element to the end of this Vector.
     *
     * @param e element to be appended to this Vector
     * @return {@code true} (as specified by {@link Collection#add})
     * @since 1.2
     */
//就是在vector中的末尾追加元素。但是看方法,synchronized,明白了为什么vector是线程安全的,因为在方法前面加了synchronized关键字,给该方法加锁了,哪个线程先调用它,其它线程就得等着,如果不清楚的就去看看多线程的知识,到后面我也会一一总结的。
    public synchronized boolean add(E e) {
        modCount++;
//通过arrayList的源码分析经验,这个方法应该是在增加元素前,检查容量是否够用
        ensureCapacityHelper(elementCount + 1);
        elementData[elementCount++] = e;
        return true;
    }

      ensureCapacityHelper(int)

    /**
     * This implements the unsynchronized semantics of ensureCapacity.
     * Synchronized methods in this class can internally call this
     * method for ensuring capacity without incurring the cost of an
     * extra synchronization.
     *
     * @see #ensureCapacity(int)
     */
//这里注释解释,这个方法是异步(也就是能被多个线程同时访问)的,原因是为了让同步方法都能调用到这个检测容量的方法,比如add的同时,另一个线程调用了add的重载方法,那么两个都需要同时查询容量够不够,所以这个就不需要用synchronized修饰了。因为不会发生线程不安全的问题
    private void ensureCapacityHelper(int minCapacity) {
        // overflow-conscious code
        if (minCapacity - elementData.length > 0)
//容量不够,就扩增,核心方法
            grow(minCapacity);
    }

 

      grow(int)

//看一下这个方法,其实跟arrayList一样,唯一的不同就是在扩增数组的方式不一样,如果capacityIncrement不为0,那么增长的长度就是capacityIncrement,如果为0,那么扩增为2倍的原容量
    private void grow(int minCapacity) {
        // overflow-conscious code
        int oldCapacity = elementData.length;
        int newCapacity = oldCapacity + ((capacityIncrement > 0) ?
                                         capacityIncrement : oldCapacity);
        if (newCapacity - minCapacity < 0)
            newCapacity = minCapacity;
        if (newCapacity - MAX_ARRAY_SIZE > 0)
            newCapacity = hugeCapacity(minCapacity);
        elementData = Arrays.copyOf(elementData, newCapacity);
    }

 

    核心的东西就已经讲完了,个人觉得,你看的懂arrayList,这个就很轻松,也就在每个方法上比arrayList多了一个synchronized。其他都一样。看下面的方法等等,都市这样,这里就不带着大家分析了。

技术分享

 

 

四、Stack

      现在来看看Vector的子类Stack,学过数据结构都知道,这个就是栈的意思。那么该类就是跟栈的用法一样了

      通过查看他的方法,和查看api文档,很容易就能知道他的特性。就几个操作,出栈,入栈等,构造方法也是空的,用的还是数组,父类中的构造,跟父类一样的扩增方式,并且它的方法也是同步的,所以也是线程安全

 

       技术分享

五、总结Vector和Stack

      首先,通过Vector源码分析,知道

      1、Vector线程安全是因为他的方法都加了synchronized关键字

      2、Vector的本质是一个数组,特点能是能够自动扩增,扩增的方式跟capacityIncrement的值有关

      3、它也会fail-fast,还有一个fail-safe两个的区别在下面的list总结中会讲到

      Stack的总结

      1、对栈的一些操作,后进先出

      2、底层也是用数组实现的,因为继承了Vector

      3、也是线程安全的

 

 

----------------------------------------------------------------------------------------------------------------------------------------------------------------------------

       List接口下的常用类到这里就已经结束了,现在总结一下(jdk1.7)

  1、arrayList和LinkedList区别?

      ·arrayList底层是用数组实现的顺序表,是随机存取类型,可自动扩增,并且在初始化时,数组的长度是0,只有在增加元素时,长度才会增加。默认是10,不能无限扩增,有上限,在查询操作的时候性能更好

      ·LinkedList底层是用链表来实现的,是一个双向链表,注意这里不是双向循环链表,顺序存取类型。在源码中,似乎没有元素个数的限制。应该能无限增加下去,直到内存满了在进行删除,增加操作时性能更好。

      ·两个都市线程不安全的,在iterator时,会发生fail-fast。

  2、arrayList和Vector的区别?

      ·arrayList线程不安全,在用iterator,会发生fail-fast

      ·Vector线程安全,因为在方法前加了Synchronized关键字。也会发生fail-fast

 

  3、fail-fast和fail-safe区别是什么?什么情况下会发生?

      一句话,在在java.util下的集合都是发生fail-fast,而在java.util.concurrent下的发生的都是fail-safe

      fail-fast:快速失败,例如在arrayList中使用迭代器遍历时,有另外的线程对arrayList的存储数组进行了改变,比如add、delete、等使之发生了结构上的改变,所以Iterator就会快速报一个

java.util.ConcurrentModificationException 异常,这就是快速失败。

      fail-safe:安全失败,在java.util.concurrent下的类,都是线程安全的类,他们在迭代的过程中,如果有线程进行结构的改变,不会报异常,而是正常遍历,这就是安全失败。

            1、为什么在java.util.concurrent包下对集合有结构的改变,却不会报异常?

                这里稍微解释一下,在concurrent下的集合类增加元素的时候使用Arrays.copyOf()来拷贝副本,在副本上增加元素,如果有其他线程在此改变了集合的结构,那也是在副本上的改变,而不是影响到原集合,迭代器还是照常遍历,遍历完之后,改变原引用指向副本,所以总的一句话就是如果在次包下的类进行增加删除,就会出现一个副本。所以能防止fail-fast,这种机制并不会出错,所以我们叫这种现象为fail-safe。

            2、vector也是线程安全的,为什么是fail-fast呢?

                这里搞清楚一个问题,并不是说线程安全的集合就不会报fail-fast,而是报fail-safe,你得搞清楚上面这个问题答案的原理,出现fail-safe是因为他们在实现增删的底层机制不一样,就像上面说的,会有一个副本,而像arrayList、linekdList、verctor等,他们底层就是对着真正的引用进行操作,所以才会发生异常。

 

            3、既然是线程安全的,为什么在迭代的时候,还会有别的线程来改变其集合的结构呢(也就是对其删除和增加等操作)?

                首先,我们迭代的时候,根本就没用到集合中的删除、增加,查询的操作,就拿vector来说,我们都没有用那些加锁的方法,也就是方法锁放在那没人拿,在迭代的过程中,有人拿了那把锁,我们也没有办法,因为那把锁就放在那边,

           

     举例来实现这两种情况的出现

      fail-fast

               技术分享

      fail-safe

          这里就直接上截图了,通过CopyOnWriteArrayList这个类来做实验,不用管这个类的作用,但是他确实没有报异常,并且还通过第二次打印,来验证了上面我们说创建了副本的事情。别说你不知道怎么验证的,哈哈,那我解释一下吧,原理是在添加操作时会创建副本,在副本上进行添加操作,等迭代器遍历结束后,会将原引用改为副本引用,所以我们在创建了一个list的迭代器,结果打印的就是123444了,证明了确实改变成为了副本引用,后面为什么是三个4,原因是我们循环了3次,不久添加了3个4吗。如果还感觉不爽的话,看下add的源码

   技术分享技术分享

 

      

    4、为什么现在都不提倡使用vector了

         这里推荐一个解答这个问题的答案,我也是借鉴它的回答来解答,因为我觉得这个答案更好。

       1、vector实现线程安全的方法是在每个操作方法上加锁,这些锁并不是必须要的,在实际开发中,一般都市通过锁一系列的操作来实现线程安全,也就是说将需要同步的资源放一起加锁来保证线程安全,

       2、如果多个Thread并发执行一个已经加锁的方法,但是在该方法中,又有vector的存在,vector本身实现中已经加锁了,那么相当于锁上又加锁,会造成额外的开销,

         3、就如上面第三个问题所说的,vector还有fail-fast的问题,也就是说它也无法保证遍历安全,在遍历时又得额外加锁,又是额外的开销,还不如直接用arrayList,然后再加锁呢。

      

      总结:Vector在你不需要进行线程安全的时候,也会给你加锁,也就导致了额外开销,所以在jdk1.5之后就被弃用了,现在如果要用到线程安全的集合,都是从java.util.concurrent包下去拿相应的类。

        

    




Vector和Stack源码分析/List集合的总结