首页 > 代码库 > 5.5 数据结构和算法
5.5 数据结构和算法
1.数据的逻辑结构:
1)线性结构:(只有一个开始结点和一个终端结点)
2)非线性结构:(一个结点有多个前驱结点和后继结点)
A: 集合:(元素之间的关系较为松散) B: 线性结构:(元素之间存在严格的一对一的关系)
C: 树形结构:(元素之将存在严格的一对多关系) D: 网状结构: (元素之间存在多对多关系)
2.数据的存储结构:
A:顺序结构 B:连接结构 C:索引结构 D:散列结构
对JAVA的集合的理解是相对于数组。数组是大小固定的,并且同一个数组只能存放类型一样的数据(基本类型/引用类型);JAVA集合可以存储和操作数目不固定的一组数据。
所有的JAVA集合都位于 java.util包中,JAVA集合只能存放引用类型的的数据,不能存放基本数据类型。
JAVA集合主要分为三种类型: Set(集) List(列表) Map(映射)
- List = 排成一长队的小猪
- Map = 放在一个个,有房间号的屋子里面的一群小猪
- Set = 一群小猪贴上号,然后赶到一个猪圈里
Collection 接口
Collection是最基本的集合接口,声明了适用于JAVA集合(只包括Set和List,Map没有)的通用方法。
Collection接口的方法: (有一个工具类 Collections)
- boolean add(Object o) : 向集合中加入一个对象的引用
- void clear() : 删除集合中所有的对象,即不再持有这些对象的引用
- boolean isEmpty() : 判断集合是否为空
- boolean contains(Object o): 判断集合中是否持有特定对象的引用
- Iterartor iterator() : 返回一个Iterator对象,可以用来遍历集合中的元素
- boolean remove(Object o): 从集合中删除一个对象的引用
- Object[] toArray() : 返回一个数组,该数组中包括集合中的所有元素
Iterator接口声明了如下方法:
- hasNext(): 判断集合中元素是否遍历完毕(即是否还有下一个元素),如果没有,就返回true
- next() : 返回下一个元素
- remove(): 从集合中删除上一个有next()方法返回的元素。
Set 的用法:
存放的是对象的引用,没有重复对象
Set set=new HashSet(); String s1=new String("hello"); String s2=s1; String s3=new String("world"); set.add(s1); set.add(s2); set.add(s3); System.out.println(set.size());//打印数目 为 2。
Set 的 add()方法是如何判断对象是否已经存放在集合中?
通过迭代器,遍历比较。
- HashSet : 为快速查找设计的Set。存入HashSet的对象必须定义hashCode()。
- TreeSet : 保存次序的Set, 底层为树结构。使用它可以从Set中提取有序的序列。
- LinkedHashSet : 具有HashSet的查询速度,且内部使用链表维护元素的顺序(插入的次序)。于是在使用迭代器遍历Set时,结果会按元素插入的次序显示。
List(列表):
List的特征是其元素以线性方式存储,集合中可以存放重复对象。 List 的 get(int index) 方法放回集合中由参数index指定的索引位置的对象,下标从“0” 开始。最基本的两种检索集合中的所有对象的方法:
1: 用for循环和get()方法: 2: 使用 迭代器(Iterator): for(int i=0; I < size; i++){ Iterator it = list.iterator(); System.out.println(list.get(i)); while(it.hashNext){ } System.out.println(it.next); }
List接口下一共实现了三个类:ArrayList(Java1.2才有),Vector(Java1.0就有),LinkedList。
- LinkedList采用链表数据结构,它一般主要用在保持数据的插入顺序的时候。插入和删除速度快,访问速度慢。
- ArrayList和Vector都是用数组实现的,用于对元素进行随机访问,主要有这么三个区别:
- Vector是多线程安全的,而ArrayList不是,这个可以从源码中看出,Vector类中的方法很多有synchronized进行修饰,这样就导致了Vector在效率上无法与ArrayList相比;
- 两个都是采用的线性连续空间存储元素,但是当空间不足的时候,两个类的增加方式是不同的:Vector增加原来空间的一倍,ArrayList增加原来空间的50%。
- Vector可以设置增长因子,而ArrayList不可以,最开始看这个的时候,我没理解什么是增量因子,不过通过对比一下两个源码理解了这个,先看看两个类的构造方法:
ArrayList有三个构造方法:
public ArrayList(int initialCapacity) // 构造一个具有指定初始容量的空列表。 public ArrayList() // 构造一个初始容量为10的空列表。 public ArrayList(Collection<? extends E> c) // 构造一个包含指定 collection 的元素的列表
Vector有四个构造方法:
public Vector() //使用指定的初始容量和等于零的容量增量构造一个空向量。 public Vector(int initialCapacity) //构造一个空向量,使其内部数据数组的大小,其标准容量增量为零。 public Vector(Collection<? extends E> c) //构造一个包含指定 collection 中的元素的向量 public Vector(int initialCapacity,int capacityIncrement) //使用指定的初始容量和容量增量构造一个空的向量 /* Vector比Arraylist多一个构造方法,capacityIncrement就是容量增长,即增长因子,ArrayList中是没有的。 扩容时,如果容量增量初始化的不是0,即使用的第四个构造方法进行的初始化,那么扩容的容量就是原来的容量加上容量增量的值;如果没有设置容量增量,那么扩容后的容量就是原来容量的二倍。 */
Map(映射):
是一种把键对象和值对象映射的集合,它的每一个元素都包含一对键对象和值对象。
Map没有继承于Collection接口。从Map集合中检索元素时,只要给出键,就会返回对应的值对象。
Map 的常用方法:
1 添加,删除操作: put() remove( ) putAll(Map t) clear()
2 查询操作: get(Object key): 获得与关键字key相关的值
Map集合中的键不允许重复,也就说,任意两个键对象通过equals()方法比较的结果都是false。但是可以将任意多个键独享映射到同一个值对象上。
- HashMap : Map基于散列表的实现。插入和查询“键值对”的开销是固定的。可以通过构造器设置容量capacity和负载因子load factor,以调整容器的性能。
- LinkedHashMap : 类似于HashMap,但是迭代遍历它时,取得“键值对”的顺序是其插入次序,或者是最近最少使用(LRU)的次序。只比HashMap慢一点。而在迭代访问时发而更快,因为它使用链表维护内部次序。
- TreeMap : 基于红黑树数据结构的实现。查看“键”或“键值对”时,它们会被排序(次序由Comparabel或Comparator决定)。TreeMap的特点在于,你得到的结果是经过排序的。TreeMap是唯一的带有subMap()方法的Map,它可以返回一个子树。
- WeakHashMao : 弱键(weak key)Map,Map中使用的对象也被允许释放: 这是为解决特殊问题设计的。如果没有map之外的引用指向某个“键”,则此“键”可以被垃圾收集器回收。
- IdentifyHashMap : 使用==代替equals()对“键”作比较的hash map。专为解决特殊问题而设计。
# Android开发中高效的数据结构用SparseArray代替HashMap
SparseArray是android提供的一个工具类,它可以用来替代hashmap进行对象的存储,其内部实现了一个矩阵压缩算法,很适合存储稀疏矩阵的。其内部实现了压缩算法,可以进行矩阵压缩,大大减少了存储空间,节约内存。此外它的查找算法是二分法,提高了查找的效率。
List按对象进入的顺序保存对象,不做排序或编辑操作。Set对每个对象只接受一次,并使用自己内部的排序方法(通常,你只关心某个元素是否属于Set,而不关心它的顺序--否则应该使用List)。Map同样对每个元素保存一份,但这是基于"键"的,Map也有内置的排序,因而不关心元素添加的顺序。如果添加元素的顺序对你很重要,应该使用 LinkedHashSet或者LinkedHashMap.
5.5 数据结构和算法