近抽空把java.lang下面常用的那些容器类型(数据结构)复习了一下,这些东西是基础,平时使用的时候也可以很容易查得到,有些方法大概知道,但是总是弄混,如果可以记住那些重要方法,并且能够熟练使用的话,还是可以让编码过程变得容易很多。另外一个是实现机制,对于常用数据结构的实现机制,应该说是必须要熟知的。 另外,并发容器我之前整理过,放在这篇文章里。 Queue add和offer的区别在于达到上add抛出异常,offer返回false; remove和poll的区别在于,队列为空时前者抛出异常,后者返回空; element和peek都返回队列头部元素,但是前者失败不抛出异常,后者返回空。 boolean add(E e); boolean offer(E e); E remove(); E poll(); E element(); E peek(); PriorityQueue,内部实现是一个Object[]queue承载的堆。 Deque,双端队列(double-ended queue),在Queue基础上,增加了这样几个方法: void addFirst(E e); void addLast(E e); boolean offerFirst(E e); boolean offerLast(E e); E removeFirst(); E removeLast(); E pollFirst(); E pollLast(); E getFirst(); E getLast(); E peekFirst(); E peekLast(); boolean removeFirstOccurrence(Object o); boolean removeLastOccurrence(Object o); ArrayDequeue:数组实现,扩容策略是容量翻倍。 List boolean add(E e); boolean remove(Object o); E get(int index); E set(int index,E element); void add(int index,E element); E remove(int index); ArrayList,扩容策略是(oldCapacity*3)/2+1。 LinkedList,它除了实现自List接口外,还实现了Deque接口。 Vector,实现自List接口,内部实现是个数组,线程安全,扩容策略是(capacityIncrement>0)?(oldCapacity+capacityIncrement):(oldCapacity*2)。 Stack是Vector的子类,增加了一些栈的方法: E push(E item) E pop() E peek() boolean empty() Map boolean containsKey(Object key); boolean containsValue(Object value); V get(Object key); V put(K key,V value); V remove(Object key); Set<K>keySet(); Collection<V>values(); Set<Map.Entry<K,V>>entrySet(); SotedMap接口,key是有序的map: SortedMap<K,V>subMap(K paramK1,K paramK2); SortedMap<K,V>headMap(K paramK); SortedMap<K,V>tailMap(K paramK); K firstKey(); K lastKey();子接口NavigableMap,提供了一些根据某个key寻找它前面或者后面的key的方法。其中floorKey/celingKey表示的关系是小于等于/大于等于,lower/higher表示的关系是严格的小于/大于: Map.Entry<K,V>floorEntry(K key) K floorKey(K key) Map.Entry<K,V>ceilingEntry(K key) K ceilingKey(K key) Map.Entry<K,V>lowerEntry(K key) K lowerKey(K key) Map.Entry<K,V>higherEntry(K key) K higherKey(K key) TreeMap是NavigableMap的直接实现子类,内部实现是一个红黑树。 EnumMap,结构是<K extends Enum<K>,V>,内部是通过一个K[]keyUniverse和一个Object[]vals来实现的。 HashMap,内部是数组+链表实现的,达到threshold=capacity*loadFactor时,扩容策略为:numKeysToBeAdded/loadFactor+1。 HashTable,实现自Dictionary和Map,方法都是线程安全的。HashTable的put方法,value不可以为空,这是它和HashMap的一个不同;再有二者找桶的hash方法不同;后则是threshold计算逻辑相同,但它的扩容策略不同:oldCapacity*2+1。HashTable、HashMap和HashSet经常被放到一起比较。 Properties,是HashTable的子类,方法线程安全。 IdentityHashMap,比较key不是使用equals来比较,而是使用“==”来比较,只要地址不等(即不是同一个对象)即可共存,也是说,key是可以重复的。 LinkedHashMap,在HashMap的基础上,又单独维护了一个双向循环链表。有一个重要参数是accessOrder,accessOrder为true时,每次调用get方法访问行为发生后,会把近访问的对象移动到头部,而超出容量移除对象时,是从尾部开始的,利用它并且覆写boolean removeEldestEntry方法可以实现一个LRU的队列。 WeakHashMap,但是key是weak引用,在不被使用时自动清除,扩容策略:tab.length*2。原理上看:Entry<K,V>extends WeakReference<K>implements Map.Entry<K,V>,因此entry是弱引用的实现类,关键方法是expungeStaleEntries,它在对这个map各种操作的时候都会被调用到,而这个方法里面也是靠监听key的ReferenceQueue这个队列的状态来确定是否真的没有对象引用了。 Set boolean contains(Object o); boolean add(E e); boolean remove(Object o); SortedSet,接口方法和SortedMap类似: SortedSet<E>subSet(E fromElement,E toElement); SortedSet<E>headSet(E toElement); SortedSet<E>tailSet(E fromElement); E first(); E last(); 相应地,NavigableSet和NavigableMap类似,方法不列出了。 TreeSet则和TreeMap类似,其实内部实现是一个TreeMap。 HashSet,尤其注意的是,有两种实现,当构造方法参数小于3个时,内部使用HashMap,否则,使用LinkedHashMap。 RegularEnumSet和JumboEnumSet,前者是普通的枚举set(用位移来表示各种组合的可能,达到空间占用小,大不能超过64个枚举值),后者适合数量较大的枚举set(老老实实地使用对象数组)。 LinkedHashSet,其实和LinkedHashMap是一个东西。 BitSet,叫set但是没有实现set的接口。用比特位来存放某个数是否存在,比如仅仅一个long,64位,可以存放0~63的数,内部实际的数据类型是long[]。 void flip(int bitIndex); void flip(int fromIndex,int toIndex); void set(int bitIndex); void set(int fromIndex,int toIndex,boolean value); void clear(int bitIndex); int length(); int size(); 其中size方法返回实际使用了的比特位数目;length方法返回逻辑意义上的长度(比如表示的数里面大是80,那么加上0,它的逻辑意义上的长度是81)。 扩容策略:Math.max(2*words.length,wordsRequired)。 Dictionary Enumeration<K>keys(); Enumeration<V>elements(); V get(Object key); V put(K key,V value); V remove(Object key); 已经被废弃了,用Map来实现相同功能。 后这张图来自这个网站,对于从宏观上把握这些容器类型实在是太有帮助了: Java容器类型复习笔记