java集合(二)----HashSet源码解析

mac2024-10-17  57

关于HashSet的图如下图所示: 从上图可以看出HashSet是Set接口的一个实现类,HashSet按Hash算法来存储集合中的元素,因此具有好的存取和查找性能。 HashSet具有以下特点: 1,不能保证元素的排列顺序,顺序可能与添加顺序不同,顺序也可能发生变化 2,HashSet不是同步的。就是说,如果多个线程同时访问一个HashSet,假设有两个或者两个以上的线程同时修改了HashSet集合时,则必须通过代码来保证其同步 3,集合元素值可以是null 以上是简单的介绍HashSet,下面来看看HashSet的源码:

一、HashSet源码介绍:

1,HashSet()方法:

public HashSet() { map = new HashMap<>(); }

源码解析: *功能:无参构造函数 *源码思路:构造一个新的空的HashMap实例,它有默认的初始化容量,容量为16,负载数为0.75

2,public HashSet(Collection<? extends E> c)方法:

public HashSet(Collection<? extends E> c) { map = new HashMap<>(Math.max((int) (c.size()/.75f) + 1, 16)); addAll(c); }

源码分析: -功能:构造一个新的set集合的构造函数,该构造函数包含集合c中的元素 -源码思路: -如果c的值是null,则跑出异常

3,public HashSet(int initialCapacity, float loadFactor)方法

public HashSet(int initialCapacity, float loadFactor) { map = new HashMap<>(initialCapacity, loadFactor); }

源码解析:

功能:构造一个新的set集合的构造函数,参数initialCapacity为hash map的初始容量,loadFactor为hashset的装载系数

4. public HashSet(int initialCapacity)方法

public HashSet(int initialCapacity) { map = new HashMap<>(initialCapacity); }

源码解析:

功能:构造一个新的set集合的构造函数,参数initialCapacity为hash map的初始容量

5. HashSet(int initialCapacity, float loadFactor, boolean dummy)方法:

HashSet(int initialCapacity, float loadFactor, boolean dummy) { map = new LinkedHashMap<>(initialCapacity, loadFactor); }

源码解析:

功能:构造一个新的,空的LinkedHashSet,这个构造函数只适用于LinkedHashSet

6. public Iterator iterator()方法:

public Iterator<E> iterator() { return map.keySet().iterator(); }

源码解析:

功能:返回集合的迭代器,通过调用map对象的keySet方法,获取set集合的所有值

源码思路:

Set集合的操作都是通过map集合实现的,集合的返回元素的顺序是随机的,没有顺序

7. public int size()方法:

public int size() { return map.size(); }

源码解析:

功能:返回集合中元素的个数

源码思路:

调用map的size方法

8. public boolean isEmpty()方法:

public boolean isEmpty() { return map.isEmpty(); }

源码解析:

功能:判断集合是否为空

源码思路:

调用map的isEmpty方法,来判断集合是否为空

9. public boolean contains(Object o)方法:

public boolean contains(Object o) { return map.containsKey(o); }

源码解析:

功能:判断集合中是否包含元素o

源码思路:

调用map的containsKey方法,来判断o是否在集合中,Set集合实际存储在map中,set的值存储为map集合的键。

10. public boolean add(E e)方法:

public boolean add(E e) { return map.put(e, PRESENT)==null; }

源码解析:

功能:向集合中添加元素e源码思路:(1)调用map的put方法,将元素e插入到集合中,作为map的键存储起来,键对应的值为HashSet类的PRESENT成员变量(2)如果集合中已经包含元素e,则不改变原集合,返回false;如果集合中不包含元素e,则向集合中添加元素e,返回true

11. public boolean remove(Object o)方法:

public boolean remove(Object o) { return map.remove(o)==PRESENT; }

源码解析:

功能:将集合中的元素o移除源码思路:(1)如果集合中存在元素o,则将其从集合中移除;(2)这里面牵扯到一个问题:就是当容器类对象在调用remove、contains等方法时需要比较对象是否相等,这会涉及到对象类型的equals方法和hashCode方法。对于这一点稍后解释。

12. public void clear()方法:

源码解析:

功能:将集合中的全部元素移除源码思路: 通过map的clear方法将集合中的元素全部移除

13. public Object clone()方法:

@SuppressWarnings("unchecked") public Object clone() { try { HashSet<E> newSet = (HashSet<E>) super.clone(); newSet.map = (HashMap<E, Object>) map.clone(); return newSet; } catch (CloneNotSupportedException e) { throw new InternalError(e); } }

源码解析:

功能:浅拷贝源码思路: 该方法只是完成了浅拷贝,集合中的元素本身没有被拷贝

二、HashSet注意事项:

1,当向集合中添加(add)、删除(remove)、是否包含(contains):

当向HashSet集合中存入一个元素时,HashSet会调用该对象的hashCode()方法来得到该对象的hashCode值,然后根据该hashCode值决定在HashSet中的存储位置。如果两个元素通过equals()方法比价返回true,但它们的hashCode()方法返回值不相等,HashSet会将它们存储在不同的位置,仍然可以添加成功。也就是说,HashSet集合判断两个元素是否相等的标准是两个对象通过equlas()方法比较相等,并且两个对象的hashCode()方法返回值也相等。对于自定义类型,需要重写equals和hashCode方法(什么时候能用到hashCode方法?一般来说,当这个对象用在map接口里面,作为“键”使用时,会用到hashCode方法,因为hashCode的效率会更高。)

2,原则:

当把一个对象放入HashSet中时,如果需要重写该对象对应类的equals()方法,则也应该需要重写其hashCode方法。规则就是:如果两个对象通过equals()方法比较返回true,这两个对象的hashCode值也应该相同。

三、hashCode对于HahSet是个怎样的地位?

首先,hash算法的功能是:它能保证快速查找被检索的对象,hash算法的价值在于速度。当需要查询集合中某个元素时,hash算法可以直接根据元素的hashCode值计算出该元素的存储位置,从而快速定位该元素。就像数组里的索引,从表面看起来,HashSet集合里面的元素都没有索引,实际上当程序向HashSet集合中添加元素时,HashSet会根据该元素的hashCode值来计算它的存储位置,这样也可以快速定位该元素。为什么不使用数组呢?因为数组元素的索引是连续的,而且数组的长度是固定的,无法自由添加数组的长度。而HashSet是采用每个元素的hashCode值来计算器存储位置,从而可以自由添加HashSet的长度,并可以根据元素的hashCode值来访问元素,因此,当以HashSet中访问元素时,HashSet先计算该元素的hashCode值(也就是调用该对象的hashCode方法的返回值),然后直接到该hashCode值对应的位置去取出该元素-------这就是HashSet速度很快的原因了。

四、重写hashCode()方法的基本原则:

1,在程序运行过程中,同一个对象多次调用hashCode()方法应该返回相同的值 2,当两个对象通过equals()方法比较返回true时,这两个对象的hashCode()方法应返回相等的值 3,对象中用作equals()方法比较标准的实例变量,都应该用于计算hashCode值 注意:当向HashSet中添加可变对象时,必须十分小心。如果修改HahSet集合中的对象,有可能导致该对象与集合中的其他对象相等,从而导致HashSet无法准确访问对象。

最新回复(0)