(01) Set 是继承于Collection的接口。它是一个不允许有重复元素的集合。
(02) AbstractSet 是一个抽象类,它继承于AbstractCollection,AbstractCollection实现了Set中的绝大部分函数,为Set的实现类提供了便利。
(03) HastSet 和 TreeSet 是Set的两个实现类。
HashSet依赖于HashMap,它实际上是通过HashMap实现的。HashSet中的元素是无序的。
TreeSet依赖于TreeMap,它实际上是通过TreeMap实现的。TreeSet中的元素是有序的。
下面我们以遍历违例来看看set集合的利用:
import
java.util.HashSet;
import
java.util.Iterator;
import
java.util.Set;
public
class
SetTest2 {
public
static
void
main(String[] args) {
Set<String> set =
new
HashSet<String>();
set.add(
"a"
);
set.add(
"b"
);
set.add(
"c"
);
set.add(
"d"
);
set.add(
"e"
);
set.add(
"e"
);
//不能放入重复数据
/**
* 遍历方法一,迭代遍历
*/
for
(Iterator<String> iterator = set.iterator();iterator.hasNext();){
System.out.print(iterator.next()+
" "
);
}
System.out.println();
System.out.println(
"********************"
);
/**
* for增强循环遍历
*/
for
(String value : set){
System.out.print(value+
" "
);
}
}
}
注意:这里Set集合中放入的是String类型,假如我们放入一个自己定义的类实例的时候,比如Person类实例,这时候我们要自己重新hashcode和equal方法,用自己的关键字段来重写,因为当使用HashSet时,hashCode()方法就会得到调用,判断已经存储在集合中的对象的hashcode值是否与增加的对象的hashcode值一致;如果不一致,直接加进去;如果一致,再进行equals方法的比较,equals方法如果返回true,表示对象已经加进去了,就不会再增加新的对象,否则加进去。
HashSet类
HashSet按Hash算法来存储集合的元素,因此具有很好的存取和查找性能。
HashSet的特点:
(1)HashSet不是同步的,多个线程访问是需要通过代码保证同步
(2)集合元素值可以使null。
HashSet集合判断两个元素相等的标准是两个对象通过equals方法比较相等,并且两个对象的hashCode()方法返回值也相等。
//类A的equals方法总是返回true,但没有重写其hashCode()方法
class A
{
public boolean equals(Object obj)
{
return true;
}
}
//类B的hashCode()方法总是返回1,但没有重写其equals()方法
class B
{
public int hashCode()
{
return 1;
}
}
//类C的hashCode()方法总是返回2,并重写其equals()方法
class C
{
public int hashCode()
{
return 2;
}
public boolean equals(Object obj)
{
return true;
}
}
public class TestHashSet
{
public static void main(String[] args)
{
HashSet<Object> books = new HashSet<Object>();
//分别向books集合中添加2个A对象,2个B对象,2个C对象
books.add(new A());
books.add(new A());
books.add(new B());
books.add(new B());
books.add(new C());
books.add(new C());
System.out.println(books);
}
}
说明:
(1)Object类提供的toString方法总是返回该对象实现类的类名+@+hashCode(16进制数)值,所以可以看到上面程序输出的结果。可以通过重写toString方法来输出自己希望的形式。
(2)即使2个A对象通过equals比较返回true,但HashSet依然把它们当成2个对象;即使2个B对象的hashCode()返回相同值,但HashSet依然把它们当成2个对象。即如果把一个对象放入HashSet中时,如果重写该对象equals()方法,也应该重写其hashCode()方法。其规则是:如果2个对象通过equals方法比较返回true时,这两个对象的hashCode也应该相同。
hash算法的功能:
它能保证通过一个对象快速查找到另一个对象。hash算法的价值在于速度,它可以保证查询得到快速执行。
当需要查询集合中某个元素时,hash算法可以直接根据该元素的值得到该元素保存位置,从而可以让程序快速找到该元素。
当从HashSet中访问元素时,HashSet先计算该元素的hashCode值(也就是调用该对象的hashCode())方法的返回值),然后直接到该hashCode对应的位置去取出该元素。
即也是快速的原因。HashSet中每个能存储元素的“曹位(slot)”通常称为“桶(bucket)”,如果多个元素的hashCode相同,但它们通过equals()方法比较返回false,就需要一个“桶”里放多个元素,从而导致性能下降。
继续深入研究HashSet:
当向HashSet中添加一个可变对象后,并且后面程序修改了该可变对象的属性,可能导致它与集合中其他元素相同,这就可能导致HashSet中包含两个相同的对象。
看下面程序:
class R { int count; public R(int count) { this.count = count; } public String toString() { return "R(count属性:" + count + ")"; } public boolean equals(Object obj) { if (obj instanceof R) { R r = (R)obj; if (r.count == this.count) { return true; } } return false; } public int hashCode() { return this.count; } } public class TestHashSet2 { public static void main(String[] args) { HashSet<R> hs = new HashSet<R>(); hs.add(new R(5)); hs.add(new R(-3)); hs.add(new R(9)); hs.add(new R(-2)); //打印HashSet集合,集合元素是有序排列的 System.out.println(hs); //取出第一个元素 Iterator<R> it = hs.iterator(); R first = (R)it.next(); //first指向集合的第一个元素 //为第一个元素的count属性赋值 first.count = -3; //first指向的元素值发生改变,地址并没有改变,大家可以试着用Java内存分配机制(栈和堆)思考下。 //再次输出count将看到HashSet里的元素处于无序状态 System.out.println(hs); hs.remove(new R(-3)); System.out.println(hs); //输出false System.out.println("hs是否包含count为-3的R对象?" + hs.contains(new R(-3))); //输出false System.out.println("hs是否包含count为5的R对象?" + hs.contains(new R(5))); } }
说明:程序重写了R类的equals()和hashCode()方法,这两个方法都是根据R对象的count属性来判断。从运行结果可以看出,HashSet集合中有完全相同元素,这表明两个元素已经重复,但因为HashSet在添加它们时已经把它们添加到了不同地方,所以HashSet完全可以容纳两个相同元素。至于第一个count为-3的R对象,它保存在count为5的R对象对应的位置(地址)。当向HashSet中添加可变对象时,必须十分小心。如果修改HashSet集合中的对象,有可能导致该对象与集合中其他对象相等,从而导致HashSet无法准确访问该对象。
HashSet还有一个子类LinkedHashSet,LinkedHashSet集合也根据元素hashCode值来决定元素存储位置,但它同时使用链表维护元素的次序,即当遍历LinkedHashSet集合元素时,HashSet将会按元素的添加顺序来访问集合里的元素。
TreeSet类
TreeSet是SortedSet接口的唯一实现,TreeSet可以确保集合元素处于排序状态(元素是有序的)。
TreeSet提供的几个额外方法:
Comparator comparator(): 返回当前Set使用的Comparator,或者返回null,表示以自然方式排序。
Object first():返回集合中的第一个元素。
Object last():返回集合中的最后一个元素。
Objiect lower(Object e):返回集合中位于指定元素之前的元素(即小于指定元素的最大元素,参考元素可以不是TreeSet的元素)。
Object higher(Object e):返回集合中位于指定元素之后的元素(即大于指定元素的最小元素,参考元素可以不需要TreeSet的元素)。
SortedSet subSet(fromElement, toElement):返回此Set的子集,范围从fromElement(包含大于等于)到toElement(不包含小于)。
SortedSet headSet(toElement):返回此Set的子集,由小于toElement的元素组成。
SortedSet tailSet(fromElement):返回此Set的子集,由大于或等于fromElement的元素组成。
public class TestTreeSetCommon { public static void main(String[] args) { TreeSet<Integer> nums = new TreeSet<Integer>(); //向TreeSet中添加四个Integer对象 nums.add(5); nums.add(2); nums.add(10); nums.add(-9); //输出集合元素,看到集合元素已经处于排序状态 System.out.println(nums); //输出集合里的第一个元素 System.out.println(nums.first()); //输出集合里的最后一个元素 System.out.println(nums.last()); //返回小于4的子集,不包含4 System.out.println(nums.headSet(4)); //返回大于5的子集,如果Set中包含5,子集中还包含5 System.out.println(nums.tailSet(5)); //返回大于等于-3,小于4的子集。 System.out.println(nums.subSet(-3 , 4)); } }
说明:由运行结果可以看出,TreeSet并不是根据元素的插入顺序进行排序,而是根据元素实际值来进行排序。TreeSet采用红黑树的数据结构对元素进行排序,具体排序内容会在后续文章中说明。