Hash
简介
Hash,一般翻译做散列、杂凑,或音译为哈希,是把任意长度的输入(又叫做预映射pre-image)通过散列算法变换成固定长度的输出,该输出就是散列值。这种转换是一种压缩映射,也就是,散列值的空间通常远小于输入的空间,不同的输入可能会散列成相同的输出,所以不可能从散列值来确定唯一的输入值。
若结构中存在和关键字K相等的记录,则必定在f(K)的存储位置上。由此,不需比较便可直接取得所查记录。称这个对应关系f为散列函数(Hash function),按这个事先建立的表为散列表。
对不同的关键字可能得到同一散列地址,即key1≠key2,而f(key1)=f(key2),这种现象称碰撞。具有相同函数值的关键字对该散列函数来说称做同义词。综上所述,根据散列函数H(key)和处理冲突的方法将一组关键字映射到一个有限的连续的地址集(区间)上,并以关键字在地址集中的“象” 作为记录在表中的存储位置,这种表便称为散列表,这一映象过程称为散列造表或散列,所得的存储位置称散列地址。
若对于关键字集合中的任一个关键字,经散列函数映象到地址集合中任何一个地址的概率是相等的,则称此类散列函数为均匀散列函数(Uniform Hash function),这就是使关键字经过散列函数得到一个“随机的地址”,从而减少冲突。
以上摘自百度百科
总结:
- hash:是一个函数,该函数中的实现就是一种算法,就是通过一系列的算法来得到一个hash值
- hash表:通过hash算法得到的hash值就在这张hash表中
也就是说,hash表就是所有的hash值组成的,有很多种hash函数,也就代表着有很多种算法得到hash值。
hashcode
hashcode就是通过hash函数得来的,通俗的说,就是通过某一种算法得到的,hashcode就是在hash表中有对应的位置。
每个对象都有hashcode,对象的hashcode怎么得来的呢?
首先一个对象肯定有物理地址,在别的博文中会hashcode说成是代表对象的地址,这里肯定会让读者形成误区,对象的物理地址跟这个hashcode地址不一样,hashcode代表对象的地址说的是对象在hash表中的位置,物理地址说的对象存放在内存中的地址,那么对象如何得到hashcode呢?通过对象的内部地址(也就是物理地址)转换成一个整数,然后该整数通过hash函数的算法就得到了hashcode,所以,hashcode是什么呢?就是在hash表中对应的位置。这里如果还不是很清楚的话,举个例子,hash表中有 hashcode 为1、hashcode为2、(...)3、4、5、6、7、8这样八个位置,有一个对象A,A的物理地址转换为一个整数17(这是假如),就通过直接取余算法,17%8=1,那么A的hashcode就为1,且A就在hash表中1的位置。
hashcode和equals
通过前面这个例子,大概可以知道,先通过hashcode来比较,如果hashcode相等,那么就用equals方法来比较两个对象是否相等,用个例子说明:上面说的hash表中的8个位置,就好比8个桶,每个桶里能装很多的对象,对象A通过hash函数算法得到将它放到1号桶中,当然肯定有别的对象也会放到1号桶中,如果对象B也通过算法分到了1号桶,那么它如何识别桶中其他对象是否和它一样呢,这时候就需要equals方法来进行筛选了。
-
如果两个对象equals相等,那么这两个对象的HashCode一定也相同
-
如果两个对象的HashCode相同,不代表两个对象就相同,只能说明这两个对象在散列存储结构中,存放于同一个位置
重写equals建议重写hashcode
比如:有个A类重写了equals方法,但是没有重写hashCode方法,看输出结果,对象a1和对象a2使用equals方法相等,按照上面的hashcode的用法,那么他们两个的hashcode肯定相等,但是这里由于没重写hashcode方法,他们两个hashcode并不一样,所以,我们在重写了equals方法后,尽量也重写了hashcode方法,通过一定的算法,使他们在equals相等时,也会有相同的hashcode值。
以上摘自:hashcode详解
Reflect
简介
运行状态中,对于任意一个类,都能够知道这个类的所有属性和方法;对于任意一个对象,都能调用它的任意一个方法和属性。这种动态获取信息及动态调用对象方法的功能叫Java的反射机制。
Class类的实例表示正在运行的Java应用程序中的类和接口,==每个类只会产生一个Class对象,在类加载的时候自动创建。==
java.lang.reflect
Java 中的 java.lang.reflect 包提供了反射功能。java.lang.reflect 包中的类都没有 public 构造方法。java.lang.reflect 包的核心接口和类如下:
- Member 接口 - 反映关于单个成员(字段或方法)或构造函数的标识信息。
- Field 类 - 提供一个类的域的信息以及访问类的域的接口。
- Method 类 - 提供一个类的方法的信息以及访问类的方法的接口。
- Constructor 类 - 提供一个类的构造函数的信息以及访问类的构造函数的接口。
- Array 类 - 该类提供动态地生成和访问 JAVA 数组的方法。
- Modifier 类 - 提供了 static 方法和常量,对类和成员访问修饰符进行解码。
- Proxy 类 - 提供动态地生成代理类和类实例的静态方法。
获得Class对象
- T.class
- Object.getClass()
- Class.forName("com.visionsly.entity.User")
判断是否为某个类的实例
- 用 instanceof 关键字
- 用 Class 对象的 isInstance 方法(它是一个 Native 方法)
创建实例
- 用 Class 对象的 newInstance 方法
- 用 Constructor 对象的 newInstance 方法
Class<?> c1 = StringBuilder.class;
StringBuilder sb = (StringBuilder) c1.newInstance();
sb.append("aaa");
System.out.println(sb.toString());
Class<?> c2 = String.class;
Constructor constructor = c2.getConstructor(String.class);
String str2 = (String) constructor.newInstance("bbb");
System.out.println(str2);
//Output:
//aaa
//bbb
Field
Class 对象提供以下方法获取对象的成员(Field):
-
getFiled
根据名称获取公有的 public 类成员。
-
getDeclaredField
根据名称获取已声明的类成员,但不包括其父类的类成员。
-
getFields
获取所有公有的 public 类成员,包括其父类的 public 类成员。
-
getDeclaredFields
获取所有已声明的所有类成员,包括public、protected、默认(包)访问和 private 成员,但不包括其父类的类成员。
Method
Class 对象提供以下方法获取对象的方法(Method):
-
getMethod
返回类或接口的特定方法。其中第一个参数为方法名称,后面的参数为方法参数对应 Class 的对象。
-
getDeclaredMethod
返回类或接口的特定声明方法。其中第一个参数为方法名称,后面的参数为方法参数对应 Class 的对象。
-
getMethods
返回类或接口的所有 public 方法,包括其父类的 public 方法。
-
getDeclaredMethods
返回类或接口声明的所有方法,包括public、protected、默认(包)访问和 private 方法,但不包括其父类的方法。
获取一个 Method 对象后,可以用 invoke 方法来调用这个方法。
invoke 方法的原型为:
public Object invoke(Object obj, Object... args)
throws IllegalAccessException, IllegalArgumentException,
InvocationTargetException
Constructor
Class 对象提供以下方法获取对象的构造方法(Constructor):
-
getConstructor
返回类的特定 public 构造方法。参数为方法参数对应 Class 的对象。
-
getDeclaredConstructor
返回类的特定构造方法。参数为方法参数对应 Class 的对象。
-
getConstructors
返回类的所有 public 构造方法。
-
getDeclaredConstructors
返回类的所有构造方法。
获取一个 Constructor 对象后,可以用 newInstance 方法来创建类实例。
Array
数组在 Java 里是比较特殊的一种类型,它可以赋值给一个对象引用。
public class ReflectArrayDemo {
public static void main(String[] args) throws ClassNotFoundException {
Class<?> cls = Class.forName("java.lang.String");
Object array = Array.newInstance(cls, 25);
//往数组里添加内容
Array.set(array, 0, "Scala");
Array.set(array, 1, "Java");
Array.set(array, 2, "Groovy");
Array.set(array, 3, "Scala");
Array.set(array, 4, "Clojure");
//获取某一项的内容
System.out.println(Array.get(array, 3));
}
}
//Output:
//Scala
其中的 Array 类为 java.lang.reflect.Array 类。我们通过 Array.newInstance 创建数组对象,它的原型是:
public static Object newInstance(Class<?> componentType, int length)
throws NegativeArraySizeException {
return newArray(componentType, length);
}
小总结
-
getFields / getMethods 当前类以及父类所有 public 成员变量 / 方法
-
getDeclaredFields / getDeclaredMethods 当前类所有 成员变量 / 方法
-
getConstructors 当前类所有 public 构造方法,不包括父类构造方法
-
getDeclaredConstructors 当前类所有构造方法,不包括父类构造方法
-
自定义类建议增加无参构造方法,有些架构使用反射时候会调用无参构造器
Annotation
简介
注解提供了一种安全的类似注释的机制,用来将任何的信息或元数据(metadata)与程序元素(类、方法、成员变量等)进行关联。为程序的元素(类、方法、成员变量)加上更直观的说明,这些说明信息是与程序的业务逻辑无关,并且供指定的工具或框架使用。Annontation像一种修饰符一样,应用于包、类型、构造方法、方法、成员变量、参数及本地变量的声明语句中。
简而言之:想像代码具有生命,注解就是对于代码中某些鲜活个体的贴上去的一张标签。简化来讲,注解如同一张标签。
注解定义
注解通过 @interface 关键字进行定义。
public @interface TestAnnotation {
}
它的形式跟接口很类似,不过前面多了一个 @ 符号。上面的代码就创建了一个名字为 TestAnnotaion 的注解。
你可以简单理解为创建了一张名字为 TestAnnotation 的标签。
注解的应用
上面创建了一个注解,那么注解的的使用方法是什么呢。
@TestAnnotation
public class Test {
}
创建一个类 Test,然后在类定义的地方加上 @TestAnnotation 就可以用 TestAnnotation 注解这个类了。
你可以简单理解为将 TestAnnotation 这张标签贴到 Test 这个类上面。
不过,要想注解能够正常工作,还需要介绍一下一个新的概念那就是元注解。
元注解
元注解是可以注解到注解上的注解,或者说元注解是一种基本注解,但是它能够应用到其它的注解上面。
如果难于理解的话,你可以这样理解。元注解也是一张标签,但是它是一张特殊的标签,它的作用和目的就是给其他普通的标签进行解释说明的。
-
@Retention
Retention 的英文意为保留期的意思。当 @Retention 应用到一个注解上的时候,它解释说明了这个注解的的存活时间。
它的取值如下:- RetentionPolicy.SOURCE 注解只在源码阶段保留,在编译器进行编译时它将被丢弃忽视。
- RetentionPolicy.CLASS 注解只被保留到编译进行的时候,它并不会被加载到 JVM 中。
- RetentionPolicy.RUNTIME 注解可以保留到程序运行的时候,它会被加载进入到 JVM 中,所以在程序运行时可以获取到它们。
我们可以这样的方式来加深理解,@Retention 去给一张标签解释的时候,它指定了这张标签张贴的时间。@Retention 相当于给一张标签上面盖了一张时间戳,时间戳指明了标签张贴的时间周期。
@Retention(RetentionPolicy.RUNTIME) public @interface TestAnnotation { }
上面的代码中,我们指定 TestAnnotation 可以在程序运行周期被获取到,因此它的生命周期非常的长。
-
@Documented
顾名思义,这个元注解肯定是和文档有关。它的作用是能够将注解中的元素包含到 Javadoc 中去。
-
@Target
Target 是目标的意思,@Target 指定了注解运用的地方。
你可以这样理解,当一个注解被 @Target 注解时,这个注解就被限定了运用的场景。
类比到标签,原本标签是你想张贴到哪个地方就到哪个地方,但是因为 @Target 的存在,它张贴的地方就非常具体了,比如只能张贴到方法上、类上、方法参数上等等。@Target 有下面的取值
- ElementType.ANNOTATION_TYPE 可以给一个注解进行注解
- ElementType.CONSTRUCTOR 可以给构造方法进行注解
- ElementType.FIELD 可以给属性进行注解
- ElementType.LOCAL_VARIABLE 可以给局部变量进行注解
- ElementType.METHOD 可以给方法进行注解
- ElementType.PACKAGE 可以给一个包进行注解
- ElementType.PARAMETER 可以给一个方法内的参数进行注解
- ElementType.TYPE 可以给一个类型进行注解,比如类、接口、枚举
-
@Inherited
Inherited 是继承的意思,但是它并不是说注解本身可以继承,而是说如果一个超类被 @Inherited 注解过的注解进行注解的话,那么如果它的子类没有被任何注解应用的话,那么这个子类就继承了超类的注解。
@Inherited @Retention(RetentionPolicy.RUNTIME) @interface Test {} @Test public class A {} public class B extends A {}
注解 Test 被 @Inherited 修饰,之后类 A 被 Test 注解,类 B 继承 A,类 B 也拥有 Test 这个注解。
可以这样理解:
老子非常有钱,所以人们给他贴了一张标签叫做富豪。
老子的儿子长大后,只要没有和老子断绝父子关系,虽然别人没有给他贴标签,但是他自然也是富豪。
老子的孙子长大了,自然也是富豪。
这就是人们口中戏称的富一代,富二代,富三代。虽然叫法不同,好像好多个标签,但其实事情的本质也就是他们有一张共同的标签,也就是老子身上的那张富豪的标签。
新增注解
-
@SafeVarargs
Java 7 开始支持,忽略任何使用参数为泛型变量的方法或构造函数调用产生的警告。
-
@FunctionalInterface
Java 8 开始支持,标识一个匿名函数或函数式接口。
-
@Repeatable
Java 8 开始支持,标识某注解可以在同一个声明上使用多次。
Repeatable 自然是可重复的意思。@Repeatable 是 Java 1.8 才加进来的,所以算是一个新的特性。
什么样的注解会多次应用呢?通常是注解的值可以同时取多个。
举个例子,一个人他既是程序员又是产品经理,同时他还是个画家。
@interface Persons { Person[] value(); } @Repeatable(Persons.class) @interface Person{ String role default ""; } @Person(role="artist") @Person(role="coder") @Person(role="PM") public class SuperMan{ }
注意上面的代码,@Repeatable 注解了 Person。而 @Repeatable 后面括号中的类相当于一个容器注解。
什么是容器注解呢?就是用来存放其它注解的地方。它本身也是一个注解。
我们再看看代码中的相关容器注解。
@interface Persons { Person[] value(); }
按照规定,它里面必须要有一个 value 的属性,属性类型是一个被 @Repeatable 注解过的注解数组,注意它是数组。
如果不好理解的话,可以这样理解。Persons 是一张总的标签,上面贴满了 Person 这种同类型但内容不一样的标签。把 Persons 给一个 SuperMan 贴上,相当于同时给他贴了程序员、产品经理、画家的标签。
我们可能对于 @Person(role=”PM”) 括号里面的内容感兴趣,它其实就是给 Person 这个注解的 role 属性赋值为 PM ,大家不明白正常,马上就讲到注解的属性这一块。
注解的属性
注解的属性也叫做成员变量。注解只有成员变量,没有方法。注解的成员变量在注解的定义中以“无形参的方法”形式来声明,其方法名定义了该成员变量的名字,其返回值定义了该成员变量的类型。
@Target(ElementType.TYPE)
@Retention(RetentionPolicy.RUNTIME)
public @interface TestAnnotation {
int id();
String msg();
}
上面代码定义了 TestAnnotation 这个注解中拥有 id 和 msg 两个属性。在使用的时候,我们应该给它们进行赋值。
赋值的方式是在注解的括号内以 value=”” 形式,多个属性之前用 ,隔开。
@TestAnnotation(id=3,msg="hello annotation")
public class Test {
}
需要注意的是,在注解中定义属性时它的类型必须是 8 种基本数据类型外加 类、接口、注解及它们的数组。
注解中属性可以有默认值,默认值需要用 default 关键值指定。比如:
@Target(ElementType.TYPE)
@Retention(RetentionPolicy.RUNTIME)
public @interface TestAnnotation {
public int id() default -1;
public String msg() default "Hi";
}
TestAnnotation 中 id 属性默认值为 -1,msg 属性默认值为 Hi。
它可以这样应用。
@TestAnnotation()
public class Test {}
因为有默认值,所以无需要再在 @TestAnnotation 后面的括号里面进行赋值了,这一步可以省略。
另外,还有一种情况。如果一个注解内仅仅只有一个名字为 value 的属性时,应用这个注解时可以直接接属性值填写到括号内。
public @interface Check {
String value();
}
上面代码中,Check 这个注解只有 value 这个属性。所以可以这样应用。
@Check("hi")
int a;
这和下面的效果是一样的
@Check(value="hi")
int a;
最后,还需要注意的一种情况是一个注解没有任何属性。比如
public @interface Perform {}
那么在应用这个注解的时候,括号都可以省略。
@Perform
public void testMethod(){}
Java预置注解
-
@Deprecated
这个元素是用来标记过时的元素,想必大家在日常开发中经常碰到。编译器在编译阶段遇到这个注解时会发出提醒警告,告诉开发者正在调用一个过时的元素比如过时的方法、过时的类、过时的成员变量。
-
@Override
提示子类要复写父类中被 @Override 修饰的方法
-
@SuppressWarnings
阻止警告的意思。之前说过调用被 @Deprecated 注解的方法后,编译器会警告提醒,而有时候开发者会忽略这种警告,他们可以在调用的地方通过 @SuppressWarnings 达到目的。
-
@SafeVarargs
参数安全类型注解。它的目的是提醒开发者不要用参数做一些不安全的操作,它的存在会阻止编译器产生 unchecked 这样的警告。它是在 Java 1.7 的版本中加入的。
-
@FunctionalInterface
函数式接口注解,这个是 Java 1.8 版本引入的新特性。函数式编程很火,所以 Java 8 也及时添加了这个特性。
函数式接口 (Functional Interface) 就是一个具有一个方法的普通接口。
注解的提取
通过用标签来比作注解,前面的内容是讲怎么写注解,然后贴到哪个地方去,而现在我们要做的工作就是检阅这些标签内容。 形象的比喻就是你把这些注解标签在合适的时候撕下来,然后检阅上面的内容信息。
注解与反射
注解通过反射获取。首先可以通过 Class 对象的 isAnnotationPresent() 方法判断它是否应用了某个注解
public boolean isAnnotationPresent(Class<? extends Annotation> annotationClass) {}
然后通过 getAnnotation() 方法来获取 Annotation 对象。
public <A extends Annotation> A getAnnotation(Class<A> annotationClass) {}
或者是 getAnnotations() 方法。
public Annotation[] getAnnotations() {}
前一种方法返回指定类型的注解,后一种方法返回注解到这个元素上的所有注解。
如果获取到的 Annotation 如果不为 null,则就可以调用它们的属性方法了。比如
@TestAnnotation()
public class Test {
public static void main(String[] args) {
boolean hasAnnotation = Test.class.isAnnotationPresent(TestAnnotation.class);
if ( hasAnnotation ) {
TestAnnotation testAnnotation = Test.class.getAnnotation(TestAnnotation.class);
System.out.println("id:"+testAnnotation.id());
System.out.println("msg:"+testAnnotation.msg());
}
}
}
程序的运行结果是:
id:-1
msg:
这个正是 TestAnnotation 中 id 和 msg 的默认值。
上面的例子中,只是检阅出了注解在类上的注解,其实属性、方法上的注解照样是可以的。同样还是要基于反射。
@TestAnnotation(msg="hello")
public class Test {
@Check(value="hi")
int a;
@Perform
public void testMethod(){}
@SuppressWarnings("deprecation")
public void test1() {
Hero hero = new Hero();
hero.say();
hero.speak();
}
public static void main(String[] args) {
boolean hasAnnotation = Test.class.isAnnotationPresent(TestAnnotation.class);
if ( hasAnnotation ) {
TestAnnotation testAnnotation = Test.class.getAnnotation(TestAnnotation.class);
//获取类的注解
System.out.println("id:"+testAnnotation.id());
System.out.println("msg:"+testAnnotation.msg());
}
try {
Field a = Test.class.getDeclaredField("a");
a.setAccessible(true);
//获取一个成员变量上的注解
Check check = a.getAnnotation(Check.class);
if ( check != null ) {
System.out.println("check value:"+check.value());
}
Method testMethod = Test.class.getDeclaredMethod("testMethod");
if ( testMethod != null ) {
// 获取方法中的注解
Annotation[] ans = testMethod.getAnnotations();
for( int i = 0;i < ans.length;i++) {
System.out.println("method testMethod annotation:"+ans[i].annotationType().getSimpleName());
}
}
} catch (NoSuchFieldException e) {
// TODO Auto-generated catch block
e.printStackTrace();
System.out.println(e.getMessage());
} catch (SecurityException e) {
// TODO Auto-generated catch block
e.printStackTrace();
System.out.println(e.getMessage());
} catch (NoSuchMethodException e) {
// TODO Auto-generated catch block
e.printStackTrace();
System.out.println(e.getMessage());
}
}
}
它们的结果如下:
id:-1
msg:hello
check value:hi
method testMethod annotation:Perform
需要注意的是,如果一个注解要在运行时被成功提取,那么@Retention(RetentionPolicy.RUNTIME) 是必须的。
注解使用场景
注解是一系列元数据,它提供数据用来解释程序代码,但是注解并非是所解释的代码本身的一部分。注解对于代码的运行效果没有直接影响。
注解有许多用处,主要如下:
- 提供信息给编译器: 编译器可以利用注解来探测错误和警告信息。
- 编译阶段时的处理: 软件工具可以用来利用注解信息来生成代码、Html文档或者做其它相应处理。
- 运行时的处理: 某些注解可以在程序运行的时候接受代码的提取,值得注意的是,注解不是代码本身的一部分。
Collection
Collection
Collection 是最基本的集合接口,一个 Collection 代表一组 Object,即 Collection 的元素,Java不提供直接继承自Collection的类,只提供继承于的子接口(如List和set)。
Collection 接口存储一组不唯一,无序的对象。
List
List接口是一个有序的 Collection,使用此接口能够精确的控制每个元素插入的位置,能够通过索引(元素在List中位置,类似于数组的下标)来访问List中的元素,第一个元素的索引为 0,而且允许有相同的元素。
List 接口存储一组不唯一,有序(插入顺序)的对象。
ArrayList
ArrayList是一个动态数组,也是我们最常用的集合,是List类的典型实现。它允许任何符合规则的元素插入甚至包括null。每一个ArrayList都有一个初始容量(10),该容量代表了数组的大小。随着容器中的元素不断增加,容器的大小也会随着增加(1.5倍)。在每次向容器中增加元素的同时都会进行容量检查,当快溢出时,就会进行扩容操作。所以如果我们明确所插入元素的多少,最好指定一个初始容量值,避免过多的进行扩容操作而浪费时间、效率。
扩容机制
/**
* Increases the capacity to ensure that it can hold at least the
* number of elements specified by the minimum capacity argument.
*
* @param minCapacity the desired minimum capacity
*/
private void grow(int minCapacity) {
// overflow-conscious code
int oldCapacity = elementData.length;
int newCapacity = oldCapacity + (oldCapacity >> 1);
if (newCapacity - minCapacity < 0)
newCapacity = minCapacity;
if (newCapacity - MAX_ARRAY_SIZE > 0)
newCapacity = hugeCapacity(minCapacity);
// minCapacity is usually close to size, so this is a win:
elementData = Arrays.copyOf(elementData, newCapacity);
}
ArrayList擅长于随机访问。同时ArrayList是非同步的。
LinkedList
LinkedList是List接口的另一个实现,除了可以根据索引访问集合元素外,LinkedList还实现了Deque接口,可以当作双端队列来使用,也就是说,既可以当作“栈”使用,又可以当作队列使用。
LinkedList的实现机制与ArrayList的实现机制完全不同,ArrayLiat内部以数组的形式保存集合的元素,所以随机访问集合元素有较好的性能;LinkedList内部以链表的形式保存集合中的元素,所以随机访问集合中的元素性能较差,但在插入删除元素时有较好的性能。
Vector
与ArrayList相似,但是Vector是同步的。所以说Vector是线程安全的动态数组。它的操作与ArrayList几乎一样。
Stack
Stack继承自Vector,实现一个后进先出的堆栈。Stack提供5个额外的方法使得Vector得以被当作堆栈使用。基本的push和pop方法,还有peek方法得到栈顶的元素,empty方法测试堆栈是否为空,search方法检测一个元素在堆栈中的位置。Stack刚创建后是空栈。
Set
Set 具有与 Collection 完全一样的接口,只是行为上不同,Set 不保存重复的元素。
Set 接口存储一组唯一,无序的对象。
HashSet
HashSet是Set集合最常用实现类,是其经典实现。HashSet是按照hash算法来存储元素的,因此具有很好的存取和查找性能。
HashSet特点
- 不能保证元素的顺序
- HashSet不是线程同步的,如果多线程操作HashSet集合,则应通过代码来保证其同步
- 集合元素值可以是null
HashSet存储原理
当向HashSet集合存储一个元素时,HashSet会调用该对象的hashCode()方法得到其hashCode值,然后根据hashCode值决定该对象的存储位置。HashSet集合判断两个元素相等的标准是(1)两个对象通过equals()方法比较返回true;(2)两个对象的hashCode()方法返回值相等。因此,如果(1)和(2)有一个不满足条件,则认为这两个对象不相等,可以添加成功。如果两个对象的hashCode()方法返回值相等,但是两个对象通过equals()方法比较返回false,HashSet会以链式结构将两个对象保存在同一位置,这将导致性能下降,因此在编码时应避免出现这种情况。
HashSet查找原理
基于HashSet以上的存储原理,在查找元素时,HashSet先计算元素的HashCode值(也就是调用对象的hashCode方法的返回值),然后直接到hashCode值对应的位置去取出元素即可,这就是HashSet速度很快的原因。
重写hashCode()方法的基本原则
- 在程序运行过程中,同一个对象的hashCode()方法返回值应相同
- 当两个对象通过equals()方法比较返回true时,这两个对象的hashCode()方法返回值应该相等
- 对象中用作equals()方法比较标准的实例变量,都应该用于计算hashCode值
LinkedHashSet
LinkedHashSet是HashSet的一个子类,具有HashSet的特性,也是根据元素的hashCode值来决定元素的存储位置。但它使用链表维护元素的次序,元素的顺序与添加顺序一致。由于LinkedHashSet需要维护元素的插入顺序,因此性能略低于HashSet,但在迭代访问Set里的全部元素时由很好的性能。
TreeSet
TreeSet时SortedSet接口的实现类,TreeSet可以保证元素处于排序状态,它采用红黑树的数据结构来存储集合元素。TreeSet支持两种排序方法:自然排序和定制排序,默认采用自然排序。
自然排序
TreeSet会调用集合元素的compareTo(Object obj)方法来比较元素的大小关系,然后将元素按照升序排列,这就是自然排序。如果试图将一个对象添加到TreeSet集合中,则该对象必须实现Comparable接口,否则会抛出异常。当一个对象调用方法与另一个对象比较时,例如obj1.compareTo(obj2),如果该方法返回0,则两个对象相等;如果返回一个正数,则obj1大于obj2;如果返回一个负数,则obj1小于obj2。
Java常用类中已经实现了Comparable接口的类有以下几个:
- BigDecimal、BigDecimal以及所有数值型对应的包装类:按照它们对应的数值大小进行比较。
- Charchter:按照字符的unicode值进行比较。
- Boolean:true对应的包装类实例大于false对应的包装类实例。
- String:按照字符串中的字符的unicode值进行比较。
- Date、Time:后面的时间、日期比前面的时间、日期大。
对于TreeSet集合而言,它判断两个对象是否相等的标准是:两个对象通过compareTo(Object obj)方法比较是否返回0,如果返回0则相等。
定制排序
想要实现定制排序,需要在创建TreeSet集合对象时,提供一个Comparator对象与该TreeSet集合关联,由Comparator对象负责集合元素的排序逻辑。
综上:自然排序实现的是Comparable接口,定制排序实现的是Comparator接口。
Map
Map接口采用键值对Map<K,V>的存储方式,保存具有映射关系的数据,因此,Map集合里保存两组值,一组值用于保存Map里的key,另外一组值用于保存Map里的value,key和value可以是任意引用类型的数据。key值不允许重复,可以为null。如果添加key-value对时Map中已经有重复的key,则新添加的value会覆盖该key原来对应的value。常用实现类有HashMap、LinkedHashMap、TreeMap等。
Map 接口存储一组键值对象,提供key(键)到value(值)的映射。
HashMap
随着JDK(Java Developmet Kit)版本的更新,JDK1.8对HashMap底层的实现进行了优化,例如引入红黑树的数据结构和扩容的优化等。JDK 1.8HashMap底层实现由之前的“数组+链表”改为“数组+链表+红黑树”。JDK1.8的HashMap的数据结构如下图所示,当链表节点较少时仍然是以链表存在,当链表节点较多时(大于8)会转为红黑树。
概述
HashMap:它根据键的hashCode值存储数据,大多数情况下可以直接定位到它的值,因而具有很快的访问速度,但遍历顺序却是不确定的。HashMap最多只允许一条记录的键为null,允许多条记录的值为null。HashMap非线程安全,即任一时刻可以有多个线程同时写HashMap,可能会导致数据的不一致。如果需要满足线程安全,可以用Collections的synchronizedMap方法使HashMap具有线程安全的能力,或者使用ConcurrentHashMap。
HashMap工作原理
HashMap基于hashing原理,通过put()和get()方法存储和获取对象。当我们将键值对传递给put()方法时,它调用建对象的hashCode()方法来计算hashCode值,然后找到bucket位置来储存值对象。当获取对象时,通过建对象的equals()方法找到正确的键值对,然后返回对象。HashMap使用链表来解决碰撞问题,当发生碰撞了,对象将会存储在链表的下一个节点中。
HashMap中一些常量值(jdk1.8)
/**
* The default initial capacity - MUST be a power of two.
* HashMap默认初始化大小为16,必须为2幂
*/
static final int DEFAULT_INITIAL_CAPACITY = 1 << 4; // aka 16
/**
* The maximum capacity, used if a higher value is implicitly specified
* by either of the constructors with arguments.
* MUST be a power of two <= 1<<30.
* HashMap最大大小
*/
static final int MAXIMUM_CAPACITY = 1 << 30;
/**
* The load factor used when none specified in constructor.
* 加载因子,扩容按照 (DEFAULT_LOAD_FACTOR * DEFAULT_INITIAL_CAPACITY) 进行扩容,例:初始化大小为16,扩容时计算 0.75 * 16 = 12,当大小为12则就开始扩容
*/
static final float DEFAULT_LOAD_FACTOR = 0.75f;
/**
* The bin count threshold for using a tree rather than list for a
* bin. Bins are converted to trees when adding an element to a
* bin with at least this many nodes. The value must be greater
* than 2 and should be at least 8 to mesh with assumptions in
* tree removal about conversion back to plain bins upon
* shrinkage.
* 一个桶的树化阈值
* 当桶中元素个数超过这个值时,需要使用红黑树节点替换链表节点
* 这个值必须为 8,要不然频繁转换效率也不高(泊松分布)
*/
static final int TREEIFY_THRESHOLD = 8;
/**
* The bin count threshold for untreeifying a (split) bin during a
* resize operation. Should be less than TREEIFY_THRESHOLD, and at
* most 6 to mesh with shrinkage detection under removal.
* 一个树的链表还原阈值
* 当扩容时,桶中元素个数小于这个值,就会把树形的桶元素 还原(切分)为链表结构
* 这个值应该比上面那个小,至少为 6,避免频繁转换
*/
static final int UNTREEIFY_THRESHOLD = 6;
/**
* The smallest table capacity for which bins may be treeified.
* (Otherwise the table is resized if too many nodes in a bin.)
* Should be at least 4 * TREEIFY_THRESHOLD to avoid conflicts
* between resizing and treeification thresholds.
* 哈希表的最小树形化容量
* 当哈希表中的容量大于这个值时,表中的桶才能进行树形化,否则桶内元素太多时会扩容,而不是树形化
* 为了避免进行扩容、树形化选择的冲突,这个值不能小于 4 * TREEIFY_THRESHOLD
*/
static final int MIN_TREEIFY_CAPACITY = 64;
HashMap功能实现
-
定位哈希桶数组索引位置
不管增加、删除、查找键值对,定位到哈希桶数组的位置都是很关键的第一步。前面说过HashMap的数据结构是“数组+链表+红黑树”的结合,所以我们当然希望这个HashMap里面的元素位置尽量分布均匀些,尽量使得每个位置上的元素数量只有一个,那么当我们用hash算法求得这个位置的时候,马上就可以知道对应位置的元素就是我们要的,不用遍历链表/红黑树,大大优化了查询的效率。HashMap定位数组索引位置,直接决定了hash方法的离散性能。下面是定位哈希桶数组的源码:
// 代码1 static final int hash(Object key) { // 计算key的hash值 int h; // 1.先拿到key的hashCode值; 2.将hashCode的高16位进行^运算 return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16); } // 代码2 int n = tab.length; // 将(tab.length - 1) 与 hash值进行&运算 int index = (n - 1) & hash;
整个过程本质上就是三步:
a. 拿到key的hashCode值
b. 将hashCode的高位进行^运算,重新计算hash值
c. 将计算出来的hash值与(table.length - 1)进行&运算
方法解读:
对于任意给定的对象,只要它的hashCode()返回值相同,那么计算得到的hash值总是相同的。我们首先想到的就是把hash值对table长度取模运算,这样一来,元素的分布相对来说是比较均匀的。
但是模运算消耗还是比较大的,我们知道计算机比较快的运算为位运算,因此JDK团队对取模运算进行了优化,使用上面代码2的位与运算来代替模运算。这个方法非常巧妙,它通过 “(table.length -1) & h” 来得到该对象的索引位置,这个优化是基于以下公式:x mod 2n = x & (2n - 1)。我们知道HashMap底层数组的长度总是2的n次方,并且取模运算为“h mod table.length”,对应上面的公式,可以得到该运算等同于“h & (table.length - 1)”。这是HashMap在速度上的优化,因为&比%具有更高的效率。
在JDK1.8的实现中,还优化了高位运算的算法,将hashCode的高16位与hashCode进行异或运算,主要是为了在table的length较小的时候,让高位也参与运算,并且不会有太大的开销。
-
分析HashMap的put方法
a. 判断键值对数组table[i]是否为空或为null,否则执行resize()进行扩容;
b. 根据键值key计算hash值得到插入的数组索引i,如果table[i]==null,直接新建节点添加,转向f,如果table[i]不为空,转向c;
c. 判断table[i]的首个元素是否和key一样,如果相同直接覆盖value,否则转向d,这里的相同指的是hashCode以及equals;
d. 判断table[i] 是否为treeNode,即table[i] 是否是红黑树,如果是红黑树,则直接在树中插入键值对,否则转向e;
e. 遍历table[i],判断链表长度是否大于8,大于8的话把链表转换为红黑树,在红黑树中执行插入操作,否则进行链表的插入操作;遍历过程中若发现key已经存在直接覆盖value即可;
f. 插入成功后,判断实际存在的键值对数量size是否超多了最大容量threshold,如果超过,进行扩容。
put方法源码:
public V put(K key, V value) { // 四个参数,第一个hash值,第四个参数表示如果该key存在值,如果为null的话,则插入新的value,最后一个参数,在hashMap中没有用,可以不用管,使用默认的即可 return putVal(hash(key), key, value, false, true); } final V putVal(int hash, K key, V value, boolean onlyIfAbsent, boolean evict) { // tab 哈希数组,p 该哈希桶的首节点,n hashMap的长度,i 计算出的数组下标 Node<K,V>[] tab; Node<K,V> p; int n, i; // table是否为空或者length等于0,如果是则调用resize方法进行初始化 if ((tab = table) == null || (n = tab.length) == 0) n = (tab = resize()).length; // 通过hash值计算索引位置,如果table表该索引位置节点为空则新增一个 if ((p = tab[i = (n - 1) & hash]) == null)// 将索引位置的头节点赋值给p tab[i] = newNode(hash, key, value, null); // table表该索引位置不为空,即发生了哈希冲突(分为三种情况) else { // e 临时节点的作用, k 存放该当前节点的key Node<K,V> e; K k; // 第一种,插入的key-value的hash值,key都与当前节点的相等,e = p,则表示为首节点 if (p.hash == hash && // 判断p节点的hash值和key值是否跟传入的hash值和key值相等 ((k = p.key) == key || (key != null && key.equals(k)))) e = p; // 如果相等,则p节点即为要查找的目标节点,赋值给e // 第二种,hash值不等于首节点,判断该p是否属于红黑树的节点(TreeNode), 如果是则调用红黑树的putTreeVal方法查找目标节点 else if (p instanceof TreeNode) e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value); // 第三种,hash值不等于首节点,不为红黑树的节点,则为链表的节点 else { // 走到这代表p节点为普通链表节点 for (int binCount = 0; ; ++binCount) { // 遍历此链表, binCount用于统计节点数 if ((e = p.next) == null) { // p.next为空代表不存在目标节点则新增一个节点插入链表尾部 p.next = newNode(hash, key, value, null); // 计算节点是否超过8个, 减一是因为循环是从p节点的下一个节点开始的 if (binCount >= TREEIFY_THRESHOLD - 1) treeifyBin(tab, hash);// 如果超过8个,调用treeifyBin方法将该链表转换为红黑树 break; } if (e.hash == hash && // e节点的hash值和key值都与传入的相等, 则e即为目标节点,跳出循环 ((k = e.key) == key || (key != null && key.equals(k)))) break; p = e; // 将p指向下一个节点 } } // e不为空则代表根据传入的hash值和key值查找到了节点,将该节点的value覆盖,返回oldValue if (e != null) { V oldValue = e.value; if (!onlyIfAbsent || oldValue == null) e.value = value; afterNodeAccess(e); // 用于LinkedHashMap return oldValue; } } // 到了此步骤,则表明待插入的key-value是没有key的重复,因为插入成功e节点的值为null // 修改次数+1 ++modCount; if (++size > threshold) // 插入节点后超过阈值则进行扩容 resize(); afterNodeInsertion(evict); // 用于LinkedHashMap 尾插法 return null; }
-
扩容机制
final Node<K,V>[] resize() { Node<K,V>[] oldTab = table; int oldCap = (oldTab == null) ? 0 : oldTab.length; int oldThr = threshold; int newCap, newThr = 0; if (oldCap > 0) { // 老table不为空 if (oldCap >= MAXIMUM_CAPACITY) { // 老table的容量超过最大容量值 threshold = Integer.MAX_VALUE; // 设置阈值为Integer.MAX_VALUE return oldTab; } // 如果容量*2<最大容量并且>=16, 则将阈值设置为原来的两倍 else if ((newCap = oldCap << 1) < MAXIMUM_CAPACITY && oldCap >= DEFAULT_INITIAL_CAPACITY) newThr = oldThr << 1; // double threshold } else if (oldThr > 0) // 老表的容量为0, 老表的阈值大于0, 是因为初始容量被放入阈值 newCap = oldThr; // 则将新表的容量设置为老表的阈值 else { // 老表的容量为0, 老表的阈值为0, 则为空表,设置默认容量和阈值 newCap = DEFAULT_INITIAL_CAPACITY; newThr = (int)(DEFAULT_LOAD_FACTOR * DEFAULT_INITIAL_CAPACITY); } if (newThr == 0) { // 如果新表的阈值为空, 则通过新的容量*负载因子获得阈值 float ft = (float)newCap * loadFactor; newThr = (newCap < MAXIMUM_CAPACITY && ft < (float)MAXIMUM_CAPACITY ? (int)ft : Integer.MAX_VALUE); } threshold = newThr; // 将当前阈值赋值为刚计算出来的新的阈值 @SuppressWarnings({"rawtypes","unchecked"}) // 定义新表,容量为刚计算出来的新容量 Node<K,V>[] newTab = (Node<K,V>[])new Node[newCap]; table = newTab; // 将当前的表赋值为新定义的表 if (oldTab != null) { // 如果老表不为空, 则需遍历将节点赋值给新表 for (int j = 0; j < oldCap; ++j) { Node<K,V> e; if ((e = oldTab[j]) != null) { // 将索引值为j的老表头节点赋值给e oldTab[j] = null; // 将老表的节点设置为空, 以便垃圾收集器回收空间 // 如果e.next为空, 则代表老表的该位置只有1个节点, // 通过hash值计算新表的索引位置, 直接将该节点放在该位置 if (e.next == null) newTab[e.hash & (newCap - 1)] = e; else if (e instanceof TreeNode) // 调用treeNode的hash分布(跟下面最后一个else的内容几乎相同) ((TreeNode<K,V>)e).split(this, newTab, j, oldCap); else { // preserve order Node<K,V> loHead = null, loTail = null; // 存储跟原索引位置相同的节点 Node<K,V> hiHead = null, hiTail = null; // 存储索引位置为:原索引+oldCap的节点 Node<K,V> next; do { next = e.next; //如果e的hash值与老表的容量进行与运算为0,则扩容后的索引位置跟老表的索引位置一样 if ((e.hash & oldCap) == 0) { if (loTail == null) // 如果loTail为空, 代表该节点为第一个节点 loHead = e; // 则将loHead赋值为第一个节点 else loTail.next = e; // 否则将节点添加在loTail后面 loTail = e; // 并将loTail赋值为新增的节点 } //如果e的hash值与老表的容量进行与运算为1,则扩容后的索引位置为:老表的索引位置+oldCap else { if (hiTail == null) // 如果hiTail为空, 代表该节点为第一个节点 hiHead = e; // 则将hiHead赋值为第一个节点 else hiTail.next = e; // 否则将节点添加在hiTail后面 hiTail = e; // 并将hiTail赋值为新增的节点 } } while ((e = next) != null); if (loTail != null) { loTail.next = null; // 最后一个节点的next设为空 newTab[j] = loHead; // 将原索引位置的节点设置为对应的头结点 } if (hiTail != null) { hiTail.next = null; // 最后一个节点的next设为空 newTab[j + oldCap] = hiHead; // 将索引位置为原索引+oldCap的节点设置为对应的头结点 } } } } } return newTab; }
总结
- HashMap的底层是个Node数组(Node<K,V>[] table),在数组的具体索引位置,如果存在多个节点,则可能是以链表或红黑树的形式存在。
- 增加、删除、查找键值对时,定位到哈希桶数组的位置是很关键的一步,源码中是通过下面3个操作来完成这一步:1)拿到key的hashCode值;2)将hashCode的高位参与运算,重新计算hash值;3)将计算出来的hash值与(table.length - 1)进行&运算。
- HashMap的默认初始容量(capacity)是16,capacity必须为2的幂次方;默认负载因子(load factor)是0.75;实际能存放的节点个数(threshold,即触发扩容的阈值)= capacity * load factor。
- HashMap在触发扩容后,阈值会变为原来的2倍,并且会进行重hash,重hash后索引位置index的节点的新分布位置最多只有两个:原索引位置或原索引+oldCap位置。例如capacity为16,索引位置5的节点扩容后,只可能分布在新报索引位置5和索引位置21(5+16)。
- 导致HashMap扩容后,同一个索引位置的节点重hash最多分布在两个位置的根本原因是:1)table的长度始终为2的n次方;2)索引位置的计算方法为“(table.length - 1) & hash”。HashMap扩容是一个比较耗时的操作,定义HashMap时尽量给个接近的初始容量值。
- HashMap有threshold属性和loadFactor属性,但是没有capacity属性。初始化时,如果传了初始化容量值,该值是存在threshold变量,并且Node数组是在第一次put时才会进行初始化,初始化时会将此时的threshold值作为新表的capacity值,然后用capacity和loadFactor计算新表的真正threshold值。
- 当同一个索引位置的节点在增加后达到9个时,会触发链表节点(Node)转红黑树节点(TreeNode,间接继承Node),转成红黑树节点后,其实链表的结构还存在,通过next属性维持。链表节点转红黑树节点的具体方法为源码中的treeifyBin(Node<K,V>[] tab, int hash)方法。
- 当同一个索引位置的节点在移除后达到6个时,并且该索引位置的节点为红黑树节点,会触发红黑树节点转链表节点。红黑树节点转链表节点的具体方法为源码中的untreeify(HashMap<K,V> map)方法。
- HashMap在JDK1.8之后不再有死循环的问题,JDK1.8之前存在死循环的根本原因是在扩容后同一索引位置的节点顺序会反掉。
- HashMap是非线程安全的,在并发场景下使用ConcurrentHashMap来代替。
其他文章
HashMap1.7 vs 1.8
HashMap 在 JDK 1.8 后新增的红黑树结构
HashMap面试题总结
Java源码分析:HashMap 1.8 相对于1.7 到底更新了什么
HashMap与HashTable
HashMap与HashTable是Map接口的两个典型实现,它们之间的关系完全类似于ArrayList与Vertor。HashTable是一个古老的Map实现类,它提供的方法比较繁琐,目前基本不用了,HashMap与HashTable主要存在以下两个典型区别:
- HashMap是线程不安全,HashTable是线程安全的。
- HashMap可以使用null值最为key或value;HashTable不允许使用null值作为key和value,如果把null放进HashTable中,将会发生空指针异常。
为了成功的在HashMap和HashTable中存储和获取对象,用作key的对象必须实现hashCode()方法和equals()方法。
LinkedHashMap
LinkedHashMap使用双向链表来维护key-value对的次序(其实只需要考虑key的次序即可),该链表负责维护Map的迭代顺序,与插入顺序一致,因此性能比HashMap低,但在迭代访问Map里的全部元素时有较好的性能。
TreeMap
TreeMap是SortedMap的实现类,是一个红黑树的数据结构,每个key-value对作为红黑树的一个节点。TreeMap存储key-value对时,需要根据key对节点进行排序。TreeMap也有两种排序方式:
- 自然排序:TreeMap的所有key必须实现Comparable接口,而且所有的key应该是同一个类的对象,否则会抛出ClassCastException。
- 定制排序:创建TreeMap时,传入一个Comparator对象,该对象负责对TreeMap中的所有key进行排序。
Iterator
Iterator是一个接口,它是集合的迭代器。集合可以通过Iterator去遍历集合中的元素。Iterator提供的API接口如下:
- boolean hasNext():判断集合里是否存在下一个元素。如果有,hasNext()方法返回 true。
- Object next():返回集合里下一个元素。
- void remove():删除集合里上一次next方法返回的元素。
ListIterator接口继承Iterator接口,提供了专门操作List的方法。ListIterator接口在Iterator接口的基础上增加了以下几个方法:
- boolean hasPrevious():判断集合里是否存在上一个元素。如果有,该方法返回 true。
- Object previous():返回集合里上一个元素。
- void add(Object o):在指定位置插入一个元素。
以上两个接口相比较,不难发现,ListIterator增加了向前迭代的功能(Iterator只能向后迭代),ListIterator还可以通过add()方法向List集合中添加元素(Iterator只能删除元素)。
以上摘自Java集合框架概述
Lambda
简介
- lambda表达式可以替代只有一个抽象方法的接口实现,告别匿名内部类,代码看起来更简洁易懂
- lambda表达式同时还提升了对集合、框架的迭代、遍历、过滤数据的操作
- lambda可以极大的减少代码冗余,同时代码的可读性要好过冗长的内部类,匿名类
语法
(Object ... args) -> {
expr;
return;
}
- ()参数的个数,根据函数式接口里面抽象的参数个数来决定,当参数只有一个的时候,()可以省略
- 当expr逻辑非常简单的时候,{}和return可以省略
- 小括号中的参数和之前方法的参数写法一样,可以写任意个参数,如果多个参数,要使用逗号隔开。
- -> 是一个运算符,表示指向性动作。
- 大括号中的方法体以及 return 返回值的写法和之前方法的大括号中的写法一样。
使用条件
Lambda 表达式需要"函数式接口"的支持
- 函数式接口:==接口中只有一个抽象方法的接口,称为函数式接口==。可以使用注解 @FunctionalInterface 修饰,可以检查是否是函数式接口。
- 函数式接口可以有默认方法和静态方法。
- 任何满足单一抽象方法法则的接口,都会被自动视为函数接口。这包括 Runnable 和 Callable 等传统接口,以及您自己构建的自定义接口。
函数式接口
函数式接口 | 参数类型 | 返回类型 | 用途 |
---|---|---|---|
Consumer | T | void | 对类型为T的对象应用操作。void accept(T t); |
Supplier | 无 | T | 返回类型为T的对象。 T get(); |
Function<T, R>(函数型接口) | T | R | 对类型为T的对象应用操作并返回R类型的对象。R apply(T t); |
Predicate | T | boolean | 确定类型为T的对象是否满足约束。boolean test(T t); |
简写格式
1. 无参方法,返回值为5
() -> {return 5;} // () -> 5;
2. 无参方法,不返回值
() -> {System.out.println("Hello");} // () -> System.out.println("Hello");
3. 接收一个int型整数,返回其 + 1 的值
(int x) -> {return x + 1;} // (int x) -> x + 1 (x) -> x + 1 x -> x + 1
4. 接收两个int型整数,返回他们的和值
(int x, int y) -> {return x + y;} // (x, y) -> x + y
5. 接收两个int型整数,返回他们的差值
(int x, int y) -> {return x - y;} // (x, y) -> x – y
方法引用
类型 | 语法 | lambda表达式 |
---|---|---|
静态方法引用 | 类名::staticMethod | (args) -> 类名.staticMethod(args) |
实例方法引用 | instance::instanceMethod | (args) -> instance.instanceMethod(args) |
对象方法引用 | 类名::instanceMethod | (instance, args) -> 类名.instanceMethod(args) |
构造方法引用 | 类名::new | (args) -> new 类名(args) |
- 静态方法引用
public class Test {
public static void main(String[] args) {
Supplier<String> s = Test::put;
System.out.println(s.get());
Function<String, String> f = Test::toUpperCase;
System.out.println(f.apply("hello"));
}
public static String put() {
return "Hello";
}
public static String toUpperCase(String s) {
return s.toUpperCase();
}
}
- 实例方法引用
public class Test {
public static void main(String[] args) {
Test test = new Test();
Supplier<String> s = test::put;
System.out.println(s.get());
Consumer<Integer> c = test::getSize;
c.accept(5);
}
public String put() {
return "Hello";
}
public void getSize(int size) {
System.out.println("size: " + size);
}
}
- 对象方法引用
public class Test {
public static void main(String[] args) {
Consumer<Test> c = Test::print;
c.accept(new Test());
BiConsumer<Test, String> b = Test::printArgs;
b.accept(new Test(), "Hello");
}
public void print() {
System.out.println("Hello");
}
public void printArgs(String s) {
System.out.println("---" + s);
}
}
- 构造方法引用
public class Test {
private String name;
public Test() {
System.out.println("调用无参构造方法");
}
public Test(String name) {
this.name = name;
System.out.println("调用有参构造方法 " + name);
}
public static void main(String[] args) {
Supplier<Test> s = Test::new;
s.get();
Consumer<String> c = Test::new;
c.accept("Hello");
}
}
Stream API
Stream 是一组用来处理数组,集合的API
Stream特性
- 不是数据结构,没有内部存储
- 不支持索引访问
- 延迟计算
- 支持并行
- 很容易生成数组或集合
- 支持过滤,查找,转换,汇总,聚合等操作
Stream常用API
- 循环 forEach
- 计算 min max count average
- 匹配 anyMatch allMatch noneMatch findFirst findAny
- 汇聚 reduce
- 收集器 toArray collect
案例使用
public class Person {
private String name;
public Person() {
}
public Person(String name) {
this.name = name;
}
public String getName() {
return name;
}
public void setName(String name) {
this.name = name;
}
public static Person build(String name) {
Person person = new Person();
person.setName(name);
return person;
}
@Override
public String toString() {
return "Person{" +
"name='" + name + '\'' +
'}';
}
}
public class Test {
public static void main(String[] args) {
/* Stream生成操作 */
// 数组生成
String[] s = {"a", "b", "c", "d", "e"};
Stream<String> stream1 = Stream.of(s);
stream1.forEach(System.out::println);
System.out.println("-------------------");
// 集合生成
List<String> list = Arrays.asList("a", "b", "c", "d", "e");
Stream<String> stream2 = list.stream();
stream2.forEach(System.out::println);
System.out.println("-------------------");
// Stream.generate
Stream<Integer> stream3 = Stream.generate(() -> 1);
stream3.limit(5).forEach(System.out::println);
System.out.println("-------------------");
// iterator
Stream<Integer> stream4 = Stream.iterate(1, x -> x + 1);
stream4.limit(5).forEach(System.out::println);
System.out.println("-------------------");
// 其他方式
String s1 = "hello";
IntStream stream5 = s1.chars();
stream5.forEach(System.out::println);
System.out.println("-------------------");
/* Stream中间操作 */
// 过滤一个集合中的偶数
Arrays.asList(1, 2, 3, 4, 5).stream().filter((x) -> x % 2 == 0).forEach(System.out::println);
System.out.println("-------------------");
// 求出一个集合中的偶数的和
int sum = Stream.of(1, 2, 3, 4, 5).filter((x) -> x % 2 == 0).mapToInt(x -> x).sum();
System.out.println(sum);
System.out.println("-------------------");
// 取出集合中最大值和最小值
int max = Stream.of(1, 2, 3, 4, 5).max((o1, o2) -> o1 - o2).get();
int min = Stream.of(1, 2, 3, 4, 5).min(Comparator.comparingInt(o -> o)).get();
System.out.println(max);
System.out.println("---");
System.out.println(min);
System.out.println("-------------------");
// 取出集合中最大值最小值而不使用max和min方法
Optional<Integer> maxOp = Stream.of(1, 2, 3, 4, 5).sorted((a, b) -> b - a).findFirst();
Optional<Integer> minOp = Stream.of(1, 2, 3, 4, 5).sorted().findFirst();
System.out.println(maxOp.get());
System.out.println("---");
System.out.println(minOp.get());
System.out.println("-------------------");
// 取出匹配元素的第一个
Optional<Integer> optional1 = Stream.of(1, 2, 3, 4, 5).filter((x) -> x % 2 == 0).findAny();
Optional<Integer> optional2 = Stream.of(1, 2, 3, 4, 5).filter((x) -> x % 2 == 0).findFirst();
System.out.println(optional1.get());
System.out.println("---");
System.out.println(optional2.get());
System.out.println("-------------------");
// 中间过程不执行
Stream<Integer> stream6 = Stream.of(1, 2, 3, 4, 5).filter((x) -> {
System.out.println("Running");
return x % 2 == 0;
});
System.out.println("-------------------");
// 对集合中的元素进行过滤并返回集合对象
List<Integer> collect1 = Stream.of(1, 2, 3, 4, 5).filter((x) -> x % 2 == 0).collect(Collectors.toList());
System.out.println(collect1);
System.out.println("-------------------");
// 对集合中的元素进行去重操作
List<Integer> collect2 = Stream.of(1, 2, 2, 3, 3, 4, 5).distinct().collect(Collectors.toList());
Set<Integer> collect3 = Stream.of(1, 2, 2, 3, 3, 4, 5).collect(Collectors.toSet());
System.out.println(collect2);
System.out.println("---");
System.out.println(collect3);
System.out.println("-------------------");
// 打印20 ~ 30的集合数据
List<Integer> collect4 = Stream.iterate(1, x -> x + 1).limit(50).skip(20).limit(10).collect(Collectors.toList());
System.out.println(collect4);
System.out.println("-------------------");
// 字符串求和
String str1 = "1,2,3,4,5";
int sumStr1 = Stream.of(str1.split(",")).mapToInt(x -> Integer.parseInt(x)).sum();
int sumStr2 = Stream.of(str1.split(",")).mapToInt(Integer::parseInt).sum();
System.out.println(sumStr1);
System.out.println("---");
System.out.println(sumStr2);
System.out.println("-------------------");
// 创建一组自定义对象
String str2 = "Tom,Jerry,Hans";
Stream.of(str2.split(",")).map(x -> new Person(x)).forEach(System.out::println);
System.out.println("---");
Stream.of(str2.split(",")).map(Person::new).forEach(System.out::println);
System.out.println("---");
Stream.of(str2.split(",")).map(x -> Person.build(x)).forEach(System.out::println);
System.out.println("---");
Stream.of(str2.split(",")).map(Person::build).forEach(System.out::println);
System.out.println("-------------------");
// 字符串求和并打印每一个数值
String str3 = "1,2,3,4,5";
int sumStr3 = Stream.of(str3.split(",")).peek(System.out::println).mapToInt(Integer::parseInt).sum();
System.out.println("---");
System.out.println(sumStr3);
System.out.println("-------------------");
// 匹配集合是否全部大于1
boolean b = Stream.of(1, 2, 3, 4, 5).allMatch(x -> x > 1);
System.out.println(b);
}
}