Java中的泛型

文章作者:Tyan
博客:noahsnail.com

1. 什么是泛型

Java泛型(Generics)是JDK 5中引入的一个新特性,允许在定义类和接口的时候使用类型参数(type parameter),它们也被称为参数化类型(parameterized type)或参量多态(parametric polymorphism)。泛型最主要的应用是在JDK 5中的新集合类框架中。Java泛型的应用可以提高代码的复用性,同时泛型提供了类型检查,减少了数据的类型转换,保证了编译时的类型安全。

1.1 Java泛型的优点

Java泛型保持了和Java语言以及Java虚拟机很好的兼容性,下面对Java泛型的特点做一个简要的概:

  • 类型安全。 泛型的一个主要目标就是提高Java程序的类型安全。使用泛型可以使编译器知道变量的类型限制,进而可以在更高程度上验证类型假设。如果没有泛型,那么类型的安全性主要由程序员来把握,这显然不如带有泛型的程序安全性高。

  • 消除强制类型转换。泛型可以消除源代码中的许多强制类型转换,这样可以使代码更加可读,并减少出错的机会。

  • 向后兼容。支持泛型的Java编译器(例如JDK5.0中的Javac)可以用来编译经过泛型扩充的Java程序(Java泛型程序),但是现有的没有使用泛型扩充的Java程序仍然可以用这些编译器来编译。

  • 层次清晰,恪守规范。无论被编译的源程序是否使用泛型扩充,编译生成的字节码均可被虚拟机接受并执行。也就是说不管编译器的输入是Java泛型程序,还是一般的Java程序,经过编译后的字节码都严格遵循《Java虚拟机规范》中对字节码的要求。可见,泛型主要是在编译器层面实现的,它对于 Java 虚拟机是透明的。

  • 性能收益。目前来讲,用Java泛型编写的代码和一般的Java代码在效率上是非常接近的。 但是由于泛型会给Java编译器和虚拟机带来更多的类型信息,因此利用这些信息对Java程序做进一步优化将成为可能。

1.2 使用Java泛型要注意的事项

在使用泛型的时候可以遵循一些基本的原则,从而避免一些常见的问题。

  • 在代码中避免泛型类和原始类型的混用。比如List和List不应该共同使用。这样会产生一些编译器警告和潜在的运行时异常。当需要利用JDK 5之前开发的遗留代码,而不得不这么做时,也尽可能的隔离相关的代码。

  • 在使用带通配符的泛型类的时候,需要明确通配符所代表的一组类型的概念。由于具体的类型是未知的,很多操作是不允许的。

  • 泛型类最好不要同数组一块使用。你只能创建new List<?>[10]这样的数组,无法创建new List[10]这样的。这限制了数组的使用能力,而且会带来很多费解的问题。因此,当需要类似数组的功能时候,使用集合类即可。

  • 不要忽视编译器给出的警告信息。

2. 与泛型相关的一些概念

2.1 类型擦除

正确理解泛型概念的首要前提是理解类型擦除(type erasure)。 Java中的泛型基本上都是在编译器这个层次来实现的。在生成的Java字节代码中是不包含泛型中的类型信息的。使用泛型的时候加上的类型参数,会被编译器在编译的时候去掉。这个过程就称为类型擦除。如在代码中定义的List和List等类型,在编译之后都会变成List。JVM看到的只是List,而由泛型附加的类型信息对JVM来说是不可见的。Java编译器会在编译时尽可能的发现可能出错的地方,但是仍然无法避免在运行时刻出现类型转换异常的情况。类型擦除也是Java的泛型实现方式与C++模板机制实现方式之间的重要区别。

很多泛型的奇怪特性都与这个类型擦除的存在有关,包括:

  • 泛型类并没有自己独有的Class类对象。比如并不存在List.class或是List.class,而只有List.class。

  • 静态变量是被泛型类的所有实例所共享的。对于声明为MyClass的类,访问其中的静态变量的方法仍然是 MyClass.myStaticVar。不管是通过new MyClass还是new MyClass创建的对象,都是共享一个静态变量。

  • 泛型的类型参数不能用在Java异常处理的catch语句中。因为异常处理是由JVM在运行时刻来进行的。由于类型信息被擦除,JVM是无法区分两个异常类型MyException和MyException的。对于JVM来说,它们都是 MyException类型的。也就无法执行与异常对应的catch语句。

类型擦除的基本过程也比较简单,首先是找到用来替换类型参数的具体类。这个具体类一般是Object。如果指定了类型参数的上界的话,则使用这个上界。把代码中的类型参数都替换成具体的类。同时去掉出现的类型声明,即去掉<>的内容。比如T get()方法声明就变成了Object get();List就变成了List。接下来就可能需要生成一些桥接方法(bridge method)。这是由于擦除了类型之后的类可能缺少某些必须的方法。比如考虑下面的代码:

1
2
3
4
5
class MyString implements Comparable<String> {
public int compareTo(String str) {
return 0;
}
}

当类型信息被擦除之后,上述类的声明变成了class MyString implements Comparable。但是这样的话,类MyString就会有编译错误,因为没有实现接口Comparable声明的int compareTo(Object)方法。这个时候就由编译器来动态生成这个方法。

了解了类型擦除机制之后,就会明白编译器承担了全部的类型检查工作。编译器禁止某些泛型的使用方式,正是为了确保类型的安全性。以上面提到的List和List为例来具体分析:

1
2
3
4
5
6
7
8
9
10
public void inspect(List<Object> list) {    
for (Object obj : list) {
System.out.println(obj);
}
list.add(1); //这个操作在当前方法的上下文是合法的。
}
public void test() {
List<String> strs = new ArrayList<String>();
inspect(strs); //编译错误
}

这段代码中,inspect方法接受List作为参数,当在test方法中试图传入List的时候,会出现编译错误。假设这样的做法是允许的,那么在inspect方法就可以通过list.add(1)来向集合中添加一个数字。这样在test方法看来,其声明为List的集合中却被添加了一个Integer类型的对象。这显然是违反类型安全的原则的,在某个时候肯定会抛出ClassCastException。因此,编译器禁止这样的行为。编译器会尽可能的检查可能存在的类型安全问题。对于确定是违反相关原则的地方,会给出编译错误。当编译器无法判断类型的使用是否正确的时候,会给出警告信息。

2.2 通配符与上下界

在使用泛型类的时候,既可以指定一个具体的类型,如List就声明了具体的类型是String;也可以用通配符?来表示未知类型,如List<?>就声明了List中包含的元素类型是未知的。 通配符所代表的其实是一组类型,但具体的类型是未知的。List<?>所声明的就是所有类型都是可以的。但是List<?>并不等同于List。List实际上确定了List中包含的是Object及其子类,在使用的时候都可以通过Object来进行引用。而List<?>则其中所包含的元素类型是不确定。其中可能包含的是String,也可能是 Integer。如果它包含了String的话,往里面添加Integer类型的元素就是错误的。正因为类型未知,就不能通过new ArrayList<?>()的方法来创建一个新的ArrayList对象。因为编译器无法知道具体的类型是什么。但是对于 List<?>中的元素却总是可以用Object来引用的,因为虽然类型未知,但肯定是Object及其子类。考虑下面的代码:

1
2
3
public void wildcard(List<?> list) {
list.add(1);//编译错误
}

如上所示,试图对一个带通配符的泛型类进行操作的时候,总是会出现编译错误。其原因在于通配符所表示的类型是未知的。

因为对于List<?>中的元素只能用Object来引用,在有些情况下不是很方便。在这些情况下,可以使用上下界来限制未知类型的范围。 如List<? extends Number>说明List中可能包含的元素类型是Number及其子类。而List<? super Number>则说明List中包含的是Number及其父类。当引入了上界之后,在使用类型的时候就可以使用上界类中定义的方法。比如访问 List<? extends Number>的时候,就可以使用Number类的intValue等方法。

2.3 类型系统

在Java中,大家比较熟悉的是通过继承机制而产生的类型体系结构。比如String继承自Object。根据Liskov替换原则,子类是可以替换父类的。当需要Object类的引用的时候,如果传入一个String对象是没有任何问题的。但是反过来的话,即用父类的引用替换子类引用的时候,就需要进行强制类型转换。编译器并不能保证运行时刻这种转换一定是合法的。这种自动的子类替换父类的类型转换机制,对于数组也是适用的。 String[]可以替换Object[]。但是泛型的引入,对于这个类型系统产生了一定的影响。正如前面提到的List是不能替换掉List的。

引入泛型之后的类型系统增加了两个维度:一个是类型参数自身的继承体系结构,另外一个是泛型类或接口自身的继承体系结构。第一个指的是对于 List和List这样的情况,类型参数String是继承自Object的。而第二种指的是 List接口继承自Collection接口。对于这个类型系统,有如下的一些规则:

  • 相同类型参数的泛型类的关系取决于泛型类自身的继承体系结构。即List是Collection 的子类型,List可以替换Collection。这种情况也适用于带有上下界的类型声明。

  • 当泛型类的类型声明中使用了通配符的时候,其子类型可以在两个维度上分别展开。如对Collection<? extends Number>来说,其子类型可以在Collection这个维度上展开,即List<? extends Number>和Set<? extends Number>等;也可以在Number这个层次上展开,即Collection和 Collection等。如此循环下去,ArrayList和 HashSet等也都算是Collection<? extends Number>的子类型。

  • 如果泛型类中包含多个类型参数,则对于每个类型参数分别应用上面的规则。

理解了上面的规则之后,就可以很容易的修正实例分析中给出的代码了。只需要把List改成List<?>即可。List是List<?>的子类型,因此传递参数时不会发生错误。

2.4 桥方法

http://www.cnblogs.com/ggjucheng/p/3352519.html

3. 泛型类

一个典型的泛型类的例子是ArrayList类:

1
2
3
4
public class ArrayList<E> extends AbstractList<E>
implements List<E>, RandomAccess, Cloneable, java.io.Serializable {

}

用法就不用多说了。

4. 泛型接口

一个典型的泛型接口例子是Comparable接口:

1
2
3
4
5
6
7
8
public interface Comparable<T> {

...

public int compareTo(T o);

...
}

用法:

1
2
3
4
5
6
7
public class Test implements Comparable<String>{

@Override
public int compareTo(String o) {
return 0;
}
}

5. 泛型方法

1
2
3
4
5
6
public class Util {
public static <K, V> boolean compare(Pair<K, V> p1, Pair<K, V> p2) {
return p1.getKey().equals(p2.getKey()) &&
p1.getValue().equals(p2.getValue());
}
}

6. 泛型命名规范

为了更好地去理解泛型,我们也需要去理解Java泛型的命名规范。为了与Java关键字区别开来,Java泛型参数只是使用一个大写字母来定义。各种常用泛型参数的意义如下:

  • E — Element,常用在Java Collection里,如:List,Iterator,Set

  • K,V — Key,Value,代表Map的键值对

  • N — Number,数字

  • T — Type,类型,如String,Integer等等

参考资料:

1、http://www.infoq.com/cn/articles/cf-java-generics

2、https://www.ibm.com/developerworks/cn/java/j-lo-gj/

3、http://peiquan.blog.51cto.com/7518552/1302898

4、https://docs.oracle.com/javase/tutorial/java/generics/

5、Effective Java 2.0

如果有收获,可以请我喝杯咖啡!