移动测试开发 lambda 表达式介绍和底层实现分析

opentest-oper@360.cn · December 17, 2020 · 1942 hits

lambda 表达式介绍和底层实现分析
关键字:java lambda 函数式编程

如果你的需求需要匿名类来实现,例如是一个只有一个方法的接口,那么匿名类的语法可能看起来比较笨拙和不清晰,尽管匿名类比命名类更简洁,但对于只有一个方法的类来说,即使是匿名类也显得有些麻烦。还有在一些情况下,需要将功能作为参数传递给另一个方法,例如当有人单击页面上按钮时应该采取什么操作,javascript 可以通过闭包实现。在 java 语言中,lambda 表达式能够将功能视为方法参数,或将代码视为数据,而且 lambda 表达式可以更紧凑地表达单方法类的实例,在 Swing 编程和集合(Collections)编程中优势很明显。

lambda 表达式

lambda 表达式,也被称为闭包,它是推动 Java 8 发布的最重要新特性。lambda 允许把函数作为一个方法的参数(函数作为参数传递进方法中)。

lambda 表达式的语法格式如下:

(parameters) -> expression或 (parameters) ->{ statements; }

以下是 lambda 表达式的重要特征:
(1)可选类型声明:不需要声明参数类型,编译器可以统一识别参数值;
(2)可选的参数圆括号:一个参数无需定义圆括号,但多个参数需要定义圆括号;
(3)可选的大括号:如果主体包含了一个语句,就不需要使用大括号;
(4)可选的返回关键字:如果主体只有一个表达式返回值则编译器会自动返回值,大括号需要指定明表达式返回了一个数值。

例如下面是一些 lambda 表达式

(int x, int y) -> x + y
() -> 42
(String s) -> { System.out.println(s); }

第一个 lambda 表达式接收 x 和 y 这两个整形参数并返回它们的和;第二个 lambda 表达式不接收参数,返回整数 ‘42’;第三个 lambda 表达式接收一个字符串并把它打印到控制台,不返回值。

了解使用 lambda 表达式,需要了解函数式接口,lambda 用来代替内部类,赋予了 Java 简单但是强大的函数式编程能力,同时可以认为 java 支持命令式编程、声明式编程、函数式编程。

函数式接口

只有一个抽象方法的接口,称为函数式接口。例如下面的接口,

public interface MyFunctionInterface<T> {
    public T getValue(T t);
}

测试类如下

public class MyFunctionInterfaceTest {
    public static void main(String[] args) {
        testMethod("   aaaa  ", s -> s.trim());
        testMethod("   aaaa  ", s -> s.trim().toUpperCase());
    }

    public static void testMethod(String str,   MyFunctionInterface<String> functionInterface) {
        System.out.println(functionInterface.getValue(str));
    }
}

输出结果如下:
aaaa
AAAA

修改一下上面的接口,增加一个方法。

public interface MyFunctionInterface<T> {
    public T getValue(T t);
    public T returnValue(T t);
}

增加一个方法之后,上面就不是函数式接口了,可以看到 lambda 表达式就会报错。

虽然不能在函数式接口中定义多个方法,但可以定义默认方法、静态方法以及 java.lang.Object 里的 public 方法。如下面的代码

@FunctionalInterface
public interface MyFunctionInterface<T> {

    public T getValue(T t);

    default void defaultMethod() {
        System.out.println("this is default method");
    }

    static void staticMethod() {
        System.out.println("this is static method");
    }


    public boolean equals(Object obj);
}

我们可以在接口上使用@FunctionalInterface注解,如果使用 Intellij IDEA 可以在编码的时候就看见报错了,这样做可以检查它是否是一个函数式接口。

通过反编译,可以看到函数式接口其实就是一个普通的 java 接口类,如下图。

函数式接口可以作为方法参数传递 lambda 表达式,但是为了将 Lambda 表达式作为参数传递,接收 Lambda 表达式的参数类型必须是与该 Lambda 表达式兼容的函数式接口的类型。但是我们没必要为每一个 lambda 表达式创建接口,在 jdk 的 java.util.function 包下面已经为我们创建了常用的函数式接口,其中比较核心的是消费型接口(Consumer),供给型接口(Supplier),断言型接口(Predicate),函数型接口(Function)四个接口,能够满足大部分应用场景。

lambda 表达式原理分析

继续使用上面的测试代码,可以在 IDEA 中使用 jclasslib Bytecode viewer
插件查看 MyFunctionInterface.class 源文件。
安装完 jclasslib Bytecode viewer,会在 view 菜单中出现如下两个选项

选择需要反编译的 class 文件,点击 Show Bytecode with Jclasslib 选项会出现如下界面

可以看到里面编译器多生成了 lambda$main$0 和 lambda$main$1 两个私有静态方法,属性当中多了 InnerClasses。我们可以通过 Show Bytecode 查看一下测试类字节码更详细的反编译结果,找到这两个静态方法。

// access flags 0x100A
private static synthetic lambda$main$1(Ljava/lang/String;)Ljava/lang/String;
 L0
  LINENUMBER 6 L0
  ALOAD 0
  INVOKEVIRTUAL java/lang/String.trim ()Ljava/lang/String;
  INVOKEVIRTUAL java/lang/String.toUpperCase ()Ljava/lang/String;
  ARETURN
 L1
  LOCALVARIABLE s Ljava/lang/String; L0 L1 0
  MAXSTACK = 1
  MAXLOCALS = 1

// access flags 0x100A
private static synthetic lambda$main$0(Ljava/lang/String;)Ljava/lang/String;
 L0
  LINENUMBER 5 L0
  ALOAD 0
  INVOKEVIRTUAL java/lang/String.trim ()Ljava/lang/String;
  ARETURN
 L1
  LOCALVARIABLE s Ljava/lang/String; L0 L1 0
  MAXSTACK = 1
  MAXLOCALS = 1
}

可以看到两个私有的静态方法干的就是 Lambda 表达式里面的内容,那么又是如何调用的生成的私有静态方法呢?如下图,通过分析 main 方法的 L0,首先通过 INVOKEDYNAMIC 指令调用是 MyFunctionInterface 的 getValue 方法的引用,以及后面的 BootstrapMethods #0。使用 jclasslib Bytecode viewer 查看。

点击 #3,进入下面界面

点击 BootstrapMethods #0,进入如下界面

点击 cp_info #44,进入如下界面

继续点击相应的方法描述符,我们可以看到最后

cp_info #74 内容如下:

(Ljava/lang/invoke/MethodHandles$Lookup;Ljava/lang/String;Ljava/lang/invoke/MethodType;Ljava/lang/invoke/MethodType;Ljava/lang/invoke/MethodHandle;Ljava/lang/invoke/MethodType;)Ljava/lang/invoke/CallSite;

可以看到 INVOKEDYNAMIC 后面的一系列指令,最后使用 INVOKESTATIC 调用

java/lang/invoke/LambdaMetafactory.metafactory(Ljava/lang/invoke/MethodHandles$Lookup;Ljava/lang/String;Ljava/lang/invoke/MethodType;Ljava/lang/invoke/MethodType;Ljava/lang/invoke/MethodHandle;Ljava/lang/invoke/MethodType;)Ljava/lang/invoke/CallSite;

查看 LambdaMetafactory.metafactory 的方法,里面通过 InnerClassLambdaMetafactory 生成了 CallSite 的子类 ConstantCallSite,当通过指令调用 CallSite 会返回函数式接口的实例,而生成接口实例的方式是通过内部类的方式,由于方法比较深,就不继续贴代码了。

public static CallSite metafactory(MethodHandles.Lookup caller,
                                   String invokedName,
                                   MethodType invokedType,
                                   MethodType samMethodType,
                                   MethodHandle implMethod,
                                   MethodType instantiatedMethodType)
        throws LambdaConversionException {
    AbstractValidatingLambdaMetafactory mf;
    mf = new InnerClassLambdaMetafactory(caller, invokedType,
                                         invokedName, samMethodType,
                                         implMethod, instantiatedMethodType,
                                         false, EMPTY_CLASS_ARRAY, EMPTY_MT_ARRAY);
    mf.validateMetafactoryArgs();
    return mf.buildCallSite();
}

CallSite 持有 com/para/lambda/MyFunctionInterfaceTest.lambda$main$0 方法的句柄,这个句柄会调用该方法。

所以使用 lambda 表达式的地方,会在类编译的时候在本类中生成对应的私有静态方法和一个 INNERCLASS 的访问标识(具体是什么东西没找到资料,注释显示是一个访问标识),该访问标识会调用引导类加载器动态生成内部类,该内部类实现了函数式接口,在实现接口的方法中,会调用编译器生成静态方法,在使用 lambda 表达式的地方,通过传递内部类实例,来调用函数式接口方法。

总结

本文从 lambda 表达式、函数式接口的介绍和对 lambda 表达式底层原理的分析来认识 java 中的函数式编程。函数式接口本身就是一个普通的接口,而 lambda 表达式本质上和匿名内部类是一样的,只不过条件更加苛刻。使用 lamda 表达式可以以一种更优雅的方式来编程。

参考
jclasslib bytecode viewer

如果觉得我的文章对您有用,请随意打赏。您的支持将鼓励我继续创作!
No Reply at the moment.
需要 Sign In 后方可回复, 如果你还没有账号请点击这里 Sign Up