QTA自动化测试 [QTA] Android 动态注入原理分析

匿名 · 2019年04月25日 · 8737 次阅读

一、前言

Android 的 UI 自动化测试可以通过注入式和非注入式分别实现，通过注入式可以更加方便地与应用进行交互。QTA 团队提供的 Android UI 自动化测试框架QT4A, 是通过动态注入的方式来获取被测应用的控件树信息等，从而达到自动化测试的目的。本文主要介绍该动态注入的原理。

二、Android 动态注入概述

QT4A 中的动态注入是借助 ptrace 函数，该函数常用于断点调试或系统调用跟踪，由于其动态附着到远程进程的特性，我们可以在 Android UI 自动化测试中加以利用。QT4A 框架中将测试桩 so 动态库链接到被测应用进程空间，使得 so 中的函数在被测进程有对应地址，通过该地址即可在被测进程中调用 QT4A 的函数，与被测应用进行交互。

三、Android 动态注入条件限制

需要注意的是，通过 ptrace 函数虽然可以跟踪进程，修改被跟踪进程的内存和寄存器值，但正因其强大的能力，它也需在以下任一条件下满足才能成功执行：

设备已越狱 (root)
设备未 root 情况下，只能注入具有相同 uid 的进程。在 Android 中，可以通过如下两种方法达到：
- 重打包 QT4A so 到被测 apk 包中实现；
- 部分支持 run-as 命令的 Android 设备,也可以通过该命令切换到被测应用 uid 下再进行注入,该命令可用情况下则无需重打包。

QT4A 结合了这两种方案实现非 root 下的动态注入。

四、Android 动态注入整体流程

为了方便看结果，我们以注入一个简单的 so(hello.so) 为例，而不以 QT4A 真正的 so 为例。hello.so 主要包括了一个入口函数，主要代码如下：

int hook_entry(char * a){
    LOGD("Hook success, pid = %d\n", getpid());
    LOGD("Hello %s\n", a);
    return 0;
}

我们目标是将其注入到被测 Android 应用进程中，预期结果是在被测应用中输出上述日志内容。整体注入流程图如下：

首先通过 PTRACE_ATTACH 附着到远程进程：

ptrace(PTRACE_ATTACH, pid, NULL, 0)

在开始加载我们的 so 之前，我们先把远程进程的现场进行保护:

ptrace_getregs( target_pid, &regs )

如上，获取远程进程 (进程 id 为 target_pid) 的寄存器,然后将其保存到 original_regs 中:

memcpy( &original_regs, &regs, sizeof(regs) );

加载 hello.so 后可以恢复现场并解除进程跟踪：

ptrace_setregs( target_pid, &original_regs );
ptrace_detach( target_pid );

接下来重点介绍如何加载 hello.so。

五、获取远程函数地址

由于 hello.so 不在远程进程中，在远程进程中并没有 hello.so 相关的地址，要在远程进程加载 hello.so，首先需要分配内存空间写入 so，我们可以在远程进程中调用 mmap 函数为 hello.so 分配内存空间，但只有知道了函数地址才能开始调用，如何获取远程进程中的 mmap 函数地址呢？本节以获取 mmap 远程函数地址为例说明如何获取远程函数地址。

5.1 mmap 远程函数地址获取公式

同一系统库 (例如 mmap 所在的系统库 libc.so) 的 mmap 地址与 libc.so 基地址的偏移量，在当前进程和远程进程 (Android 应用) 中是相同的，所以，只要获取到当前进程的 libc 基地址 (假设用变量 local_handle 表示)、当前进程 mmap 地址 (local_addr)、远程进程 libc.so 基地址 (remote_handle)，即可根据如下公式获取远程 mmap 地址 (remote_addr)：

如上图，可获得公式：
local_addr - local_handle + = remote_addr - remote_handle，式子可转化为remote_addr = local_addr + remote_handle - local_handle
接下来首先获取 libc.so 基地址 (local_handle/remote_handle) 和当前进程 mmap 函数地址 (local_addr)。

5.2 获取 libc.so 基地址

获取进程中 libc.so 模块基地址 (local_handle/remote_handle) 的方法为:

即在/proc/{pid}/maps路径中找到模块名，其中 pid 替换为目标进程的进程 id,对应的行首地址即为模块的基地址。如果在当前进程中读取当前进程的模块基地址，可读取/proc/self/maps路径下的模块地址即可。通过该方法可求得 local_handle/remote_handle 的值。

5.3 获取当前进程 mmap 函数地址

获取当前进程的 mmap 函数地址，有两种方法：

方法一：通过 dlopen/dlsym 的方式获取，如下图：

方法二：根据 elf 文件内容格式获取符号相对基地址的偏移量，加上当前进程中 libc.so 基地址，即可求得当前进程函数地址。实现在get_symbol_offset函数中，后续可详细见开源后的源码。

两种方法可以结合调用，更为可靠，整体调用代码如下：

/*
* 获取当前进程中的函数地址
* 调用：void* local_mmap_addr = get_func_addr(libc_path, "mmap");
*/
void* get_func_addr(const char* module_path, const char* func_name) {
    void* handle = dlopen(module_path, RTLD_NOW);
    if(handle != NULL){
        void* addr = dlsym(handle, func_name); 
        if(addr != NULL) return addr;
    }
    uint32_t addr = get_symbol_offset(module_path, func_name);
    if(addr == 0) return NULL;
    return get_module_base(-1, module_path) + addr;
}

其中get_symbol_offset读取到了函数偏移值，get_module_base获取了 libc.so 基地址 (详细见《获取 libc.so 基地址》一节)，两者相加即为当前进程 mmap 函数地址 (local_addr)。
至目前为止，根据公式remote_addr = local_addr + remote_handle - local_handle，我们知道了 local_handle/remote_handle/local_addr 三个变量的值，从而可求得远程 mmap 地址 (remote_addr)。

类似的，其他远程函数地址的获取方法类似上述过程，区别在于函数所在的库不同、函数名不同而已，后续不再赘述。

六、远程进程函数调用

6.1 调用远程函数 mmap 分配内存空间

通过上一节分析，可知远程进程函数的地址获取方法，然后开始调用远程进程函数 mmap 分配内存空间,需要借助 ptrace 函数进行调用：

void* ret = ptrace_call( pid, remote_mmap_addr, parameters, 6, regs );

如上，传入所需的参数，可调用 mmap 函数分配内存空间并返回分配的内存地址。ptrace_call 函数首先会将调用的函数 (mmap) 所需的参数 (parameters) 从右到左压入堆栈，同时写入返回地址到对应寄存器中，并同步修改栈顶指针。请注意，不同的 CPU 架构所用的寄存器和数据压入方式有一定的差异，请按不同的 CPU 架构对应处理，这里总结了部分的差异：

将堆栈和寄存器值都设置完毕后，通过调用 ptrace 函数，并传入参数PTRACE_CONT使 mmap 函数得以执行。

6.2 往 mmap 分配的内存空间写入 hello.so 路径和参数

int ptrace_writedata( pid_t pid, uint8_t *dest, uint8_t *data, size_t size )

该函数实现往地址中写入字符串的功能，其中了利用 ptrace 函数提供的写内存空间的方法，通过传入参数PTRACE_POKETEXT及其他所需参数进行写入，我们首先将 hello.so 路径写入 mmap 分配的内存空间中 (remote_memory)。同理，hello.so 中的入口函数（hook_entry）如果需要传入参数，也可通过这种方法写入 remote_memory 中。更多细节请参考后续开源出来的源码。而对应的，如果需要进行读操作，则传入参数PTRACE_PEEKTEXT及其他参数。

6.3 远程进程中调用 hello.so 的函数

目前为止，我们已经在远程进程中分配了内存，写入了 hello.so 和其函数hook_entry的参数。而我们又可以通过《获取远程函数地址》一节的方法，获取 hello.so 的函数地址，用变量 remote_func_addr 表示，接下来可以调用hook_entry函数：

ret = (long)ptrace_call( target_pid, remote_func_addr, parameters, param_size, &regs );

上述 ptrace_call 的函数的详细过程参考《6.1 调用远程函数 mmap 分配内存空间》一节。
调用结果如下图：

可以看到，hello.so 中的hook_entry函数中的日志 (Hook success……) 在目标进程（2422）中打印出来了，证明我们的注入已成功。

七、总结

本文分析了 QT4A 所涉及的 Android 动态注入过程，QT4A 利用该过程注入 QT4A 测试桩到被测 Android 应用进程中，达到与应用通信的目的。整个注入过程比较关键的是获取远程函数地址和调用远程函数。调用远程函数需要首先通过 mmap 分配内存写入待注入 so(hello.so) 和其函数所需参数,同时需要维护寄存器和堆栈状态，不同 CPU 架构有所差别。

感兴趣的同学可以加入 QQ 群和公众号交流

如果你想要了解更多资讯，欢迎关注我们的微信公众号我们会定时向大家推送团队同学分享的经验文章哦。

转载文章时务必注明原作者及原始链接，并注明「发表于 TesterHome 」，并不得对作品进行修改。

2 个赞

共收到 2 条回复时间点赞

nongbochen #1 · 2019年04月30日

请问你们的 pc 端什么时候开源。

匿名 #1 · 2019年05月16日

对

nongbochen 回复

正在排期中，预计下半年开源，到时欢迎体验使用。

需要登录后方可回复, 如果你还没有账号请点击这里注册。