为什么选择这个话题？
一是发现很多 “点工” 在转型迷茫期都会问一些自动化测试相关的问题，可以说自动化测试是 “点工” 升级的必经之路；二是 Google 一下接口自动化测试，你会发现很多自动化测试框架相关的文章，但是大部分文章都有一个通病，就是只告诉读者 how(怎么做)，很少介绍 why，还有框架开发完成之后的事情（例如如何推广、维护等）。那下面就聊一聊我的接口自动化测试框架建设的一些经验和教训吧，希望能给大家一些借鉴。

工作多年，第一次听说接口测试是在《软件测试的艺术》的书上面，那时候校招复习软件测试理论，当时没有体感，甚至不知道什么是接口。第一次接触接口测试并非来源于项目需要，而是来源于团队 KPI 需要。当时校招刚入职没多久，团队内部有测试相关知识与技能培训（虽然只是测试工具的使用），当时接触的第一个接口测试工具是 JMeter。还记得我同事通过一个 word 文档给我介绍它的一些常用组件，然后就给我安排上了一个任务 - 将团队 xx 平台接口代码覆盖率提升至 40% 以上。当时还不知道代码覆盖率是什么，但是只晓得通过 JMeter 开发更多单接口/业务场景组合的用例就是了，于是乎就开始通过针对单接口的入参类型、边界、是否必传做各种组合，而场景组合用例就做接口间的笛卡尔积生成不同的业务流。第二份工作老板想打造一个团队内部使用的接口测试平台，当时就给我这个机会负责接口测试框架的建设。这也是第一次实践接口自动化测试框架。今天聊的故事就从这里开始。。。

一、为什么要自建测试框架
1.1 先谈谈接口测试
何为接口？通俗来讲生活中常见的电灯开关就是接口，它接收开、关（默认）指令（值），输出对灯泡的控制结果（亮、灭）。接口测试是测试系统组件间接口的一种测试。测试的重点是要检查数据的交换，传递以及系统间的相互逻辑依赖关系等。

1.接口测试 “套路”
根据我举的例子，可以知道对接口测试，从功能上可以把接口当做黑盒进行输入以观察其输出，根据不同的输入去测试其内部的逻辑，我们可以借助边界值分析、等价类等方法设计用例。非功能上要测试接口性能、安全、幂等。此外，如果所测接口存在上下接口调用的依赖，则还需要进行全链路联调测试（不部分接口不是独立存在的，都是和其他接口相互调用的），联调测试是为了保证上下联路接口之间契约的准确性。

2.为什么适合自动化
根据分层测试思想，可以将系统测试分为单元测试、接口测试以及界面测试。一般来说，单元测试就像一座房子的地基，地基打得好，房子也就比较稳固；接口测试就像房子的架子，决定房子的形态；而界面测试就像房子的装修，体现房子的外观。诚然，地基以及房子架子是比较稳定的，变化不大的，而房子的装修是可以根据心情不断更换的。大家都知道变化和成本是成正比的，变化越大成本越高，根据 ROI=产出/投入，分子不变，分母越大，ROI 越小，这也是界面测试不适合自动化的主要原因。当然不代表所有项目都不适合做 UI 自动化，如果 UI 比较固定也是可以做自动化的。

当然，大公司在这方面已经走在了前列了。就拿行业标杆 Google 来说，《How Google Tests Software》书中也有提到，70% 自动化在单测，20% 自动化在接口测试，10% 自动化在 UI 测试。

3.常用的接口测试工具
介绍下我使用过的 JMeter、Postman 这两工具。

总体而言 JMeter 更适合作为接口自动化工具的，虽然官网将其定义为压测工具（The Apache JMeter™ application is open source software, a 100% pure Java application designed to load test functional behavior and measure performance.）因为 JMeter 几乎能满足接口自动化测试的所有诉求，有丰富的函数（类似 utils）（例如生成个随机数、uuid 等，这些都是测试过程经常用的能力，而且还支持自己扩展）、断言丰富、结合 Jenkins 做持续集成、有测试报告、有丰富的插件库可供下载等等，非常适合技术感不强的测试团队。Postman 也是可以做自动化，但是我还没有实践过，平常更多将其作为接口调试的工具，不做过多赘述。

1.2 自动化测试目的
本来这个小标题是 “接口自动化测试目的”，提笔写的时候发现所有自动化目的貌似是公途的。我先抛出来两个论点：发现缺陷？提高测试效率？

大家可能觉得实现自动化的话，这两个目的是自然而然的。当然我不否认但也不完全赞同。那我为什么要把这两个论点拿出来讨论下呢？因为自动化测试是一个有计划的过程，不同的目的可能会有不同的实现过程，有不同的实现侧重点。

如果目的是发现缺陷，那么自动化测试用例就要覆盖的比较全面且细致（业务层面、断言层面），这无疑会加大自动化测试用例的开发成本，所以投入过程需要重点分析业务以及多排期些开发时间。

而提高测试效率呢？当然这里的提效不仅仅体现在测试过程，而且还体现在测试者的日常工作中，类似造数据等工作内容。因此如果以提效为目标，那么自动化测试用例开发要重点分析哪些业务流是调用比较频繁的，而在断言层面也没有必要太过细致，以造数为例，毕竟提效的目的在于获得结果，只要结果符合预期就是 OK 的。当然，这些都是笔者个人看法，大家可以各抒己见。

1.3 为什么需要自研框架？
上文也说道做接口自动化测试，当下有现成的开源工具 JMeter、Postman 等可以选择，也有一些开源的自动化测试平台。但是，这些开箱即用工具也有弊端：

测试工具开发的测试用例往往不易于维护，试想一下当你维护 JMeter 生成的各种 JMX 文件场景。

大量的测试用例可重用性差，例如登陆模块，每个接口调用前都要获取 cookie，而登陆则是前置模块，使用 JMeter 开发用例需要每个 JMX 文件都要包含登陆，重复度太高。

无法满足自动化平台诉求，短期内确实可以快速实现自动化，但是这些工具对于平台非自动化能力的拓展成本较高，毕竟改动开源工具的成本比自研高很多。

使用开源工具不利于提升团队在自动化技术方面的成长。自动化能力的提升离不开编程能力的提升，使用开源工具能提升工具学习使用能力，最终你的成长无外乎又掌握了一个测试工具的使用。

无法最大化提升自己解决问题的能力。

1.4 接口测试框架选型
关于语言

语言建议和负责项目的系统语言保持一致，如果被测项目语言是 Java，测试框架就选用 Java 语言开发，结合 Spring boot 框架搭建。

关于扩展性

扩展性是非常重要的，因为框架不是一蹴而就的，是一个需要基于业务的迭代不断 “更新” 的，良好的扩展性，可以让你更高效的开发所需的 feature。这点可以参考 JMeter 的架构设计。

关于实现方案

确定使用的技术后，务必要将的实现思路整理出来，写一个实现方案，就像项目的系分文档一样，这样对你来说具备指导意义。仔细想想，测试框架的开发，就是要求自己兼顾产研测的角色（条件可以的话，可以让产品/UI 帮你设计平台草图）。

二、经验沉淀
1.计划的重要性
人、事准备好后，下一步就是制定计划。万事预则立，不预则废。对于测试来说，计划尤为重要。一方面测试框架建设的任务并不会允许你 100% 工作时间去做，因为你还有业务测试工作要负责和跟进。另一方面，老板要看结果，制定每个阶段的里程碑是非常重要的，当然计划这些会在 OKR 里体现的。

以我的经验，可以制定按照 feature 数量给自己排期，例如每周实现 x 个 feature，这样就可以大概推出完成测试框架开发需要的周数，尽量周报里有所体现实现的进度，以及下周的 todo。

2.文档必不可少
为什么文档这么重要？文档其实是另一种 “自动化测试框架” 的实现方式。代码实现框架本身，文字为框架 “穿上衣服”。再者，文档可以节约你未来非常多的 “客服” 时间。文档内容范围不限，总的来说有三类：技术实现文档、使用说明文档以及问题记录的文档。

（1）技术实现文档用于描述框架实现的技术手段以及编码规范，可以在系分文档上继续补充。

（2）使用说明文档用于介绍使用方法，最好是先以快速入门为例，教大家如何利用测试框架开发一个测试用例。再详细介绍如何使用（调用）某些公共组件（工具）。当然建议录制操作视频。

（3）问题记录文档用于协作开发的时候供其他小伙伴参考使用，毕竟你踩过的坑别人也有可能踩过。这样可以减少同类问题排查和定位时间。（笔者曾经在帮助小组同学排查问题方面就耗费了不少时间。）

3.多人协作下的开发模式
自动化框架最终的是推广给大家使用它去开发接口测试用例，以替代 JMeter 这些接口测试工具。在平台化实现之前，就避免不了多人同时提交开发好的用例代码。针对这个，我建议使用 master\dev 分支，每日的自动化用例运行使用 master 分支代码，而 dev 分支用于大家提交各自分支的代码。这就需要经常 dev 分支的代码合到 master 分支。

4.做好代码 review 工作
正如经验 3 一样，确定好开发模式之后，同样不能避免有些同学在提交代码时 “乱来”（不规范开发和提交，例如随意修改别人的代码等），导致代码冲突。而作为项目的负责人，就像一个门神，要做好代码 review 工作。这样可以在一定程度上降低代码冲突的概率。总之尽量不要将宝贵的时间消耗在这些代码管理的问题上。

5.推广小组试用
框架开发好后，不建议急于大批量推广，建议先 “小流量” 灰度试用。我们大团队下面分了很多小团队，基本上业务 owner 带一些外包保障项目质量。而管理者注重框架的结果。框架开发者是全职员工，框架的使用者主要是外包和偏业务测试全职同学。当时搞定框架开发之后（算是 1.0 版本，已经可以使用），就在我的小组进行使用。这样可以先搜集一下使用效果和反馈的问题，先做一版小迭代，把他们觉得比较影响使用的问题先解决掉。

6.分享和培训
先给大家做了一次分享，演示框架操作原理，如何开发接口测试用例。为了让大家好理解，我就拿 postman 的使用步骤和框架测试一个接口做类比。即使如此，大家刚使用测试框架时候仍遇到了不少问题（也是意料之中，大多数外包几乎 0 编程经验），包括接口测试用例开发成本高，外包同学代码能力差遇到问题解决不了，不会 debug 代码，开发好的用例上传 gitlab 经常搞出冲突需要解决，每个同学用例的写法千奇百怪等等。还记得当时那段时间的内容，除了做手上的业务就是帮忙看大家在写用例遇到的各种问题。为了解决这些问题，我也挤时间编写测试框架使用说明书，对大家进行 git 使用培训，debug 培训等，鼓励大家多学点 Java，多读读《Java 编程思想》。

7.注重大家的使用反馈
使用反馈是非常重要的。因为它是你进行版本迭代的驱动力。其实就和产品做项目一样，每个版本都要分析用户的使用反馈，根据反馈进行版本优化和迭代。可以和使用者沟通，发现一些他们使用过程的痛点。当然这只是第一步，更重要的是要有解决方案。

8.考虑代码生成
针对用例开发成本高的问题，我通过在测试用例开发过程总结到 HTTP 不同请求方法对应的接口测试写法不一样，同方法的测试接口写法几乎一致，突然想到可以使用模板（freemarker）自动生成接口测试用例，然后我就整理几种接口测试用例生成模板（post、get 等），这样大大降低测试用例开发成本，大家更多在于测试数据的准备和断言。

个人觉得代码生成是每个测试框架设计的必须考虑的点，因为像 postman、jmeter 等这些工具本质上和你开发测试框架是雷同的，如果做到用例之间可以相互转化，可以提高用例的可迁移性和复用性。

三、教训总结

1.缺乏自动化效果的统计&度量
上文说了，相比过程，老板更看重结果。如何体现结果，那就是要有数据统计与度量。记得被开发挑战过，你们搞得自动化发现了多少缺陷、节约了多少时间等问题。这块当时做的不好。

1 是框架本身还没有平台化，当时实现的功能是测试用例开发模块的实现，统计数据没有落 DB，这块需要靠人工统计比较费时间（当时为了统计自动化用例运行结果数据，在 Jenkins 服务器上捞日志，简直是痛苦）。
2 是当时没有明确的度量目标，像节约了多少时间这类，确实难以衡量。

现在我觉得当时的框架设计之初是遗漏了这个问题的，建议后来者可以将测试数据都落 DB。

2.没有对测试进行测试
这个主要是没有对测试框架本身进行测试，特别是多人协作开发模式，单测尤为重要，单测在一定程度上是保障代码质量的手段，可以有效避免部分同学 “乱改” 别人的代码。当然，如果时间充足，建议对测试框架写单测。

3.自动化用例开发计划没有突出侧重点
这个也是教训 1 的一个原因。框架完成之后，我们就在 okr 里计划 xx 完成接口 100% 自动化覆盖，刚开始阶段没有对被测接口重要性做分析，导致没有将时间花在核心的接口用例开发上，也间接导致产出不高。

现在想想，其实是计划不明确且没有突出重点的问题，颗粒度还不够，现在的建议是大家要优先实现核心接口，这些接口流量大，更容易有产出。不要为了追求覆盖率而本末倒置。

4.断言的不完善
当时的框架没有开发 DB checker，所以断言全靠 http 响应，其实这样的用例是质量不高的，也就是测试预期不全面，可能会存在漏网之鱼（遗漏缺陷）。

建议大家一定要断言模块重点考虑到。包括 http 层面（响应时间、响应码、key 字段断言、状态码等）、DB 层面（key 字段值比对等）。

↙↙↙阅读原文可查看相关链接，并与作者交流