接口测试 自动化测试落地为什么那么难

CKL的思考 · 2024年03月06日 · 最后由 704280139 回复于 2024年04月02日 · 12295 次阅读

提起自动化测试能力,作为现在测试人员技术能力体现的一部分,越来越多的人关注到这部分能力的提升。但是,很多团队的落地效果并不佳,在轰轰烈烈的开始中,慢慢沦为 PPT 产物。那么,如何让团队真实地享受到自动化带来的提效呢?结合个人在不同公司的落地情况,说说自己的想法。

01 管理好预期

提效从来不意味着降本,如果你是想通过自动化测试,来减少测试人员的数量,节约人力成本,以此为目标的话,大概率是失败的。个人认为,自动化测试的意义在于构建快速反馈的能力,不论是集成在 CICD 流水线上,还是作为线上巡检的一部分,都能够提升质量反馈的速度。在敏捷研发的大环境下,快速反馈能力是必不可少的。不能让测试执行成为团队交付瓶颈。

记住这个初衷,它将影响后续一系列的动作。不要让它变形了。

02 自动化的前提是标准化

在之前的《通过抓包能否做好接口测试》中,有提到过,只有标准化后,才有可能自动化,很多测试负责人仅从测试的角度出发,通过一些取巧的方式来实现接口自动化(比如通过 Curl 或者录制 har 文件,来实现接口测试),虽然能在短期内看似落地了接口自动化,但是缺乏对接口的理解,是无法长期执行并产生效果的。

这里的标准化,指的是接口文档的时效性问题,很多团队也有自动维护的接口文档,但都是第一稿的信息,后续在实现过程中的变更都没有办法在文档中体现,那么做接口自动化就会非常的痛苦。

所以,推动上游的接口标准化、实时性,就成为关键问题,其实这是个双赢的事。对研发而言规范了接口,自己联调也方便。并不难推动。

03 需要具备工程化思维

如何解决第 2 点的问题呢?你不能期待让研发人员手动去维护接口文档,也不能期待研发人员主动告诉你接口变更了,这是不现实的,也不要抱怨。解决这类问题,需要从工程能力的角度去着手。基于现在的研发能力,不论是 Swagger 还是 ApiDoc,都有能力直接从代码工程上自动生成接口文档,而且还是实时的。

个人的实践是,如果团队比较小,那就直接引用 Swagger 的标准化框架,然后直接对接 Swagger 路径,去自动解析接口,监听接口变更。如果团队较大,可以写个 SDK,来主动上报 Swagger 路径,从而获取接口信息。

一个完整的接口自动化全链路大致如下:

这样对研发而言,改动量最小,又能规范研发代码,让研发主管也能从中受益,相互绑定利益,推动起来也容易。

04 贴合实际业务的场景化脚本

很多时候,自动化测试沦为鸡肋的原因是,大多数的测试用例都只是单接口的用例,通过参数的等价类、边界、异常值作为人参就完事了。不是说这类测试不重要,而是真的没太必要把时间花在这上面。这些完全可以通过接口定义和参数注解来约束,出问题的概率不大(做好 Code Review 和静态扫描,用好框架,能解决 90% 的这类问题)。

从测试覆盖的角度看,我们更希望看到的是多接口串联场景,能够真实地模拟业务操作,把数据流完整地跑通,配合上有效的检查点,来帮助我们发现、拦截问题。

这部分的具体内容,可参考《接口测试这么玩才明白》。

所以,贴合实际业务场景的链路接口操作,合理的检查点设置,才能让自动化有效地运转起来,能帮助我们有效地去拦截问题。测试用例的数量和覆盖率并不是我们追求的数据。切记。

05 最大化接口测试的价值

基于接口自动化的脚本,我们还可以做很多事,让这件事的价值最大化。常见的有以下几类:

CICD 门禁:由于自动化的执行效率高,可以集成到 CICD 中,作为质量门禁的一部分,把问题拦截在开发环境,及时反馈问题。

造数工具:在合理的参数化场景下,多数接口测试场景都能用于测试数据的制造,特别是对于链路比较长的前置数据,接口造数是个非常可行的方案

辅助回归测试:基于接口自动化测试,可以快速覆盖核心功能,把时间节约出来,做针对性的专项测试或者对新功能进行验证。前提是你的用例足够清晰和健壮。

线上巡检:线上环境的拨测已经被越来越多的团队重视,也是测试右移的一项重要能力,自动化测试可以作为业务线上巡检的一部分,快速发现问题。

06 小结

自动化测试是构建测试人员快速反应能力的基本要求,也是提升效率的有效手段,它需要前期的投入,标准化的维护以及有效的测试用例设计,才能最大化地发挥它的价值。自动化测试的负责人,需要具备推动标准化落地的能力,并让自动化在更多的地方体现出价值来。

任意一项技术手段的推广与实践,不论是研发过程的规范,还是测试活动的规范,都不是一次性的投入,都需要长期持续地投入维护,潜移默化地影响其他人

关于自动化测试的 ROI,东东也写了一篇估算的文章,大家可以参考下:自动化测试投入产出效益与价值

共收到 20 条回复 时间 点赞

有几个问题:1.自动化测试建设的进度跟不上版本发版的进度,怎么办?2.要做动态数据的自动化吗?对应的断言校验又要怎么处理呢?3.陈老师这边接口自动化建设的规模如何,效果如何,每次执行通过率如何,不通过的都是什么原因呢?

小狄子 回复
  1. 为什么会跟不上版本进度呢?没有时间写脚本?在我的团队,迭代周期中的测试内容就会包含自动化测试的时间,而且通过工程能力的建设,所需要花费的时间也不会很长,基本上都是要求在迭代内完成对应新版本的接口自动化设计;

  2. 需要做对应的断言,具体的断言要求可参考 :https://testerhome.com/topics/36216

  3. 我辅导过多家公司的自动化测试落地,规模基本在 30~50 人的测试团队之间。效果还行吧,至少现在大家都还在坚持着做。通过率不好评估,具体问题具体分析吧。主要还是脚本和数据的问题。环境的问题通过技术手段基本上不太出现了

CKL的思考 回复

感谢老师的解答,我这边也和测试团队一起做了多年的自动化测试,感触颇深,因此还有些问题想继续和老师探讨:
1.关于 1 自动化跟不上版本进度的问题,您所在团队迭代周期中,自动化测试用例调试编写的时间在总测试时间的占比是多少?写不写手工用例?写的手工用例能否直接转为自动化用例?
2.关于通过率,如果自动化的通过率/稳定性堪忧,如何能让人信服自动化的测试结果呢?所以我才问您所在团队的自动化通过率是多少。
3.对于一次非 100% 通过的自动化测试,这次结果怎么算?那些没有通过的用例,又是怎么处理的呢?是要把这些用例改对,还是认为是误报?
4.自动化测试发现过缺陷吗?发现缺陷的频率大概有多高?
5.咱这边接口串联场景引用接口数量的中位数大概为多少?最大为多少?
盼望您的具体回答,最好能列举具体示例,少些 “政治正确、套路正确” 的表述

完全当 kpi 做,回归用例不合格、本身对自动化没信心、完全不花时间运营 ,普罗大众工作赚钱吃饭,自动化和手点完全不影响吃饭

小狄子 回复
  1. 自动化脚本的编写在一个迭代内基本上一天搞定,会有基本的用例设计,再动手写脚本;

  2. 通过率不好算,基本上有问题就马上排查解决,如果是误报或者数据错误,需要及时修复脚本。我们对于自动化用例有降级机制,连续失败 5 次后,就会被踢出用例集,进入修复库,这个修复库会邮件通报的。所以解决问题的速率还行。

3.对于报错,人工分析是什么原因,不自动上报,是 BUG,就是 BUG,是误报,就按 2 处理;

  1. 肯定发现过缺陷,特别是接口变动没有通知上下游的,导致关联业务报错。但不会很多,因为也不是自动化的主要目标;

  2. 接口场景的接口数在 15~20 之间吧,长的也有 40+ 的,再多就建议拆分了

以上,不知道对你是否有帮助。可以加微信细聊

CKL的思考 回复

感谢陈老师的回复,我仍然关注一些具体数据,具体疑问如下:
1.“您所在团队迭代周期中,自动化测试用例调试编写的时间在总测试时间的占比是多少?” 您回复说 “在一个迭代内基本上一天搞定”,并没有直接回复比例,您所在团队一个迭代周期是多久?2 周吗?所以我关注占比,想看看能力优秀的团队做自动化到底会花费多少项目资源,我们目前距离优秀团队还有多少差距。
2.如果有问题立刻就解决,为什么通过率会不好算呢?难道每次执行都会有不通过的用例吗?连续五次执行失败会进入修复库,这种需要修复的用例的平均修复时间大概是多久呢(从进入修复库到修复完成)?
3.咱们的自动化执行频率又是如何呢?每次全量执行,耗时大概多久呢?
4.您所在团队的自动化用例是否考虑异常场景?如考虑,异常场景会考虑到什么程度?
盼望老师的解答。

小狄子 回复
  1. 双周迭代
  2. 为什么要算通过率呢?这并不是个很有用的指标,通过率的高低并不能说明什么,我们没关注这个指标;如果执行失败,我们的要求是 2 天内必须解决。
  3. 执行频率是分等级的,对于 P0 的级别的,集成到流水线上,每次 Merge 到保护分支都会触发,其它级别的每天至少运行一次;
  4. 会考虑异常场景,验证是否做了足够友好的提示,我们原则上不允许直接抛出代码异常。
CKL的思考 回复

确实是优秀团队的能做出来的理想情况了,给您和您的团队点赞

精彩的对话 为两位老师点赞

自动化提效不能带来降本,这都说不过去,上层是没办法理解的。

精彩的对话,很受用

恒温 回复

我之前给老板打过一个比喻,可能不是很正确:就像你平时公交上班,今年买了个车。是提效了,不管去哪里都方便,也能省出点时间做别的。但是,成本肯定是增加了。和自动化一样,它能提效,能在更多的地方发挥作用,但肯定是无法降本的。

如果是出于降本的考虑,有其它更多更快速的办法,不是么?都懂的。

CKL的思考 回复

提效的逻辑,收益的地方能有量化的指标出来,业务方认都好说。现实并不是这样的,成本之间的关系都很难理清,更别说考虑你自动化的提效了。所以最直观就是既然提效了,如果说你提效 50%,那我就可以减掉你 0.5 个人。

恒温 回复

同意恒温,我们这边的提效的最终目标,也是铆定优化研发测试比去搞的(如降低外包同学的数量,从而节省人力的经济成本),或者在相同的人口和保持相同质量的前提下接更多的活干。但研发数量不变的前提下,测试活就这么多,业务盘子也不会突然增大,所以更多时候还是选择优化研发测试比。


【提效从来不意味着降本,如果你是想通过自动化测试,来减少测试人员的数量,节约人力成本,以此为目标的话,大概率是失败的。个人认为,自动化测试的意义在于构建快速反馈的能力,不论是集成在 CICD 流水线上,还是作为线上巡检的一部分,都能够提升质量反馈的速度。在敏捷研发的大环境下,快速反馈能力是必不可少的。不能让测试执行成为团队交付瓶颈】

对于这段话,我的理解不太一样。

  1. 注意主语是【自动化测试】,然后才泛化成【提效】。自动化早期建设它反而会带来成本,要建设就需要人力代价,而收益也只会在建设完成之后才会拿到。来到现实上,很多自动化建设因为里程碑拆分不清晰,或者阶段性建设没想清楚,往往都是憋大招的形式去搞,周期长难度大,但凡中间翻车了就是 0 收益,剩余的全是成本。所以才会给人带来一种错觉:自动化建设需要很大的成本,而这个成本往往大于收益(因为收益根本就没出来过)。

  2. 自动化测试确实构建了快速反馈的能力。举个例子,有一个未知的线上问题,因为自动化巡检,让研发测试提前于用户发现出来并修复,这里面包含质量和效率的双重收益。【质量】体现于早于用户发现问题然后解决,那对于用户来说这个问题就不存在了,质量就更好;【效率】体现于因为自动化建设,有了明确的复现路径,不需要很费力排查与定位。那这种【快速反馈的能力】是不是就是提效,是不是就能让本来 2 个人做的事情缩减成 1 个人做的事情?所以换句话说,做自动化就是提效->降本的一种路径,当然它不是唯一路径。

  3. 举的例子存在我个人认知的局限性。以互联网的常规操作说,多数先从获取流量开始,然后考虑变现。获取流量需要在短时间内快速占领市场,这种行为本身有巨大成本,包括但不限于招聘超出业务所需的人来迅速支撑业务盘子。当业务发展起来,大环境如果不好,就面临一个多少有点卸磨杀驴的问题:“早期为了业务发展搭建了偏冗余的团队,造成相对大的信息流通和决策执行成本,现在希望通过精简团队的方式来让团队对市场响应更敏捷,决策落地更迅速,同时增大业务利润率,我能通过什么方式来让同样的钱做更多的事/节省开支?”,大概率不会是 “我是不是要花更多钱招人,把质量做好,从而获客更多”。之所以这么说,我认为当产品质量到达一个阈值之后,再提升质量 ROI 就很低,所以质量和效率在业务不同阶段各有侧重,效率引出来就是人力成本。【第 3 点有些跑题,但是刚好联想到,试着探讨了做自动化的一些前因后果】

大佬们 对于存在业务逻辑的线上巡检 不可避免的要对正式环境进行增删改操作,会影响正式环境的数据,那应该怎么避免呢?使用一些字段的特殊数据(如联单号字段 写为 testnumber)吗?

王稀饭 回复

可能是行业不太一样吧,我所在行业是制造业的 IT 部门,所以没有那么紧迫的本成压力,所以自动化的目标并不是以减少人员为目标来展来的。聊下自己的观点,仅供参考:

  1. 关于自动化平台的建设周期,在很早的文章里有提到过,是围绕能用 -- 好用 -- 优化使用 来构建的,每个阶段都会有具体的产出和收益,个人也比较反对一上来就规划太多的功能,把平台做的太大,周期太长。

  2. 快速反馈的能力是提效的表现,但也不太可能因此就把 2 个人做的事缩减成 1 人,因数快速反馈的能力构建本身也是有成本的,无非就是看把成本花在哪,是花在人力验证上,还是花在维护自动化上。可能成本是一样的,但是带来的效果是不一样的。

  3. 你提到的案例我也经历过,不同阶段的产品形态对质量的要求是不一样的,对团队的组织结构也是不一样的。这个是肯定的,所以测试人员也需要学会识别业务对质量的要求,并不一定非要开展自动化。

CKL的思考 回复

或许你可以换个方式想,用车的成本能节约你多少时间?假设你的工资是 250 元/小时,开车让你上班少了 1 个小时的时间,产生的费用是 30 元的油费,那你是节省 220 元的成本。

难以怀瑾 回复
  1. 操作数据的账号是被标记的测试账号,其数据库增删改权限有限制,产生的数据可以通过账号来辨识以跟踪,实现和线上真实用户的数据隔离
  2. 操作数据本身是有明确测试特征的数据,可被辨识并删除
王稀饭 回复

谢谢大佬解答 普通有界面的增删改可以使用 1 ;来自于消息队列的数据就可以使用 2 了

如果是游戏行业主要用的是 TCP 协议的有什么办法能上手吗

CKL的思考 我的 2024 年终总结 中提及了此贴 12月27日 16:00
需要 登录 后方可回复, 如果你还没有账号请点击这里 注册