测试报告风波

小菜:大鸟,最近的那个 XX 接口测试完成了,发现了一个性能问题,我感觉自己萌萌哒😆
大鸟:😄哦?让我看看你的报告。

XX 接口 12 小时稳定性测试中,TPS 从 78 下降到了 18,应用服务器 CPU 从 50% 飙升到 95%,存在性能问题

TPS:

应用 CPU:

大鸟:😰 你这报告给项目组发过去有什么意义?项目怎么要怎么优化呢?
小菜:我只是一个测试人员,发现 BUG 就可以了,优化是开发的事😆
大鸟:我要是开发肯定 neng(第 4 声)死你 信不信😤 ?来来来 把测试数据拿来 我来帮你分析一下。

12 小时稳定性测试时,XX 接口在执行 2 小时后 CPU 瞬间上升并且 TPS 急剧下降。

应用 CPU:

TPS:

CPU 上升后 Sys% 占用部分(红色)明显上升,怀疑系统处理部分压力上升,我们继续查看 IO 和 net 相关数据,发现系统 IO Write 在此时上升明显。

NET:
无图,待补
IO:

再登录到应用服务器,查看磁盘情况 发现 App-log 磁盘已满。

磁盘空间:

此时可以初步判定问题原因为日志盘符在大数据量交易下爆满,导致 IO 频繁降低了应用的处理能力。

小菜:哈哈😄原来是磁盘空间满了导致性能下降了啊,这下可以交差了。
大鸟:交差个鬼啊💢,分析还没有结束呢。

XX 接口在执行 2 个小时即执行 2*3600*70=504000 笔交易后,产生了 20G 的交易日志量,日志磁盘空间不足后 TPS 下降了 70%, 且 CPU 使用率 达到 95%。
1 笔交易的日志产生量大约为 40KB 左右, 建议项目组根据生产实际交易量调整日志策略。

大鸟:这样你的测试报告差不多才算合格了。一份好的性能测试报告不仅要标注缺陷问题,更要对产生的问题进行深入分析,并提出相应的解决方案。
小菜:😢 这才算合格啊...看来我的性能测试道路还很长呢。


↙↙↙阅读原文可查看相关链接,并与作者交流