结论:AI 适合生成测试用例初稿和补充,不适合直接替代测试设计和最终风险判断。

如果把 AI 放在合适的位置,它能提高效率;如果把它当成最终方案,很容易生成一批 “看起来完整,但不贴业务” 的用例。

适合场景

1. 规则明确的功能

例如:

这类功能的特点是:输入、分支和预期结果相对清楚。

推荐提示词:

请根据以下需求生成测试用例,先列业务规则,再按正常场景、异常场景、边界场景输出。

2. 旧用例整理

AI 适合做第一轮清洗:

这类工作可以节省整理时间,但最终是否保留仍需人工判断。

3. 边界场景补充

在已有用例基础上,可以让 AI 从多个维度补边界:

推荐提示词:

请基于已有测试用例,从时间、权限、库存、金额组成、状态切换维度补充可能遗漏的边界场景。

谨慎场景

以下场景可以用 AI,但必须人工重审:

原因是这些功能的关键规则往往不只在需求文档里,还可能来自:

如果不给 AI 这些背景,它生成的用例可能很标准,但不适合当前项目。

不建议直接交给 AI 的场景

1. 探索性测试

探索性测试的重点不是提前列全用例,而是边观察、边怀疑、边调整方向。

AI 可以提供探索清单,但不能替代现场判断。

2. 测试优先级最终判断

比如:

AI 可以给排序建议,但最终优先级需要结合项目背景、近期改动、线上事故和业务影响。

3. 高风险上线决策

AI 不应该承担上线风险判断。它可以帮助整理信息,但不能替代负责人做决策。

推荐工作流

需求/旧用例
  -> AI 提取规则或整理初稿
  -> AI 补充正常/异常/边界场景
  -> 人工审查业务规则、状态、边界、风险
  -> 人工确定优先级和执行范围

这个流程里,AI 的位置是 “初稿助理”,不是 “最终评审人”。

判断表

适合让 AI 先写:

可以用,但必须人工重审:

不建议直接交给 AI:

一句话总结:AI 写初稿,人做判断。


↙↙↙阅读原文可查看相关链接,并与作者交流