结论:AI 适合生成测试用例初稿和补充,不适合直接替代测试设计和最终风险判断。
如果把 AI 放在合适的位置,它能提高效率;如果把它当成最终方案,很容易生成一批 “看起来完整,但不贴业务” 的用例。
例如:
这类功能的特点是:输入、分支和预期结果相对清楚。
推荐提示词:
请根据以下需求生成测试用例,先列业务规则,再按正常场景、异常场景、边界场景输出。
AI 适合做第一轮清洗:
这类工作可以节省整理时间,但最终是否保留仍需人工判断。
在已有用例基础上,可以让 AI 从多个维度补边界:
推荐提示词:
请基于已有测试用例,从时间、权限、库存、金额组成、状态切换维度补充可能遗漏的边界场景。
以下场景可以用 AI,但必须人工重审:
原因是这些功能的关键规则往往不只在需求文档里,还可能来自:
如果不给 AI 这些背景,它生成的用例可能很标准,但不适合当前项目。
探索性测试的重点不是提前列全用例,而是边观察、边怀疑、边调整方向。
AI 可以提供探索清单,但不能替代现场判断。
比如:
AI 可以给排序建议,但最终优先级需要结合项目背景、近期改动、线上事故和业务影响。
AI 不应该承担上线风险判断。它可以帮助整理信息,但不能替代负责人做决策。
需求/旧用例
-> AI 提取规则或整理初稿
-> AI 补充正常/异常/边界场景
-> 人工审查业务规则、状态、边界、风险
-> 人工确定优先级和执行范围
这个流程里,AI 的位置是 “初稿助理”,不是 “最终评审人”。
适合让 AI 先写:
可以用,但必须人工重审:
不建议直接交给 AI:
一句话总结:AI 写初稿,人做判断。