灌水 测试人员为什么要搞 ai

一代人 · 2026年01月28日 · 最后由 996 回复于 2026年01月30日 · 5411 次阅读

最近各公司都在搞 ai 提效,大家热议的话题也是 ai 提效,自己也一直关注着 ai 这块的动态,虽然了解的不多,但是一直持续关注着吧
去年和一位前领导及前辈聊天他点了我一下要关注这个方向,事后开始关注这块的动态,当时大家提效的场景议题还不多 ---- 需求转用例、代码提交的检查、还有个自动转自接口自动化的,但是最实用的还是需求转用例,只听说一些大厂可能自己训练模型搞,中厂调 openapi 搞,小厂自己乱搞;我自己就是小厂,自己在本地弄了个 小 demo 下载了几个模型试了下需求转用例,效果还行,然后试了调 openapi,确实不错
后面有个大佬@Tttt用 ai 写了原型图自动转 ui 用例再执行出报告的
再到去年年末,看了高飞老师的 cursor 使用视频,然后自己也搞了个 cursor 白嫖了几天
我发现身边有些朋友都在用 ai,那么,测试为什么要用 ai,意义在哪里,提效么,那主要是提了哪里的效,测试执行效率,回归测试效率?
比如现在的 ai 测试平台,假设它适用于复杂系统,并且在转需求,用例这些环节加了人审,用例执行完真的敢上线吗
或者说需求转用例,一方面需要人审介入,另一方面也丢弃了自己逐句理解分析需求的过程,对需求和用例的理解势必比之前略浅,再者就是可能需求或者用例本身看上去没有问题,但是会漏掉很多场景,当然,我们肯定可以在后面执行过程中中慢慢总结完善
回到问题本身,跟提效无关且有关吧,应该是适应介入 ai 后的节奏吧,现在我们公司产品用 ai 写需求出原型图,ui 也会借助 ai,开发用 ai 写代码,以后的趋势就是,敏捷节奏会非常快,特别是小厂,本身项目过程就不标准,如果测试还用传统的自动化和手工去覆盖,应该是搞不过来的;另一个点高飞老师的视频有提到过,开发用 ai 写代码后,新产品还好,如果是迭代需求,很可能开发自己也不知道是否会有回退问题,可能有的开发很负责每次都会检查 ai 改了哪些代码,但是如果系统足够大,改动足够多的时候呢,那就只能加一项咯 ------ 测试用 ai 进行常规的手工测试
第一次发文,有点混乱,不好意思

共收到 21 条回复 时间 点赞

我在的公司基本全民 AI,产品研发测试都是在 AI,其实绝大部分人就是拿着锤子找钉子,无论什么方向都尝试用 AI “重塑”,这个思路是没问题的。

但正因为这个思路是很普遍,所以越是容易想到的想法就越多人挤,AI 的出现让很多问题似乎变得不再复杂了,但复杂度并没有消失,多数时候是从工程复杂度转化为给 AI 多维输入的复杂度。

同时一个错误的方向是,很多人想着靠 AI 一把梭把问题全解决了,但 AI 幻觉永远存在,AI 不会懂它没学过的东西,外部一定要尽量把可以确定的东西做成确定性,不要每次都让 AI 玄幻解决。

回到 AI 生成用例这个方向,可能是作为 QA “拿着锤子找钉子” 的前三个冒出来的想法,就类比研发第一个想到 “ AI 能不能根据需求文档直接生成需求所有代码” 一样,太广太泛,以至于第一眼让人以为很容易做而放松警惕(的确撸一个原型可以说毫无难度),实际上是非常难做的。

为啥难做?大家想到的是喂给 AI 需求文档,技术文档,进阶一些地再喂研发需求代码实现,但本质上,AI 不知道你的测试环境(有什么工具、用什么平台)、用例规范、功能历史上下文、业务特性……本质上就是 context 不够,所以【AI 生成用例】我个人感觉步子太大有点扯蛋。

但从始至终,基座模型还是会越发强大,下限越来越高,哪一天 AI 确实能一步到位生成用例了,咱们就失业了。

昨天刚开完会,公司今年也让全员 AI.准备搞 AI agent 了,现在的系统太复杂改为 agent。说是 4 月底必须搞出来,准备去拉投资。作为测试,我真不知道这个 agent 怎么测😂

王稀饭 回复

小厂目前还好,本身需求比较饱和,业绩平稳发展,老板暂时没有降本的心思,只是提了些简单的 ai 应用需求,没有强推研发搞 ai。
不少公司已经开始要求且开始挥刀裁员 ing 了,有的公司还要求开发必须用 ai 写代码,还会用工具检查开发的代码是否是 ai 写的,ai 提效必须 5 倍以上......ai 发展实在太快,后面肯定会逐步批量失业的

RR 回复

摸着 deepseek 过河呗

挺无聊的;
通义灵码 +Cursor,提效了工具的开发,其他目前没提供什么帮助

看现在的 ai 生成用例,直接一步到位生成执行用例输出报告,有没有先理解需求生成功能用例会不会 好一点

一个 AI 开发代码,另一个 AI 测试代码,再一个 AI 搞第三方审计评测,然后另一个 AI 搞安全渗透。。。没人什么事儿了😂 除了背锅签字

王稀饭 回复

这个时间是半年还是一年啊,头顶的剑不知道啥时候就掉下来了

sxxz 回复

不能一步生成,正常应该介入多次人审,并根据人审不断优化总结提示词等

香百果 回复

公司质量高层求变,核心逻辑还是降本,反正已经陆陆续续有人头顶上的剑掉下来了

20 年的时候,卷 web 开发,测试平台。
25 年的时候,卷 prompt,mcp,agent。
赶上就赶上了,也可以不搞。

王稀饭 回复

还是小厂好,没有质量高层,都是小卡拉米

RR 回复

Agent 的质量=工程质量 + 效果评测

效果是建立在稳定的工程之上的,就像草莓蛋糕,底下的胚子是工程质量,上面的草莓是效果。

就拿近期比较火的 skills 做例子吧,就算 llm 已经被大家承认能力很强,也需要各种 skills 进行 token 压缩或者更具体更明确更效率的结果产出。我们用 AI 也只是在现有的流程工具下,增加 agent 角色的引入,它解决了一些显而易见的效率提升质量提升,但是这之后呢?挖掘额外的质量和效率依然是一个大的课题,然后重新回到 agent 角色和流程引入替换。

AI 确实好用,啥都能问,sql 和脚本我都直接交给 ai 生成了
小厂自己乱搞也是真的,难道公司真指望我拿个笔记本电脑折腾吗,openai cursor 就免费的用用,目前的使用频率还没打算付费给自己提效上班,涉及公司内部资料喂给这些也有担心惹麻烦,我也认为 AI 好用,更多是解决问题方便了,但还不到互联网、移动设备等像基础设施一样能让我愿意每月固定为其额外支出
另外对于公司来说,人提效了,AI 还要额外支出,不降本那不就是在亏

兄弟你这种小 demo 都是去哪些平台上找的

Seven 回复

deepseek

RR 回复

我猜可以这么侧:看你们 agent 能干什么,先梳理正常场景去发指令,再梳理边界场景发,在搞异常场景发,在搞性能测试和大数据量场景发,看它的正确率呗

所以到底想讲什么:自己在本地弄了个 小 demo 下载了几个模型试了下需求转用例,效果还行,然后试了调 openapi,确实不错 然后又说:测试为什么要用 ai,意义在哪里,提效么,那主要是提了哪里的效,测试执行效率,回归测试效率? 总结我想说的:你觉得需求转用例效果还行,你问 ai 意义在哪,那你体会的效果还行是什么

见仁见智咯,那就是讲了个寂寞呗

996 回复

MCP 加强了知识库的学习; 但是在日常工作中比较少用到,还是喜欢直接在知识库中搜关键字

然后,有些复杂的大数据处理相关的命令,会问下 AI;
结论:提效是有的,工作内容范围内:比人要聪明点

需要 登录 后方可回复, 如果你还没有账号请点击这里 注册