AI测试【转自群核科技质量技术】AI 助力测试提效与大模型落地应用实践

爱学习的饲养员 · 2025年03月17日 · 6831 次阅读

今天看了一篇大模型在测试领域落地的文章，忍不住分享下：

从 2023 年底起，群核科技质量团队便反复强调 AI 可能对测试团队带来的价值，旋即我们组建了专门的 AIGC 虚拟小组，进行了一系列的基建能力搭建和部分领域的探索。从建设进度来看，AI 带来的价值是非常大的。2024 年年底，deepseek 的发布，给业界带来了非常大的震撼，AI 推理能力已经非常强大，行业内纷纷围绕 AI 质量测试和效能领域进行了大量探索。从这些探索、经验和我们取得的结果上看，我们必须紧跟这个潮流，通过运用各种 AI 工具武装我们自己，结合我们的工作流，提升我们的效能。经过一段时间的实践探索，我们 2025 年将重点在以下几个方面进行建设：

探索更好的 AI 模型，从而助力测试提效
搭建更易用的 AI 测试平台，方便大家应用接入
不断助力各项测试效能领域/流程提效
持续推广和带领测试同学认识 AI、使用 AI 现将取得的一些进展分享给大家，也欢迎更多的内外部团队共建和使用。我们希望通过本文的分享，能够激发更多创新思维，推动这一领域的深入发展，同时也鼓励开发者积极探索，让 AI 发挥更大作用，为行业带来更多价值。

01 探索更好的 AI 模型，助力测试提效

2025 年开年至今，我们测试平台已接入如下业界领先的大模型，这些模型也在各个领域得到较好反馈。

接入时间	模型	应用领域
2025 年 1 月	DeepSeek v3&r1	知识库问答
2025 年 2 月	text-embedding-3-small bge-m3-embedding	向量模型&知识库领域
2025 年 2 月	Claude3.5&Claude 3.7 Sonnet	自动化测试代码编写

02 搭建更易用的 AI 测试平台，方便大家应用接入

目前已有 20+ 各类应用接入质量部 AI 测试平台 FastQA，平台也在不断优化升级能力中。

时间	平台优化	接入效果反馈
2025 年 2 月	模型对接优化
2025 年 2 月	平台版本升级
2025 年 1 月	企信对接问答优化	支持企信群 @ 机器人方式对话，方便对接知识库应用

03 不断助力各项测试效能领域/流程提效

思路：

通过维护工单 AI 知识库以及对接 openAPI 方式，实现 AI 在线问答&自动创建工单等功能进展：
目前在技术支持团队最佳实践
80% 内部咨询自动回复，帮助客服&技术支持岗告别重复劳动
自动创建工单，减少提单的提交工作量，提升了工单提交质量，节省各方澄清工单问题的沟通成本。
整体上提升用户问题的服务体验，减少问题处理角色和流程，提升客户满意度。应用展示：
群聊群内@AI虚拟账户，进行问题咨询，自助解决 FAQ 类问题;
群聊群内@AI虚拟账户发送创建工单指令，自动创建工单
应用内，点击【客服酷小宝】，进行问题咨询，自助解决 FAQ 类问题 ;
应用内，点击【客服酷小宝】，发送创建工单指令，自动创建工单

3.2【UI 自动化代码生成】

思路：

利用 vs ode 插件能力和 AI 知识库，让 AI 根据用例描述生成自动化脚本。
利用油猴插件和 AI 能力，生成符合酷家乐 UI 自动化规范的 xpath 表达式。进展：
针对三个业务试点，生成的代码准确率在 50~80% 之间。降低编写 xpath 编写成本（约 30%），提升 xpath 的质量。 ## 3.3【AI 精选文档分享】思路：
利用 AI 根据高质量文档规则，爬取分析近期文档，并推送高质量文档方便学习。进展：
目前已经在整个质量部门进行爬取和 AI 分析推送，得到众多同学的点赞认可

3.4【AI 知识库秒级搭建】

思路：

根据 cf 标签进行文档爬取，快速将 cf 文档转换为 FastQA 平台知识库内容

进展：

目前已经在质量效能部门内部进行推广，运行 2 周累计录入知识量 2k 页面，快速扩增中
配套提供 AI 知识库创建、cf 文档 AI 打标规则，AI 知识库自动导入，及丰富的 AI 应用落地（企信答疑群的 AI 智能机器人自助应答 && openAPI 接入等）等配套一条龙服务
预计在 Q2 进行流程规范的评审，作为新流程并纳入公司级别 ITM 流程标准

3.5【AI 用例编写】

思路：
使用 AI Agent 解析文档并生成测试用例，阅读 CF 并解析文档中的图片，拆分功能点，为每个功能点设计测试用例，检查用例的中英文情况
应用：

可以大幅提升用例编写效率

3.6【AI 页面检测】

思路：

针对国际化翻译中容易出现的多语言问题，根据国际化网页设计规范利用 AI 知识库能力，预设正确错误国际化翻译及布局情况，通过 AI 动态检测当前版本多语言、文本规范性、页面布局情况进展：
基本流程已经调通（典型页面错误识别率超过 80%），工程化并建立常态化运行中。

04 测试管理平台接入 AI 能力

4.1【测试分析报告撰写】
针对大项目编写测试分析报告，引入 LLM 大模型（文本 + 视觉），根据需求文档/CF 文档链接/设计稿，生成初步的测试分析报告。这些报告有助于测试人员拓展思维，为撰写详尽的测试分析报告提供有力的启发与参考。

4.2【AI 用例生成】
生成新功能用例时，运用 LLM 大模型依据需求文档，初步生成功能用例，二次确认修改后，一键导入系统。这不仅能为测试人员打开编写思路，还能辅助他们编写更为全面、细致的功能用例。

4.3【影响用例自动识别（调研中）】
由于受影响功能在开发阶段已确认，且相关功能用例已存在用例库中，在评估影响范围时，采用 RAG/KAG 模型通过检索增强技术，能够快速从用例库中精准定位相关功能用例，呈现给测试人员。这将极大地节省查找时间，为测试人员编写回归用例提供了重要辅助参考依据。
4.4【AI 用例评审】
用例评审环节也可以用 LLM 大模型。具体方法是制定一系列严谨的评审规则，让大模型在这些严格条件下运行。大模型会给出用例的合格分数，并提供具有针对性的修改意见，助力测试人员对用例进行修改与优化，以保障测试用例达到较高质量标准。

05 更多领域探索

除了上述介绍之外，我们还进行了以下探索的应用建设，值得我们持续期待！

5.1【用户分析-AI 辅助七鱼会话分类打标】
目标：实现 70% 以上的七鱼分类自动精准打标
思路：七鱼会话结束后，通过输入会话信息及七鱼分类后，让大模型给出一个精准的四级分类再回传给七鱼平台打标，减少客服的工作量
进度：进行中，基础建设完成，提示词待调优

5.2【自动化测试平台接入 AI 能力】
目标：

目标 1：阿波罗自动化测试平台 AI 辅助提效，包括接口测试和 UI 自动化测试，提升自动化执行失败和异常情况的排查能力，和小助手自助率应答能力，在去年基础上提升 20%。
目标 2：自动化 issue 有效性在去年基础上提升 10% 思路：
Jenkins 错误日志排查工具，提升问题排查分析能力，结合已有常见典型的错误日志特征进行聚合归类
利用 CI 链路问题排查分析能力，在上述错误日志排查基础之上，进一步按照链路顺序分析，按照常规 SRE 排查思路进行链路问题的识别和智能分析
平台开放功能布点，当发现有在平台上面执行自动化测试失败的场景，测试同学通过点击智能分析进行快速诊断，提升排查自动化环境以及脚本问题的耗时，进一步提升用户在平台体验
和业务线形成合力，共同维护自动化知识库经典案例库，提升问题智能小助手自助回答&问题分析能力进度：目前整体处于前期技术设计框架阶段

06 持续推广使用 AI

我们整个部门团队非常重视 AI 领域提效，也希望整个团队同学提升这方面的能力和意识，因此制定了三步走计划：

团队进行 AI 相应的培训学习和考试
团队熟悉使用各个 AI 工具和考试
结合自身业务及测试能力/平台，需要进行 AI 提效思考并探索接入。

当前培训计划如下：AIGC 知识培训

07 小结

随着 AI 的持续发展，我们已然看到了它对于互联网及软件工程领域带来的巨大价值，测试领域也是受用方之一。AI 是一个万花筒，对于我们测试同学来说不仅要持续学习 AI、掌握 AI，更要结合我们实际业务场景和诉求，合理利用 AI 能力，与我们现有的系统、流程做深度结合，才能发挥它最大的价值。酷家乐质量效能部门将会持续投入到 AI 学习和基于 AI 落地实践的浪潮中。

原文链接：https://mp.weixin.qq.com/s/zghVVVDIkgy5EDTKv6zLyQ

3 个赞

暂无回复。

需要登录后方可回复, 如果你还没有账号请点击这里注册。

AI测试 【转自群核科技质量技术】AI 助力测试提效与大模型落地应用实践

AI测试 【转自群核科技质量技术】AI 助力测试提效与大模型落地应用实践

01 探索更好的 AI 模型，助力测试提效

02 搭建更易用的 AI 测试平台，方便大家应用接入

03 不断助力各项测试效能领域/流程提效

3.2【UI 自动化代码生成】

3.4【AI 知识库秒级搭建】

3.5【AI 用例编写】

3.6【AI 页面检测】

04 测试管理平台接入 AI 能力

05 更多领域探索

06 持续推广使用 AI

07 小结

AI测试【转自群核科技质量技术】AI 助力测试提效与大模型落地应用实践

AI测试【转自群核科技质量技术】AI 助力测试提效与大模型落地应用实践