大佬们简历上写这个面试会问什么呀？求提问一年多经验

小叮当 #1 · 2025年08月26日

好强，是个 AI 测试大佬

jokerbay #2 · 2025年08月26日

这个框架是你自己写的，有在公司推广吗，公司其他人怎么反馈的

dun #3 · 2025年08月26日

为什么要做这个？解决了业务中什么问题？相对于传统的 xpath 定位，采用 AI 准确率提升了多少？落地效果怎样？

我吃香菜了 #4 · 2025年08月26日 1 个赞

哎，说了一堆没说做的效果怎么样，落地后数据怎么样，效果比传统的快了多少，稳定了多少，用例量级在多少。总之都在说工具没说业务和效果，让人看了都是在吹很虚

LYC #5 · 2025年08月26日

1.稳定性问题：如何解决用大模型做 UI 测试的误报问题，成功率 80%，那每次都有 20% 左右的误报需要多少人力成本去排查
2.知识库问题：如何让模型知道你的业务逻辑或者说业务术语，比如什么是发起回帖

LYC #6 · 2025年08月26日

这让我想起了之前试过的一个东西 midscene

pp1 #7 · 2025年08月26日

想知道根据元素定位成功率调整缓存策略实现自适应学习机制是怎么实现，这个要缓存啥

Boolean #8 · 2025年08月26日 Author

对

LYC 回复

不是它但是效果是一样那个是字节的开源框架 node 写的如果要用的话还得去学 node 感觉生态不是很好

Boolean #9 · 2025年08月26日 Author

对

pp1 回复

是这样的核心思路就是把最近成功的定位结果记到 Redis，下次优先用；成功就升，失败就降，同一候选连续成功 2 次就缓存一天失败的就缓存一小时如果定位不到就会降级到从 mysql 里面找找不到就会用 ai+ocr 进行兜底 ai 识别成功元素会把元素坐标位置选择器等信息存数据库将元素的优先级提高下次优先使用如果都定位失败那就需要人工来协助了

小黑子-IKUN #10 · 2025年08月26日 10 个赞

你这个是面向什么业务设计的？80% 的识别成功率影响不大吗？

如果是我，我会问这几个问题：

80% 识别率是怎么统计的？样本覆盖了哪些场景？不同复杂度页面的识别率差异有多大？
80% 成功率之外的 20% 失败场景，你们怎么处理？是回退手工测试，还是有其他自动化兜底方案？
新框架识别率只有 80%，实际落地时，这个成功率真的能比传统方案更稳吗？有没有和旧方案做过对比测试（比如相同页面的执行稳定性、维护成本）？
80% 成功率是针对所有页面，还是只覆盖了部分简单场景？如果遇到高频的复杂页面（比如表单嵌套、动态加载），识别率会不会暴跌？这种情况下怎么保障测试质量？
token 消耗怎么计算？每次元素识别、用例执行要花多少钱？有没有统计过
20% 的不稳定性会不会让业务测试提心吊胆？，增加了监控和重跑的负担，违背了自动化提升效率的初衷？

另外你的描述，给我一种你没有在实际业务测试中用过这个测试框架的感觉，否则 80% 的成功率你都写出来？
你想想识别成功率是 80%，不考虑其他因素，算你一条用例的成功率是 80%，若一次回归测试有 50 个用例，全部成功的概率仅为 0.8⁵⁰ ≈ 0.0001%（几乎为 0），这意味着几乎每次执行都会出现失败，这就是我上面想问的，如果每次执行都会出现识别率问题，那你们的精力是不是都分散到区分是实际 bug 还是识别问题？

Boolean #11 · 2025年08月26日 Author

对

dun 回复

这个主要是为了提高在快速迭代中的元素定位效率尤其是前端经常迭代页面元素经常失效都需要重新去写 xpath css 等定位，通过 redis 缓存→数据库→AI→OCR 四层降级来命中元素，基本上缓存命中毫秒级完成，而且自适应学习（成功晋级、失败降级），把高质量候选沉淀到缓存与 DB，减少改版后的批量修复。目前刚搞完只跑了几条 case 目前效果还可以正在编写大量 case 来验证，目前对预热后的页面元素定位时间 1s 不到输入框就可以成功输入信息

Boolean #12 · 2025年08月26日 Author

对

我吃香菜了回复

好的哥我补一下这个刚搞完目前 case 不是很多对于预热后的页面像输入框按钮什么的元素定位时间 1s 以内就会输入完成像一些 img 图标什么的就可能需要 ai 来处理了，我试验一下补一些数据

Boolean #13 · 2025年08月26日 Author

对

LYC 回复

这块没有做 rag 产品文档不是很规范写用例的话是可以用 yaml 那种声明式的直接中文描述哪里需要点击需要打开那个页面我用的大模型其实是一种兜底策略用的是多模态的通义千问的让大模型 +ocr 去识别页面元素通过对置信度的判断来确定页面元素坐标是否可用，是通过四层定位 redis mysql ai ocr 这样来提高元素定位效率跨域 iframe 且未暴露测试钩子这种就只能靠视觉模型处理了

Boolean #14 · 2025年08月26日 Author

对

小叮当回复

没我才做测试一年经验大家一起学习

Boolean #15 · 2025年08月26日 Author

对

jokerbay 回复

是我写的目前在真实业务在跑的 case 有 20 条还在陆续编写不断完善

pp1 #16 · 2025年08月26日

对

Boolean 回复

牛牛

Xindy #17 · 2025年08月27日

是个大佬

dun #18 · 2025年08月27日

对

Boolean 回复

一年测试经验就不要写具体的量化的指标，一年能有多少经验？量化指标结合你的 1 年工作经验，可能我会觉得一眼假，1 年经验就说你做这个的起因，怎么实现的，用了什么技术就行，搞这些量化指标随便追问下你就懵了

MichaleScold #19 · 2025年08月27日 1 个赞

是个大佬

赵又廷 #20 · 2025年08月27日 1 个赞

已经很强了

LYC #21 · 2025年08月27日

对

Boolean 回复

最近也是做这个相关的，我的问题是，你怎么让大模型知道你要点哪里，因为对于用户来说他的语言是自然语言，没有知识库的话那么大模型他怎么知道描述的是什么

disable #22 · 2025年08月27日

怎么解决 ai 张冠李戴的问题？无法解决怎么能确定他跑出来的结果是可信任的？ ai 幻想出不显示的法律，律师去打官司要付法律责任，ai 幻想出不切实际的处方药，医生拿去治病，要付医疗事故责任；ai 幻想出不符合业务逻辑的用例，测试未进过筛选，过程全自动，上线直接被嘎

disable #23 · 2025年08月27日

对

我吃香菜了回复

我让 ai 讲述历史故事，秦始皇爱上溥仪，他没反驳我写出来了，这样的 ai 测试的结果你敢信？

ITRoad #24 · 2025年08月27日

其实我更好奇一件事，四层定位中的 redis、MySQL 起到了什么作用，几小时，几天的缓存有价值吗，假如我每个版本都想跑一下，那之前的缓存不就没价值了？录入数据库的步骤能保证一定正确吗，如果大模型幻觉的用例录入到数据库中了，那后面不都凉了吗

maigamo1 #25 · 2025年08月28日

对比过哪些模型的效果，有什么思考？要投高级岗可能问下，要投初级岗的话简历过不了（招个初级来做 AI？）。

Eric #26 · 2025年08月28日

感觉会针对项目问的多一点

陈恒捷 #27 · 2025年08月28日

如果是我，我会先问项目落地情况、实际收益、遇到的困难和解决方法，后面再进一步去深挖实现原理等细节。测开不像开发，落地会有产品 + 运营等负责，测开基本要自己负责落地，完成整体闭环的。

另外，这里的量化指标，说实话，太工整了，很明显不是统计出来，而是自己拍脑袋估算出来的。

Boolean #28 · 2025年08月29日 Author

对

maigamo1 回复

我是想找个自动化的或者测开的我也才一年多经验初级吧目前只是用多模态的模型只对比过通义千问和 openai 的首先通义千问对于中文的处理以及收费情况调用返回的速度是比 opeai 的 40 模型要好很多主要便宜通义千问单次请求大概 0.0004 元,openai 大概 0.014 元

Boolean #29 · 2025年08月29日 Author

对

disable 回复

你说的是大模型幻觉吧我是会严格设置置信度阈值，只接受高置信度的结果；其次使用多方法交叉验证，包括 AI 视觉分析、CSS 选择器验证、坐标检查等，至少需要 2 种方法都通过才执行操作；对提示词进行优化减少不必要的信息返回；同时建立降级策略，当 AI 定位失败时自动切换到传统定位方法；最后建立完整的监控体系，记录 AI 的成功率、失败率和幻觉率，让 ai 自适应的去学习，形成持续优化的闭环。

Boolean #30 · 2025年08月29日 Author

对

ITRoad 回复

四层定位中的 redis、MySQL 是这样的我的核心是先将页面元素预热然后将有需要的用例中的数据相关的页面元素存放到 mysql，存的时候我目前是将页面的 url 和元素关联不过你说的这个问题我没考虑到我之后数据库再补个版本号元素定位策略关联 URL + 版本号这样应该可以解决这个问题， mysql 存是预热的元素并且每个元素都有分数分数高的优先级是第一然后再存入 redis 每次执行就先走 redis 中分数高的元素，redis 是短期存储 mysql 长期

Boolean #31 · 2025年08月29日 Author

对

LYC 回复

我是这样的通过实时截取页面截图，将用户的自然语言指令（如"点击登录按钮"）与页面视觉信息（蓝色按钮这种）同时输入到多模态模型中，大模型通过图片识别的方式，结合视觉理解（看到页面上的具体元素）、语言理解（解析用户指令的含义）和上下文推理（分析元素在页面中的位置和功能关系），最终理解用户要点击的是页面底部的蓝色登录按钮，并返回相应的 CSS 选择器和坐标信息，无需依赖任何预定义的知识库。如果是做用例生成之类的是需要知识库的不然一些公司内部用的词汇 ai 不是很了解

自动化工具大佬们简历上写这个面试会问什么呀？求提问一年多经验

自动化工具大佬们简历上写这个面试会问什么呀？求提问一年多经验

自动化工具 大佬们 简历上写这个面试会问什么呀？求提问 一年多经验

自动化工具 大佬们 简历上写这个面试会问什么呀？求提问 一年多经验

自动化工具大佬们简历上写这个面试会问什么呀？求提问一年多经验

自动化工具大佬们简历上写这个面试会问什么呀？求提问一年多经验