明白了,,感谢解答
想问问还有没有其他的收益啥的 ,总感觉正文列举的这些场景也挺通用的,不太体现得出来 gpt 的作用,可能多写几个脚本就行,也没太大的维护成本?
LZ 有评估过实际效果吗
同问下高飞老师对于偏业务的 AI 测试有没有什么建议?
我们这边的偏应用向而非基础模型,基本上都是直接和其他公司的模型对接微调出适合自己业务的东西。例如用户输入问题后,AI 生成一串 json,前端再拿这段 json 转换成业务操作等等。
感觉针对基础模型的测试并不适合这样的场景,我们目前是人工去校验一批小的评测集,来判断模型效果,导致产品迭代效率很低,这种不知道要怎么才能做到自动化评测
和楼主差不多的经历,只不过还正处于在稀巴烂部门苟活的最后阶段,很犹豫要不要主动走人了
大佬跳槽去飞书了么
高飞老师,这本会出电子版吗
用 hosts 屏蔽掉 google 用来检查更新的域名,之前试过可用
想问下 LZ 有没有评估过 在当下投入哪个方向才会比较有价值呢,看来看去感觉除了搭知识库,短期内大语言模型对测试的帮助很有限
感觉 Sonic 开发进展挺快的,很厉害
最近有注意到 sonic 似乎打算做视觉相关的东西,有点想参与进去,不过没看到有明确的计划。不知道大佬有没有打算弄个需求看板之类的东西,方便新人参与做开源(
感觉 ocr 的识别速度还是不适合大规模的用例执行
和开发商量下加个开关,url 里带某个参数的话,就不走服务端渲染
或许可以参考下论坛里这篇文章,用视频阶段切割和图像分类去算耗时 https://testerhome.com/topics/22215
最近也在做类似的东西,测试过开源工具里这个 stagesepx 的效果是最好的了。缺点是如果要测试的场景太多的话可能就不太适合
想问下大佬这些用例是录制出来的还是纯代码实现的,这个数量级维护成本也太高了吧……