请教下,llm 有随机性,怎么确保完成了 n 轮测试集的测试后,上线后生产环境针对同样的 query 不会出现意外的情况呢?或者说测试几轮才能评估出他的输出是稳定的呢?
请教下,llm 有随机性,怎么确保完成了 n 轮测试集的测试后,上线后生产环境针对同样的 query 不会出现意外的情况呢?或者说测试几轮才能评估出他的输出是稳定的呢?
大佬,请教下目前在借助 AI 做业务测试领域,网上到处传的测试用例生成、AI 自动化测试,实际项目上试用下来真的一言难尽,不知道大佬在这块具体的落地效果如何?
执行速度怎么样,我们试下来速到巨慢啊
赞同
很好的实践分享,值得借鉴
请问业务的那个什么部门的,看描述也是纯工具开发加推广
现在清楚了,感谢回复
感谢回复
临时的副本是直接部署在容器上的吗?
感谢回复
临时的 workspace 是直接部署在容器上的吗?
感谢回复、
1.git 新分支还是不能避免 merge 到构建分支时有任务在执行吧;
2.Jenkins 构建时 pull 代码到 workspace 是独立里可运行环境吗?这个不太了解,麻烦详细指点下,谢谢
请教下,这 2 个插件 sandbox-1.2.1-bin.tar ,repeater-stable-bin.tar,还不能执行 repeat.standalone.mode=false 模式吗?

为了验证并发时会不会出现功能性问题
试了下 没法分别断言
我的问题是并发时给每个请求设置一个断言,断言的内容不一样的
UP~
airtest 怎么兼容不同分辨率的
请教一下,对于截图比较的,在不同分辨率的设备上,都要截图么?若不用,怎么解决这个问题的
说实话,以现在框架的稳定性,和前端的迭代速度来看,我个人觉得真没必要做。想知道现在哪个公司团队在做 UI 自动化并且有收益不是疲于奔命的维护 case 的?
Headless 是截不到图的吧?
采集 1 分钟的数据没有多大意义,时间太短,看不出内存 gc 的情况
分十次压不行吗
我也想知道怎么解决
很清晰
我今天也遇到了