刚看到,加了
短期内暂无开源计划,可以参考下论文复现
这部分正在开发,主要是针对 app 构建知识地图或者图谱
未来工业化用例生成 + 机器校验 + 人工辅助这套流程,整个 UI 测试的麻烦程度能减少比较多
多次执行的准确率可以参考实验结果https://github.com/bz-lab/AUITestAgent/blob/main/interaction_zh.md https://github.com/bz-lab/AUITestAgent/blob/main/evaluation_results/evaluation_zh.md 整体来看还是比较稳定的
UI 的不合理状态可以进行一定程度的检查,但是当前的检查能力没有对这种通识性布局问题进行特化,总体准确率不会特别高,在实际使用的过程中会加入针对各种类型异常的专项检测
这个对于基座的要求不是特别高,国内的几个 MLLM 效果都不错,每一步操作大概耗时十几秒到 20 多秒吧
可以的,整体是从多模态来对页面进行的认知,包括文字、图片、页面结构等,不单纯依赖文字
正常 ,这方面研究挺火的,大家都在弄
https://github.com/bz-lab/AUITestAgent/blob/main/verification.md
这个是驱动 + 校验的 case 例子集合
暂时还没,不过关键的流程和原理已经在论文里写明了,可以参考复现,整体不复杂
其实能够实际应用的点还挺多的,只要是需要在程序中模拟人类进行识别认知的部分都可以尝试使用类似的能力,例如页面画像,录制回放、智能化测试机器人等等
主要还是在 ROI 的提升,传统的自动化 Case 的泛化性比较差、维护成本也太高了
这块学术界和软件工程届进展都挺快的
成本还是不够低,现在如 LLM、MLLM 结合利用可以进一步降低成本
up down
顶😁
更新
可能还需要更深入些,对于语言,框架的原理有一些了解吧
666
本科以上吧
👌
领域知识吧,能够在生产环境中使用肯定不止局限在语言内部
肯定有提测单,最好还有提测准入流程,以免代码质量过低