AI测试【迭代 1】基于视觉模型的 APP 自动化异常诊断中心

Fun_Fox · 2025年03月14日 · 最后由布吉岛回复于 2025年05月06日 · 9879 次阅读

SmartDigger 项目

项目简介

SmartDigger 是一个基于 Appium 及视觉大模型的智能移动应用测试工具。它能够自动检测应用界面中的弹窗，并智能处理各种弹窗场景，同时生成详细的元素边界数据报告，为移动应用测试提供高效、智能的解决方案。

功能特性

设备信息获取：自动识别连接的 Android 设备，获取设备名称、分辨率等信息
界面元素分析：实时截取应用界面，智能分析可点击元素及其边界信息
弹窗智能处理：基于视觉大模型识别各类弹窗，自动执行关闭操作
数据报告生成：自动记录元素边界信息，生成详细的 Markdown 格式报告
异常处理机制：内置完善的错误处理机制，确保检测流程的稳定性

环境要求

Python 3.8+
Appium Server 1.22.0+
Android 设备或模拟器（Android 8.0+）
视觉大模型 API 访问权限

运行效果

Case 1

系统

截图标注
运行日志

Case 2

抖音

截图标注
运行日志 ng)

参考

项目地址

https://gitee.com/grabby_Tester/smart-digger

8 个赞

共收到 13 条回复时间点赞

哲豪 #1 · 2025年03月14日 1 个赞

先点赞，后评论。
个人认为需要处理的弹窗：应该是那种属性取不到的，且像叉号这种类型的弹窗。要能在不依赖页面结构的情况下识别到弹窗的叉号。（看图 2 可以看出应该用到了获取页面结构）

Fun_Fox #2 · 2025年03月14日 Author

对

哲豪回复

嗯，这种尝试过的，给大模型手机分辨率后，让模型返回按钮坐标。
这种对模型的能力要求有些高。之前尝试过，返回的坐标容易不正确。
但可以看一下 mobile_agent 这部分代码，是阿里视觉模型的，没有依赖页面结构

张昊翔 #3 · 2025年03月15日

大模型在区分所谓自动弹窗 vs 期望弹窗上真的会很优秀？准确率和召回率你有数据吗？只是 run 了几个例子，还是要不停地尝试啊

云青 #4 · 2025年03月15日

大佬想请教下其中的实现细节。调用视觉大模型 API 传的参数和在整个自动化过程中什么时候调用大模型 API

云青 #5 · 2025年03月15日

对

张昊翔回复

我也觉得适应度不是很高，但是解决弹窗问题目前也没有什么好方法

Fun_Fox #6 · 2025年03月17日 Author

对

张昊翔回复

大佬，受教了，后面研究一下

Fun_Fox #7 · 2025年03月17日 Author 1 个赞

对

云青回复

解决弹窗，还有一种使用 OCR 的方式，但实现逻辑比较复杂。

Fun_Fox #8 · 2025年03月17日 Author 1 个赞

对

云青回复

在自动化脚本执行失败，大模型介入进行 “诊断”。

Fun_Fox #9 · 2025年03月17日 Author

纯视觉的可以研究看一下这个例子
https://github.com/X-PLUG/MobileAgent/blob/main/README_zh.md

云青 #10 · 2025年03月22日

请教下这里购买的是哪个厂家的视觉大模型 API 接口，以及如何将非点击区域置为灰的

Fun_Fox #11 · 2025年03月26日 Author 1 个赞

对

云青回复

API 是 deepseek 的 vl 模型，硅基流动平台的很便宜
非点击区域至灰，很简单 Opencv 实现即可

七星瓢虫 #12 · 2025年03月27日

是不是可以在和开发约定好，通用弹窗，如果找不到目标组件不可用，之间查看是否有弹窗，假如有，直接关闭弹窗后重试？

Fun_Fox 在【迭代 2】基于视觉模型的 APP 自动化异常诊断中心中提及了此贴 04月06日 20:22

Fun_Fox 在【迭代 3】基于视觉模型的 APP 自动化异常诊断中心中提及了此贴 04月06日 20:30

Fun_Fox 在【迭代 4】基于视觉模型的 APP 自动化异常诊断中心中提及了此贴 04月07日 14:33

Fun_Fox 在【迭代 5】基于视觉模型的 APP 自动化异常诊断中心中提及了此贴 04月30日 12:11

布吉岛 #20 · 2025年05月06日

这种调大模型视觉比较慢，我试过从截图到识别结果坐标大概要 20 多秒，我感觉一般适用于非预期弹窗或者非原生元素等。

需要登录後方可回應，如果你還沒有帳號按這裡注册。

AI测试 【迭代 1】基于视觉模型的 APP 自动化异常诊断中心

AI测试 【迭代 1】基于视觉模型的 APP 自动化异常诊断中心

SmartDigger 项目

项目简介

功能特性

环境要求

运行效果

Case 1

Case 2

参考

项目地址

AI测试【迭代 1】基于视觉模型的 APP 自动化异常诊断中心

AI测试【迭代 1】基于视觉模型的 APP 自动化异常诊断中心