【迭代 1】基于视觉模型的 APP 自动弹窗检测及关闭 【迭代 2】基于视觉模型的 APP 自动化任务异常诊断 【迭代 3】基于视觉模型的 APP 自动化异常诊断中心
体验步骤
web 版有吗
OK,后面考虑用 gradio 加一个体验测试页面
再重新拉去一下代码已经增加 WEB 页面版本了
想问下这里存模版库有什么作用呢,是用来做模版匹配算法用吗(按理说视觉大模型用不到)
白话讲,第一次遇到的问题(问大模型),第二次就不用再问了
试了几个例子,给大模型输入截图、屏幕分辨率,然后输出坐标都不太准,想问下楼主有碰到这种情况吗 输入:该设备的屏幕宽 1080,高 2340,现在有一个弹窗,我想要取消这个弹窗,请给我取消弹窗的坐标
请看测试的模型,建议使用 32b,测试下来很准
或者就使用方案一:依赖于 xml 层次结构