如果你是测试工程师,会不会都行,但如果你是测开,这些肯定是需要会的
干土木吧
算法题是啥样的,leetcode 那种吗?
那不行,你得用模糊匹配去定位对应的坐标,另外我这边没有管他是什么类型的元素
是的,拿到坐标后进行一些键鼠操作,omniparser 识别坐标后,把元素框的位置和索引,通过 js 代码追加到页面上,就是红框里面的部分;另外有些相同的元素,可以用多个相邻元素作最近距离值或偏移坐标来实现;另外一些复杂逻辑或操作肯定不能通过点点点解决,可以在 Excel 里面设计一个自定义脚本,直接在代码里面写好逻辑,Excel 里面直接调用测试函数就好,一般来说,大部分操作都是简单的键鼠操作,有一部分需要写代码实现。
我的电脑是 5 年前发布的 MacBook Pro M1,性能肯定比不上现在的新款电脑或服务器,这应该是图片识别慢的主要原因
PyTorch 不支持使用苹果芯片的 GPU 来加速,难受,CPU 跑的贼慢
browser-use 我年前用了,效果挺好的,不过准确率还整体不高,不知道是不是大模型响应慢,思考速度很慢
大佬,OmniParser 有两个问题请教
1、图像识别区域的时候,用的是大模型的能力还是 OmniParser 本地的能力?
2、我看网上都是使用 web-ui 界面去操作,可以直接通过代码去交互吗?
说到我心坎去了 太真实了