PyTorch 不支持使用苹果芯片的 GPU 来加速,难受,CPU 跑的贼慢
browser-use 我年前用了,效果挺好的,不过准确率还整体不高,不知道是不是大模型响应慢,思考速度很慢
大佬,OmniParser 有两个问题请教
1、图像识别区域的时候,用的是大模型的能力还是 OmniParser 本地的能力?
2、我看网上都是使用 web-ui 界面去操作,可以直接通过代码去交互吗?
说到我心坎去了 太真实了
上面使用的是元素匹配 + 图像识别两种方式,当 AI 无法在 html 末端元素数组中匹配到合适的元素,或者匹配到多个元素,就切换到图像识别上,让 AI 找到对应的位置返回坐标,playwright 根据坐标来做操作
deepseek 开源 可以本地部署,不过准确性目前不知
是的,自动化太费 token 了,交互频率很高,在线模型的话就是烧钱,完全不值得,最近公司准备采购机器离线部署 deepseek,但是具体用哪个参数的模型暂不清楚,感觉小参数的模型意义也不大