桌面端、web 端、移动端,两个方案: 1、写 UI 自动化脚本 2、借助 AI 去做,是否成熟? 感觉所有页面功能都做成本好高啊,现在的大模型能支持吗,试用过 midscene 框架,用的 qwen-vl-max,感觉执行速度很慢,准确率也不理想