元素如果极其 ID 稳定,甚至可以不用任何编写代码的框架了。 就老式的录制回放就行。
我写了一个探测的 Agent, 动态启动浏览器探测, 然后生成 CSS 和 AI 的定位方式。 优先 CSS,如果 CSS 定位失败,就降级到 AI 定位。 然后还有一个测试 Agent,测试不通过就打回去重新定位。 现在正确率还可以。
但我没有试过,我没有做过移动端的测试。
字节的 midsence 我看文档上是支持全平台的。
都是 AI 来写,我专门写了一个 skill,是一个有三个 agent 的 skill,专门去帮我探索 UI 界面并编写脚本。
续期有 8 折优惠, 你要是接受不了 200 块钱, 加我微信:ycwdaaaa,我给你搞个优惠券
第一次进 200,能持续一年,一年后续期 8 折哈。
最近没那么忙了~
周日录播:
主要演示:
录制:山治预定的会议
日期:2026-04-05 19:26:29
录制文件:https://meeting.tencent.com/crm/2qMO193y6a
录制:山治预定的会议
日期:2026-04-05 19:51:59
录制文件:https://meeting.tencent.com/crm/2ykOkpBVac
录制: 山治预定的会议
日期: 2026-04-05 20:29:39
录制文件:https://meeting.tencent.com/crm/KnvZmAVM7e