如题所述,最近站内看到挺多号称自然语言进行自动化测试的框架。乍一看卧槽挺酷眩啊!速度也挺快,再仔细一看槽点挺多
1.速度
所有 demo 都是 2 倍乃至 3 倍速播放,跑一步基本都要 10 秒往上了
2.底层
一看底层,哦,调用 GPT-4o(现在升级了,可以调国内其他模型)。
GPT-4o 本身收费没开源不说了,跑个测试还得挂梯子。然后所有处理都是丢给 GPT 呗。。
所以原理就是,比如我想在美团搜个外卖,那步骤就是
1.截个图
2.图传给 gpt,问他搜索框在什么位置,给我对应坐标
3.adb 拿坐标点击,然后输入外卖名称
这东西有什么难度吗?只要你提问的方式够好,限定词加的够多,它就能返回给你你想要的,无非是寻找最优提问方式罢了。这玩意我早就试过了,速度慢,要收费我就不提了。其次根本没法批量跑,模型是人家的,token 限制也是人家定的。你量一大,人家直接给你限制调用,直接抓瞎。
我认为真正要做到自然语言进行自动化测试,用离线开源模型或者自己训练一个,这是必须的。否则就是中看不中用的玩具一个