语音识别成文字准确率,大家是怎么测的,有什么好用的工具可以推荐
现在已经非常准了吧。基本可以用于工业生产了。
这个好像就只能人工去测试了吧? 最后的比对结果还是人来看,人工就是核对准确率的最佳工具
上面多种场景多个数据测试后再进行人工统计正确率,要我测试的话基本只能这样做了,体力活。最后再灰度让大众体验测试反馈下。
可以去魔搭那里找个 AI 生成语音的,让手机播放念
找其他公司的竞品,一起把同一段语音识别成文字,然后互相比对。这里肯定有龙头产品,以它作为最高目标去比对,比对出来有些明显差异的数据再引入人工去判断打标,或者说找众测平台去帮助打标啥的
文字转语音再转文字,直接比对文字?
这里,我建议把歌拿出来,因为有歌词,这样相当于标注了。就可以对比两个结果,拿到准确率,召回率了。至于其他场景,菜市场之类的,只能定向了