随着人工智能越来越火,语音识别作为一个特别重要的入口,也将成为下一个技术风口,语音识别应该怎么测试呢?
。。这个得机器学习吧,人工只能覆盖一部分,可以着重测试下与业务相关的关键字或都与业务完全无关的关键字
没搞过,但可以考虑把语音分类成语种后,在转成字符串。具体实现不知道。
1.爬虫爬不同的音频数据(语言种类、发音特色、区域特征等)、音频处理软件对音频特殊处理(模糊化、音调)===》采集训练数据 2.利用训练数据预处理、训练 3.算法训练参数优化 4.编不下去了。。。
就公司产品举例来说(某英语口语评分软件): 功能业务测试组: 1、符合话题,正常表述完整 2、符合话题,正常表述 5 秒/10 秒/30 秒/60 秒 3、符合话题,音量小 4、符合话题,环境噪音大 5、不符合话题,但正常表述 6、不符合话题,讲中文 7、完全非正常朗读(敲桌子声音,嘈杂讲话声等) 8... 貌似回答的是测试语音评分了。。。。
我记得有算法可以做单元测试的。
之前有幸测一段时间的语音,主要是功能测试,我理解的语音大概分语音录制、解析、反馈。 录制的话跟硬件有关系,与设备的距离,说话的语速、时间长短 解析的话,录制的语言(不同语种国语、粤语、四川话、英语)解析、特殊名称、地名(相同名字的省、市、区、县)、常用词、口语等等 反馈,这个需要根据录制语音的内容,对话、提问、闲聊、命令,反馈的都不一样,多选答案什么的
当然还要做场景测试:比如网络,车载设备还要考虑各种车上的场景;内存/cpu、响应速度什么的