举个栗子:
1.拍照文字识别 app
2.需要拍照 100 页实物(必须拍摄,不能用已有图片识别,说白了不能自动化)书本报纸等,统计该页的总字数(标点单独统计),app 识别正确字数,app 识别错误字数
3.每次迭代后(不排除每次调整完识别引擎后都要进行),需要完成最少一轮,上不封顶次的识别率结果
4.不排除样本不够 ,后续要加到 300-500-1000 页
5.后期肯定会加入多个竞品对比,工作量 *N
6.排期要求紧张,100 还好,考虑后期 500-1000
上面是栗子,不代表真实情况
获取这些字数等内容是计算识别率的必要条件
按理说 app 识别率可以作为测试点,识别率是 app 质量的一个关键指标
但总感觉哪里不对劲,为什么这种类型的识别率会叫测试点,而不是其他点(产品卖点?识别引擎开发的能力点?)
得出来的结果跟 ‘测试’ 本身有什么关系
这个 ‘测试数据’ 是测试数据吗