AI测试人脸识别中性别识别模型评价 (项目实例)--第三篇

凌晨两点半 · 2018年12月29日 · 最后由凌晨两点半回复于 2020年06月11日 · 6607 次阅读

什么是人脸识别

来自百度 AI 平台

来自 face++

通过上面两张图相信对人脸识别相信有一定理解，想要具体了解概念的，可以百度，谷歌。
而性别识别是人脸属性中其中一种。

项目背景介绍

一、需求分析

算法的输入和输出是什么的内容，格式。
测试人员需要给出的评价指标。
训练数据中男性照片和女性照片数据分别有多少，比例。
照片数据是怎样的（是否有老人，小孩等）。
算法是如何实现的。（整个模型预测流程；数据是如何处理；用的是什么算法）

思考方向：
算法工程师使用男女训练数据比例是否合理？
照片数据中覆盖是否全面？

二、测试数据

类比一个输入框的测试，需要测试汉字、字符、表情、数字、字母，组合等多种情况下的。这里也是类似。
主要考虑：
1，需要什么样的测试数据
2，测试数据要多少

思考什么情况下可能会影响到算法识别性别，准备这样的测试数据。
这里给出一些参考：

男性照片和女性照片测试数据比例和训练数据中比例保持一致。
照片数据中包括不同年龄段男女
正常脸部拍摄的照片
包括不同光线照明场景，尤其是弱光，光线不足，暗场景下的照片。
包括不同姿势（偏头、仰头、侧面）场景照片。
被物体（如眼镜、面膜、口罩、手等）遮挡场景照片。
测试数据总数多少参考之前写文章。
本次项目测试主要考虑用户群体，用户场景下拍摄的照片。不使用网络照片。不使用国外人脸数据集。不考虑国外人群，像黑种人性别识别。
进入性别识别前有人脸识别模型判断有没有人脸，多人脸判断等，所以不用考虑非人脸是否会识别出性别的问题。
场景下不会有脸部区域很小的照片。此不考虑。

笔者这里使用 1100 张女性照片，900 张男性照片做为测试数据。