文章来自本人公众号:selenium 测试
人社部等三部门联合发布智能制造工程技术人员等 16 个新职业,前天我在微博里看到了热搜,点进去瞅了瞅简介,我觉得人工智能训练师对我来说靠点谱。闲话少说哦,先来看看职位的简介。
没有做过人工智能的童鞋们可能不太理解,我简单解释下。计算机的智能就像你新出生的孩子,并不认识图片、看不懂文字、听不明白语音,它需要你告诉它什么是正确的,指着汽车告诉它这就是汽车。汽车这个事物就是原始数据,而汽车这个文字就是你给它标注的数据。
看过我之前学习记录文章的童鞋们知道,我做过的是 Tensorflow 图像识别。Tensorflow 的例子是 MNIST 数据集,里面有标注好的数据集,其中包括 55000 个训练集、10000 个测试集和 5000 个验证集。只有 0~9 十个数字,却用了 7 万张图标注好。训练结果如何呢?97% 以上,还是挺喜人的。
在验证码识别中我需要标注的图片,取值范围包括 0~9 及部分英文字符。每张图不仅有四个扭曲且重合的字符,而且还有两条交叉的的干扰线。我从 500 张图片开始标注,最终标注到 1623 张才符合了自己正确 50% 的预期。(过程可以看我之前的文章:TensorFlow 学习记录 (三:执行记录))
标注过程,及其枯燥乏味:打开图、看字符、重命名、写结果。各位测试童鞋回忆下,像不像你们造测试数据的过程。需要的能力也极为简单:细致。
如何分析和提炼专业领域特征呢?还用 0~9 举例来说,看下面的图,我随便点哪个数字你都能读出来。
我截取一部分呢,
你看像不像 2 或者 3 的上部分,又或是 6、8、9、0 的上部分呢?答案是都有可能。由于他和剩下的数字关系不大,它就是 2、3、6、8、9、0 的特征,只不过都是概率。
假如我截取到的是这一部分,
你肯定要抢答了,这就是显著的特征。
训练和评测需要写代码,这种需要积累,这里不是 21 天学会 XXX 就能办到的。
重点看这里!!!相关算法、功能和性能。算法测试、功能测试、性能测试,不会一个情有可原,不会两个需要学习,三个都不会,对不起这篇文章不适合你。
请套用你写测试计划和测试用例的过程
请套用你提 bug 时的过程
请套用你配置数据库的过程
重要的事情说三遍:测试员 测试员 测试员,还不来试试么