楼主在自学完人工智 (ruo) 能 (zhi) 后，一直都没有在测试工作中找到可施展的地方。碰巧最近再和 360 的同行交流后，灵光一闪，有了今天的文章。

背景

花椒相机是 360 发布的一款拍照 APP，可以在照片中加入各种小插件来美化照片。尽管自动化可以搞定该 APP 拍照的大部分功能，但是对于加入插件后的照片是否正确却无法验证，只能通过保存到本地，进行人工检查。无法使自动化形成一个闭环，未能使自动化的价值最大化。

可行性分析

既然可以拍照把照片保存到本地，当照片变多后，就形成了大量的照片数据，这些照片完全就可以再利用起来，用人工智能来玩。

工具选择

Google 出品的 TensorFlow，说真的，楼主倒腾了两天 TensorFlow，硬是没搞出个结果来，所以放弃了。
Python 机器学习包，Scikit-learn，超好用的机器学习包，一直都在用这个机器学习包。

工欲善其事必先利其器

这里简单的写下所需要的工具包的安装，如果安装的时候遇到了各种莫名其妙的报错问题，那么 Google 一下

楼主的 Python 版本是 2.7，已经安装好 pip，所以只要简单几步就可以安装好运行 Scikit-learn 所需要的环境
- 安装 Numpy
```
$ sudo pip install numpy
```
- 安装 Scipy
```
$ sudo pip install scipy
```
- 安装 Scikit-learn
```
$ sudo pip install scikit-learn
```
- 安装 PIL，这个用来读取图片，到官网下载安装包到本地，切换到解压路径
```
$ sudo python setup.py install
```
注意： 有可能还要安装 JPEG 的包，这个取决于本机是否已经安装，未安装的可以参考网上教程

其他

训练数据以及测试数据，这里楼主自拍了 7 种不同插件的照片共计 136 张，测试数据 5 种共计 5 张

对于机器学习来说，数据是越多越好越多越好，更多的数据会让你的模型效果更佳：）
你仅仅需要一点点机器学习的基础知识，以及 Python 基础知识。

那我们就从这里开始进入正文

因为楼主的目的是要对图片进行多分类，因为楼主的数据里面已经有 X -> Y 了，所以这是一种有监督学习。
首先我们要确定的是用什么算法来训练数据，这里楼主主要试验了两种算法：

KNN

使用 KNN 的时候，因为数据样本不够多，正确率大概在 60% 左右，不是太可观的结果。
SVM
对于，支持向量机，也使用了两种算法
1. SVC："one-against-one"策略
2. LinearSVC："one-vs-the-rest"策略

代码如下：

import Image
import numpy as np
import os
from sklearn import svm

def getTrainClass(category):
    if category == 'Train':
        classes = {0, 1, 2, 3, 4, 5, 6, 7}
    else:
        classes = {0, 1, 2, 5, 7}
    return classes

def getImageData(path,classes):
    ImageList = []
    LabelList = []
    for name in classes:
        class_path = cwd + path + "/" + str(name) + "/"
        for image_name in os.listdir(class_path):
            image_path = class_path + image_name
            if 'JPG' in image_path:
                img = Image.open(image_path)
                ImageList.append(np.asarray(img).flatten())
                LabelList.append(name)
    return ImageList, LabelList

cwd = '/home/hadoop/Pictures/pic1/'

TrClasses = getTrainClass('Train')
tr_img, tr_label = getImageData('Train',TrClasses)  #加载训练数据
tstClass = getTrainClass('Validation')
tst_img, tst_label = getImageData('Validation',tstClass)  #加载测试数据

svcClf = svm.LinearSVC()    #直接使用默认参数就好了
svcClf.fit(tr_img,tr_label)

Z = svcClf.predict(tst_img)

result = (1 - np.sum(Z==tst_label)/float(len(tst_img)))
print "\nthe total error rate is: %f" %result

使用 LinearSVC 训练数据的时候，效率稍微有点低，比直接使用 SVC 低，但是别人正确率高呀
结果如下：

剩下要做的是就是固化了，然后就可以直接调用了。

写在最后的话

这是时下很火热的人工智 (RUO) 能 (ZHI) 在测试中的一种应用，相信在测试工作中，还有很多地方可以使用人工智 (RUO) 能 (ZHI) 来提高咱们的工作效率。
那就自己多发现吧。

↙↙↙阅读原文可查看相关链接，并与作者交流