最近一直在学习机器学习,也查询了大量的资料,总结机器学习的步骤如下,如有不对,欢迎指正。
1、数据预处理
(1)数据来源,采样,样本分析。----这个占据全部工作的 70%,这个也决定了后续使用的算法为监督模型、无监督模型等、强化学习等。
a、采样:根据业务需求分为随机采样,分层采样,以及各种算法的采样,详见:https://zhuanlan.zhihu.com/p/76024846
b、样本分析
c、样本处理:通过分析样式,会发现样本中经常存在一些空置,分类值,异常值等情况,这些需要提前做预处理,然后才能进行训练。

2、选择模型:

3、选择模型模型的方法

4、模型参数微调

5、模型保存和维护


↙↙↙阅读原文可查看相关链接,并与作者交流