AI测试 机器学习 01-2

唱跳rap打篮球 · 2025年07月05日 · 79 次阅读

大家好!我是新人唱跳 rap 打篮球,是一个立志 2025 年开始每周都能水一篇文章的人


上一篇我们介绍了什么是机器学习以及数据集,这篇继续聊

什么是监督学习

在监督学习中,重点关注是监督学习问题的分类

因为明确要解决的问题是机器学习项目的第一步,也是非常重要的一步。

如果我们不了解问题的类型,就无法选择合适的算法。

根据标签的特点,监督学习可以被分为两类:回归问题和分类问题。

回归问题

回归问题的标签是连续数值。

例如阿奇加班的时间从 1 分钟到 180 分钟,那要预测阿奇今天的加班时长,这就是个回归问题。

再比如说预测房价、股市、天气情况,这都是回归类型的问题。

分类问题

分类问题的标签是离散性数值。

比如,预测阿奇今天和女朋友吵没吵架,这就是个分类问题。

还有比如鉴别高欺诈风险的客户、辅助诊断来访者是否患病、人脸识别等等,这些都属于分类问题的应用。


再简单说一下无监督学习和半监督学习

无监督学习就是为没有标签的数据而建的模型,目前它大多只应用在聚类、降维等有限的场景中,一般应用在数据预处理的子步骤使用

半监督就是使用大量无标签数据和一部分有标签数据建模。

这一半是因为获取数据标签的难度很高。半监督学习的原理、功能和流程于监督学习是很相似的,主要在于多了 “伪标签的生成” 环节,也就是给无标签的数据人工 “贴标签”。

其实很多问题监督学习、无监督学习和半监督学习来解决。比如你要设计一个机器人来陪你玩牌,怎么办?这就需要强化学习登场了。

什么是强化学习

强化学习研究的目标是智能体(agent)如何基于环境而做出行动反应,以取得最大化的累积奖励。

这里的 “智能体” 我们可以把它理解成一种机器学习模型。

强化学习和监督学习的差异在于:监督学习是从数据中学习,而强化学习是从环境给它的奖惩中学习。

强化学习智能体在调整策略的时候需要思路比较长远,它不一定每次都明确地选择最优动作,而是在探索和利用之间找到平衡。

它反复试错、不断收集反馈,收集可供自己学习的信号,每经过一个训练周期,都变得比原来强一点,经过亿万次的训练能变得非常强大

强化学习需要对数学基础的要求很高,这里不做赘述了

什么是深度学习

深度学习是一种使用深度神经网络算法的机器学习模型,也就是一种算法

这个算法可以应用在监督学习、半监督学习、无监督学习和强化学习

“神经网络”(Artificial Neural Network,ANN)和人脑中的神经网络没啥大的关联,它是数据结构和算法形成的机器学习模型。

图形图像、自然语言和文本的处理事计算机行业的难题,因为这类信息的数据集,并不是结构化的,需要人工根据信息的类型来选择特征进行提取,这样对于特征的提取是有限的。

深层神经网络的厉害之处在于,它能对非结构的数据集进行自动的复杂特征提取,完全不需要人工干预。

深度学习让这个曾经的 “难题” 一下子变得非常容易。

常用的神经网络有这几种:深度神经网络 DNN、卷积神经网络 CNN、循环神经网络 RNN

总结

通过机器学习 01,我们大概知道了机器学习是干什么的

机器学习是一种从数据生成规则、发现模型,来帮助我们预测、判断、分组和解决问题的技术。

机器学习项目就是要选定一个算法,然后用数据训练机器,找到一族函数中最适合的那一个,形成模型。

机器学习分为四大类,分别是监督学习、无监督学习和半监督学习和强化学习。

监督学习能解决两类问题:回归和分类

深度学习,是一种使用深层神经网络的模型,可以应用于上述四类机器学习中

深度学习擅长处理非结构化的输入,在视觉处理和自然语言处理方面都很厉害。


我是新人唱跳 rap 打篮球,是一个立志 2025 年开始每周都能水一篇文章的人,希望我的文章可以给你带来好心情!

暂无回复。
需要 登录 后方可回复, 如果你还没有账号请点击这里 注册