其他分享
首页 > 其他分享> > 机器学习中的分类

机器学习中的分类

作者:互联网

一、无监督学习(unsupervised learning)

训练样本的标记信息未知,目标是通过对无标记训练样本的学习来揭示数据的内在性质及规律,为进一步的数据分析提供基础,此类学习任务中研究最多、应用最广的是"聚类" (clustering)。

二、监督学习(supervised learning)

通过已有的训练样本(即已知数据以及其对应的输出)去训练得到一个最优模型(这个模型属于某个函数的集合,最优则表示在某个评价准则下是最佳的),再利用这个模型将所有的输入映射为相应的输出,对输出进行简单的判断从而实现分类的目的,也就具有了对未知数据进行分类的能力。监督学习的数据中带有标记信息,分类和回归是监督学习的代表。

三、半监督学习(Semi-Supervised Learning)

训练集同时包含有标记样本数据和未标记样本数据不需要人工干预,让学习器不依赖外界交互、自动地利用未标记样本来提升学习性能,就是半监督学习。半监督学习可进一步划分为纯半监督学习直推学习。前者假定训练数据中的未标记样本并非待预测的数据,而后者则假定学习过程中所考虑的未标记样本恰是待预测数据,换言之,纯半监督学习是基于"开放世界"假设, 希望学得模型能适用于训练过程中未观察到的数据;而直推学习是基于"封闭世界"假设,仅试图对学习过程中观察到的未标记数据进行预测。

四、自监督学习(Self-Supervised Learning)

自监督学习主要是利用辅助任务(pretext task)从大规模的无监督数据中挖掘自身的监督信息,通过这种构造的监督信息对网络进行训练,从而可以学习到对下游任务有价值的表征。辅助任务可以是一个预测类任务、生成式任务、对比学习任务。辅助任务的监督信息来源是从数据本身获得的。

五、深度学习(Deep Learning)

深度学习是一种机器学习方法,它作为人工神经网络可以根据学习过程中的示例数据来独立地构建(训练)出基本规则。尤其是在机器视觉领域,神经网络通常采用监督式学习的方法来训练,即通过示例数据和示例数据的预定义结果来进行训练。

六、强化学习(Reinforcement learning)

强化学习(Reinforcement Learning, RL),又称再励学习、评价学习或增强学习,是机器学习的范式和方法论之一,用于描述和解决智能体(agent)在与环境的交互过程中通过学习策略以达成回报最大化或实现特定目标的问题。换句话说:强化学习是一种学习如何从状态映射到行为以使得获取的奖励最大的学习机制。这样的一个agent需要不断地在环境中进行实验,通过环境给予的反馈(奖励)来不断优化状态-行为的对应关系。

七、集成学习(Ensemble learning)

 集成学习通过构建并结合多个学习器来完成学习任务,有时也被称为多分类器系统、基于委员会的学习等。集成算法就是这样一种算法,它本身不是一个单独的机器学习算法,或者说没有自身的机器学习思维,而是采用集成的方式来完成对数据或事物的学习、训练过程。

标签:机器,训练,标记,分类,任务,学习,监督,数据
来源: https://www.cnblogs.com/HOI-Yzy/p/16292020.html