机器学习的基本概念
作者:互联网
基本概念:
有监督学习,无监督学习,机器学习的分类,回归,什么情况过拟合,什么情况下欠拟合。
机器学习最常见的算法:
K最近邻算法,线性模型,朴素贝叶斯,决策树,随机森林,SVMs,神经网络。
不同的算法在不同的数据集上的表现不同。
主要任务是:建模,模型参数调整
建模的基础:数据进行降维,聚类,算法建模,数据处理,找到合适的模型,模型最优参数,
有监督学习:
通过对现有数据集进行建模,再用模型对新的数据样本进行分类或者回归分析的机器学习方法。训练数据集包含样本特征和分类标签,算法模型通过数据推断出分类,并应用到新样本中。
无监督学习:
对没有标签的训练数据集的数据进行分析并建模,主要是两类任务类型:数据转换(数据降维去除无关特征变量保留关键特征变量)和聚类分析(把样本划到不同分组的算法)
分类和回归是有监督学习中两个最常见的方法
分类:机器学习的目标是对样本的类标签进行预测,判断属于哪个分类,结果是离散的数值
回归分析:其目标要预测一个连续的数值或者范围
模型的泛化:有监督学习中,在训练数据集上建立一个模型,再把这个模型用于新的数据。希望模型对新数据的预测是准确的,这叫泛化的准确度。
过拟合:用测试数据集对模型表现进行评估,如果模型复杂在训练数据集上表现很好,但是在测试数据集上表现差,模型出现了过拟合。
欠拟合:模型过于简单,训练集上的数据特征都不能完全考虑到,这样的模型在训练数据集和测试数据集得分都较差,这叫欠拟合。
标签:机器,模型,建模,学习,拟合,集上,数据,基本概念 来源: https://www.cnblogs.com/yeskey/p/16122020.html