其他分享
首页 > 其他分享> > 机器学习基本概念和方法三要素

机器学习基本概念和方法三要素

作者:互联网

课程目的

学习目标


机器学习的几个基本概念

机器学习方法流程

以监督学习方法为例,(比着例题来做习题)

在这里插入图片描述

输入数据——》特征工程《——》模型训练——》模型部署——》模型应用

模型(Models):通过丰富经验形成的处理过程

特征工程(Features):在输入数据的基础上,整理、加工、扩展、合并等等形成的一些新的数据特征。

建模过程是一个反复的过程,需要循环优化。

模型训练达到预期效果后进行部署,投入到实际应用。

注:实际工作过程中,业务、数据都是在动态变化的,所以模型具有时效性,需要在使用过程中进行模型生命周期管理,定期更新。

输入空间与输出空间

特征空间

特征:即属性。每个输入实力的各个组成部分(属性)称作原始特征,基于原始特征还可以扩展出更多的衍生特征。

特征向量:由多个特征组合的集合,称作特征向量

特征空间:将特征向量存在的空间称作特征空间。

-  特征空间中每一维都对应了一个特征(属性)
-  特征空间可以和输入空间相同,也可以不同
-  需将将实例从输入空间映射到特征空间
-  模型实际上是定义于特征空间之上

假设空间

假设空间:由输入空间到输出空间的映射的集合。

针对每一种可能的输入,都能找到一个映射,对应了输出空间中某个输出。


机器学习的实质

大部分的机器学习本质上都是一个最优化问题,也就是寻找模型参数(优化变量),使得损失函数(目标函数)最小,同时为了避免过拟合,加入正则项,也就是约束要优化的参数。深度学习是机器学习的一个分支,它用于分类时,也是一个最优化问题。而一般的最优化问题不容易求解,是因为容易陷入局部最优解,而不能得到全局最优。如果这个最优化问题恰巧是一个凸优化问题,则可以高效地求解出模型最优解,这是因为,根据凸函数的性质,局部最优就是全局最优。


机器学习方法的三要素

机器学习方法通常都是由模型、策略和算法三部分构成:
方法 = 模型 + 策略 + 算法

模型

输入空间到输出空间的映射关系。学习过程即为从假设空间中搜索适合当前数据的假设。

分析当前需要解决的问题,确定模型。

在这里插入图片描述

策略

从假设空间众多的假设中选择到最优的模型的学习标准或规则。

要从假设空间中选择一个最合适的模型出来,需要解决以下问题:

定义几个指标用来衡量上述的问题:

基本策略:

损失函数

损失函数:用来衡量预测结果和真实结果之间的差距,其值越小,代表预测结果和真实结果越一致。通常是一个非负实值函数。通过各种方式缩小损失函数的过程称作优化。损失函数记作L(Y,f(x))

常见的损失函数类型:

经验风险和结构风险

经验风险 VS 风险函数

经验风险:损失函数度量了单个样本的预测结果,要想衡量整个训练集的预测值与真实值的差异,将真个训练集所有记录均进行一次预测,求取损失函数,将所有值累加,即为经验风险。经验风险越小说明模型f(x)对训练集的拟合程度越好。

风险函数:又称期望损失、期望风险。所有数据集(包含训练集和预测集,遵循联合分布P(X,Y))的损失函数的期望值。

解决方法:

结构风险

结构风险:在经验风险的基础上,增加一个正则化项或者叫做惩罚项。

结构风险 vs 经验风险

正则化项

正则化项:即惩罚函数,该项对模型向量进行惩罚,从而谜面过拟合问题。正则化方法会自动削弱不重要的特征变量,自动从许多的特征变量中“提取”重要的特征变量,减小特征变量的数量级。

总结

  1. 机器学习的几个基本概念

  2. 机器学习的实质,

    • 输入空间到输出空间的假设空间中搜索到一个假设,选出对当前处理效果最好的假设。
  3. 机器学习三要素

    • 模型:确定什么类的问题
    • 策略:怎么评估模型好坏
    • 算法:怎么在学习规则要求的范围内优化改进,得到想要的结果
  4. 经验风险与结构风险

    处理三要素中策略的时候使用,实际上判断模型好坏的方法,通常会使用结构风险来评估

    • 结构风险和经验风险的区别
      • 经验风险仅对模型在测试集上表现结果来做评估,测试集上越好,经验风险越小
      • 结构风险兼顾两方面:1.模型在测试集上表现结果良好;2.模型的复杂程度不高,模型越复杂,对后续的预测效果越差,容易过拟合

在学习规则要求的范围内优化改进,得到想要的结果

  1. 经验风险与结构风险

    处理三要素中策略的时候使用,实际上判断模型好坏的方法,通常会使用结构风险来评估

    • 结构风险和经验风险的区别
      • 经验风险仅对模型在测试集上表现结果来做评估,测试集上越好,经验风险越小
      • 结构风险兼顾两方面:1.模型在测试集上表现结果良好;2.模型的复杂程度不高,模型越复杂,对后续的预测效果越差,容易过拟合

标签:风险,经验,机器,函数,模型,三要素,损失,空间,基本概念
来源: https://blog.csdn.net/qq_40127785/article/details/118692059