其他分享
首页 > 其他分享> > 什么是机器学习?

什么是机器学习?

作者:互联网

什么是机器学习?

参考了网络上的各家说法,一句话概括就是数据学习,机器决策(对应输入和输出)。

机器学习通常解决分类,回归等问题。

1 分类算法&机器学习

一张图概括分类算法流程

机器学习

  1. 原始数据集
  2. 探索性数据分析
  3. 数据预处理
  4. 数据分割(训练和测试)
  5. 算法建模
  6. 选择机器学习任务
  7. 模型结果评估

1.1 数据集

数据集本质上是一个M*N矩阵(N由X变量和Y标签变量组成)

1.2 数据分析

EDA做的是去了解数据,知道数据分布,通过图表对数据做直觉分析。通用的EDA三大方法包括

1.3 数据预处理

对数据做检查和校正

数据的质量将对机器学习算法模型的质量好坏产生很大的影响。因此,为了达到最好的机器学习模型质量,传统的机器学习算法流程中,其实很大一部分工作就是在对数据进行分析和处理。

一般来说,数据预处理可以轻松地占到机器学习项目流程中80%的时间,而实际的模型建立阶段和后续的模型分析大概仅占到剩余的20%。

1.4 数据分割

训练和测试8:2

1.5 算法建模

机器学习算法可以大致分为以下三种类型之一:

参数调优(入门能做的)
传说中的调参侠主要干的就是这个工作啦。超参数本质上是机器学习算法的参数,直接影响学习过程和预测性能。由于没有万能的超参数设置,可以普遍适用于所有数据集,因此需要进行超参数优化。

特征选择
从大量特征中选择重要的特征子集。特征选择的任务本身就可以构成一个全新的研究领域,在这个领域中,大量的努力都是为了设计新颖的算法和方法。从众多可用的特征选择算法中,一些经典的方法是基于模拟退火和遗传算法。除此之外,还有大量基于进化算法(如粒子群优化、蚁群优化等)和随机方法(如蒙特卡洛)的方法。

机器学习任务

评估回归模型性能的常用指标是确定系数(R²)。此外,均方误差(MSE)以及均方根误差(RMSE)也是衡量残差或预测误差的常用指标。

贴张深度学习的流程

深度学习

标签:机器,什么,学习,算法,可视化,数据,模型
来源: https://www.cnblogs.com/hshsk/p/16656913.html