icode9大数据关键技术:常规机器学习方法
作者:互联网
机器学习方法简介
机器学习、人工智能、深度学习是什么关系?
机器学习研究和构建的是一种特殊算法(而非某一个特定的算法),能够让计算机自己在数据中学习从而进行预测。
Arthur Samuel给出的定义指出,机器学习是这样的领域,它赋予计算机学习的能力(这种学习能力)不是通过显著式编程获得的。
不管是机器学习还是深度学习,都属于人工智能(AI)的范畴。所以人工智能、机器学习、深度学习可以用下面的图来表示:
机器学习的基本思路
1.把现实生活中的问题抽象成数学模型,并且很清楚模型中不同参数的作用
2.利用数学方法对这个数学模型进行求解,从而解决现实生活中的问题
3.评估这个数学模型,是否真正的解决了现实生活中的问题,解决的如何?
机器学习分类
监督学习
监督学习:指我们给算法一个数据集,并且给定正确答案。机器通过数据来学习正确答案的计算方法。
这种通过大量人工打标签来帮助机器学习的方式就是监督学习。这种学习方式效果非常好,但是成本也非常高。
监督学习的2个任务:
1.回归:预测连续的、具体的数值。比如:支付宝里的芝麻信用分数
2.分类:对各种事物分门别类,用于离散型预测
“回归”案例:个人信用评估方法——FICO
FICO 评分系统得出的信用分数范围在300~850分之间,分数越高,说明信用风险越小。
非监督学习#
非监督学习中,给定的数据集没有“正确答案”,所有的数据都是一样的。无监督学习的任务是从给定的数据集中,挖掘出潜在的结构。
强化学习
在一个有特定规则的场景下,尤其是游戏。
机器学习实操的步骤
机器学习在实际操作层面一共分为7步:
- 收集数据
- 数据准备
- 选择一个模型
- 训练
- 评估
- 参数调整
- 预测(开始使用)