HICA AI V3.0培训教材重点记录笔记
作者:互联网
文章目录
- 1.人工智能概览
- 2.机器学习
- 3.深度学习
- 3.业界主流开发框架
- 4.华为AI开发框架MindSpore
- 5.Atlas人工智能计算平台
- 6.华为智能终端AI开放平台
- 7.华为云企业智能应用平台
- 1.1.人工智能概述
- 1.2.人工智能的技术领域与应用领域
- 1.3.华为人工智能发展战略
- 1.4.人工智能的争议
- 2.1.机器学习算法
- 2.2.机器学习的分类
- 2.3.机器学习的整体流程
- 2.4.其他机器学习重要方法
- 2.5.机器学习的常见算法
1.人工智能概览
1.1.人工智能概述
- 人类的智能可以分成七个范畴:
- 语言(Verbal/Linguistic)
- 逻辑(Logical/Mathematical)
- 空间(Visual/Spatial)
- 肢体运作(Bodily/Kinesthetic)
- 音乐(Musical/Rhythmic)
- 人际 (Inter-personal/Social)
- 内省(Intra-personal/Introspective)
- 人工智能:它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。
- 机器学习:专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。是人工智能的核心研究领域之一。
- 深度学习:源于人工神经网络的研究,多层感知器就是一种深度学习结构。深度学习是机器学习研究中的一个新的领域,它模仿人脑的机制来解释数据,例如图像,声音和文本。
- 三大主义学派:
符号主义
1)人类的认知过程是各种符号进行推理运算的过程。
2)人是一个物理符号系统,计算机也是一个物理符号系统,因此,能用计算机来模拟人的智能行为。
3)知识表示、知识推理、知识运用是人工智能的核心。符号主义认为知识和概念可以用符号表示,认知就是符号处理过程,推理就是采用启发式知识及启发式搜索对问题求解的过程。
落脚点在推理,符号推理与机器推理。连接主义
1)思维的基本是神经元,而不是符号处理过程。
2)人脑不同于电脑,并提出连接主义的电脑工作模式,用于取代符号操作的电脑工作模式。
落脚点在神经元网络与深度学习。行为主义
1)智能取决于感知和行动,提出智能行为的“感知-动作”模式。
2)智能不需要知识、不需要表示、不需要推理;人工智能可以像人类智能一样逐步进化;智能行为只能在现实世界中,通过与周围环境的不断交互而表现出来。
落脚点在行为控制、自适应与进化计算。
- AI相关技术概览:
- 人工智能的分类:
- 强人工智能:
强人工智能观点认为有可能制造出真正能推理( Reasoning )和解决问题( Problem_solving )斜体样式的智能机器,并且,这样的机器将被认为是有知觉的,有自我意识的。可以独立思考问题并制定解决问题的最优方案,有自己的价值观和世界观体系。有和生物一样的各种本能,比如生存和安全需求。在某种意义上可以看作一种新的文明。 - 弱人工智能:
弱人工智能是指不能制造出真正地推理( Reasoning )和解决问题( Problem_ solving )的智能
机器,这些机器只不过看起来像是智能的,但是并不真正拥有智能,也不会有自主意识。
- AI产业生态:
- AI涉及的子领域:
1.2.人工智能的技术领域与应用领域
- 现在AI的应用技术方向主要分为:计算机视觉、语音处理、自然语言处理。
1.3.华为人工智能发展战略
- 华为全栈全场景AI解决方案:
1.4.人工智能的争议
- 算法的偏见主要源于数据的偏见。
2.机器学习
2.1.机器学习算法
2.2.机器学习的分类
- 监督学习:利用已知类别的样本,训练学习得到一个最优模型,使其达到所要求性能,再利用这个训练所得模型,将所有的输入映射为相应的输出,对输出进行简单的判断,从而实现分类的目的,即可以对未知数据进行分类。
- 无监督学习:对于没有标记的样本,学习算法直接对输入数据集进行建模,例如聚类,即“ 物以类聚,人以群分”。我们只需要把相似度高的东西放在一起,对于新来的样本,计算相似度后,按照相似程度进行归类就好。
- 半监督学习:试图让学习器自动地对大量未标记数据进行利用以辅助少量有标记数据进行学习。
- 强化学习:学习系统从环境到行为映射的学习,以使奖励信号(强化信号)函数值最大,强化学习不同于连接主义学习中的监督学习,主要表现在教师信号上,强化学习中由环境提供的强化信号是对产生动作的好坏作一种评价(通常为标量信号),而不是告诉强化学习系统如何去产生正确的动作。
- 回归问题(监督学习):反映了样本数据集中样本的属性值的特性,通过函数表达样本映射的关系来发现属性值之间的依赖关系。
- 分类问题(监督学习):通过分类模型,将样本数据集中的样本映射到某个给定的类别中。
- 聚类问题(无监督学习):通过聚类模型,将样本数据集中的样本分为几个类别,属于同一类别的样本相似性比较大。
- 最佳行为(强化学习):强化学习总是在寻找什么样的行动才是最佳的?强化学习针对的对象是机器或者机器人。
2.3.机器学习的整体流程
- 数据集:在机器学习任务中使用的一组数据,其中的每一个数据称为一个样本。反映样本在某方面的表现或性质的事项或属性称为特征。
- 训练集:训练过程中使用的数据集,其中每个训练样本称为训练样本。从数据中学得模型的过程称为学习(训练)。
- 测试集:学得模型后,使用其进行预测的过程称为测试,使用的数据集称为测试集,每个样本称为测试样本。
- 数据预处理:
- 数据清理(填充缺失值,发现并消除造成数据及异常点)
- 数据标准化(标准化数据来减少噪声,以及提高模型准确性)
- 数据降维(简化数据属性,避免维度爆炸)
- 数据预处理的主要操作:
- 数据过滤
- 处理数据缺失
- 处理可能的异常、错误或者异常值
- 合并多个数据源数据
- 数据汇总
- 特征选择技术的必要性:
- 简化模型,是模型更容易被使用者所解释。
- 减少训练的时间。
- 避免维度爆炸的问题。
- 提升模型泛化性,避免过拟合。
- 什么是好的模型?
- 泛化能力(能否在实际的业务数据也能预测准确)
- 可解释性(预测的结果是否容易被解释)
- 预测速率(每一条数据的预测需要多长时间)
- 可塑性(实际业务过程中数据量可能很大,随着业务量增大,预测的速率是否仍然可以接受)
2.4.其他机器学习重要方法
2.5.机器学习的常见算法
3.深度学习
3.1.深度学习简介
3.2.训练法则
3.3.激活函数
3.4.正则化
3.5.优化器
3.6.神经网络类型
3.7.常见问题
3.业界主流开发框架
4.华为AI开发框架MindSpore
4.1.MindSpore开发框架简介
4.1.1.MindSpore架构
4.1.2.MindSpore特性
4.2.MIndSpore开发与应用
5.Atlas人工智能计算平台
5.1.AI芯片概览
5.2.昇腾芯片硬件架构
5.3.昇腾芯片软件架构
5.4.华为Atlas人工智能计算平台
5.5.Atlas的行业应用
主要应用于电力、金融、制造、交通、超算等领域。
6.华为智能终端AI开放平台
6.1.AI行业生态
7.华为云企业智能应用平台
7.2.ModelArts
标签:V3.0,机器,AI,样本,学习,人工智能,培训教材,数据 来源: https://blog.51cto.com/u_15251606/2870666