人工智能产业链了解
作者:互联网
“全面化人工智能可能意味着人类的终结...”机器可以自行启动,并且自动对自身进行重新设计,速率也会越来越快。受到漫长的生物进化历程的限制,人类无法与之竞争,终将被取代“
--- by史蒂芬·霍金
人迟早会用机器把自己从大量重复性的工作中解放出来,但是实现这个愿望并不需要那些鼓吹的最终版本“超级智能”。
AI的业务2018年快速崛起,对其中的技术框架,产业信息需要了解。
简介
ML(machine learning):即机器学习,wiki定义:“计算机系统以来科学的预测和判断模型去有效完成特定的任务,而无需借助明确的执行指令”,属于AI的一个分支,机器学习算法的重点在于通过“训练数据”来实现合理的预判决策,摆脱对固定明确的执行指令的依赖。
AI(artificial intelligence):即人工智能,wiki定义:“机器可以通过察觉环境,采取最大成功概率的行动,去达到特定的目标”,更通俗的定义是“机器/计算机,通过对外部输入数据的理解和学习,自适应的去解决特定的问题,表现出类似自然人的学习能力,问题分析和解决能力”。
AI不是单一的学科技术,是跨行业,跨学科的。它主要包含四大核心技术:
- 机器学习:通过大量数据训练,做最佳决策和预测;
- 自然语言处理:人类语言和计算机可处理的形式之间的相互转换,可以是文字也可以是声音,主要有信息检索,信息提取,语音识别,词性标注等等;
- 图像处理:类似人类的图像识别功能,可以识别图像和多维数据,主要有图像过滤,特征提取等;
- 人机交互:计算机通过人机交互界面和人进行交流,比如VR,增强现实等技术;
技术框架及分析
显而易见,“数据”是企业非常重要的一种资产,是后续智能赖以生存和发展的基础。
数据相关目前有以下几种业务:
数据采集(data acquisition),按照一定规则和诉求,收集原始数据,国内有火车头,瑞雪采集,神箭手等采集工具,可以通过用户配置的规则进行数据采集,这个产业中可能会有大量的隐私数据,涉及用户敏感信息的数据被转手交易,在用户完全不知情的情况下被使用,所以个人觉得后面数据的隐私安全也是一个方向;
数据清洗(data cleaning),从大量数据中筛选矫正,剔除那些过期的,异常的的值;
数据挖掘(data mining),通过算法实现对海量数据的分析和建模,从数据中发现规律;
数据标注(data annotation),目前来看“有多少智能,就有多少人工”,智能以来的数据输入,需要经过标注处理。举个例子:要想训练一个识别可乐罐的算法,前期就需要输入大量的,各种各样带有可乐罐的图片,并且把其中可乐罐的位置标注出来,在大量数据需求面前, 这个工作量非常庞大,有不少公司专门做数据标注的业务。这个方向后面会逐渐的被自动化工具所替代。
数据以上,云计算/大数据/GPU/各种IC,甚至5G等等,这类通用的技术支撑,不仅在人工智能的产业链中扮演重要角色,在未来“万物互联”的环境中,都将作为主要支撑层,已经不会是传统意义上的“技术”,更像是一种社会不可或缺的基础设施。所以不论是阿里还是华为,他们都不仅仅是表面上的“淘宝天猫”和“智能手机”,更重要的是背后的飞天,盘古,HISI等这些东西。并且,“中兴事件”上可以看出,芯片级别的优势,作为行业上游的优势,可以对下面的集成商,开发商,构成很大的威胁。
基础通用技术这层,不是什么公司都可以玩的起,需要比较早的规划和技术储备。
这就像技术人员为什么总是往底层走,更底层不一定代表更高的收入,但更底层往往更安全。
再往上,就是通用的一些计算/算法框架, 通用的算法技术。
框架以TensorFlow为例,官方解释如下:
TensorFlow™ is an open source software library for high performance numerical computation. Its flexible architecture allows easy deployment of computation across a variety of platforms (CPUs, GPUs, TPUs), and from desktops to clusters of servers to mobile and edge devices.
框架,到通用技术,可以理解为一个抽象封装层析,到另一个更高的抽象封装层次。
为了应对上层纷繁的业务层快速迭代,快速集成,快速发布贴近用户具体场景的开发需求。
再上一层,也就是顶层,可以叫做“应用层”了。
所谓的“应用”,就是“业务”,也就是“业务代码”的那个“业务”。具体讲,就是各个细分行业中不同的用户需求和业务流程。主要开发工作在这个分层的公司,严格意义上将不能叫技术公司,更多的是业务的迭代集成和二次开发,技术深度和投入上都有局限,通用性上也受局限。
最后,收集下AI产业链中公司的分布。
全球:
国内:
BAT布局:
标签:机器,人工智能,data,技术,产业链,AI,了解,数据,标注 来源: https://www.cnblogs.com/doctors/p/10505452.html