【速记】网智天元 任俊杰:大数据智能应用实践分享
作者:互联网
【演讲主题】大数据智能应用实践分享
【演讲内容】网智天元科技集团股份有限公司技术总监任俊杰和我们介绍了网智天元在大数据智能应用实践经验。演讲内容主要包括以下三个方面:
一、网智天元简介
二、网智天元大数据智能平台
三、网智天元大数据智能应用分享
01
网智天元简介
▽
大家好,我是网智天元的任俊杰。先跟大家简单介绍一下网智天元。网智天元是星环科技的金牌伙伴,同时还有一个身份,是省部委级服务最多的大数据智能应用公司。我们服务的客户有外交部、银监会、保监会、证监会、还有国家的食药监以及旅游局。我们在大数据智能方向一直深耕不辍,业务领域涵盖了政府、银行、影视、媒体还有旅游等多个行业。我们一直以“数据洞见未来,智能创造机遇”的宗旨来服务客户。我们公司从2007年成立以来,十年磨一剑,总资本已经达到7970万,是新三板上市公司,市值已经达到了20亿。
我们秉承着服务客户、拥抱友商的宗旨,拥有了众多的客户群。网智天元通过哪些努力获得这么多的厚爱和荣誉呢?我们独创的网智机器人技术十年磨一剑,能够模拟人使用网络的行为,提供可视化工具软件,构建网络智能机器人,能够模拟人的上网行为,包括登录、搜索、点击、网购、评论等网络行为。我们用网络智能机器人,以模拟人类行为一种方式,每天可以采集包括三千多家国外媒体的境外板块和五百多家重要媒体的荣内,以及国内两万多家新闻媒体和六万个论坛的覆盖。以及我们拥有上千万微博的虚拟身份,其实这也是网络智能机器人一个重要的特点。它能够形成自己的虚拟身份,而且能够以这种方式来实现智能机器人的功能。
也是基于此,我们的创始人莫倩博士,创立了我们网智天元金三角商业模型。也就是以信息流、资金流、情感流围绕网络智能的方式实现我们的商业模型。什么是情感流呢?我们简单理解,像大家所说的粉丝经济就是一个例子,就是基于情感建立的一种商业模式。比如说你要是非常喜欢一件文化衫,你会不会考虑以更高的价格去买它呢?我们的大数据智能平台就可以为情感流的商业模式做支撑。
02
网智天元大数据智能平台
▽
接下来我从数据、内容、用户、时间、情感五个方面为大家简要介绍我们的大数据智能平台。首先我们拥有大量数据,刚才已经提到了。同时我们拥有高效快速的管理能力来实现对这些数据的价值挖掘。用户的方面,我们的巨象分析做过超过十亿的用户的画像。我们曾为12306做了7.6亿人的画像,也为中国联通我们做了3亿多的画像,可能在这个就有在座的你和我。时间维度,我们可以做到20年的长期趋势预测。我们在1984年以来,所有的票房通过大数据的方式,做的预测统计,准确率能够达到84%,在这个行业里面应该是相当高的一个水平。最后,基于我们百万级互联网机器人的网络并发评论,实现网络热点话题的传播塑造。这是我们能对情感方面所提供的支持。
正因为我们在不断砥砺前行的情况,获得了很多国家科研课题、文化课题的创新项目。2018年中国大数据企业50强中,网智天元喜获全国第一位。同时我们还获得了多项个别的单项奖,2018中国大数据·舆情监测领域最佳解决方案、2018中国大数据·金融行业最佳产品、2018中国大数据·金融行业最佳创新应用三个专有领域大奖。
03
网智天元大数据智能应用分享
▽
现在我带大家具体了解一下我们具体的产品。我们在大数据的创新和发掘的过程中,看到行业内有许多数据安全的需要,因此我们创造了一个金蜂巢脱敏系统。现在众多行业有数据安全的需要,尤其是银行、证券等一系列金融企业,还有一些大型的国企等。这些企业整个线上跑的数据都是真实而具有隐私性的。如果希望在一个测试环境中,体验它的系统或者进行系统的升级验证,既要保证数据的功能性,又要保证合理性。比如说手机号必须是11位,身份证15位到18位。这样的各类条件,是必须在测试环境中能够满足才能够验证新的升级系统是否可以正常使用。与此同时你要规避你数据安全的问题,通过我们的脱敏系统,就可以实时把数据的系统中的敏感信息隐蔽,或者是改变规则变换敏感信息。比如系统中有我的名字、我的身份证号,就会变换成了一个叫做李俊杰,或李杰俊,身份证也会同时随机生成。
通过我简单一个案例,跟大家说一下这个过程。更多的是终端执行的效率和敏感信息的自动挖掘功能,以及客户数据真实反应,并且在脱敏过程中安全可试,这才是真正的好的数据脱敏工具一个应用和实践。通过脱敏的分析、配置、变形、分发,就能够实现相关的脱敏敏感信息发现和业务需求的分析,以及最后的脱敏和数据验证等一系列所需要脱敏能力。
下面我们说一下在客户画像的应用,客户画像其实有很多嘉宾已经跟大家交流了,我们的特点在哪里呢。首先我们在客户画像模型分析上面拥有自己的特点,同时在客户留存以及功能转化分析上,用了一个比较清晰的逻辑和转化标准的模式。其实大家都知道,客户画像很多都是为数据打标签。我们能够提供八位,30多个子类基础标签,无论是用户价值,人工属性,消费特征,这些都通过算法迅速完成。我们以用户为中心,直接面对主题的数据分析框架系统。同时我们还要有一些预测,通过数据的分类,包括聚类,复杂数据的挖掘。正因为我们通过这一系列的沉淀和分析,我们给中国铁路12306、中国联通、还有股民朋友所熟悉的同花顺,做了3.5亿的客户画像的分析。
下面我想重点给大家介绍的我们的声誉风险管控系统,也就是态势感知。系统的全名叫做金战鹰声誉风险管控系统。我们不仅仅是在展示,而且我们还对整个业务量进行舆情的发现,还有传播学一系列路径的追踪,做了一系列的模型和相关的数据建模,以及在整个系统中的实现。
下面举一个例子,这是一个北京的产业大数据监测平台,我们通过它的多项产业基层属性列入之后,对整体产业聚集,人口流动,领域分布,等热点问题进行一呈现。比如热点指数,这些数据范围在论坛,博客、微信,也就是我们在全网进行挖掘,而且还可以根据客户的需求,自定义实现你的整个舆情,按照你所要求的时段来去反应。
我们现在可以提前预知、提前分析,能够在这个事态之前,告诉我们的用户事态的发展方向是什么。这一切都积淀于整个事件发生研判和预警,包括你的深度挖掘和追踪。通过根结点和叶节点的会聚和聚合,以及分散性的分析,你都可以知道整个数据的来源和数据发展未来的走向。尤其是在政府部门,或者对一些舆情高感知单位,他们对整个事态的研判和预警方向有一个需求。我们在对突发事件和网民、媒体以及地域性态势感知是具有我们独特的优势。
这是一个关键人物和实践论点关系的分析。通过关键点进行发散,包括影响力,包括一系列整个扩散的方式,起到一个全面的挖掘,最后形成了织网。这种来去反映这件事件在整个舆情过程中得到哪些重要的干预,包括粉丝的一些态度。
刚才是简单解释了一下整个运营逻辑和过程,以及在使用过程中看到简单应用一些界面。这是我们之前做的贵阳市云岩区的一个展示大屏的内容,同时我们会进行数据的实时发掘。展示内容已经用我们自己的脱敏工具完成脱敏了。我们在公共数据采集上,在全方位覆盖及精准抓取,包括数据积累和传播呈现,这些是我们所实现一个目势。通过刚才这种分析之后,我们希望达到怎样的目的呢?是要做决策指挥,下一步的行动就基于刚才的分析,你实现了哪些行动。当这些行动可以推送到你的用户待办事项中,他可以一目了然的为下一步行动进行决策,我们数据展示的能力为他提供了强有力的支撑。我们数据的及时性抓住传统新闻里最看重的黄金四小时,包括自媒体时代一定要抓住的黄金四十分钟。
我们不仅仅在舆情方向做了一些应用,还可以做多语种智能采集翻译。这其实是我们在外交部所做的,还有包括中央电视台的多语种平台。多语种主要是依赖于知识图谱,这个技术其实上午专家已经讲过,知识图谱的建立,实现中文英文等主流语言的知识成果。目前还有些小众语言,比如阿拉伯语还在建设之中。甚至我们还在建设藏语,2017年我们在西藏成立了一个分部。我们对各种语种知识图谱的构建,正在不断去挖掘和迭代。
同时我们在网络内容的感知分析这块,我们通过一系列的传统传播学,还有态势感知的过程和分析,我们进行了多维度挖掘和分析。我们不仅仅是要分析,而且要直接为用户决策提供直觉的支持,让用户觉得好用。数据分析完之后,用户看到之后是应用,不仅仅采用常用的条状、折线做呈现,我们还要使他能够看到更多更丰富的、更多用户想要看到的东西。
以上就是我们要给大家介绍的,我们在大数据智能方面的应用。这些就是我们在部委进行的一系列应用模型和应用展示,以及界面。刚才展示的这些,客户就是因为我们严谨,专业的态度,拥抱的客户所获得大量的客户群。同时我们能够服务20万小微企业,通过我们网络智能,包括运用思维和数据驱动的模式,在创投、众筹以及融资等方式实现对20万的文化小微企业服务。这个就是我们的网智天元想构建的一个行业大数据智能生态平台。
也是非常感谢和大家一起分享,我们过程中的一些产品和我们过程中所做的经验。还是那句话,我们网智天元是以服务客户,拥抱友商为宗旨,欢迎大家在会后到北京总部莅临参观,我们一起沟通携手,创造大数据美好的新业态,谢谢。
标签:网智,俊杰,速记,智能,天元,数据,我们,脱敏 来源: https://blog.51cto.com/u_15127640/2773737