小白也能轻松看懂大数据【大数据系列01集】
作者:互联网
【完整文案】
Hi,大家好,这里是晓阳的数据小站。因为很多机缘巧合的原因,原本学习Java开发的我,从毕业以后就干上了数据的开发工作,一晃到现在都八年了。这么多年的过程里,我看到了后信息时代大数据概念的风起云涌,从过去在中关村创业大街,每天看着无数西装革履的人来来回回,在观摩互联网创业经验的同时,还不忘到车库、3W喝一杯互联网的咖啡,真香!在这条据说超过了2万家创业公司的大街上,大数据开始了它风光无限的青年时代。
说起大数据,很多人都不陌生,不仅新闻自媒体上相关的文章数不胜数,连政府都开始有条不紊的制定《大数据条例》了。在京东上搜索大数据的时候,展示结果更是达到了10万+。
那么什么是大数据,我们还是从基本的“数据”概念说起。说起“数据”,很多人就更熟悉了:上班的时候选择了滴滴打车,工作时在百度上搜索某篇文章,主管不在的时候偷偷在淘宝上买了一件商品,中午饿了就点一份美团外卖,下班点开腾讯视频看几段综艺,睡觉前再刷一刷微博看看今天有哪些热搜。可以说你在手机或者电脑上的每一次行为,互联网公司都会把它记录下来,这就是“数据”。尽管我们不知道你是谁,你做这件事的目的是什么,但这并不妨碍大数据公司利用这些“数据”来不断优化升级它们的服务,使自己的服务变得更加智能。例如你点开了滴滴打车系统会提示你常用的上车地点,百度点击“论文查重”它会贴心的告诉你网址和价格,点开的淘宝的APP总会给你推荐几件你可能喜欢的东西(嗯,别问它是怎么知道的),祖国千里江山哪里有八卦了微博都是第一时间上热搜的。尽管国家不断强调不能侵犯个人的隐私,但收集匿名的“数据”同样还是非常有用的。
那么多少数据才能称之为“大”呢?一般来说,一家上了规模的互联网企业,每天采集10TB的数据是很正常的,如果某家公司宣称自己是大数据技术,但一看数据才几个GB,那么这些数据只能说“多”,还算不上“大”。10TB是什么概念?用我手里的华为手机做个比喻吧,这里强调一下,我没有给华为打广告的意思,你用苹果或者小米同样都可以。我买的是128GB的版本,1TB=1024GB,所以10TB大概是80个128G,也就是一天的数据就能存满80台手机。听起来好像不多,但你要知道,是每天都要收集这么多,一年下来光存这么多的数据就要花很多钱。以UCloud为例,买一台标准的8核16G服务器,带1000G的数据盘,一年大概要11200元,那么每天10TB的数据,存一年的话,光服务器成本就要四千多万,这还不算要雇佣程序员需要的钱。
那么这么多数据是怎么算出来的呢?这就不得不说谷歌三大论文了,具体的意思太专业了,我就用直白一些的话来说。简单说就是三大论文提供了一种可行的方法,把很多台电脑(服务器)组合起来,像一台电脑(服务器)一样来计算数据。这样原本需要几天时间才能算出来的东西,现在只需要几分钟甚至几秒钟就能算出来,大大提高了程序员的工作效率。所以忙的焦头烂额的程序员们欣喜的发现我怎么这么厉害了,开始把省出来的时间来算各种各样有趣的东西。假如你是一名奶爸,原本你只打算买一瓶啤酒,但我的数据告诉我其他人买啤酒的时候,还同时买了纸尿裤,那我把纸尿裤推荐给你,原本只能卖出一件商品就变成了能卖出两件,商家能赚更多的钱。例如前些年很多人到了一个陌生的城市,打出租车总是会被司机多绕路,有了打车软件,我就能用数据来算出来怎么走更合理,这样司机想多绕路就会被我一眼看穿,我就能省下更多的钱。因此大数据不仅仅能让企业赚到更多的钱,还可以让消费者省下更多的钱,真正诠释了什么叫做“没有中间商赚差价”。
那说了这么多,让我来对今天的视频做一个总结,就是大数据之所以“大”,是因为它会一直不停的收集和计算数据,经年累月积攒下来的数量很大。大数据的价值不在于记录这些信息,而在于能够通过分析从而发现普通人发现不了的规律。
大数据并不神秘,它存在于我们的身边,为我们而服务,让世界变得更加和谐美好。我信了,你呢?
标签:很多,01,程序员,点开,10TB,小白,服务器,数据 来源: https://blog.51cto.com/u_15291990/2978866