在风起云涌的“互联网+”时代,高大上的贵阳数博会是一场大数据盛宴,也是一场“头脑风暴”,用万众瞩目来形容并不为过。看看那些参会企业及大佬,真是“亮瞎”人的眼:微软、谷歌、英特尔、惠普、思科、甲骨文、戴尔、阿里巴巴、富士康、奇虎360、华为、联想、京东、中兴,马云、郭台铭、刘东强、周鸿祎……全球首个数博会,世界精英云集,他们可不止“来看看”这么简单。
目前,大多数人对大数据的概念还停留在:就是海量的数据,PB(1PB=1024TB)级别的,甚至是 EB、ZB 以上的数据,通过对这些数据进行深入分析,就能得出非常有价值的结论,指引企业做出最佳决策。
其实,现在的大数据指的并不仅仅是海量数据,更准确而言是对大数据分析的方法。大数据是从收集的海量数据中,通过算法将这些来自不同渠道、格式的数据进行直接分析,从中寻找到数据之间的相关性。简单而言,大数据更偏重于发现,以及猜测/印证的循环逼近过程。
IBM的研究称,整个人类文明所获得的全部数据中,有90%是过去两年内产生的。而到了2020年,全世界所产生的数据规模将达到今天的44倍。
每一天,全世界会上传超过5亿张图片,每分钟就有20小时时长的视频被分享。然而,即使是人们每天创造的全部信息——包括语音通话、电子邮件和信息在内的各种通信,以及上传的全部图片、视频与音乐,其信息量也无法匹及每一天所创造出的关于人们自身的数字信息量。这样的趋势会持续下去。