Stay foolish:初学者轻松了解“大数据”
特色。由于网络数据的不断膨胀和用户需求的不断涌现,近年来互联网企业开始广泛研究和使用数据流处理,诞生了Yahoo! S4、Twitter Storm、IBM StreamBase、Facebook的Puma/Puma2 及学术界开源的Borealis等系统。
大数据是云计算吗?
如果有人问你这句话,你看完本文,可以很自信的回答他"Absolutely!"
为了回答这个问题,我们有需要引入一个概念----云计算是什么。
维基百科给云计算下的定义:云计算将IT相关的能力以服务的方式提供给用户,允许用户在不了解提供服务的技术、没有相关知识以及设备操作能力的情况下,通过Internet获取需要服务。
中国云计算网将云定义为:云计算是分布式计算(Distributed Computing)、并行计算(Parallel Computing)和网格计算(Grid Computing)的发展,或者说是这些科学概念的商业实现。
云计算分为三个层次:基础设施即服务(IaaS),平台即服务(PaaS)和软件即服务(SaaS)。
"在说什么,云啊云啊,好多的云啊,好大的棉花糖啊~~"
云计算的核心技术是海量数据分布式存储和海量数据分布式计算,现在云计算系统主要采用Map-Reduce模型。
"Map-Reduce?哪里看到过?"没错,在前面对大数据的解读的时候,我们就已经明确描述过这一段。终于看到熟悉的内容了,无比兴奋啊。
实际上,云计算的数据存储技术主要有谷歌的非开源的GFS(Google File System)和 Hadoop 开发团队开发的GFS的开源实现HDFS(Hadoop Distributed File System)。大部分IT厂商,包括yahoo、Intel的"云"计划采用的都是HDFS的数据存储技术。
通过对简单的云计算的定义及技术分析,加上前面我们对大数据的了解,不难得出结论,大数据当然是可以归为云计算的范畴。
应用领域有哪些?
说些我们熟知的地方吧,哪些我们接触到的地方用到了Hadoop?
要回答这个问题,举几个例子,很容易。在国内,包括中国移动、百度、网易、淘宝、腾讯、金山和华为等众多公司都在研究和使用它。
行业动态及展望
"大数据"的影响,增加了对信息管理专家的需求,甲骨文,IBM,微软和SAP花了超过15亿美元的在软件智能数据管理和分析的专业公司。这个行业自身价值超过1000亿美元,增长近10%,大数据已经出现,因为我们生活在一个社会中有更多的东西。有46亿全球移动电话用户有1亿美元和20亿人访问互联网。基本上,人们比以往任何时候都与数据或信息交互。1990年至2005年,全球超过1亿人进入中产阶级,这意味着越来越多的人,谁收益的这笔钱将成为反过来导致更多的识字信息的增长。思科公司预计,到2013年,在互联网上流动的交通量将达到每年667艾字节。
最早提出"大数据"时代已经到来的机构是全球知名咨询公司麦肯锡。麦肯锡在研究报告中指出,数据已经渗透到每一个行业和业务职能领域,逐渐成为重要的生产因素;而人们对于海量数据的运用将预示着新一波生产率增长和消费者盈余浪潮的到来。
麦肯锡的报告发布后,大数据迅速成为了计算机行业争相传诵的热门概念,也引起了金融界的高度关注。随着大数据时代的全面开启,你是否做好了充分的准备迎接这个时代的到来呢?
- 三大因素制约可穿戴设备的大数据梦想(09-27)
- 阿里云从三大方面布局物联网生态链(11-22)
- 揭秘云计算技术的现状及特点(02-19)
- 物联网基础设施强化的5个提示(07-08)
- 工业4.0的大数据在西门子、博世的应用案例(07-12)
- 【科普】一分钟全面了解“云存储”(08-07)