大数据技术及应用
大数据技术及应用
【摘要】:随着互联网技术的飞速发展,特别是近年来云计算、物联网、社交
网络等新兴服务促使人类社会的数据种类和规模正以前所未有的速度增长,大数
据时代正式到来.数据从简单的处理对象开始转变为一种基础性资源,如何更好
地管理和利用大数据已经成为普遍关注的话题.大数据的规模效应给数据存储、
管理以及数据分析带来了极大的挑战,数据管理方式上的变革正在酝酿和发生.
对大数据的产生背景和基本概念进行剖析,并对大数据的主要应用作简单对比.
在此基础上,阐述大数据处理的基本框架,并就云计算技术对于大数据时代数据
管理所产生的作用进行分析.最后归纳总结大数据时代所面临的新挑战。
【关键字】:大数据 发展趋势 应用 机遇和挑战
一、大数据时代的背景
半个世纪以来,随着计算机技术全面融入社会生活,信息爆炸已经积累到了一个开始
引发变革的程度。21 世纪是数据信息大发展的时代,移动互联、社交网络、电子商务等极
大拓展了互联网的边界和应用范围,各种数据正在迅速膨胀并变大。互联网(社交、搜索
电商)、移动互联网(微博)、物联网(传感器,智慧地球)、车联网、GPS、医学影像
安全监控、金融(银行、股市、保险)、电信(通话、短信)都在疯狂产生着数据。2011
年 5 月,在“云计算相遇大数据” 为主题的 EMC World 2011 会议中,EMC 抛出了 Big Data
概念。正如《纽约时报》2012 年 2 月的一篇专栏中所称,“大数据”时代已经降临,在商业、
经济及其他领域中,决策将日益基于数据和分析而作出,而并非基于经验和直觉。哈佛大
学社会学教授加里·金说:“这是一场革命,庞大的数据资源使得各个领域开始了量化进程,
无论学术界、商界还是政府,所有领域都将开始这种进程。”
二、什么是大数据
大数据(BigData)是指那些超过传统数据库系统处理能力的数据。它的数据规模和
转输速度要求很高,或者其结构不适合原本的数据库系统。为了获取大数据中的价值,我
们必须选择另一种方式来处理它。数据中隐藏着有价值的模式和信息,在以往需要相当的
时间和成本才能提取这些信息。如沃尔玛或谷歌这类领先企业都要付高昂的代价才能从大
数据中挖掘信息。而当今的各种资源,如硬件、云架构和开源软件使得大数据的处理更为
方便和廉价。即使是在车库中创业的公司也可以用较低的价格租用云服务时间了。对于企
业组织来讲,大数据的价值体现在两个方面:分析使用和二次开发。对大数据进行分析能
揭示隐藏其中的信息。例如零售业中对门店销售、地理和社会信息的分析能提升对客户的
理解。对大数据的二次开发则是那些成功的网络公司的长项。例如 Facebook 通过结合大量
用户信息,定制出高度个性化的用户体验,并创造出一种新的广告模式。这种通过大数据
创造出新产品和服务的商业行为并非巧合,谷歌、雅虎、亚马逊和 Facebook 它们都是大数
据时代的创新者。u
(一)大数据的 4V 特征
大量化(Volume):企业面临着数据量的大规模增长。例如, IDC 最近的报告预测称,到
2020 年,全球数据量将扩大 50 倍。目前,大数据的规模尚是一个不断变化的指标,单一
数据集的规模范围从几十 TB 到数 PB 不等。简而言之,存储 1PB 数据将需要两万台配备
50GB 硬盘的个人电脑。此外,各种意想不到的来源都能产生数据。
多样化(Variety):一个普遍观点认为,人们使用互联网搜索是形成数据多样性的主要原因,
这一看法部分正确。然而,数据多样性的增加主要是由于新型多结构数据,以及包括网络
日志、社交媒体、互联网搜索、手机通话记录及传感器网络等数据类型造成。其中,部分
传感器安装在火车、汽车和飞机上,每个传感器都增加了数据的多样性。
评论0
最新资源