大数据 大数据(big data),或称巨量资料,指的是所涉及的资料量规模巨大到无法通过目前主流软件工具, 在合理时间内达到撷取、管理、处理、并整理成为帮助企业经营决策更积极目的的资讯 。(在维克托·迈尔- 舍恩伯格及肯尼斯·库克耶编写的《大数据时代》中大数据指不用随机分析法(抽样调查) 这样的捷径,而采用所有数据的方法)大数据的4V特点:Volume(大量)、Velocity( 高速)、Variety(多样)、veracity(真实性)。 大数据技术的战略意义不在于掌握庞大的数据信息,而在于对这些含有意义的数据进 行专业化处理。换言之,如果把大数据比作一种产业,那么这种产业实现盈利的关键, 在于提高对数据的"加工能力",通过"加工"实现数据的"增值"。 从技术上看,大数据与云计算的关系就像一枚硬币的正反面一样密不可分。大数据必 然无法用单台的计算机进行处理,必须采用分布式架构。它的特色在于对海量数据进行 分布式数据挖掘(SaaS),但它必须依托云计算的分布式处理、分布式数据库(PaaS) 和云存储、虚拟化技术(IaaS)。 大数据需要特殊的技术,以有效地处理大量的容忍经过时间内的数据。适用于大数据 的技术,包括大规模并行处理(MPP)数据库、数据挖掘电网、分布式文件系统、分布式 数据库、云计算平台、互联网和可扩展的存储系统。 大数据分析相比于传统的数据仓库应用,具有数据量大、查询分析复杂等特点。《计 算机学报》刊登的"架构大数据:挑战、现状与展望"一文列举了大数据分析平台需要具备 的几个重要特性,对当前的主流实现平台——并行数据库、MapReduce及基于两者的混合架 构进行了分析归纳,指出了各自的优势及不足,同时也对各个方向的研究现状及作者在 大数据分析方面的努力进行了介绍,对未来研究做了展望。 大数据的4个"V",或者说特点有四个层面:第一,数据体量巨大。从TB级别,跃升到 PB级别;第二,数据类型繁多。前文提到的网络日志、视频、图片、地理位置信息等等 。第三,数据的来源,直接导致分析结果的准确性和真实性。若数据来源是完整的并且 真实,最终的分析结果以及决定将更加准确。第四,处理速度快,1秒定律。最后这一点 也是和传统的数据挖掘技术有着本质的不同。业界将其归纳为4个"V"——Volume(大量) 、Velocity(高速)、Variety(多样)、Veracity(真实性) 从某种程度上说,大数据是数据分析的前沿技术。简言之,从各种各样类型的数据中 ,快速获得有价值信息的能力,就是大数据技术。 大数据可分成大数据技术、大数据工程、大数据科学和大数据应用等领域。目前人们 谈论最多的是大数据技术和大数据应用。工程和科学问题尚未被重视。大数据工程指大 数据的规划建设运营管理的系统工程;大数据科学关注大数据网络发展和运营过程中发 现和验证大数据的规律及其与自然和社会活动之间的关系。 物联网、云计算、移动互联网、车联网、手机、平板电脑、PC以及遍布地球各个角落 的各种各样的传感器,无一不是数据来源或者承载的方式。 有些例子包括网络日志,RFID,传感器网络,社会网络,社会数据(由于数据革命的社 会),互联网文本和文件;互联网搜索索引;呼叫详细记录,天文学,大气科学,基因组 学,生物地球化学,生物,和其他复杂和/或跨学科的科研,军事侦察,医疗记录;摄影 档案馆视频档案;和大规模的电子商务 。 ----------------------- 大数据54720全文共1页,当前为第1页。
- 粉丝: 168
- 资源: 3万+
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助