大数据基础知识点总结 大数据是指其大小超出了常规数据库工具获取、存储和分析能力的数据集。它具有四个特征:Volume(巨量性)、Velocity(即时性)、Variety(多样性)和Value(高价值). 大数据的发展背景是数据爆炸,伴随着互联网、物联网、电子商务、社交媒体、现代物流、网络金融等行业的发展,全球数据总量正呈几何级数增长。 大数据的定义和特征:大数据是指其大小超出了常规数据库工具获取、存储和分析能力的数据集。 Volume 巨量性数据体量巨大,数据规模已从 GB 到 TB 到 PB ,甚至开始以 EB 和 ZB 计数。Velocity 即时性数据产生、处理和分析速度在持续加快,数据流量大,处理能力从批处理转向流处理。Variety 多样性大数据类型复杂。Value 高价值和低价值密度数据体量不断增大,单位数据的价值密度不断降低,而数据的整体价值在不断升高。 大数据的意义:工业革命后的 200 年里,人们对物理资源(如煤炭、石油、天然气等)的利用已经登峰造极,对新兴能源(太阳能、风能、潮汐能等)的利用也日渐成熟,但对数据资源的利用仍处于起步阶段,后续还有很长的路要走。毋庸置疑,云计算和大数据的出现,将导致社会经济结构和重心由传统的物质和能源向数据时代的时间和空间进行转换过渡。 大数据的目的是:挖掘和整合一切有用的信息,为人类社会提供更好的服务。 大数据框架:Hadoop 是大数据产业中广泛应用的框架,框架中最重要的组成部分 HDFS(Hadoop Distributed File System)和 MapReduce 就是前两篇论文的成果。 大数据处理方法:MapReduce 是一种针对超大规模数据集的编程模型和系统,描述了大数据的分布式计算方式,主要思想是将任务分解然后在多台处理能力较弱的计算节点中同时处理,然后将结果合并从而完成大数据处理。 BigTable 是用来在海量数据规模下管理结构化数据的分布式存储系统。每个大表被切分成若干个部分称为 tablet ,各个 tablet 分布在各个不同的 tablet 服务器上,tablet 服务器之间的负载均衡是通过合并与切分tablet 来动态实现的,保证了服务器的高效利用。 大数据的应用前景:大数据技术将会对社会经济结构和重心产生巨大影响,对人类社会的发展和变革产生深远的影响。
剩余38页未读,继续阅读
- 粉丝: 3
- 资源: 13
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- x64dbg-development-2022-09-07-14-52.zip
- 多彩吉安红色旅游网站-JAVA-基于springBoot多彩吉安红色旅游网站的设计与实现
- 本 repo 包含使用新 cv2 接口的 OpenCV-Python 库教程.zip
- 更新框架 (TUF) 的 Python 参考实现.zip
- Qos,GCC,pacing,Nack
- 章节1:Python入门视频
- 无需样板的 Python 类.zip
- ESP32 : 32-bit MCU & 2.4 GHz Wi-Fi & BT/BLE SoCs
- 博物馆文博资源库-JAVA-基于springBoot博物馆文博资源库系统设计与实现
- 旅游网站-JAVA-springboot+vue的桂林旅游网站系统设计与实现