没有合适的资源?快使用搜索试试~ 我知道了~
南开大学复习资料-大数据导论.docx
1 下载量 175 浏览量
2022-12-18
07:17:51
上传
评论
收藏 41KB DOCX 举报
温馨提示
试读
20页
南开大学复习资料-大数据导论.docx
资源推荐
资源详情
资源评论
《大数据导论》课程期末复习资料
一、客观部分:(单项选择、多项选择)
(一)、单项选择以下不是NoSQL数据库的是(D)MongoDBHBaseCassandraDB22以
下不是目前主流开源分布式计算系统的是(A)AzureHadoopSparkStorm3.Apriori算
法是一种(A)算法关联规则聚类分类预测
(二)、多项选择大数据的特征包括(ABCD )体量大(Volume)多样性(
Variety)速度快(Velocity)价值高(Value)按照数据结构分类,数据可分为(
ABC )结构化数据半结构化数据非结构化数据无结构数据根据产生主体的不同,大
数据可以分为(BC)产量企业应用产生的数据大量个人用户产生的数据由巨量机器
产生的数据科研数据
数据可根据产生主体的不同分为三类:
(1)由少量企业应用而产生的数据。关系型数据库中的数据、数据仓库中 的
数据。
8. 简述大数据面临存储的问题与挑战。
随着结构化数据和非结构化数据数量的不断增长,以及分析数据来源的多样 化,
之前的存储系统设计已经无法满足大数据应用的需求。
对于大数据的存储,存在以下问题和挑战:
1. 容量问题:大数据通常可达到pb级的数据规模,因此大数据存储系统需 要达
到相应等级的扩展能力。
2. 延退问题:大数据应用还存在实时性的问题,很多大数据应用环境,如涉 及
网上交易或者金融类相关的应用,都需要较高的每秒进行读写操作的次数
3. 安全问题:某些特殊行业的应用,例如金融数据、医疗信息以及政府情报 等
又都自己的安全标准和保密性需求
4. 成本问题对于使用大数据环境的企业,成本控制是关键问题
5. 数据的积累,需要基于大数据的应用要求较长的数据保存时间,为了实现 长
期的数据保存,需要存储厂商开发出能持续进行数据一致性检测、备份和容灾 等保证
长期高可用性的技术
6. 灵活性大数据存储系统的基础设置规模庞大,保证存储系统的灵活性和 扩展
性是一大挑战。
为了应对大数据对存储系统的挑战,数据存储领域的工作者通过不懈努力提 升
数据存储系统的能力,主要提升有3个方面:提升系统的存储容量、提升系统 的吞吐
量、系统的容错性等。
9. 简述传统存储系统架构分类
经过多年发展,存储系统架构由早期的DAS (Direct-AttachedStorage,直连 式存储
)发展到NAS ( Network-AttachedStorage,网络附加存储)和SAN (
StoragcArcaNctwork,存储区域网络),现在已经进入到云存储阶段。
1. 直连式存储(Direct Attached Storage, DAS)是最早出现的最直接的扩展 数据
存储模式,即与普通的PC架构一样,存储设备与主机系统直接相连,挂接 在服务器
内部总线上。
2. 网络附加存储(Network Attached Storage, NAS )是一种采用直接与网 络
介质相连的特殊设备实现数据存储的模式。
3. 存储区域网络(Storage Area Network, SAN)指存储设备相互连接并与服 务
器群相连而成网络,创造了存储的网络化。通过专用高速网将一个或多个网络 存储设
备和服务器连接起来的专用存储系统,数据处理服务器上的操作系统可以 像访问本地
盘数据一样对这些存储设备进行高速访问。
10. 云存储技术具有哪些特点?并加以解释
云存储技术具有以下特点
(1) 可靠性。云存储通过增加冗余度提高存储的可靠性。但是增加可靠性受 到
可靠性原理、成本及性能等方面的制约,因此在在保证可靠性的同时,提高系 统的
整体运行效率是当前一个亟待解决问题。
(2) 可用性。企业需要全天候地为世界不同地区的用户提供服务支持,因 此可
用性至关重要。对于云存储平台,冗余的架构部分可以减少停机风险。同时, 多路
径、控制器、不同的光纤网、RAID技术、端到端的架构控制/监控和成熟的 变更管
理过程等方案均可提高云存储可用性。
(3) 安全性。云存储服务间传输以及保存的数据都有被截取或篡改的隐患, 因
此当服务通过云交付时,数据分片混淆存储和数据加密传输成为了实现用户数 据私密
性和保证安全性的重要手段。
(4) 动态伸缩性。指的是读/写性能和存储容易的扩展与缩减。一个设计优 良
的云存储系统可以在系统运行过程中简单地通过添加或移除节点来自由扩展 和缩减,
这些操作对用户来说是透明的。
(5) 低成本。云存储可以降低企业级存储成本,包括购置存储的成本、驱 动存
储的成本、修复存储的成本及管理存储的成本。
11. 云存储架构分哪些层次,各层实现了什么功能?
云存储是一个由网络设备、存储设备、服务器、应用软件、公用访问接口、 接
入网和客户端程序等组成的复杂系统。以存储设备为核心,通过应用软件来对 外提供
数据存储和业务访问服务。
云存储的架构由上而下可以分为访问层、应用接口层、基础管理层和存储层。
1) 存储层:云存储的最基础部分。云存储中的存储设备通常分布在不同地
域且数量非常庞大,通过互联网、广域网或FC光纤通道网络把各个存储设备连 接在
一起。统一存储设备管理系统在存储设备的上一层,它能够完成多链路冗余 管理,
存储设备的逻辑虚拟化管理以及硬件设备的状态监控与故障维护。
2)基础管理层:云存储最核心最难以实现的部分,基础管理层的主要功能 是使
云存储中多个存储设备之间可以协同工作,以便对外提供同一种服务,能够 提供更大
、更好、更强的数据访问性能,它所采用的技术主要有集群系统、分布 式文件系统
和网格计算等。为了保证云存储中的数据不会被未授权的用户所访问, 它还提供了
CDN内容分发系统以及数据加密技术。同时,为了确保云存储中的 数据不丢失以及
云存储自身的安全和稳定,它还采取了各种数据备份、数据容灾 技术和措施。
3)应用接口层:云存储中灵活性最好的部分,根据实际业务类型的不同, 不同
的云存储运营单位开发的应用服务接口及提供的应用服务也不一样。例如在 线音乐播
放应用平台、网络硬盘应用平台、IPTV和视频点播应用平台、远程教 学应用平台等。
4)访问层:用户获得云存储系统的授权后,就可以通过标准的公用应用接 口进
行登录并享受云存储服务。云存储提供的访问类型和访问手段会根据云存储 运营单位
的不同而有所不同。
12. 存储虚拟化技术有哪几个实施层次,分别叙述这几个层次的特点。
根据不同的虚拟化实现位置,虚拟化还可以分为基于主机虚拟化、基于存储 设备
剩余19页未读,继续阅读
资源评论
yyyyyyhhh222
- 粉丝: 403
- 资源: 6万+
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功