没有合适的资源?快使用搜索试试~ 我知道了~
云计算与大数据技术应用习题.docx
1.该资源内容由用户上传,如若侵权请联系客服进行举报
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
版权申诉
0 下载量 56 浏览量
2022-11-01
00:45:09
上传
评论
收藏 209KB DOCX 举报
温馨提示
试读
21页
。。。
资源推荐
资源详情
资源评论
1. 简述什么是云计算?
答:云计算是一种动态扩展的计算模式,通过网络将虚拟化的资源作为服务提供;
云计算是一种无处不在的、便捷的通过互联网访问一个可定制的 IT 资源(IT 资
源包括网络、服务器、存储、应用软件和服务)共享池,并是一种按使用量付费
的模式,它能够通过最少量的管理或与服务供应商的互动实现计算资源的迅速供
给和释放;云计算是基于互联网服务的增加、使用和交付模式,通常涉及通过互
联网来提供动态易扩展且经常是虚拟化的资源。
2. 云计算有什么特点?
答:①具有大规模并行计算能力;②资源虚拟化(Virtualization)和弹性调度;
③数据量巨大并且增速迅猛;④高可靠性;⑤按需分配,按量计费。
3. 请分别回答什么是 IaaS、PaaS、SaaS?
答:IaaS:基础设施即服务,Infrastructure as a Service;PaaS:平台即服务,Platform
as a Service;SaaS:软件即服务,Software as a Service。
4. 云计算的基础设施有哪些,各自完成什么功能?
答:①分布式文件系统,完成数据的存储;②MapReduce 编程模式,提供分布式
并行编程环境进行数据处理;③大规模分布式数据库 BigTable,提供分布式大规
模数据库管理系统。
1. 解释说明什么是非结构化和半结构化数据?
答:非结构化数据是数据结构不规则或不完整,没有预定义的数据模型,不方便
用数据库二维逻辑表来表现的数据,包括所有格式的办公文档、文本、图片、图
像和音频/视频信息等。半结构化数据是介于完全结构化数据(如关系型数据库、
面向对象数据库中的数据)和完全无结构的数据之间的数据,XML、HTML 文
档属于半结构化数据,它一般是自描述的,数据的结构和内容混在一起,没有明
显的区分。
2. 大数据价值链的三大构成是什么?
答:数据本身、技能与思维。
3. 大数据的 4V 特征是什么?
答:①多样性(Variety);②规模性大(Volume);③快速性(Velocity);④价值
密度低(Value)。
4. 简述云计算与大数据的关系?
答:云计算与大数据是一对相辅相成的概念,它们描述了面向计算时代信息技术
的两个方面,云计算侧重于描述资源和应用的网络化交付方法,大数据侧重于描
述面向数据时代由于数据量巨大所带来的技术挑战。
云计算的核心是业务模式,本质是数据处理技术。数据是资产,云为数据资产提
供了存储、访问的场所和计算,即云计算更偏重海量存储和计算,以及提供的云
服务,运行云应用。云计算是基础设施架构,大数据是灵魂资产。
1. 什么是虚拟化?
答:虚拟化是一个广义的术语,对不同的行业或不同的人有着不同的意义。在计
算机科学领域中,虚拟化意味着对计算机资源的抽象。简单来说,虚拟化是模拟
真正的(或者称物理的)计算机资源,模拟 CPU、内存、存储、网络等用户可
见的物理的硬件资源。
2. 为什么要使用虚拟化?
答:使用虚拟化的原因主要有以下四点:
(1)使用虚拟化可以共享资源,而相互不受影响。
(2)使用虚拟化可以将很多零散的资源集中到一处,而使用的用户则感觉像是
一个整体。
(3)使用虚拟化可以动态维护资源的分配,动态扩展或减少某个用户所使用的
资源。
(4)使用虚拟化易于管理资源,易于发布版本,易于部署版本,易于测试版本
等。
3. 常见的虚拟化技术有哪些?
答:常见的虚拟化技术有:CPU 虚拟化,内存虚拟化,全虚拟化,半虚拟化,
硬件辅助虚拟化,存储虚拟化等虚拟化技术。
1. 数据中心的发展经历了_________、________、_______、_______四个阶段。
答:巨型机时代、微型计算机/PC 时代、互联网时代、云计算与大数据时代。
2. 数据中心的选址主要考虑 _________、_________、_________、_________等
因素。
答:地质条件、气候环境、电力供给、网络带宽。
3. 数据中心的主要组成部分有_________、_________、_________、_________。
答:基础设施、硬件设施、基础软件、管理支撑软件。
4.PUE 的定义为_____________________________________________。
答:PUE(Power Usage Effectiveness )由美国绿色网格联盟(The Green Grid )
于 2007 年提出,是业界公认的测量数据中心能耗的主要指标之一,其定义如下:
数据中心整体能耗
PUE
IT 设备能耗
5. DCIE 的定义为_____________________________________________。
答:DCIE(Data Center Infrastructure Efficiency)是数据中心能耗评估的另一公
认指标,是由美国绿色网格联盟于 2007 年提出,用于表示数据中心 IT 设备用电
占总用电量的比例,其定义如下:
IT 设备能耗
DCIE
数据中心整体能耗
1. 解释说明什么是并行计算?简要概括并行计算的发展如何?
答:在计算机术语中,并行性指的是把一个复杂问题分解成多个能同时处理子问
题的能力。并行计算(Parallel Computing)是指同时使用多种计算资源解决计算
问题的过程,是提高计算机系统计算速度和处理能力的一种有效手段。
20 世纪 70 年代,第一台并行计算机于 1972 年产生(ILLIAC IV,伊利诺依大学),
由 64 个处理器组成,可扩展性好,但可编程性差;20 世纪 80 年代,并行计算
机进入百家争鸣状态,以多指令多数据流 MIMD(Multiple Instruction stream
Multiple Data stream)并行计算机为主;20 世纪 90 年代,并行计算体系结构框
架趋于统一,基本以分布式共享存储(Distributed Shared Memory,DSM)、大规
模并行处理结构(Massively Parallel Processing,MPP)、工作站机群(Cluster of
Workstations,COW)为代表;21 世纪初,并行计算得到了前所未有的大踏步发
展,以 COW 为原型的由大规模商用普通 PC 机构成的机群为主;今天,越来越
多的并行计算机系统采用商品化的微处理器加上商品化的互连网络构造,这种分
布存储的并行计算机系统称为集群(NOW),并行计算进入了一个新的时代,并
行计算的应用达到了前所未有的广度和深度。
2. 简要说明集群的概念和集群系统的分类。
答:集群是一组独立的计算机(结点)的集合体,结点间通过高性能的网络相连
接,各结点除了作为一个单一的计算资源供用户使用外,还可以协同工作,并表
示为一个单一的、集中的计算资源,供并行计算使用。集群是一种造价低廉、易
于构建并且具有较好可扩展性的体系结构。
集群系统按功能和结构可以分为如下四类:(1)高可用性集群系统(2)负载均
衡集群系统(3)高性能集群系统(4)虚拟化集群系统。
3. 并行计算的分类有哪些?
答:并行计算技术在高速发展的今天,出现了各种不同的技术方法,同时也出现
了不同的分类方法,包括按指令和数据处理方式的Flynn 分类、按存储访问结构
的分类、按应用计算特征的分类。
4. 简要说明并行计算的四类设计模型?
答:并行计算的设计模型主要有四类:隐式并行(Implicit Parallel)、数据并行(Data
Parallel)、共享变量(Shared Variable)、消息传递(Message Passing)。
(1)隐式并行是程序员用熟悉的串行语言编程,编译器或运行支持系统自动转
化为并行代码。其特点是语义简单、可移植性好、单线程、易于调试和验证正确
性,但效率很低。
(2)数据并行是 SIMD 的自然模型,是局部计算和数据选路操作。其特点是单
线程、并行操作于聚合数据结构(数组)、松散同步、单一地址空间、隐式交互
作用和显式数据分布。
(3)共享变量是 PVP、SMP、DSM 的自然模型。其特点是多线程( SPMD、
MPMD)、异步、单一地址空间、显式同步、隐式数据分布、隐式通信。
(4)消息传递是 MPP、COW 的自然模型。其特点是多线程、异步、多地址空
间、显式同步、显式通信、显式数据映射和负载分配。
5. 并行程序设计方式主要有哪几种并分别说明。
答:实现并行编程常见方法有以下三种。但三者可混合使用,如对以 SMP 为节
点的 Cluster 来说,可以在节点间进行消息传递,在节点内进行共享变量编程。
(1)线程模型:OpenMP、POSIX。
(2)消息传递模型:PVM(Parallel Virtual Machine Computing)、MPI(Message
Passing Interface)。
(3)数据并行模型:HPF。
1. 描述云存储系统的结构模型。
答:云存储系统的结构模型主要包括:存储层,基础管理层,应用接口层,访问
层。
(1)存储层是云存储最基础的部分,云存储中的存储设备往往数量庞大且多分
布在不同地域,彼此之间通过广域网、互联网或者 FC 光纤通道网络连接在一起。
云存储系统对外提供多种不同的存储服务,各种服务的数据统一存放在云存储系
统中,形成一个海量数据池。云存储的数据存储层将不同类型的存储设备互连起
来,实现海量数据的统一管理,同时实现对存储设备的集中管理、状态监控以及
容量的动态扩展,实质上是一种面向服务的分布式存储系统。存储设备之上是一
个统一存储设备管理系统,可以实现存储设备的逻辑虚拟化管理、多链路冗余管
理,以及硬件设备的状态监控和故障维护。
(2)基础管理层是云存储最核心的部分,也是云存储中最难以实现的部分。基
础管理层通过集群、分布式文件系统和网格计算等技术,实现云存储中多个存储
设备之间的协同工作,使多个存储设备可以对外提供同一种服务,并提供更大、
更强、更好的数据访问性能。
(3)应用接口层是云存储最灵活多变的部分。不同的云存储运营单位可以根据
实际业务类型,开发不同的应用服务接口,提供不同的应用服务。云存储平台面
向用户的部分,包括数据存储服务、公共资源使用、数据备份功能等接口服务。
(4)用户访问层主要功能包括访问控制、身份识别与验证、安全隔离等。云存
储用户应用程序,可以全新开发和移植现有的应用程序方式实现。云存储服务商
均为独立实体,会有个性化的云存储服务提供方式,因此,云存储服务系统的访
问方式和访问手段,不同的服务系统会有所差异。
2. 请简述云存储的实现前提。
答:主要分为以下六点:宽带网络的发展,Web2.0 技术的出现,应用存储的发
剩余20页未读,继续阅读
资源评论
春哥111
- 粉丝: 1w+
- 资源: 5万+
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功