没有合适的资源?快使用搜索试试~ 我知道了~
《探索大数据与人工智能》题目.docx
1.该资源内容由用户上传,如若侵权请联系客服进行举报
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
版权申诉
0 下载量 36 浏览量
2022-10-22
17:50:27
上传
评论
收藏 36KB DOCX 举报
温馨提示
试读
12页
《探索大数据与人工智能》题目.docx
资源推荐
资源详情
资源评论
《探索大数据与人工智能》习题库
一、 单选题
1、Spark Streaming 是什么软件栈中的流计算?
A. Spark B. Storm C. Hive D. Flume
2、下列选项中,不是大数据发展趋势的是?
A. 大数据分析的革命性方法出现 B. 大数据与与云计算将深度融合
C. 大数据一体机将陆续发布 D. 大数据未来可能会被淘汰
3、2011 年 5 月是哪家全球知名咨询公司在《 Big data: The next frontier for
innovation, competition and productivity 》研究报告中指出,数据已经渗透
到每一个行业和业务职能之中,逐渐成为重要的生产因素的?
A. 比尔·恩门 B. 麦肯锡 C. 扎克伯格 D. 乔图斯
4、以下哪个属于大数据在电信行业的数据商业化方面的应用?
A.精准广告 B. 网络管理 C. 网络优化 D. 客服中心优化
5、以下哪个不属于大数据在电信行业的应用?
A. 数据商业化 B. 物流网络 C. 企业运营 D. 客户关系管理
6、2012 年 7 月,为挖掘大数据的价值,阿里巴巴集团在管理层设立()一职,负责
全面推进“数据分享平台”战略,并推出大型的数据分享平台。
A.首席数据官 B. 首席科学家 C. 首席执行官 D. 首席架构师
7、下列选项中,不是 kafka 适合的应用场景是?
A. 日志收集 B. 消息系统 C. 业务系统 D.流式处理
8、下列选项中,哪个不是 HBASE 的特点?
A.面向行 B. 多版本 C. 扩展性 D. 稀疏性
9、在数据量一定的情况下,MapReduce 是一个线性可扩展模型,请问服务器数量
与处理时间是什么关系?
A.数量越多处理时间越长 B. 数量越多处理时间越短
B. 数量越小处理时间越短 D.没什么关系
10、在 Spark 的软件栈中,用于机器学习的是
A. Spark Streaming B. Mllib C. GraphX D.SparkSQL
11、Spark 是在哪一年开源的?
A. 1980 B. 2010 C. 1990 D. 2000
12、大数据的多样性使得数据被分为三种数据结构,那么以下不是三种数据结构
之一的是?
A 结构化数据 B. 非结构化数据 C. 半结构化数据 D. 全结构化数据
13、自然语言处理难点目前有四大类,下列选项中不是其中之一的是?
A.机器性能 B. 语言歧义性 C. 知识依赖 D. 语境
14、语音识别常用的应用有四个,下列不是常用应用的是?
A. 聊天 B. 拨号 C. 导航 D. 设备控制
15、以下哪种学习方法不属于人工智能算法?
A.迁移学习 B. 对抗学习 C. 强化学习 D.自由学习
16、机器学习研究如何通过计算的手段 ,利用经验来改善系统自身的性能 ,请问
机器学习利用数据训练出什么?
A.模型 B. 表结构 C. 结果 D. 报表
17、总体来说,人工智能发展的未来趋势是?
A.上升 B. 下降 C. 不动 D. 大幅度下降
18、中国移动自主研发、发布的首个人工智能平台叫做()
A.九天 B. OneNET C. 移娃 D.大云
19、以下数据单位从小到大排列的顺序是?
A. GB、B、KB B. B、KB、MB C. KB、ZB、PB D.B、MB、KB
20、以下数据单位换算错误的是?
A. 1KB=1024B B. 1GB=1024MB C. 1TB=1000GB D. 1MB=1024KB
21、以下不是非结构化数据的项是?
A. 图片 B. 音频 C. 数据库二维表数据 D. 视频
22、整个 MapReduce 的过程大致分为 Map、Shuffle、Combine、()?
A.Reduce B. Hash C. Clean D. Loading
23、人工智能是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术
及应用系统的一门新的技术科学,请问它的英文缩写是?
A.AI B. BI C. AL D. AF
24、下列选项中,哪项是由谷歌开发的人工智能算法框架?
A. Kafka B. Tensorflow C. Caffe D.Torch
25、BP 神经网络的学习规则是?
A. 梯度上升法 B. 梯度下降法 C. 梯度提升法 D. 梯度曲线法
26、语音识别产品体系有四部分,下列哪项不是体系之一?
A. 语音合成 B. 语音播放 C. 语音识别 D. 语义理解
27、数据生态中,算法模型分为两代,那么第一代算法模型是?
A. Tez B. Spark C. Pig D.MapReduce
28、Spark 是基于什么的迭代计算框架?它适用于需要多次操作特定数据集的应
用场合。需要反复操作的次数越多,所需读取的数据量越大,受益越大,数据量小
但是计算密集度较大的场合,受益就相对较小;
A.内存 B. 硬盘 C. 磁带 D. 显卡
29、下列选项中,哪项是分布式文件存储系统?
A.HDFS B. Flume C. Kafka D. Zookeeper
30、工信部官网正式发布大数据产业”十三五“发展规划是在哪一年?
A. 1987 B. 1997 C.2007 D. 2017
31、学习没有标签的数据集的机器学习方法是?
A. 监督学习 B. 无监督学习 C. 半监督学习 D. 强化学习
32、当前世界产生的数据总量的单位是?
A. KB B. ZB C. GB D. TB
33、下列选项中正确说明价值密度低的是?
A.100TB 数据中有 50TB 有效数据 B. 1TB 数据中有 1KB 有效数据
C.100PB 数据中有 100PB 有效数据 D. 10EB 数据中有 10EB 有效数据
34、中国移动研发了智能客服问答机器人 (),使业务流程自动化 ,更加智能的回
答用户解决业务咨询、业务办理、流量查询等问题。
A. 精灵 B. 阿尔法蛋 C. 小度 D. 移娃
35、IBM 的()是第一个在国际象棋上战胜人类棋手的人工智能计算机。
A. AlphaGo B. 深蓝C. 图灵机模型 D. 深度学习机器人
36、在 HDFS 中 存 在 NameNode 、 DataNode 、 Client, 而 NameNode 是 管 理
者,DataNode 是文件存储者,那么 Client 是什么呢?
A. 连接器 B. 客户端 C. 接口提供者 D. 数据采集
37、mapreduce 计算模型适用于哪种任务?
A. 多线程处理 B. 有关联的行处理 C. 批处理 D. 实时数据变化处理
38、大数据特征有几种(不包括 IBM 提出的新特征)?
A.1 B.2 C.3 D.4
剩余11页未读,继续阅读
资源评论
xxpr_ybgg
- 粉丝: 6485
- 资源: 3万+
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功