《探索大数据与及人工智能》习题及答案.pdf
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
【知识点详解】 1. Spark Streaming 是 Spark 软件栈中的流计算组件,它提供了对实时数据流的处理能力。 2. 大数据的发展趋势包括分析方法的创新、与云计算的融合以及一体机的发布,但不包括可能被淘汰。 3. 麦肯锡公司在2011年的报告中提出了大数据的重要性,将其视为新的生产因素。 4. 大数据在电信行业的应用,如精准广告、网络管理和客服中心优化,而网络优化不属于这一范畴。 5. 物流网络不属于大数据在电信行业的典型应用。 6. 阿里巴巴在2012年设立了首席数据官的职位,推进数据分享平台战略。 7. Kafka 适合日志收集、消息系统和流式处理,而不适合作为业务系统。 8. HBase 是一个面向列、多版本、扩展性和稀疏性的分布式数据库,而不是面向行的。 9. 在 MapReduce 中,服务器数量越多,处理时间越短,因为可以并行处理任务。 10. Spark 的软件栈中,用于机器学习的是 MLlib。 11. Spark 在2010年被开源。 12. 大数据的三种数据结构是结构化、非结构化和半结构化数据,全结构化数据不是其中之一。 13. 自然语言处理的难点包括语言歧义性、知识依赖和语境,但不包括机器性能。 14. 语音识别的常见应用包括拨号、导航和设备控制,聊天则不是典型的语音识别应用。 15. 自由学习不属于人工智能算法的学习方法,常见的有迁移学习、对抗学习和强化学习。 16. 机器学习通过数据训练出模型,以提高系统的性能。 17. 人工智能的未来趋势是持续上升。 18. 中国移动的首个人工智能平台叫“九天”。 19. 数据单位从小到大的顺序是 B、KB、MB、GB。 20. 数据单位换算中,1TB=1024GB 是正确的。 21. 数据库二维表数据属于结构化数据,不是非结构化数据。 22. MapReduce 的过程包括 Map、Shuffle、Combine 和 Reduce。 23. 人工智能的英文缩写是 AI。 24. 谷歌开发的人工智能算法框架是 TensorFlow。 25. BP 神经网络的学习规则是梯度下降法。 26. 语音识别产品体系包括语音合成、语音识别和语义理解,不包括语音播放。 27. 第一代算法模型是 MapReduce,而 Tez、Spark 和 Pig 是后来发展起来的。 28. Spark 是基于内存的迭代计算框架,适用于多次操作数据集的应用。 以上是根据题目内容解析的相关知识点,涵盖了大数据、人工智能、数据处理框架、企业应用等多个方面。

















剩余10页未读,继续阅读


- 粉丝: 1w+
- 资源: 6万+
我的内容管理 展开
我的资源 快来上传第一个资源
我的收益
登录查看自己的收益我的积分 登录查看自己的积分
我的C币 登录后查看C币余额
我的收藏
我的下载
下载帮助


最新资源


