课 程 简 介
课程名称: 《Hadoop 平台技术 》
课程代码: R01921233
课程性质: 专业群核心课
适用对象: 大数据技术专业学生
建议学时: 64 课时
建议学分: 4 学分
先修要求: 《Java 程序设计 I》、《面向对象程序设计(Java)》、《Linux 基础》
后续课程: 《数据仓库 Hive》
教学方式: 线上+线下混合式教学
课程内容:
本课程内容包括大数据概述、Hadoop 概述、分布式文件存储系统 HDFS、分布式计算
框架 MapReduce、资源管理框架 Yarn、分布式数据库 HBase。
通过本课程的学习,能了解大数据基本涵盖内容;能对大数据以及 Hadoop 的诞生,
发展过程有一个初步的认识。重点介绍 Hadoop 平台的四大基础组件:HDFS、
MapReduce 、Yarn 和 HBase,讲解其原理、作用以及使用场景。通过本课程学习,为今后
更深入的学习和从事大数据相关工作打下良好的基础。
教学目标:
1、知识目标
1. 掌握 Hadoop 的发展历史,以及应用场景,掌握 Hadoop 集群搭建;
2. 学会 HDFS 文件读写的过程,了解 HDFS 中存储文件的类型;
3. 掌握 Yarn 框架的原理;
4. 掌握 MapReduce 程序的运行过程,会开发简单的 MapReduce 程序;
5. 掌握安装和使用高性能分布式数据库 Hbase,学会其数据存储原理。