大数据技术导论
Introduction of Big Data Technology
一、课程基本情况课程类别:专业任选课
课程学分:2学分课程总学时:32学时,其中讲课:32学时
课程性质:选修开课学期:第6学期
先修课程:数据结构,数据库原理,面向对象Java程序设计适用专业:信息工程
教材:自编开课单位:电子与信息工程学院,信息工程系
二、课程性质、教学目标和任务
大数据技术导论课程从大数据的开展与现状入手,面向本科生主要介绍了大数据开发的
相关技术,并讨论了大数据技术的具体应用。重点介绍了工业界流行的SPARK大数据开发平
台,讨论了 SPARK大数据平台的基本结构和基本原理。在此基础上,全面剖析如何使用SPARK
进行大数据开发,并配以应用实例。通过教学使学生全面了解当前大数据技术动态和开展趋
势,并可针对自己面临的大数据问题找到可行的解决方案。
三、教学内容和要求1、大数据技术概述(2学时)
(1)掌握大数据的定义及特征
(2)理解大数据结构类型
(3) 了解大数据开展史和大数据在各领域的广泛应用
(4)初步了解大数据技术架构重点:大数据的定义和特征、大数据结构特征和大数据应用
难点:大数据技术架构2、SPARK大数据平台基础(6学时)
(1)理解RDD的概念和RDD在SPARK平台中的重要作用
(2)理解RDD的变换和行为,了解延后计算的概念
(3)掌握SPARK中常见的变换和行为
(4)掌握RDD的类型转换方法
(5)理解RDD的持久化重点:理解RDD的概念与作用,掌握SPARK中RDD常见的变换和行为
难点:理解RDD的变换和行为,理解延后计算的作用和RDD的持久化3、Scala语言基础(4学
时)
(1)掌握Scala语言的基本语法
(2)理解Scala语言的函数式编程风格
(3)掌握Scala语言的开发环境与调试方法重点:Scala语言的基本语法,Scala语言的开发环境
难点:理解Scala语言的函数式编程风格4、SPARK编程基础(4学时)
(1)理解SPARK中的键/值对
(2)掌握键/值对的基本变换,如聚集、分组、联合、排序等