课程实验与课程设计内容与要求-20171
![preview](https://dl-preview.csdnimg.cn/86335806/0001-629729bf0a77cb9f362fbe9ada9aca4c_thumbnail.jpeg)
![preview-icon](https://csdnimg.cn/release/downloadcmsfe/public/img/scale.ab9e0183.png)
【课程实验与课程设计内容与要求-20171】是南京大学计算机科学与技术系的一门关于大数据处理与编程实践的课程。这门课程由黄宜华和顾荣主讲,得到了Google (北京)与Intel公司中国大学合作部精品课程计划的资助。课程的目标是让学生深入理解大数据处理,并通过实验和设计来实践MapReduce等大数据处理技术。 实验内容分为四个部分: 1. **单机Hadoop系统安装与WordCount实验**:学生需要在本地环境中搭建伪分布式Hadoop系统,运行并理解WordCount程序。实验报告需包含系统安装情况、实验数据说明、作业运行状态和输出结果的截图,以及实验体会。 2. **倒排索引实验**:学生需实现带词频属性的文档倒排索引算法,同时计算每个词语的平均提及次数。实验报告需详细说明设计思路、算法设计、程序结构,以及性能分析。 3. **HBase与Hive实验**:在本地安装HBase和Hive,用HBase存储倒排索引信息,通过Java程序读取并保存到本地,再使用Hive进行数据导入、查询操作。报告要求包含实验过程、输出结果和体会。 4. **社交网络图三角形计数实验**:处理社交网络关系图,转换为无向图并计算所有三角形的数量。此实验需要编写多个MapReduce Job,实验报告需涵盖设计思路、算法设计、实验结果分析和性能评估。 在整个课程中,MapReduce作为主要的处理工具,用于解决大规模数据的并行计算问题。WordCount是MapReduce的经典示例,用于统计文本中单词的频率;倒排索引则展示了MapReduce在文本处理和搜索引擎中的应用;HBase和Hive的使用让学生了解NoSQL数据库和SQL查询在大数据环境中的作用;三角形计数实验则涉及图论和复杂数据结构在大数据分析中的应用。 通过这些实验,学生不仅能掌握Hadoop生态系统的基本组件,还能了解如何使用MapReduce解决实际问题,以及如何利用HBase和Hive进行数据存储和分析。实验报告的撰写则旨在锻炼学生的文档编写能力和对技术的理解深度。
![pdf](https://img-home.csdnimg.cn/images/20210720083512.png)
![docx](https://img-home.csdnimg.cn/images/20210720083331.png)
![docx](https://img-home.csdnimg.cn/images/20210720083331.png)
![zip](https://img-home.csdnimg.cn/images/20210720083736.png)
![docx](https://img-home.csdnimg.cn/images/20210720083331.png)
![docx](https://img-home.csdnimg.cn/images/20210720083331.png)
![pdf](https://img-home.csdnimg.cn/images/20210720083512.png)
![docx](https://img-home.csdnimg.cn/images/20210720083331.png)
![docx](https://img-home.csdnimg.cn/images/20210720083331.png)
![docx](https://img-home.csdnimg.cn/images/20210720083331.png)
![docx](https://img-home.csdnimg.cn/images/20210720083331.png)
![docx](https://img-home.csdnimg.cn/images/20210720083331.png)
![docx](https://img-home.csdnimg.cn/images/20210720083331.png)
![docx](https://img-home.csdnimg.cn/images/20210720083331.png)
![docx](https://img-home.csdnimg.cn/images/20210720083331.png)
![docx](https://img-home.csdnimg.cn/images/20210720083331.png)
![docx](https://img-home.csdnimg.cn/images/20210720083331.png)
![zip](https://img-home.csdnimg.cn/images/20210720083736.png)
![rar](https://img-home.csdnimg.cn/images/20210720083606.png)
![zip](https://img-home.csdnimg.cn/images/20210720083736.png)
![avatar](https://profile-avatar.csdnimg.cn/6964306308c74ab083479ecb67dec557_weixin_35739886.jpg!1)
- 粉丝: 15
- 资源: 317
我的内容管理 展开
我的资源 快来上传第一个资源
我的收益
登录查看自己的收益我的积分 登录查看自己的积分
我的C币 登录后查看C币余额
我的收藏
我的下载
下载帮助
![voice](https://csdnimg.cn/release/downloadcmsfe/public/img/voice.245cc511.png)
![center-task](https://csdnimg.cn/release/downloadcmsfe/public/img/center-task.c2eda91a.png)
最新资源
- 2020届毕业生档案转递去向汇总(1).xlsx
- 梅州市住宅矢量数据shp数据wgs84坐标系.zip
- 编程实战:基于Java的蚁群算法路由选择可视化动态模拟(源程序+文档+开题报告+任务书+翻译).zip
- Scratch 烧脑大挑战:字母冒险.sb3
- python爬虫入门通用框架
- 7种车辆类型检测YOLO数据集
- 一个基于 tauri + rust + vue 构建的抢票软件,全部调用大麦的接口
- 大麦网 演唱会抢票软件,一个基于 tauri + rust + vue 调用接口的抢票软件
- nessus-10.6.3.-x64
- 编程实战:基于Javamail的邮件收发系统的设计与实现(源码+文档+开题报告+答辩PPT).zip
![feedback](https://img-home.csdnimg.cn/images/20220527035711.png)
![feedback-tip](https://img-home.csdnimg.cn/images/20220527035111.png)
![dialog-icon](https://csdnimg.cn/release/downloadcmsfe/public/img/green-success.6a4acb44.png)
评论0