# BigData-Notes
<div align="center"> <img width="444px" src="https://gitee.com/heibaiying/BigData-Notes/raw/master/pictures/bigdata-notes-icon.png"/> </div>
<br/>
**大数据入门指南**
<table>
<tr>
<th><img width="50px" src="https://gitee.com/heibaiying/BigData-Notes/raw/master/pictures/hadoop.jpg"></th>
<th><img width="50px" src="https://gitee.com/heibaiying/BigData-Notes/raw/master/pictures/hive.jpg"></th>
<th><img width="50px" src="https://gitee.com/heibaiying/BigData-Notes/raw/master/pictures/spark.jpg"></th>
<th><img width="50px" src="https://gitee.com/heibaiying/BigData-Notes/raw/master/pictures/storm.png"></th>
<th><img width="50px" src="https://gitee.com/heibaiying/BigData-Notes/raw/master/pictures/flink.png"></th>
<th><img width="50px" src="https://gitee.com/heibaiying/BigData-Notes/raw/master/pictures/hbase.png"></th>
<th><img width="50px" src="https://gitee.com/heibaiying/BigData-Notes/raw/master/pictures/kafka.png"></th>
<th><img width="50px" src="https://gitee.com/heibaiying/BigData-Notes/raw/master/pictures/zookeeper.jpg"></th>
<th><img width="50px" src="https://gitee.com/heibaiying/BigData-Notes/raw/master/pictures/flume.png"></th>
<th><img width="50px" src="https://gitee.com/heibaiying/BigData-Notes/raw/master/pictures/sqoop.png"></th>
<th><img width="50px" src="https://gitee.com/heibaiying/BigData-Notes/raw/master/pictures/azkaban.png"></th>
<th><img width="50px" src="https://gitee.com/heibaiying/BigData-Notes/raw/master/pictures/scala.jpg"></th>
</tr>
<tr>
<td align="center"><a href="#一hadoop">Hadoop</a></td>
<td align="center"><a href="#二hive">Hive</a></td>
<td align="center"><a href="#三spark">Spark</a></td>
<td align="center"><a href="#四storm">Storm</a></td>
<td align="center"><a href="#五flink">Flink</a></td>
<td align="center"><a href="#六hbase">HBase</a></td>
<td align="center"><a href="#七kafka">Kafka</a></td>
<td align="center"><a href="#八zookeeper">Zookeeper</a></td>
<td align="center"><a href="#九flume">Flume</a></td>
<td align="center"><a href="#十sqoop">Sqoop</a></td>
<td align="center"><a href="#十一azkaban">Azkaban</a></td>
<td align="center"><a href="#十二scala">Scala</a></td>
</tr>
</table>
<br/>
<div align="center">
<a href = "https://github.com/heibaiying/Full-Stack-Notes">
<img width="150px" src="https://gitee.com/heibaiying/BigData-Notes/raw/master/pictures/weixin.jpg"/>
</a>
</div>
<div align="center"> <strong> 如果需要离线阅读,可以在公众号上发送 “bigdata” 获取《大数据入门指南》离线阅读版! </strong> </div>
<br/>
## :black_nib: 前 言
1. [大数据学习路线](notes/大数据学习路线.md)
2. [大数据技术栈思维导图](notes/大数据技术栈思维导图.md)
3. [大数据常用软件安装指南](notes/大数据常用软件安装指南.md)
## 一、Hadoop
1. [分布式文件存储系统 —— HDFS](notes/Hadoop-HDFS.md)
2. [分布式计算框架 —— MapReduce](notes/Hadoop-MapReduce.md)
3. [集群资源管理器 —— YARN](notes/Hadoop-YARN.md)
4. [Hadoop 单机伪集群环境搭建](notes/installation/Hadoop单机环境搭建.md)
5. [Hadoop 集群环境搭建](notes/installation/Hadoop集群环境搭建.md)
6. [HDFS 常用 Shell 命令](notes/HDFS常用Shell命令.md)
7. [HDFS Java API 的使用](notes/HDFS-Java-API.md)
8. [基于 Zookeeper 搭建 Hadoop 高可用集群](notes/installation/基于Zookeeper搭建Hadoop高可用集群.md)
## 二、Hive
1. [Hive 简介及核心概念](notes/Hive简介及核心概念.md)
2. [Linux 环境下 Hive 的安装部署](notes/installation/Linux环境下Hive的安装部署.md)
4. [Hive CLI 和 Beeline 命令行的基本使用](notes/HiveCLI和Beeline命令行的基本使用.md)
6. [Hive 常用 DDL 操作](notes/Hive常用DDL操作.md)
7. [Hive 分区表和分桶表](notes/Hive分区表和分桶表.md)
8. [Hive 视图和索引](notes/Hive视图和索引.md)
9. [Hive 常用 DML 操作](notes/Hive常用DML操作.md)
10. [Hive 数据查询详解](notes/Hive数据查询详解.md)
## 三、Spark
**Spark Core :**
1. [Spark 简介](notes/Spark简介.md)
2. [Spark 开发环境搭建](notes/installation/Spark开发环境搭建.md)
4. [弹性式数据集 RDD](notes/Spark_RDD.md)
5. [RDD 常用算子详解](notes/Spark_Transformation和Action算子.md)
5. [Spark 运行模式与作业提交](notes/Spark部署模式与作业提交.md)
6. [Spark 累加器与广播变量](notes/Spark累加器与广播变量.md)
7. [基于 Zookeeper 搭建 Spark 高可用集群](notes/installation/Spark集群环境搭建.md)
**Spark SQL :**
1. [DateFrame 和 DataSet ](notes/SparkSQL_Dataset和DataFrame简介.md)
2. [Structured API 的基本使用](notes/Spark_Structured_API的基本使用.md)
3. [Spark SQL 外部数据源](notes/SparkSQL外部数据源.md)
4. [Spark SQL 常用聚合函数](notes/SparkSQL常用聚合函数.md)
5. [Spark SQL JOIN 操作](notes/SparkSQL联结操作.md)
**Spark Streaming :**
1. [Spark Streaming 简介](notes/Spark_Streaming与流处理.md)
2. [Spark Streaming 基本操作](notes/Spark_Streaming基本操作.md)
3. [Spark Streaming 整合 Flume](notes/Spark_Streaming整合Flume.md)
4. [Spark Streaming 整合 Kafka](notes/Spark_Streaming整合Kafka.md)
## 四、Storm
1. [Storm 和流处理简介](notes/Storm和流处理简介.md)
2. [Storm 核心概念详解](notes/Storm核心概念详解.md)
3. [Storm 单机环境搭建](notes/installation/Storm单机环境搭建.md)
4. [Storm 集群环境搭建](notes/installation/Storm集群环境搭建.md)
5. [Storm 编程模型详解](notes/Storm编程模型详解.md)
6. [Storm 项目三种打包方式对比分析](notes/Storm三种打包方式对比分析.md)
7. [Storm 集成 Redis 详解](notes/Storm集成Redis详解.md)
8. [Storm 集成 HDFS/HBase](notes/Storm集成HBase和HDFS.md)
9. [Storm 集成 Kafka](notes/Storm集成Kakfa.md)
## 五、Flink
1. [Flink 核心概念综述](notes/Flink核心概念综述.md)
2. [Flink 开发环境搭建](notes/Flink开发环境搭建.md)
3. [Flink Data Source](notes/Flink_Data_Source.md)
4. [Flink Data Transformation](notes/Flink_Data_Transformation.md)
4. [Flink Data Sink](notes/Flink_Data_Sink.md)
6. [Flink 窗口模型](notes/Flink_Windows.md)
7. [Flink 状态管理与检查点机制](notes/Flink状态管理与检查点机制.md)
8. [Flink Standalone 集群部署](notes/installation/Flink_Standalone_Cluster.md)
## 六、HBase
1. [Hbase 简介](notes/Hbase简介.md)
2. [HBase 系统架构及数据结构](notes/Hbase系统架构及数据结构.md)
3. [HBase 基本环境搭建 (Standalone /pseudo-distributed mode)](notes/installation/HBase单机环境搭建.md)
4. [HBase 集群环境搭建](notes/installation/HBase集群环境搭建.md)
5. [HBase 常用 Shell 命令](notes/Hbase_Shell.md)
6. [HBase Java API](notes/Hbase_Java_API.md)
7. [HBase 过滤器详解](notes/Hbase过滤器详解.md)
8. [HBase 协处理器详解](notes/Hbase协处理器详解.md)
9. [HBase 容灾与备份](notes/Hbase容灾与备份.md)
10. [HBase的 SQL 中间层 —— Phoenix](notes/Hbase的SQL中间层_Phoenix.md)
11. [Spring/Spring Boot 整合 Mybatis + Phoenix](notes/Spring+Mybtais+Phoenix整合.md)
## 七、Kafka
1. [Kafka 简介](notes/Kafka简介.md)
2. [基于 Zookeeper 搭建 Kafka 高可用集群](notes/installation/基于Zookeeper搭建Kafka高可用集群.md)
3. [Kafka 生产者详解](notes/Kafka生产者详解.md)
4. [Kafka 消费者详解](notes/Kafka消费者详解.md)
5. [深入理解 Kafka 副本机制](notes/Kafka深入理解分区副本机制.md)
## 八、Zookeeper
1. [Zookeeper 简介及核心概念](notes/Zookeeper简介及核心概念.md)
2. [Zookeeper 单机环境和集群环境搭建](notes/installation/Zookeeper单机环境和集群环境搭建.md)
3. [Zookeeper 常用 Shell 命令](notes/Zookeeper常用Shell命令.md)
没有合适的资源?快使用搜索试试~ 我知道了~
大数据精选入门指南,包括大数据学习路线、大数据技术栈思维导图
共630个文件
png:380个
md:101个
java:69个
需积分: 5 0 下载量 95 浏览量
2024-04-01
20:18:23
上传
评论
收藏 20.77MB ZIP 举报
温馨提示
前言 大数据学习路线 大数据技术栈思维导图 大数据常用软件安装指南 一、Hadoop 分散文件存储系统 —— HDFS 多元计算框架——MapReduce 集群资源管理器 —— YARN Hadoop单机伪集群环境搭建 Hadoop 云服务环境搭建 HDFS使用Shell命令 HDFS Java API的使用 基于Zookeeper搭建Hadoop高可用服务 二、蜂巢 Hive简介及核心概念 Linux环境下Hive的安装配置 Hive CLI 和 Beeline 命令行的基本使用 Hive 使用 DDL 操作 Hive 分区表和分区表 Hive 视图和索引 Hive 使用 DML 操作 Hive数据详细查询解 三、火花 火花核心: 斯帕克简介 Spark开发环境搭建 弹性式数据集 RDD RDD使用算子详解 Spark运行模式与作业提交 Spark 累加器与广播信号 基于Zookeeper搭建Spark高可用服务 火花 SQL: 日期帧和数据集 结构化API的基本使用 Spark SQL 外部数据源 Spark SQL常用聚合函数 Spark SQL JOIN 操作 火花流:
资源推荐
资源详情
资源评论
收起资源包目录
大数据精选入门指南,包括大数据学习路线、大数据技术栈思维导图
(630个子文件)
dept.csv 80B
.gitignore 411B
mysql-connector-java-5.1.47.jar 984KB
HBaseUtils.java 8KB
HBaseUtils.java 8KB
HdfsTest.java 8KB
BasicOperation.java 7KB
HdfsUtils.java 5KB
HBaseUtilsTest.java 4KB
HbaseUtilsTest.java 4KB
WordCountCombinerPartitionerApp.java 3KB
DataToHdfsApp.java 3KB
AclOperation.java 3KB
WordCountToHBaseApp.java 3KB
WordCountCombinerApp.java 3KB
WritingToKafkaApp.java 3KB
WordCountApp.java 3KB
WordCountDataUtils.java 3KB
ThresholdWarning.java 3KB
ReadingFromKafkaApp.java 3KB
WordCountToRedisApp.java 3KB
ConsumerExit.java 2KB
RebalanceListener.java 2KB
ThresholdWarningWithTTL.java 2KB
CustomRedisCountApp.java 2KB
ConsumerASynWithOffsets.java 2KB
KafkaStreamingJob.java 2KB
AppendRegionObserver.java 2KB
StandaloneConsumer.java 2KB
RedisCountStoreBolt.java 2KB
ConsumerASyn.java 2KB
ThresholdWarning.java 2KB
ConsumerASynAndSyn.java 2KB
ConsumerGroup.java 2KB
PopulationTest.java 2KB
PopulationDaoTest.java 2KB
DataSourceSpout.java 2KB
DataSourceSpout.java 2KB
DataSourceSpout.java 2KB
DataSourceSpout.java 2KB
ProducerSyn.java 1KB
ConsumerSyn.java 1KB
DataSourceSpout.java 1KB
ProducerASyn.java 1KB
ClusterWordCountApp.java 1KB
FlinkToMySQLSink.java 1KB
ProducerWithPartitioner.java 1KB
CountBolt.java 1KB
CountBolt.java 1KB
OperatorStateJob.java 1KB
LocalWordCountApp.java 1KB
CountBolt.java 1KB
SplitBolt.java 1KB
SplitBolt.java 1KB
SimpleProducer.java 1KB
LogConsoleBolt.java 1KB
KeyedStateJob.java 1KB
SplitBolt.java 1002B
WordCountStoreMapper.java 943B
JedisPoolUtil.java 904B
CustomSinkJob.java 824B
StreamingJob.java 741B
Employee.java 719B
PopulationDao.java 697B
CustomPartitioner.java 696B
WordCountMapper.java 671B
WordCountReducer.java 611B
CustomPartitioner.java 494B
PopulationDao.java 440B
SpringBootMybatisApplication.java 353B
USPopulation.java 320B
USPopulation.java 274B
hdfs-tolerance-3.jpg 346KB
hdfs-tolerance-4.jpg 340KB
hdfs-tolerance-2.jpg 327KB
hdfs-tolerance-5.jpg 314KB
hdfs-tolerance-1.jpg 310KB
hdfs-write-3.jpg 308KB
hdfs-write-1.jpg 307KB
hdfs-write-2.jpg 297KB
hdfs-read-1.jpg 291KB
flink-on-yarn-session.jpg 88KB
zookeeper-zkservice.jpg 85KB
flink-standalone-cluster.jpg 72KB
sql-join.jpg 49KB
zookeeper-zknamespace.jpg 35KB
zookeeper-zkcomponents.jpg 30KB
hbase.jpg 29KB
weixin.jpg 27KB
zookeeper.jpg 21KB
oozie.jpg 16KB
scala.jpg 14KB
hadoop.jpg 11KB
spark.jpg 7KB
hive.jpg 7KB
zookeeper-brocast.jpg 5KB
emp.json 2KB
dept.json 207B
Hbase_Java_API.md 26KB
SparkSQL外部数据源.md 25KB
共 630 条
- 1
- 2
- 3
- 4
- 5
- 6
- 7
资源评论
AaronWang94
- 粉丝: 1716
- 资源: 311
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功