# pybigdata
![](https://img.shields.io/badge/python-3.6%2B-brightgreen)
做大数据应用需要学习什么编程语言,一定要学 java 吗,不,python 也是一个很好的选择
所以,一起用 python 来玩转大数据吧
# install
```shell
pip install -r requirements.txt
pip install --no-deps thrift-sasl==0.2.1
```
# list
| 大数据组件 | python 操作示例 | 文档 |
|------------------|------------------------------------------------------------------------------------------------------------------------------------| --------------- |
| hadoop | [ctrl_hdfs.py](hadoop/ctrl_hdfs.py) | [hdfs](https://hdfscli.readthedocs.io/en/latest/) |
| hadoop-mapreduce | [mapreduce](hadoop/mapreduce/wordcount) | [mapreduce.md](hadoop/mapreduce/wordcount/wordcount.md) |
| hive | [ctrl_hive.py](hive/ctrl_hive.py) <br> [一进一出 udf](hive/hive-udf) <br> [多进一出 udaf](hive/hive-udaf) <br> [一进多出 udtf](hive/hive-udtf) | [impyla](https://github.com/cloudera/impyla) |
| impala | [ctrl_impala.py](impala/ctrl_impala.py) | [impyla](https://github.com/cloudera/impyla) |
| hbase | [ctrl_hbase.py](hbase/ctrl_hbase.py) | [happybase](https://happybase.readthedocs.io/en/latest/user.html#retrieving-data) |
| kafka | [demo_producer.py](kafka/demo_producer.py) <br> [demo_consumer.py](kafka/demo_consumer.py) | [kafka](https://kafka-python.readthedocs.io/en/master/) |
| elasticsearch | [ctrl_elasticsearch.py](elasticsearch/ctrl_elasticsearch.py) | [elasticsearch](https://elasticsearch-py.readthedocs.io/en/7.7.1/) |
| spark | [demo_spark.py](spark/demo_spark.py) | [pyspark](http://spark.apache.org/docs/latest/api/python/getting_started/index.html) |
| flink | [flink-sql](flink/flink-sql) | [flink 实践系列2-flinksql](http://blog.turboway.top/article/flinksql/) |
| doris | [ctrl_doris](doris/ctrl_doris.py) | [DorisClient](https://github.com/TurboWay/DorisClient) |
没有合适的资源?快使用搜索试试~ 我知道了~
使用 python 操作大数据的各种组件.zip
共28个文件
py:16个
sql:5个
txt:3个
1.该资源内容由用户上传,如若侵权请联系客服进行举报
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
版权申诉
0 下载量 116 浏览量
2025-01-01
19:40:30
上传
评论
收藏 44KB ZIP 举报
温馨提示
pybigdata做大数据应用学习什么编程语言,一定要学java吗,不,python也是一个很好的选择所以,一起用python来玩转大数据吧安装pip install -r requirements.txtpip install --no-deps thrift-sasl==0.2.1列表集团 python 操作示例 文檔Hadoop 复制代码 硬盘文件系统Hadoop的mapreduce 映射归约 mapreduce.md蜂巢 ctrl_hive.py一进一出 udf多进一出 udaf一进多出 udtf 因皮拉黑斑羚 复制代码 因皮拉数据库 ctrl_hbase.py 快乐基地卡夫卡 demo_生产者.pydemo_消费者.py 卡夫卡elasticsearch ctrl_elasticsearch.py elasticsearch火花 演示spark.py pysparkflink flink-sql flink 实践系列2-flinksql多丽丝 ctrl_doris Doris客户
资源推荐
资源详情
资源评论
收起资源包目录
使用 python 操作大数据的各种组件.zip (28个子文件)
标签.txt 48B
LICENSE 1KB
flink
flink-sql
flink-user_behavior.sql 3KB
category.sql 125KB
datagen.py 1KB
hadoop
mapreduce
wordcount
reducer.py 508B
mapper.py 220B
wordcount.md 596B
ctrl_hdfs.py 1KB
spark
demo_spark.py 1KB
demo_spark2.py 759B
hbase
ctrl_hbase.py 3KB
资源内容.txt 763B
elasticsearch
ctrl_elasticsearch.py 2KB
doris
ctrl_doris.py 2KB
requirements.txt 472B
impala
ctrl_impala.py 743B
hive
hive-udtf
hive.sql 266B
explode_all.py 368B
hive-udf
dateformat.py 5KB
hive.sql 2KB
hive-udaf
sum_all.py 332B
hive.sql 273B
ctrl_hive.py 856B
.gitignore 15B
README.md 3KB
kafka
demo_consumer.py 642B
demo_producer.py 684B
共 28 条
- 1
资源评论
赵闪闪168
- 粉丝: 1726
- 资源: 6943
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- 【门店】-01-组织架构图.docx
- 【民营医院】-02-组织机构图.docx
- 【民营医院】-03-组织机构图.docx
- 【生产制造】-02-组织架构图.docx
- 【生产制造】-01-组织架构图.docx
- 【汽车行业】-01-组织架构图.docx
- 【生产制造】-03-组织架构图.docx
- 【生产制造】-05-组织架构图.docx
- 【通讯行业】-01-组织架构图.docx
- 【通用】-01-组织架构图.docx
- 【通用】-03-组织架构图.docx
- 【通用】-02-组织架构图.docx
- 【通用】-06-组织架构图.docx
- 【通用】-04-组织架构图.docx
- 【通用】-05-组织架构图.docx
- 【通用】-09-组织架构图.docx
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功