没有合适的资源?快使用搜索试试~ 我知道了~
温馨提示
Reddit数据很漂亮 Reddit的“ dataisbeautiful”社区分析 Python 2.7脚本 第一个脚本下载包含新帖子列表的html页面。 第二个脚本从已保存的列表中提取单个帖子的网址。 第三个脚本使用帖子网址下载每个帖子。 最后,第四个脚本解析各个帖子文件,并将结果保存到制表符分隔的文件中。 在要保存数据的位置创建一个文件夹,然后在每个脚本中编辑root_dir变量以提供此文件夹的路径。 将user_agents_non_mobile.txt保存到此文件夹中。 R脚本 该脚本导入由上一个python脚本创建的制表符分隔文件,清理数据并创建图。
资源推荐
资源详情
资源评论
收起资源包目录
reddit-data-is-beautiful-master.zip (7个子文件)
reddit-data-is-beautiful-master
LICENSE 1KB
1_get_post_lists.py 3KB
README.md 775B
user_agents_non_mobile.txt 1KB
2_parse_post_lists.py 2KB
3_get_posts.py 3KB
4_parse_posts.py 5KB
共 7 条
- 1
资源评论
小小鹊
- 粉丝: 42
- 资源: 4534
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- API网关 vs IDAAS网关 vs WAF,以及API网关在微服务中的应用
- 360T7路由集客AP固件
- meltdown/spectre处理器漏洞知识点整理
- AWDAWDWADWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWWW
- 15000个英文单词, SQLite3数据库,字段为 单词, 翻译,各种时态,复数形式,例句
- Replicate 的 Python 客户端.zip
- Raven 是 Sentry 的旧版 Python 客户端(getsentry.com),已被 sentry-python 取代.zip
- python打包创造-pycache-文件
- 基于Hadoop平台分析准大学生手机网购偏好与趋势
- 基于Python和ECharts的京东手机销售数据分析与可视化
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功