没有合适的资源?快使用搜索试试~ 我知道了~
Krawl:自动的Web搜寻器,可从TripAdvisor.com收集酒店评论并将数据存储在MongoDB中
共18个文件
js:9个
sh:6个
license:1个
需积分: 13 1 下载量 139 浏览量
2021-05-07
17:18:22
上传
评论 1
收藏 20KB ZIP 举报
温馨提示
牛皮纸 自动的Web搜寻器,它从TripAdvisor.com收集酒店评论并将数据存储在MongoDB中。 安装 1安装公共节点( ) sudo npm -g install common-node 2安装PhantomJS( ) sudo npm -g install phantomjs 3安装nodejs-legacy(由common-node要求) sudo apt-get install nodejs-legacy 如何使用 编辑src/0-add-city.js 运行./0-add-cities.sh添加城市数据 运行./1-collect-city-hotels.sh收集酒店URL 运行./2-collect-hotel-reviews.sh来收集评论URL(在处理./2-collect-hotel-reviews.sh所有页面之前,您可能需要多次运行它
资源推荐
资源详情
资源评论
收起资源包目录
Krawl-master.zip (18个子文件)
Krawl-master
0-add-cities.sh 33B
1-collect-city-hotels.sh 42B
src
4-get-blocked-review-html.js 4KB
setup.js 9KB
generate-export-file.js 476B
3-get-reviews-html.js 3KB
export-reviews.js 3KB
2-collect-hotel-reviews.js 3KB
5-process-review-html.js 8KB
0-add-cities.js 405B
1-collect-city-hotels.js 4KB
3-get-reviews-html.sh 39B
2-collect-hotel-reviews.sh 44B
5-process-review-html.sh 42B
LICENSE 16KB
README.md 1KB
.gitignore 526B
4-get-blocked-review-html.sh 41B
共 18 条
- 1
资源评论
ZackRen
- 粉丝: 24
- 资源: 4624
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功