==========================
# **scrapy-amazon**(亚马逊爬虫)
基于scrapy的亚马逊的爬虫
默认python3环境,python2未测试
- 默认抓取手机版亚马逊
- 默认采集亚马逊指定关键词所有商品
- 采集属性包括商品名称、链接、图片地址、ASIN、商品描述、评论等等
- 爬取到的数据存储到MongoDB数据库
未开源版本新增功能
- 支持采集指定不同国家的亚马逊(美国亚马逊、日本亚马逊等等)
- 支持指定代理IP访问,减少亚马逊Robot Check几率
- 支持采集、发布日志保存到文件,方便查询
- 接入百度翻译、有道翻译、腾讯翻译,自定义语种实现伪原创
- 支持采集到的数据清洗伪原创一键发布到wordpress(带特色图片)
- 支持发布去重、减少网站被K几率
注意:建议自行指定IP池,随机更换User-Agent,防止被封
截图展示
=======
![数据展示](https://github.com/OFZFZS/scrapy-amazon/blob/master/scpture.jpg?raw=true)
联系作者
-------
QQ1498066696,不常回复,欢迎直接issue
没有合适的资源?快使用搜索试试~ 我知道了~
温馨提示
【资源说明】 基于scrapy框架的亚马逊爬虫,采集商品和评论等信息详细文档+资料齐全.zip 【备注】 1、该项目是个人高分项目源码,已获导师指导认可通过,答辩评审分达到95分 2、该资源内项目代码都经过测试运行成功,功能ok的情况下才上传的,请放心下载使用! 3、本项目适合计算机相关专业(人工智能、通信工程、自动化、电子信息、物联网等)的在校学生、老师或者企业员工下载使用,也可作为毕业设计、课程设计、作业、项目初期立项演示等,当然也适合小白学习进阶。 4、如果基础还行,可以在此代码基础上进行修改,以实现其他功能,也可直接用于毕设、课设、作业等。 欢迎下载,沟通交流,互相学习,共同进步!
资源推荐
资源详情
资源评论
收起资源包目录
基于scrapy框架的亚马逊爬虫,采集商品和评论等信息详细文档+资料齐全.zip (15个子文件)
scrapy-amazon-master
scpture.jpg 97KB
Amazon
Amazon
__init__.py 0B
pipelines.py 830B
spiders
__init__.py 161B
amazon.py 7KB
items.py 509B
images
default.jpg 0B
settings.py 3KB
middlewares.py 2KB
scrapy.cfg 255B
LICENSE 1KB
requirements.txt 62B
.gitignore 162B
README.md 1KB
CSDN
软件
项目授权码.txt 268B
共 15 条
- 1
资源评论
Yuki-^_^
- 粉丝: 3099
- 资源: 700
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功