京东爬虫，可抓取京东商品信息和评论.zip

共30个文件

pyc：8个

py：8个

xml：6个

版权申诉

python

爬虫

数据收集

5星 · 超过95%的资源 190 浏览量 2024-03-01 14:13:53 上传评论 2 收藏 126KB ZIP 举报

资源推荐

资源详情

资源评论

收起资源包目录

京东爬虫，可抓取京东商品信息和评论.zip （30个子文件）

SJT-code

scrapy.cfg 262B

jd_spider

__init__.py 0B

pipelines.py 6KB

settings.pyc 3KB

middlewares.pyc 2KB

spiders

jd_comment.pyc 3KB

__init__.py 161B

jd_home.pyc 3KB

__init__.pyc 146B

jd_home.py 3KB

jd_comment.py 3KB

items.py 2KB

__init__.pyc 138B

pipelines.pyc 6KB

settings.py 4KB

middlewares.py 1KB

items.pyc 2KB

.idea

vcs.xml 180B

workspace.xml 36KB

misc.xml 701B

inspectionProfiles

Project_Default.xml 410B

profiles_settings.xml 235B

modules.xml 268B

jingdong.iml 459B

jd_comment.sql 1KB

test.xlsx 23KB

jd_goods.sql 1KB

goods.xls 29KB

good.png 79KB

README.md 2KB

# jd_spider 用scrapy框架写的京东爬虫，可以抓取京东商品信息和评论 # 1、目的： <li>1、爬取京东的商品信息（以电子烟为例）</li> <li>2、爬取商品的评论信息</li> #2、抓取到的数据属性如下所示 ##商品数据 ![image](http://img.blog.csdn.net/20160706175045922) ##评论数据 ![image](http://img.blog.csdn.net/20160706174754513) #3、使用说明： ##(1)抓取商品信息和抓取评论分别写在了两个不同的爬虫里 抓取商品信息代码在jd_home.py中，数据库在setting.py中修改ITEM_PIPELINES，使用MySQLPipeline 抓取评论代码在jd_comment.py中，数据库在setting.py中修改ITEM_PIPELINES，使用CommentPipeline ##(2)setting.py文件 默认开启了代理IP，因为IP的存活期的限制，要定期更新PROXIES中IP信息，可从网站：http://www.xicidaili.com/ 中找免费的代理IP 如果不想使用代理IP，可以将DOWNLOADER_MIDDLEWARES代码注释掉 数据库的配置： <li>setting.py中可以配置数据库的主机，端口，用户名，密码和数据库名信息</li> <li>pipeline.py中在sql语句中配置你要存入的表的名称。</li> <li>数据库表结构：</li> <li>jd_comment.sql：评论数据</li> <li>jd_goods.sql：商品数据</li> 在使用本爬虫中，因为在抓取评论信息时需要用到goods.xls文件。因此需要先抓取商品信息，然后将商品信息的相关内容导出到goods.xls中（这里提供了一个goods.xls的格式供参考） goods.xls格式：第1列：商品ID，第2列：商品评论数；第3列：商品的commentVersion 在一个工程中，抓取商品信息和抓取评论信息不能同时进行。

评论收藏

内容反馈

版权申诉

cwh5920

2024-04-10

报错File "J:\信息技术部事务\数据采集\03_代码\京东爬虫，可抓取京东商品信息和评论\SJT-code\jd_spider\spiders\jd_home.py", line 2, in <module> import scrapyFile "D:\Python\Python39\lib\site-packages\OpenSSL\crypto.py", line 1598, in X509StoreFlags NOTIFY_POLICY = _lib.X509_V_FLAG_NOTIFY_POLICY AttributeError: module 'lib' has no attribute 'X509_V_FLAG_NOTIFY_POLICY'

JJJ69
上传者
2024-04-10

你好，程序运行出错，你也许应该更新一下你的运行环境
2401_86078946

2024-11-13

超赞的资源，感谢资源主分享，大家一起进步！
岁城。

2024-05-25

资源内容总结地很全面，值得借鉴，对我来说很有用，解决了我的燃眉之急。
weixin_43587002

2024-05-04

资源有很好的参考价值，总算找到了自己需要的资源啦。
2301_79705257

2024-04-03

超赞的资源，感谢资源主分享，大家一起进步！