ezcrawl:深度浏览网站的自动抓取工具，如StackOverflow，Amazon，TedTalks等。未指定x路径

共17个文件

py：12个

pyc：2个

csv：1个

python

crawler

python3

Python

需积分: 5 1 下载量 139 浏览量 2021-05-02 14:07:48 上传评论收藏 12KB ZIP 举报

温馨提示

自动深层列表网络爬虫这是一个用Python编写的Web内容提取模块，它很大程度上基于python lxml。它在Amazon，StackOverflow，Ebay等Deep网站（根据您输入的内容生成信息的网站）上效果最佳。给定首页网址，它将从中提取所有产品/文章链接（包括分页）。它还可以提取用户对产品/文章的评论。文件资料半结构化网页的自下而上区域提取器-Wachirawut Thamviset，Sartra Wongthanavasu 演示视频：从包含用户生成内容的网页中提取信息性文本部分：

资源推荐

资源详情

资源评论