1.从一个给定的网址中分析其所包含的 URL 并爬取对应的网页,直到爬取完全部 不重复的网页为止。 2.支持分布式爬取,同时记录输出每一个网页的大小。 3.采用多线程结构设计,实现高性能的网络爬虫。
评论星级较低,若资源使用遇到问题可联系上传者,3个工作日内问题未解决可申请退款~