# TBSpider
基于Jsoup实现的爬虫demo项目,支持对淘宝商品页面进行抓取分析
## 框架和技术
- JDK-1.8
- SpringBoot-2.4.5
- Jsoup-1.13.1
- poi-5.0.0
- bootstrap-3.3.5 bootstrap-fileinput-4.3.1
## 功能介绍
启动SpiderApplication后,页面访问地址为[http://localhost:8888](),选择需要分析的淘宝链接excel进行上传,后台收到文件会解析Excel并逐行对链接分析商品当前是否是出售中状态,分析完成后支持下载出售中的商品链接excel。
因为本项目是单机版,所以文件都存储在临时文件夹,进度也是保存在内存中,重启以后会丢失所有数据,需要分布式或者持久化的话可以自行改造。
没有合适的资源?快使用搜索试试~ 我知道了~
资源推荐
资源详情
资源评论
收起资源包目录
基于Jsoup实现的淘宝爬虫项目.zip (22个子文件)
项目授权码.txt 268B
TBSpider-master
pom.xml 6KB
src
main
resources
logback.xml 409B
user_agent
user_agent.txt 991KB
static
index.html 3KB
application.yml 62B
java
com
martin
product
SpiderApplication.java 497B
spider
TaoBaoSpider.java 751B
controller
IndexController.java 7KB
response
BaseResponse.java 1KB
tuple
Tuple2.java 611B
constants
WebConstants.java 113B
listener
InitListener.java 691B
util
LogUtil.java 648B
HttpUtil.java 14KB
FileUtil.java 900B
HtmlUtil.java 1KB
UserAgents.java 2KB
advice
ExceptionAdvice.java 1KB
LICENSE 1KB
.gitignore 63B
README.md 720B
共 22 条
- 1
资源评论
不走小道
- 粉丝: 3218
- 资源: 5113
下载权益
C知道特权
VIP文章
课程特权
开通VIP
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功