基于网络爬虫的新闻系统设计与实现
1. 传统的新闻网站系统的缺点?
* 门户网站考广告生存,存在严重的 打包销售现象
* 帅选内容。媒体所构造的不那么真实的世界。
* 内容及展示内容的形式
* 新闻网站通过人工方式采集发布来自其他网站的Web新闻,费时费力、易采重与漏采问题。
* 解决:基于网络爬虫 信息自动采集、网页去躁技术、文本文档去重技术、文本自动分类技术
2. 该系统的系统架构,功能结构?
- 1、新闻自动爬取模块
- 2、新闻管理模块
- 3、新闻分类管理模块
- 4、新闻轮播图管理模块
- 5、垃圾桶管理模块
- 6、搜索模块
- 7、关键词自动抽取模块
- 8、登录注册模块
- 9、图片管理模块
- 10、新闻爬取定时任务调度模块
- 11、客户端新闻浏览模块
- 12、推荐功能模块(待扩展)
3. 该系统的数据库设计?
4. 该系统的页面设计?
5. 该系统的技术选型?
- 前端技术:
* Vue.js :npm install -g vue -> cpm install cnpm -g --registry=https://registry.npm.taobao.org
* Vue-cli : cnpm install -g vue-cli -> vue init webpack
* Vuetify : cnpm i vuetify -S
* 引入icon库 : cnpm install material-design-icons-iconfont --save-dev(入口js文件中:import 'material-design-icons-iconfont/dist/material-design-icons.css')
* axios : cnpm i axios -S
* element-ui
- 后端技术:
* SpringCloud(Zuul Eureka Hystrix Ribbon OpenFeign)
* SpringBoot
* SpringMVC
* Spring
* Mybatis
* mysql
* 通用Mapper
* 基于mybatis的pageHelper插件
* ElasticSearch 全文检索
* RabbitMQ 消息队列
* FastDFS 分布式文件系统
* JWT
* htmlParse html解析器
* HanLp中文分词器
相关新闻网站:
https://news.baidu.com/ent
https://tuijian.hao123.com/
https://www.thepaper.cn/
https://www.huanqiu.com/
http://www.people.com.cn/
https://news.sina.com.cn/
https://news.qq.com/
http://paper.people.com.cn/rmrb/html/2020-03/28/nbs.D110000renmrb_01.htm
https://s.weibo.com/top/summary?cate=realtimehot
https://github.com/search?p=2&q=%E6%96%B0%E9%97%BB&type=Repositories
任务:
a、springboot中 如何动态实现任务调度管理 https://www.cnblogs.com/baixianlong/p/10659045.html
b、对爬取到的内容进行关键词抽取 https://www.jianshu.com/p/e129d312d1a9?utm_campaign=maleskine&utm_content=note&utm_medium=reader_share&utm_source=weibo
https://blog.csdn.net/qq_41664845/article/details/82869596
d、管理系统的登录拦截 cookie bug : https://blog.csdn.net/qq_23329167/article/details/83720504、https://www.jianshu.com/p/aef58c67d37e
没有合适的资源?快使用搜索试试~ 我知道了~
温馨提示
【资源说明】 基于网络爬虫的新闻系统设计与实现源码+文档+全部资料(高分项目).zip 【备注】 1、该项目是个人高分项目源码,已获导师指导认可通过,答辩评审分达到95分 2、该资源内项目代码都经过测试运行成功,功能ok的情况下才上传的,请放心下载使用! 3、本项目适合计算机相关专业(人工智能、通信工程、自动化、电子信息、物联网等)的在校学生、老师或者企业员工下载使用,也可作为毕业设计、课程设计、作业、项目初期立项演示等,当然也适合小白学习进阶。 4、如果基础还行,可以在此代码基础上进行修改,以实现其他功能,也可直接用于毕设、课设、作业等。 欢迎下载,沟通交流,互相学习,共同进步!
资源推荐
资源详情
资源评论
收起资源包目录
基于网络爬虫的新闻系统设计与实现源码+文档+全部资料(高分项目).zip (121个子文件)
.gitignore 107B
.gitignore 15B
NewsItemService.java 12KB
CarouselNewsService.java 7KB
CategoryService.java 7KB
NewsItemController.java 5KB
CookieUtil.java 5KB
CarouselNewsController.java 5KB
TextRankKeyword.java 5KB
MilitaryNewsCarouselProcessor.java 5KB
TaskSchedulerServiceImpl.java 5KB
SearchService.java 5KB
UnfinishedWebCrawlerTask.java 5KB
NewsHighlightsProcessor.java 4KB
HotNewsProcessor.java 4KB
GlobalNewsProcessor.java 4KB
RsaUtils.java 4KB
CategoryController.java 4KB
MilitaryNewsTextProcessor.java 3KB
UserController.java 3KB
DateUtil.java 3KB
AuthFilter.java 3KB
JwtUtils.java 3KB
NewsCarouselDataPipeline.java 3KB
NewsController.java 2KB
NewsSystemExceptionEnum.java 2KB
NewsDataPipeline.java 2KB
NewsRepositoryTest.java 2KB
HtmlUtil.java 2KB
UserService.java 2KB
UploadService.java 2KB
NewsItemServiceImpl.java 2KB
JwtTest.java 2KB
SpringContextUtil.java 2KB
GlobalCorsConfig.java 2KB
JwtProperties.java 2KB
ItemListener.java 2KB
TaskScheduledController.java 1KB
NewsItemApi.java 1KB
News.java 1KB
NewsDetailServiceImpl.java 1KB
CarouselNewsServiceImpl.java 1KB
SearchController.java 1KB
NewsDetailService.java 1KB
ObjectUtils.java 937B
NewsDetailController.java 936B
TaskSchedulerService.java 926B
UploadController.java 902B
CommonExceptionHandler.java 795B
WebCrawlerApplication.java 744B
CategoryClientTest.java 713B
JwtProperties.java 702B
FastClientImporter.java 695B
PageResult.java 685B
NewsItem.java 684B
TaskScheduler.java 658B
SearchApplication.java 599B
User.java 597B
ItemApplication.java 593B
CarouselNews.java 588B
CarouselNews.java 581B
NewsItem.java 575B
GatewayApplication.java 566B
ExceptionResult.java 542B
WeiBoProcessor.java 537B
TaskSchedulerVo.java 534B
NewsDetail.java 520B
RegistryApplication.java 516B
UploadApplication.java 513B
NewsDetail.java 493B
Category.java 488B
Category.java 461B
SunxnNewsException.java 433B
UploadProperties.java 418B
NewsDetailApi.java 416B
RepositoryTest.java 413B
CategoryApi.java 398B
CarouselNewsMapper.java 382B
NewsItemVo.java 361B
FilterProperties.java 360B
NewsDetailService.java 354B
CategoryNewsItemVo.java 350B
NewsItemService.java 344B
UserInfo.java 338B
NewsRequest.java 336B
CarouselNewsService.java 334B
CategoryClient.java 321B
NewsRepository.java 317B
NewsDetailClient.java 297B
NewsItemClient.java 291B
CarouselNewsVo.java 288B
TaskSchedulerRepository.java 281B
CarouselNewsRepository.java 277B
NewsDetailRepository.java 271B
NewsItemRepository.java 266B
CategoryRepository.java 265B
JwtConstants.java 259B
NewsDetailMapper.java 253B
NewsItemMapper.java 247B
CategoryMapper.java 247B
共 121 条
- 1
- 2
资源评论
Yuki-^_^
- 粉丝: 3100
- 资源: 1817
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功