## Problem Set
| Problem | Status |
| :-----: | ------ |
|爬虫 | 于军帅、姜钰宝|
|索引建立 | 于军帅|
|基础界面展示 | 于军帅|
|基础搜索(默认搜索content字段,BM25F排序) | 于军帅|
|添加新闻来源、时间、类似新闻展示 | 于军帅|
|首页增加展示热点新闻(需要展示摘要内容) | 于军帅|
|分页功能 | 于军帅|
|搜索界面底部(或者右部)显示相关搜索 | 于军帅|
|界面添加按照时间\热度排序选择框| 于军帅|
|按照时间排序(读API就可以,尽量不要进行二次搜索) | 于军帅|
|相似新闻(有类似api) | 于军帅|
|新闻摘要生成(还不知道怎么从whoosh的索引中得到tfidf数据) | * |
|排序函数的重写(Whoosh的默认排序是基于一个字段的BM25F分数,<br>我们想要根据标题和内容的综合检索得分得到排序结果,应该是需要<br>重写whoosh的某些API) | * |
|热点新闻(类似于上面的需求,但是要求在所有文档上进行热度排序,<br>不知道有没有类似的API,还可以在给文章建立索引的同时计算它的热度值) | *|
|相关搜索(whoosh有类似api) | *|
|查询解析还有很多问题,比如短语搜索、通配符搜索,需要深度阅读API | * |
# search-engine-ui
基于 [https://github.com/AnthonySigogne/web-search-engine](https://github.com/AnthonySigogne/web-search-engine)修改
一个简单的搜索引擎界面,基于whoosh全文检索,使用之前需要自行建立索引,可以参考[https://github.com/serryuer/news-crawler-python.git](https://github.com/serryuer/news-crawler-python.git),爬新闻并建立索引
索引文件夹位置配置在config.py文件:
```
class Config(object):
index_file_path='**/**'
```
## 环境
**Python3.6/Ubuntu18**
- 安装依赖
```
pip install -r requirements.txt
```
## 运行
```
./start.sh
```
<center>
<img src="https://github.com/serryuer/search-engine-ui/raw/master/images/home.png" width=100% height=100%/>"
<center>
<img src="https://github.com/serryuer/search-engine-ui/raw/master/images/search.png" width=100% height=100%/>"
没有合适的资源?快使用搜索试试~ 我知道了~
温馨提示
CSDN IT狂飙上传的代码均可运行,功能ok的情况下才上传的,直接替换数据即可使用,小白也能轻松上手 【资源说明】 Python优秀项目 基于Flask+MySQL+MongoDB+Scrapy实现的搜索引擎系统源码+部署文档+数据资料.zip 1、代码压缩包内容 代码的项目文件 部署文档文件 2、代码运行版本 python3.7或者3.7以上的版本;若运行有误,根据提示GPT修改;若不会,私信博主(问题描述要详细) 3、运行操作步骤 步骤一:将代码的项目目录使用IDEA打开(IDEA要配置好python环境) 步骤二:根据部署文档或运行提示安装项目所需的库 步骤三:IDEA点击运行,等待程序服务启动完成 4、python资讯 如需要其他python项目的定制服务,可后台私信博主(注明你的项目需求) 4.1 python或人工智能项目辅导 4.2 python或人工智能程序定制 4.3 python科研合作 Django、Flask、Pytorch、Scrapy、PyQt、爬虫、可视化、大数据、推荐系统、人工智能、大模型
资源推荐
资源详情
资源评论
收起资源包目录
Python优秀项目 基于Flask+MySQL+MongoDB+Scrapy实现的搜索引擎系统源码+部署文档+数据资料.zip (42个子文件)
search-engine-ui-master
.DS_Store 6KB
.vscode
settings.json 71B
nohup.out 4KB
templates
spatial
index.html 10KB
elements.html 16KB
layout.html 159KB
layout-empty.html 83KB
start.sh 141B
run.py 4KB
query.py 12KB
requirements.txt 1010B
.gitignore 1KB
images
home.png 1.13MB
search.png 346KB
static
spatial
assets
js
main.js 2KB
skel.min.js 9KB
util.js 12KB
jquery.min.js 94KB
css
main.css 55KB
font-awesome.min.css 27KB
paginate.css 2KB
images
overlay.png 113B
fonts
FontAwesome.otf 107KB
fontawesome-webfont.eot 69KB
fontawesome-webfont.woff 82KB
fontawesome-webfont.woff2 65KB
fontawesome-webfont.svg 357KB
fontawesome-webfont.ttf 139KB
images
caledonie.jpg 52KB
pic05.jpg 19KB
banner.jpg 382KB
pic02.jpg 54KB
pic06.jpg 15KB
pic04.jpg 12KB
pic03.jpg 90KB
pic01.jpg 51KB
pic07.jpg 20KB
README.md 2KB
config.py 566B
python系统部署文档.md 14KB
Flask系统部署文档.md 4KB
171265889347208773632.zip 416B
共 42 条
- 1
资源评论
IT狂飙
- 粉丝: 4840
- 资源: 2651
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- SBT 226-2007 食品机械通用技术条件 焊接、铆接件技术要求.pdf
- SBT 10148.6-1993 粮油加工机械通用技术条件 焊接件.pdf
- SHJ 509-1988 石油化工工程焊接工艺评定.pdf
- SH 3525-1992 石油化工低温钢焊接规程(附条文说明).pdf
- SDCV0041-2002 钢结构焊接节点.pdf
- SHJ 520-1991 石油化工工程铬钼耐热钢管道焊接技术规程(现编号SH3520-91).pdf
- SHS 01012-2004 常压立式圆筒形钢制焊接储罐维护检修规程.pdf
- 基于RFID的物联网STM32单片机图书档案管理系统源码(高分毕业设计)
- 在Debian上安装Docker Engine.pdf
- 岚精灵课程预约系统(教师端+学院端)
- 齿环研磨机sw16可编辑全套技术开发资料100%好用.zip
- 大卡车头模型step全套技术开发资料100%好用.zip
- c语言文件读写操作代码.txt
- ysaggxgzvhgvzshvhgvahg
- c语言文件读写操作代码.txt
- c语言文件读写操作代码.txt
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功