## Problem Set
| Problem | Status |
| :-----: | ------ |
|爬虫 | 于军帅、姜钰宝|
|索引建立 | 于军帅|
|基础界面展示 | 于军帅|
|基础搜索(默认搜索content字段,BM25F排序) | 于军帅|
|添加新闻来源、时间、类似新闻展示 | 于军帅|
|首页增加展示热点新闻(需要展示摘要内容) | 于军帅|
|分页功能 | 于军帅|
|搜索界面底部(或者右部)显示相关搜索 | 于军帅|
|界面添加按照时间\热度排序选择框| 于军帅|
|按照时间排序(读API就可以,尽量不要进行二次搜索) | 于军帅|
|相似新闻(有类似api) | 于军帅|
|新闻摘要生成(还不知道怎么从whoosh的索引中得到tfidf数据) | * |
|排序函数的重写(Whoosh的默认排序是基于一个字段的BM25F分数,<br>我们想要根据标题和内容的综合检索得分得到排序结果,应该是需要<br>重写whoosh的某些API) | * |
|热点新闻(类似于上面的需求,但是要求在所有文档上进行热度排序,<br>不知道有没有类似的API,还可以在给文章建立索引的同时计算它的热度值) | *|
|相关搜索(whoosh有类似api) | *|
|查询解析还有很多问题,比如短语搜索、通配符搜索,需要深度阅读API | * |
# search-engine-ui
基于 [https://github.com/AnthonySigogne/web-search-engine](https://github.com/AnthonySigogne/web-search-engine)修改
一个简单的搜索引擎界面,基于whoosh全文检索,使用之前需要自行建立索引,可以参考[https://github.com/serryuer/news-crawler-python.git](https://github.com/serryuer/news-crawler-python.git),爬新闻并建立索引
索引文件夹位置配置在config.py文件:
```
class Config(object):
index_file_path='**/**'
```
## 环境
**Python3.6/Ubuntu18**
- 安装依赖
```
pip install -r requirements.txt
```
## 运行
```
./start.sh
```
<center>
<img src="https://github.com/serryuer/search-engine-ui/raw/master/images/home.png" width=100% height=100%/>"
<center>
<img src="https://github.com/serryuer/search-engine-ui/raw/master/images/search.png" width=100% height=100%/>"
没有合适的资源?快使用搜索试试~ 我知道了~
温馨提示
CSDN IT狂飙上传的代码均可运行,功能ok的情况下才上传的,直接替换数据即可使用,小白也能轻松上手 【资源说明】 Python优秀项目 基于Flask+MySQL+MongoDB+Scrapy实现的搜索引擎系统源码+部署文档+数据资料.zip 1、代码压缩包内容 代码的项目文件 部署文档文件 2、代码运行版本 python3.7或者3.7以上的版本;若运行有误,根据提示GPT修改;若不会,私信博主(问题描述要详细) 3、运行操作步骤 步骤一:将代码的项目目录使用IDEA打开(IDEA要配置好python环境) 步骤二:根据部署文档或运行提示安装项目所需的库 步骤三:IDEA点击运行,等待程序服务启动完成 4、python资讯 如需要其他python项目的定制服务,可后台私信博主(注明你的项目需求) 4.1 python或人工智能项目辅导 4.2 python或人工智能程序定制 4.3 python科研合作 Django、Flask、Pytorch、Scrapy、PyQt、爬虫、可视化、大数据、推荐系统、人工智能、大模型
资源推荐
资源详情
资源评论
收起资源包目录
Python优秀项目 基于Flask+MySQL+MongoDB+Scrapy实现的搜索引擎系统源码+部署文档+数据资料.zip (42个子文件)
search-engine-ui-master
.DS_Store 6KB
.vscode
settings.json 71B
nohup.out 4KB
templates
spatial
index.html 10KB
elements.html 16KB
layout.html 159KB
layout-empty.html 83KB
start.sh 141B
run.py 4KB
query.py 12KB
requirements.txt 1010B
.gitignore 1KB
images
home.png 1.13MB
search.png 346KB
static
spatial
assets
js
main.js 2KB
skel.min.js 9KB
util.js 12KB
jquery.min.js 94KB
css
main.css 55KB
font-awesome.min.css 27KB
paginate.css 2KB
images
overlay.png 113B
fonts
FontAwesome.otf 107KB
fontawesome-webfont.eot 69KB
fontawesome-webfont.woff 82KB
fontawesome-webfont.woff2 65KB
fontawesome-webfont.svg 357KB
fontawesome-webfont.ttf 139KB
images
caledonie.jpg 52KB
pic05.jpg 19KB
banner.jpg 382KB
pic02.jpg 54KB
pic06.jpg 15KB
pic04.jpg 12KB
pic03.jpg 90KB
pic01.jpg 51KB
pic07.jpg 20KB
README.md 2KB
config.py 566B
python系统部署文档.md 14KB
Flask系统部署文档.md 4KB
171265889347208773632.zip 416B
共 42 条
- 1
资源评论
IT狂飙
- 粉丝: 4822
- 资源: 2654
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- 2024年最全面Java面试题集及其详细解答
- 跨站脚本攻击(XSS)深度解析:从原理到防御
- 2024年下半年软考中级网络工程师防火墙直路部署-上下行连接交换机配置
- Scratch编程(少儿图形化编程工具)安卓手机、平板版本
- 2024年下半年软考中级网络工程师防火墙直路部署-上下行连接路由器(OSPF)配置
- GeekAI 是基于 AI 大语言模型 API 实现的 AI 助手全套开源解决方案,自带运营管理后台,开箱即用
- 2024年下半年软考中级网络工程师防火墙直路部署-上下行连接路由器配置
- 2010年美国边境及偏远地区代码数据文件
- 基于《Python神经网络编程》一书写的代码
- 手机、平板 Scratch编程(少儿图形化编程工具)少儿版 ScratchJr 安卓版(5~7岁)
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功