## Problem Set
| Problem | Status |
| :-----: | ------ |
|爬虫 | 于军帅、姜钰宝|
|索引建立 | 于军帅|
|基础界面展示 | 于军帅|
|基础搜索(默认搜索content字段,BM25F排序) | 于军帅|
|添加新闻来源、时间、类似新闻展示 | 于军帅|
|首页增加展示热点新闻(需要展示摘要内容) | 于军帅|
|分页功能 | 于军帅|
|搜索界面底部(或者右部)显示相关搜索 | 于军帅|
|界面添加按照时间\热度排序选择框| 于军帅|
|按照时间排序(读API就可以,尽量不要进行二次搜索) | 于军帅|
|相似新闻(有类似api) | 于军帅|
|新闻摘要生成(还不知道怎么从whoosh的索引中得到tfidf数据) | * |
|排序函数的重写(Whoosh的默认排序是基于一个字段的BM25F分数,<br>我们想要根据标题和内容的综合检索得分得到排序结果,应该是需要<br>重写whoosh的某些API) | * |
|热点新闻(类似于上面的需求,但是要求在所有文档上进行热度排序,<br>不知道有没有类似的API,还可以在给文章建立索引的同时计算它的热度值) | *|
|相关搜索(whoosh有类似api) | *|
|查询解析还有很多问题,比如短语搜索、通配符搜索,需要深度阅读API | * |
# search-engine-ui
基于 [https://github.com/AnthonySigogne/web-search-engine](https://github.com/AnthonySigogne/web-search-engine)修改
一个简单的搜索引擎界面,基于whoosh全文检索,使用之前需要自行建立索引,可以参考[https://github.com/serryuer/news-crawler-python.git](https://github.com/serryuer/news-crawler-python.git),爬新闻并建立索引
索引文件夹位置配置在config.py文件:
```
class Config(object):
index_file_path='**/**'
```
## 环境
**Python3.6/Ubuntu18**
- 安装依赖
```
pip install -r requirements.txt
```
## 运行
```
./start.sh
```
<center>
<img src="https://github.com/serryuer/search-engine-ui/raw/master/images/home.png" width=100% height=100%/>"
<center>
<img src="https://github.com/serryuer/search-engine-ui/raw/master/images/search.png" width=100% height=100%/>"
Yuki-^_^
- 粉丝: 3106
- 资源: 4154
最新资源
- 基于智慧云校园管理系统全部资料+高分项目+详细文档.zip
- 基于智慧自助餐饮系统-图像识别全部资料+高分项目+详细文档.zip
- 彩虹-DNS管理系统源码V2.0.1,SSL证书自动申请与部署.zip
- 7寸液晶屏覆膜机(含工程图bom单)sw16全套技术开发资料100%好用.zip
- AI程序源码最新,支持多个国家语言.zip
- 0.64四方针插针打弯机(sw12可编辑+cad)全套技术开发资料100%好用.zip
- 600离心清洗机sw13可编辑全套技术开发资料100%好用.zip
- 基于 Linux 的智能家居系统全部资料+详细文档+优秀项目.zip
- 基于 Yunzai 的小米智能家居控制插件全部资料+详细文档+优秀项目.zip
- 基于android的智能语音家居控制系统 安卓端1.0全部资料+详细文档+优秀项目.zip
- 基于C#的智能家居控制系统通信协议的实现全部资料+详细文档+优秀项目.zip
- 基于LLM Agent的全能管家,通过语音或文字交互,调用工具控制智能家居(HA米家)和电脑。超高拓展性,无限可能。全部资料+详细文档+优秀项目.zip
- 基于ESP32-S3的小键盘,具有时间显示、实时天气、天气预报、实时股票、快捷键、蓝牙键盘、倒计时、快捷访问网站、米家智能家居控制等功能。全部资料+详细文档+优秀项目.zip
- 基于QML智能家居UI全部资料+详细文档+优秀项目.zip
- 基于python实现智能家居物联网服务平台全部资料+详细文档+优秀项目.zip
- 基于STC89C52的智能家居系统全部资料+详细文档+优秀项目.zip
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈