# 这是NLP的期末大作业:基于潜在语义索引算法-LSI的电影检索
### 潜在语义索引(LSI)概述:潜在语义索引(Latent Semantic Indexing,以下简称LSI),有的文章也叫Latent Semantic Analysis(LSA)。其实是一个东西,后面我们统称LSI,它是一种简单实用的主题模型。LSI是基于奇异值分解(SVD)的方法来得到文本的主题的。
详细介绍见:https://www.cnblogs.com/pinard/p/6805861.html
### 本次电影检索分为**中文电影**检索和**英语电影**检索
# 文档说明
## 0. 环境(不用一定一样)
anaconda version 1.7.2
python version 3.8.3
## 1. 数据
名称:**KaggleMovie.csv**
来源:https://www.kaggle.com/datasets/devendra45/movies-similarity
名称:**DouBanMovie.csv**
来源:[https://sec.douban.com/](https://movie.douban.com/top250) /---- 手动爬取-----/
## 2. 文件
**input**文件夹:存放处理文件KaggleMovie.csv和DouBanMovie.csv
**KaggleMain.pynb**文件:处理KaggleMovie.csv的主函数,由jupyter笔记编写,见代码注解
**DouBanMain.pynb**文件:处理DouBanMovie.csv的主函数,由jupyter笔记编写,见代码注解
**script**文件:由于涉及绘制词云图,wordcloud缺少中文字体,需要导入,这里导入simfang.ttf字体
没有合适的资源?快使用搜索试试~ 我知道了~
NLP的期末大作业:基于潜在语义索引算法-LSI的电影检索+源代码+文档说明
共6个文件
ipynb:2个
csv:2个
ttf:1个
1.该资源内容由用户上传,如若侵权请联系客服进行举报
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
版权申诉
0 下载量 74 浏览量
2023-12-23
08:37:08
上传
评论
收藏 6.87MB ZIP 举报
温馨提示
1、资源内容:NLP的期末大作业:基于潜在语义索引算法-LSI的电影检索+源代码+文档说明 2、代码特点:内含运行结果,不会运行可私信,参数化编程、参数可方便更改、代码编程思路清晰、注释明细,都经过测试运行成功,功能ok的情况下才上传的。 3、适用对象:计算机,电子信息工程、数学等专业的大学生课程设计、期末大作业和毕业设计。 4、作者介绍:某大厂资深算法工程师,从事Matlab、Python、C/C++、Java、YOLO算法仿真工作10年;擅长计算机视觉、 目标检测模型、智能优化算法、神经网络预测、信号处理、元胞自动机、图像处理、智能控制、路径规划、无人机等多种领域的算法仿真实验,更多源码,请上博主主页搜索。 -------------------------------------------------------------------------- -
资源推荐
资源详情
资源评论
收起资源包目录
NLP-Semantic-Search-Engine-using-NLP-main.zip (6个子文件)
NLP-Semantic-Search-Engine-using-NLP-main
input
KaggleMovies.csv 1.74MB
DouBanMovies.csv 181KB
KaggleMain.ipynb 377KB
DouBanMain.ipynb 474KB
script
simfang.ttf 10.09MB
README.md 1KB
共 6 条
- 1
资源评论
机器学习的喵
- 粉丝: 491
- 资源: 1259
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功