# nlp_windows_exe_ui
[![star](https://gitee.com/bensonrachel/nlp_windows_exe_ui/badge/star.svg?theme=dark)](https://gitee.com/bensonrachel/nlp_windows_exe_ui/stargazers)
[![fork](https://gitee.com/bensonrachel/nlp_windows_exe_ui/badge/fork.svg?theme=dark)](https://gitee.com/bensonrachel/nlp_windows_exe_ui/members)
#### 介绍
python3.6-制作一个含有NLP基本功能系统(Windows exe)自然语言处理系统。系统功能:分词、词性标注、关键词提取、文本分类;由于要打包成exe的关系,我将原本的项目的多个文件的集成到一个python文件(窗体文件)里,只保留了使用这个系统所需要用的函数,方便打包,通俗地讲就是,比如生成词向量过程,装袋过程,模型训练过程的,以及一些中间步骤的程序代码,这些有些涉及很多库的,这些打包进去。但是整个项目里的东西是完整的(包括数据)
运行这个系统需要数据支持,所以请务必像我这样将所要用的数据跟exe放在同一个文件夹下,否则运行不了。
![输入图片说明](https://images.gitee.com/uploads/images/2021/0313/171139_e45ce058_8773742.png "屏幕截图.png")
#### 软件架构
系统实现:
分词:使用jieba中文分词(去停用词,精确模式);
词性标注:使用jieba库里的posseg包进行词性标注;
关键词提取:基于lda模型结合tfidf的最合适前六个词;
文本分类:给复旦预料数据进行分词,生成词向量,装袋(词袋模型),接着训练集训练,多次调参,具体参数注释和代码中有,然后再选择相应测试预料进行测试,用的是skleran库的多项式朴素贝叶斯算法。
![输入图片说明](https://images.gitee.com/uploads/images/2021/0313/171914_f8a5c0df_8773742.png "屏幕截图.png")
#### 安装教程
使用步骤:打开项目,打开dist文件夹,运行ui.exe即可。
![输入图片说明](https://images.gitee.com/uploads/images/2021/0313/171918_f9ae3b17_8773742.png "屏幕截图.png")
#### 特技
使用Pyinstaller进行命令行打包
本项目已同时import至[github](https://github.com/benson08230539/nlp_windows_exe_ui)
历时一天~
[gitee地址](https://gitee.com/bensonrachel/nlp_windows_exe_ui)
[csdn博客地址](https://blog.csdn.net/bensonrachel/article/details/108087340)
没有合适的资源?快使用搜索试试~ 我知道了~
温馨提示
是一种技术向导,是数据科学的一部分,它教计算机理解人类语言。 它涉及分析数据以提取有意义的见解。在其众多用途中,主要用途包括文本挖掘、文本分类、文本和情感分析以及语音生成和识别。 今天,我们探索七个顶级 Python NLP 库。使用这些库将使人们能够构建端到端的 NLP 解决方案 —从获取模型数据到呈现结果。 此外,还将了解相关概念,例如标记化、词干提取、语义推理等。 自然语言工具包 (NLTK) 自然语言工具包或 NLTK 是构建 Python 程序最流行的平台之一。 它提供了一套开源 Python 模块、教程和数据集,以支持 NLP 的研究和开发。超过 50 个语料库和 词汇资源是 NLTK 接口的接收者。这些包括: 一套用于分类的文本处理库 代币化 词干 标记 解析 语义推理 工业级 NLP 库的包装器 词网 它适用于各类程序员,学生、教育工作者、工程师、研究人员和行业专业人士。NLTK 可在 Python 3.6 及更高版本中访问,并且适用于 Windows、Mac OS X 和 Linux。 在此处阅读有关 NLTK 的兼容性和功能的更多信息。 ----------
资源推荐
资源详情
资源评论
收起资源包目录
python3.6-制作一个含有NLP基本功能系统(Windows exe)自然语言处理系统.rar (66个子文件)
python3.6-制作一个含有NLP基本功能系统(Windows exe)自然语言处理系统
新建文本文档.txt 19B
nlp_windows_exe_ui-master
nlpexe.ico 91KB
nlp
ui.py 4KB
dict.txt 4.84MB
ui.spec 885B
.gitignore 1KB
nlp_exe.py 4KB
ui.py 10KB
README.en.md 2KB
test.py 458B
README.md 2KB
stopwords.txt 36KB
jieba
__init__.py 19KB
analyse
__init__.py 501B
textrank.py 4KB
idf.txt 5.91MB
tfidf.py 4KB
analyzer.py 1KB
lac_small
nets.py 4KB
utils.py 4KB
__init__.py 0B
reader_small.py 3KB
predict.py 3KB
tag.dic 425B
model_baseline
gru_1.w_0 192KB
gru_2.b_0 2KB
fc_4.b_0 252B
fc_1.b_0 2KB
fc_1.w_0 192KB
fc_0.b_0 2KB
gru_1.b_0 2KB
fc_3.w_0 384KB
fc_0.w_0 192KB
fc_2.w_0 384KB
fc_2.b_0 2KB
gru_3.w_0 192KB
gru_2.w_0 192KB
crfw 13KB
word_emb 10.23MB
gru_0.w_0 192KB
gru_3.b_0 2KB
fc_4.w_0 57KB
fc_3.b_0 2KB
gru_0.b_0 2KB
word.dic 193KB
creator.py 1KB
_compat.py 3KB
finalseg
__init__.py 3KB
prob_start.py 93B
prob_emit.py 1.26MB
prob_trans.p 260B
prob_start.p 109B
prob_trans.py 241B
prob_emit.p 1.22MB
dict.txt 4.84MB
__main__.py 2KB
posseg
__init__.py 9KB
char_state_tab.p 2.02MB
prob_start.py 7KB
prob_emit.py 3.8MB
prob_trans.p 138KB
viterbi.py 2KB
prob_start.p 8KB
prob_trans.py 242KB
char_state_tab.py 1.54MB
prob_emit.p 3.08MB
共 66 条
- 1
资源评论
野生的狒狒
- 粉丝: 1494
- 资源: 1530
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功