# nlp_windows_exe_ui
[![star](https://gitee.com/bensonrachel/nlp_windows_exe_ui/badge/star.svg?theme=dark)](https://gitee.com/bensonrachel/nlp_windows_exe_ui/stargazers)
[![fork](https://gitee.com/bensonrachel/nlp_windows_exe_ui/badge/fork.svg?theme=dark)](https://gitee.com/bensonrachel/nlp_windows_exe_ui/members)
#### 介绍
python3.6-制作一个含有NLP基本功能系统(Windows exe)自然语言处理系统。系统功能:分词、词性标注、关键词提取、文本分类;由于要打包成exe的关系,我将原本的项目的多个文件的集成到一个python文件(窗体文件)里,只保留了使用这个系统所需要用的函数,方便打包,通俗地讲就是,比如生成词向量过程,装袋过程,模型训练过程的,以及一些中间步骤的程序代码,这些有些涉及很多库的,这些打包进去。但是整个项目里的东西是完整的(包括数据)
运行这个系统需要数据支持,所以请务必像我这样将所要用的数据跟exe放在同一个文件夹下,否则运行不了。
![输入图片说明](https://images.gitee.com/uploads/images/2021/0313/171139_e45ce058_8773742.png "屏幕截图.png")
#### 软件架构
系统实现:
分词:使用jieba中文分词(去停用词,精确模式);
词性标注:使用jieba库里的posseg包进行词性标注;
关键词提取:基于lda模型结合tfidf的最合适前六个词;
文本分类:给复旦预料数据进行分词,生成词向量,装袋(词袋模型),接着训练集训练,多次调参,具体参数注释和代码中有,然后再选择相应测试预料进行测试,用的是skleran库的多项式朴素贝叶斯算法。
![输入图片说明](https://images.gitee.com/uploads/images/2021/0313/171914_f8a5c0df_8773742.png "屏幕截图.png")
#### 安装教程
使用步骤:打开项目,打开dist文件夹,运行ui.exe即可。
![输入图片说明](https://images.gitee.com/uploads/images/2021/0313/171918_f9ae3b17_8773742.png "屏幕截图.png")
#### 特技
使用Pyinstaller进行命令行打包
本项目已同时import至[github](https://github.com/benson08230539/nlp_windows_exe_ui)
历时一天~
[gitee地址](https://gitee.com/bensonrachel/nlp_windows_exe_ui)
[csdn博客地址](https://blog.csdn.net/bensonrachel/article/details/108087340)
没有合适的资源?快使用搜索试试~ 我知道了~
温馨提示
python自制自然语言处理系统 实现: 分词:使用jieba中文分词(去停用词,精确模式); 词性标注:使用jieba库里的posseg包进行词性标注; 关键词提取:基于lda模型结合tfidf的最合适前六个词; 文本分类:给复旦预料数据进行分词,生成词向量,装袋(词袋模型),接着训练集训练,多次调参,具体参数注释和代码中有,然后再选择相应测试预料进行测试,用的是skleran库的多项式朴素贝叶斯算法。
资源推荐
资源详情
资源评论
收起资源包目录
NLP:python自制自然语言处理系统.zip (65个子文件)
nlp_windows_exe_ui-master
stopwords.txt 36KB
README.en.md 2KB
test.py 458B
jieba
posseg
prob_emit.py 3.8MB
char_state_tab.py 1.54MB
viterbi.py 2KB
prob_emit.p 3.08MB
char_state_tab.p 2.02MB
__init__.py 9KB
prob_start.p 8KB
prob_trans.py 242KB
prob_trans.p 138KB
prob_start.py 7KB
lac_small
word.dic 193KB
nets.py 4KB
creator.py 1KB
utils.py 4KB
predict.py 3KB
tag.dic 425B
model_baseline
word_emb 10.23MB
gru_3.w_0 192KB
gru_0.b_0 2KB
gru_1.w_0 192KB
fc_2.b_0 2KB
fc_4.b_0 252B
fc_0.b_0 2KB
gru_2.w_0 192KB
fc_3.b_0 2KB
gru_3.b_0 2KB
fc_0.w_0 192KB
fc_2.w_0 384KB
fc_1.b_0 2KB
gru_1.b_0 2KB
fc_1.w_0 192KB
gru_2.b_0 2KB
crfw 13KB
fc_3.w_0 384KB
fc_4.w_0 57KB
gru_0.w_0 192KB
__init__.py 0B
reader_small.py 3KB
__main__.py 2KB
__init__.py 19KB
dict.txt 4.84MB
analyse
idf.txt 5.91MB
__init__.py 501B
tfidf.py 4KB
textrank.py 4KB
analyzer.py 1KB
_compat.py 3KB
finalseg
prob_emit.py 1.26MB
prob_emit.p 1.22MB
__init__.py 3KB
prob_start.p 109B
prob_trans.py 241B
prob_trans.p 260B
prob_start.py 93B
nlp
ui.py 4KB
nlpexe.ico 91KB
ui.spec 885B
dict.txt 4.84MB
.gitignore 1KB
nlp_exe.py 4KB
README.md 2KB
ui.py 10KB
共 65 条
- 1
资源评论
- 816942024-03-22资源不错,对我启发很大,获得了新的灵感,受益匪浅。
- 启程12232023-04-12资源内容总结的很到位,内容详实,很受用,学到了~
- 一零不是十2022-12-18非常有用的资源,可以直接使用,对我很有用,果断支持!
- lemon_coffee2023-05-28发现一个超赞的资源,赶紧学习起来,大家一起进步,支持!
方案互联
- 粉丝: 18
- 资源: 967
下载权益
C知道特权
VIP文章
课程特权
开通VIP
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- .archivetemp04 - 继承和多态 作业.doc
- 基于运动学车辆模型的开放式驾驶MPC横向控制算法Analyzed commaai Openpilot MPC lateral c
- STM32F103单片机源码STM32-74HC595串转并控制数码管显示
- python语言教程项目案例
- 斐波那契数列java代码 FibonacciProblem
- 服务器的概要介绍与分析
- logseq-linux包
- 蓝色简历首页的微信小程序模板源码
- 基于MPC的仿真轨迹跟踪模块MPC-based Simulink trajectory tracking module
- 递归地求解Fibonacci数列.pdf
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功