没有合适的资源?快使用搜索试试~ 我知道了~
chinese_correct_wsd:简易的中文纠错和消歧
共28个文件
py:14个
txt:2个
sh:2个
需积分: 10 4 下载量 152 浏览量
2021-05-15
07:52:19
上传
评论
收藏 1.08MB ZIP 举报
温馨提示
用于用户输入语句的同音自动纠错. 依赖于pynlpir 数据是抓取的某东客服语料训练的,可以后续把自己抓取的语料共享 给大家训练用 ./proc.py 训练产生数据 使用方法: ./server.py 或者 /usr/bin/python3 server.py 启动服务端 然后./client_run.py 或者 /usr/bin/python3 client_run.py XXX来进行纠错测试 ➜ utf-8 ./client_run.py "我想买哥苹果手机" "对京东新人度大打折扣" 原语句:我想买哥苹果手机 纠正句:我想买个苹果手机 原语句:对京东新人度大打折扣 纠正句:对京东信任度大打折扣 ➜ utf-8 中文词义消歧也是这个思路,但是效果比较差,有时间后续研究。使用到了 同义词词林(没有加入库,utils目录中的只做参考)。
资源推荐
资源详情
资源评论
收起资源包目录
chinese_correct_wsd-master.zip (28个子文件)
chinese_correct_wsd-master
proc.py 8KB
correct.c 3KB
correct_server.py 14KB
HIT-IRLab-同义词词林(扩展版)_full_2005.3.3.txt 680KB
test.py 3KB
pinyin.py 115KB
pynlpir
py_test.py 12KB
server.py.bak_d 12KB
correct.cpp 6KB
correct.exe 32KB
同音纠错.doc 14KB
《同义词词林(扩展版)》说明.pdf 161KB
correct_client.py 1KB
wds_client.py 1KB
wds_server.py 9KB
hanzi_prep.py 3KB
hanzi_util.py 2KB
README.md 830B
utils
to_pinyin.py 330B
HIT-IRLab-同义词词林(扩展版)_full_2005.3.3.txt 680KB
sqlite_db.py 3KB
tyccl.py 987B
ReadMe.sh 304B
《同义词词林(扩展版)》说明.pdf 161KB
.gitignore 22B
to_sqlite.py 2KB
encode.sh 122B
skip_words.dat 4B
共 28 条
- 1
资源评论
泰国旅行
- 粉丝: 37
- 资源: 4773
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- 使用JAVA开发的飞机大战小游戏,包括i背景图以及绘制.zip竞赛
- 使用java代码完成一个联机版五子棋applet游戏.zip
- Linux系统上FastDFS相关操作脚本与软件包.zip
- W3CSchool全套Web开发手册中文CHM版15MB最新版本
- Light Table 的 Python 语言插件.zip
- UIkit中文帮助文档pdf格式最新版本
- kubernetes 的官方 Python 客户端库.zip
- 公开整理-2024年全国产业园区数据集.csv
- Justin Seitz 所著《Black Hat Python》一书的源代码 代码已完全转换为 Python 3,重新格式化以符合 PEP8 标准,并重构以消除涉及弃用库实现的依赖性问题 .zip
- java炸弹人游戏.zip学习资料程序资源
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功