没有合适的资源?快使用搜索试试~ 我知道了~
chinese_correct_wsd:简易的中文纠错和消歧
共28个文件
py:14个
txt:2个
sh:2个
需积分: 10 4 下载量 83 浏览量
2021-05-15
07:52:19
上传
评论
收藏 1.08MB ZIP 举报
温馨提示
用于用户输入语句的同音自动纠错. 依赖于pynlpir 数据是抓取的某东客服语料训练的,可以后续把自己抓取的语料共享 给大家训练用 ./proc.py 训练产生数据 使用方法: ./server.py 或者 /usr/bin/python3 server.py 启动服务端 然后./client_run.py 或者 /usr/bin/python3 client_run.py XXX来进行纠错测试 ➜ utf-8 ./client_run.py "我想买哥苹果手机" "对京东新人度大打折扣" 原语句:我想买哥苹果手机 纠正句:我想买个苹果手机 原语句:对京东新人度大打折扣 纠正句:对京东信任度大打折扣 ➜ utf-8 中文词义消歧也是这个思路,但是效果比较差,有时间后续研究。使用到了 同义词词林(没有加入库,utils目录中的只做参考)。
资源推荐
资源详情
资源评论
收起资源包目录
chinese_correct_wsd-master.zip (28个子文件)
chinese_correct_wsd-master
proc.py 8KB
correct.c 3KB
correct_server.py 14KB
HIT-IRLab-同义词词林(扩展版)_full_2005.3.3.txt 680KB
test.py 3KB
pinyin.py 115KB
pynlpir
py_test.py 12KB
server.py.bak_d 12KB
correct.cpp 6KB
correct.exe 32KB
同音纠错.doc 14KB
《同义词词林(扩展版)》说明.pdf 161KB
correct_client.py 1KB
wds_client.py 1KB
wds_server.py 9KB
hanzi_prep.py 3KB
hanzi_util.py 2KB
README.md 830B
utils
to_pinyin.py 330B
HIT-IRLab-同义词词林(扩展版)_full_2005.3.3.txt 680KB
sqlite_db.py 3KB
tyccl.py 987B
ReadMe.sh 304B
《同义词词林(扩展版)》说明.pdf 161KB
.gitignore 22B
to_sqlite.py 2KB
encode.sh 122B
skip_words.dat 4B
共 28 条
- 1
资源评论
泰国旅行
- 粉丝: 36
- 资源: 4773
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功