没有合适的资源?快使用搜索试试~ 我知道了~
SpellChecker
共9个文件
py:3个
jsonln:2个
gitattributes:1个
需积分: 5 0 下载量 27 浏览量
2021-04-12
09:05:51
上传
评论
收藏 25.48MB ZIP 举报
温馨提示
Python简单拼写检查器 自然语言处理-INSPER 2021.1 安德烈·韦伯 马修斯·佩里松(Matheus Pellizzon) 命令: 要清除文本: python cleaner.py 要从明文生成词汇表,请执行以下操作: python vocab_generator.py 要从词汇表中进行更正: python corrector.py "frase para correção" 对项目进行的改进: 我们对Wikipedia文本进行了预处理,使用cleaner.py文件删除了html格式及其注释,数学类型标记,Wikipedia自己的格式以及似乎与单词校正无关的其他内容。 但是,在词汇表中仍然存在一些奇怪的情况,例如“ fff”,但是以后可以通过分析单词的概率来处理。 对于vobabulary的生成,通过文件vocab_generator.py我们去掉停用词由NLTK
资源推荐
资源详情
资源评论
收起资源包目录
SpellChecker-main.zip (9个子文件)
SpellChecker-main
dump_small.jsonln 58.3MB
vocab.json 201KB
.gitattributes 44B
vocab_generator.py 1KB
README.md 2KB
dump_small_clean.jsonln 26.85MB
corrector.py 3KB
cleaner.py 5KB
.gitignore 2KB
共 9 条
- 1
资源评论
善音
- 粉丝: 26
- 资源: 4611
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- 基于python和协同过滤算法的电影推荐系统
- 国际象棋棋子检测3-YOLO(v5至v9)、COCO、CreateML、Darknet、Paligemma、TFRecord数据集合集.rar
- Python毕业设计基于知识图谱的电影推荐系统源码(完整项目代码)
- 基于C++的简易图书管理系统(含exe可执行文件)
- 使用python爬取数据并采用Django搭建系统的前后台,使用Spark进行数据处理并进行电影推荐项目源码
- 商城蛋糕数据库sql源码
- 基于Spark的电影推荐系统源码(毕设)
- NET综合解决工具,windows平台必备
- ZZU 面向对象Java实验报告
- 2024年秋学季-C#课程的信息系统大作业winform
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功