没有合适的资源?快使用搜索试试~ 我知道了~
morphemeCatcher:查找具有派生后缀的任何单词的基础单词。 许多误报
共7个文件
txt:4个
py:1个
license:1个
需积分: 8 0 下载量 137 浏览量
2021-03-13
21:01:02
上传
评论
收藏 364KB ZIP 举报
温馨提示
查找具有派生后缀的任何单词的基本单词。 快速和肮脏的脚本,以找到任何带有派生后缀的单词的基础单词。 非常嘈杂,请小心处理。 输入文件 该脚本需要三个输入文件。 首先,一个用空格分隔的文件,其中包含您的语料库中的词条及其绝对频率,称为input.txt 。 不幸的是,我用来计算输出的文件太大,无法在此处上传。 volta 1260829 modo 1209297 fine 1190979 punto 1160029 italia 1150307 vita 1139233 persona 1139018 diritto 1117652 ... 所需的第二个文件是派生后缀的列表,每行一个,名为morphemes.txt 。 ata one uccio 最后一个文件是一个干净的名词列表,命名为input_cleaner.txt ,以防您的input.txt过于吵杂。 casa italia
资源推荐
资源详情
资源评论
收起资源包目录
morphemeCatcher-main.zip (7个子文件)
morphemeCatcher-main
morphemeCatcher.py 1KB
input_cleaner.txt 394KB
input.txt 15KB
morphemes.txt 497B
LICENSE 1KB
README.md 1KB
output.txt 514KB
共 7 条
- 1
资源评论
哈奇明
- 粉丝: 30
- 资源: 4771
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功