没有合适的资源?快使用搜索试试~ 我知道了~
uniparser-grammar-meadow-mari:Meadow Mari的形态分析
共39个文件
txt:18个
py:16个
md:2个
需积分: 9 0 下载量 30 浏览量
2021-02-17
22:51:15
上传
评论
收藏 10.25MB ZIP 举报
温馨提示
uniparser-语法-草甸-玛丽 这是对文学梅多·玛丽形态的形式化描述,其中还包括许多方言元素。 该描述以UniParser格式执行,并且包含对变形的描述(paradigms.txt),语法词典(mhr_lexemes_XXX.txt文件)和应避免的简短分析列表(bad_analyses.txt)。 该词典包含对单个词素的描述,每个词素都附带有关其词干,词性标记和一些其他语法/借阅信息,其变形类型(范例)以及俄语翻译的信息。 此说明可以通过以下方式用于Meadow Mari文本的形态分析: 最简单的解决方案是使用预先分析的词表来分析文本。 wordlists目录包含基于Meadow Mari语料库的标记的频率列表。 第一组列表( _main )来自标准语料库,该语料库在大众媒体,维基百科的文章等中包含263万个单词。 第二个( _social_media )来自Meadow Mea
资源推荐
资源详情
资源评论
收起资源包目录
uniparser-grammar-meadow-mari-master.zip (39个子文件)
uniparser-grammar-meadow-mari-master
paradigms.txt 141KB
finalizer
paradigms.txt 151KB
gramm_finalizer.py 3KB
lexemes.txt 6.1MB
mhr_lexemes_N.txt 2.55MB
bad_analyses.txt 564B
mhr_lexemes_V.txt 677KB
mhr_lexemes_PN.txt 1.68MB
analyzer
paradigms.txt 151KB
bad_analyses.txt 564B
lexemes.txt 6.1MB
UniParser
clitic.py 7KB
lex_rule.py 2KB
reduplication.py 4KB
lexeme.py 20KB
errors.log 0B
periphrastic.py 3KB
yamlReader.py 2KB
wordform.py 9KB
analyze.py 7KB
stem_conversion.py 3KB
derivations.py 10KB
morph_fst.py 12KB
paradigm.py 49KB
ErrorHandler.py 928B
morph_parser.py 37KB
grammar.py 12KB
wordlists
mhr_wordlist_main.csv 3.64MB
mhr_parsed_social_media.txt 18.63MB
mhr_parsed_main.txt 21.94MB
mhr_unparsed_social_media.txt 1.55MB
mhr_wordlist_social_media.csv 3.31MB
mhr_unparsed_main.txt 1.41MB
mhr_lexemes_A.txt 780KB
mhr_lexemes_PRO.txt 32KB
mhr_lexemes_NUM.txt 8KB
mhr_lexemes_unchangeable.txt 361KB
LICENSE.md 1KB
README.md 3KB
共 39 条
- 1
资源评论
胡轶强
- 粉丝: 17
- 资源: 4572
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功