没有合适的资源?快使用搜索试试~ 我知道了~
linguistics_problems:示例和游戏中的自然语言处理
共86个文件
py:64个
txt:10个
ipynb:4个
需积分: 10 0 下载量 200 浏览量
2021-05-23
01:14:54
上传
评论
收藏 23.87MB ZIP 举报
温馨提示
计算语言学 欢迎来到我的项目主页! 该存储库存储语言学问题的示例。 我叫Daria,我是一位具有自然语言处理技能的软件工程师。 我的一般科学兴趣是知识库和事实提取。 有非常重要的分析工具可提供语义分析和文本挖掘。 该项目有以下几节: 在源代码中,现在支持三种语言:英语,俄语和芬兰语。 我希望很快的下一个发布问题将为更多语言实现NLP算法。 源代码: 前形态 音系学 Soundex算法实现 音节模块(单词音节数(俄语/英语/芬兰语)和单词音节列表(俄语/芬兰语)) 形态学 俄罗斯的赞助人产生器 俄语小名生成器 俄罗斯案件生成器(母语) 俄语同源词检查器 英语形容词比较器 普通英语问题发生器 芬兰语谓语 芬兰语POS标记器 芬兰箱标记器 俄罗斯POS匕首 句法 语法分析器,用于简单句子 知识工程 家谱 公司的抽象本体 简单的时间表质量保证体系 书架 N-gram应用 N-gra
资源推荐
资源详情
资源评论
收起资源包目录
linguistics_problems-master.zip (86个子文件)
linguistics_problems-master
src
ngrams
Collocations.py 7KB
LanguageModel.py 4KB
NGramDictionaryManager.py 3KB
Diminutive-rnn.py 9KB
resources
test.txt 29KB
facts.txt 84.03MB
diminutive
train_diminutives.tsv 21KB
test_diminutives.tsv 1KB
PiDayLanguageModel.py 2KB
WordFiller.py 5KB
CharLevelLanguageModel.py 2KB
svenska
SwedishPOSTagger.py 4KB
NounLemmatizer.py 2KB
resources
irregular_nouns.txt 145B
ontologies
Pedigree.py 11KB
biblio
README.md 1012B
resources
library.json 1KB
main
__init__.py 0B
searcher
Library.py 3KB
__init__.py 0B
rules
century_rules.py 1KB
__init__.py 0B
categories_rules.py 1KB
herou_rules.py 431B
RulesParser.py 2KB
CompanyOntology.py 9KB
Timetable.py 18KB
russian
Sentiment_Analysis.ipynb 135KB
SpellCheckerBkTree.py 15KB
NaivePosTagger.py 6KB
Syllables.py 16KB
morphemes
scripts
hmm
model.py 3KB
viterbi_classifier.py 2KB
annotation
morpheme_annot.py 8KB
pos_tagging.py 1KB
evaluation
utils.py 6KB
hmm_adv
model.py 4KB
viterbi_classifier.py 2KB
NaiveTransliterator.py 14KB
Cognate_Words.py 11KB
MaskSearch.py 4KB
WordTrie.py 8KB
NaiveTokenizer.py 13KB
SpellingTrieLevenstein.py 5KB
SpellChecker.py 16KB
Russian_Caser.py 7KB
Soundex.py 11KB
games
Secret_Letter.py 4KB
Guess_City.py 5KB
Cities.py 4KB
Opposites_Game.py 5KB
More_or_Less.py 4KB
WordDecompounder.py 5KB
Diminutive_Names.py 5KB
SpellingTrie.py 3KB
Patronymic-ya.py 7KB
NaiveSyntaxAnalyzer.py 7KB
TextNormalizer.py 21KB
resources
ru_opposites.txt 4KB
ru_cities.txt 19KB
readme.txt 3KB
tokenizer
abbreviations.txt 3KB
tlds-alpha-by-domain.txt 10KB
NaiveSentenceBoundaryDetector.py 6KB
WordFilterTrie.py 1KB
Autocomplete.py 3KB
suomi
finnish-trigram-pos-bilstm-case-tagger.ipynb 264KB
FinnishNERTagger.py 8KB
FinnishPOSTagger.py 4KB
FinnishPredicativeQuestioner.py 8KB
finnish-bigram-emb-cnns-bilstm-pos-tagger.ipynb 298KB
finnish-ending-pos-bilstm-case-tagger.ipynb 284KB
english
CamelCaseMatcher.py 1KB
Nationalities.py 7KB
LetterCaseGeneration.py 2KB
CamelCaseSplitter.py 2KB
Question.py 9KB
Anagrams.py 2KB
resources
irregular_adjectives.txt 136B
irregular_verbs.txt 2KB
StringsGenerator.py 2KB
Comparative_or_Superlative.py 6KB
.idea
encodings.xml 205B
vcs.xml 180B
README.md 4KB
.gitignore 764B
共 86 条
- 1
资源评论
LeonardoLin
- 粉丝: 17
- 资源: 4659
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功