没有合适的资源?快使用搜索试试~
我知道了~
文库首页
数据库
其它
基于动态流通语料库的现代汉语基本词汇自动识别与提取方法研究_赵小兵.caj
基于动态流通语料库的现代汉语基本词汇自动识别与提取方法研究_赵小兵.caj
需积分: 9
3 下载量
164 浏览量
2014-01-09
16:30:01
上传
评论
收藏
16.76MB
CAJ
举报
温馨提示
立即下载
开通VIP(低至0.43/天)
买1年送3月
基于动态流通语料库的现代汉语基本词汇自动识别与提取方法研究_赵小兵.caj
资源推荐
资源评论
基于语义结构的信息抽取系统的研究与实现
浏览:84
基于语义结构的信息抽取系统的研究与实现,是关于信息抽取方面的内容,重点在于基于语义方面的信息抽取系统!
汉语自动分词词典机制的实验研究
浏览:28
分词词典是汉语自动分词系统的一个基本组成部分。 其查询速度直接影响到分词 系统的处理速度。 本文设计并通过实验考察了三种典型的分词词典机制: 整词二分、TRIE 索 引树及逐字二分, 着重比较了它们的时间、空间效率。 实验显示: 基于逐字二分的分词词典机 制简洁、高效, 较好地满足了实用型汉语自动分词系统的需要。
中文语料库:msr_training.utf8.ic
浏览:86
语料库。配合该实验使用:https://blog.csdn.net/admiz/article/details/109846185
基于中文的外卖评价语料库waimai_10k.csv
浏览:68
中文外卖评价语料waimai_10k.csv格式,很好用的语料库,做nlp用。
Weibo_Analysis.rar_posdict.pkl下载_微博 语料_情感分析_文本分类_文本情感
浏览:7
5星 · 资源好评率100%
《微博语料库及其在情感分析中的应用》 在当今大数据时代,社交媒体平台如微博成为了人们日常生活中的信息交流与情感表达的重要渠道。微博上的大量文本数据蕴含着丰富的社会情绪、观点和趋势,对其进行分析,有助于...
brat-v1.3_Crunchy_Frog.tar.gz
浏览:14
4. **语料库建设**:BRAT用于创建高质量的标注语料库,这些语料库是训练机器学习模型和深度学习模型的关键资源。 四、使用BRAT的流程 1. **部署BRAT**:解压“brat-v1.3_Crunchy_Frog”文件,配置服务器环境,启动...
基于视觉信息和深度学习的中文唇语数据集构建与识别_胡扬.caj
浏览:110
1. 研究以互联网视频为数据源头,自动快速构建中文唇语数据集的方法。互联 网视频中的场景变化较多,与现实环境相符,同时资源获取成本较低,本文 基于此,提出有效的从互联网视频中获取可以用于训练唇读模型的唇部...
三元组可比语料库自动剖析技术研究与应用
浏览:102
国内外基于语料库的翻译研究主要集中在翻译共性、翻译规范、译者风格和翻译培训等涉及翻译理论和翻译实践方面的研究;提出的基于三元组可比语料库的自动语言剖析技术扩大了该研究领域的内涵,使其包括面向自然语言处理的应用研究。从工程可实现性考虑,创新性地提出了建造三元组可比语料库,利用n-元词串、关键词簇和语义多词表达等自动抽取技术,通过对比中式英语表达,发掘英语本族语言模型,实现改进和发展机器翻译、跨语言信
现代汉语语料库
浏览:99
语言所公开的现代汉语语料库,通过分别查询3500个常用汉字,将所有数据进行清洗去重后的集合。共554026行,解压后约93.8M,带分词和词性标注。
基于动态贝叶斯网络的大词汇量连续语音识别和音素切分研究
浏览:136
有关于连续语音识别方面的研究和DBN应用
中文语料库数据集。Corpus_of_Chinese._ChineseCorpus.zip
浏览:23
中文语料库数据集。Corpus_of_Chinese._ChineseCorpus
nltk_data.zip
浏览:16
3. **语料库**:nltk_data中还包含了大量预处理的语料库,如Brown语料库、Gutenberg语料库等,这些语料库用于模型训练、测试和演示,帮助开发者理解和验证NLP算法的效果。 4. **标记集和模型**:除了基础数据,nltk...
微软亚洲研究院语料库(1 089 050 字,训练集和测试集)
浏览:167
在实际应用中,语料库可以用于多个NLP任务,如文本分类、情感分析、机器翻译、语音识别、命名实体识别、自动问答系统、聊天机器人等。例如,在文本分类中,模型会学习如何将文本分配到预定义的类别;在情感分析中,...
ChnSentiCorp_htl_ba_4K.zip
浏览:36
基于【谭松波ChnSentiCorp-Htl-ba-4000: 平衡语料,正负类各2000篇】的【改良版】语料库。原语料库夹杂着许多重复评论、垃圾评论,以及被错误分类的评论,影响分类模型的评价指数。本语料库4000评论都已经过人工整理...
维基百科英文语料文档out_wiki.en.txt
浏览:185
维基百科英文语料文档out_wiki.en.txt
基于网页的语料库自动生成.pdf
浏览:94
基于网页的语料库自动生成是指通过网页爬虫技术和自然语言处理技术,将网络上大量的网页信息自动提取、处理和整理,生成一个语料库的过程。这个过程可以自动完成语料库的构建、更新和维护,减少人工劳动的投入,提高...
基于多种数据源的中文知识图谱构建方法研究_胡芳槐.caj
浏览:181
基于多种数据源的中文知识图谱构建方法研究 自从语义网的概念提出以来,越来越多的开放链接数据和用户生成内容被发布于互联网中,互联网逐步从仅包含网页与网页之间超链接的文档万维网转变为包含大量描述各种实体和...
智能机器人语料库.rar
浏览:14
5星 · 资源好评率100%
智能机器人语料库是人工智能领域中的一个重要组成部分,主要用于训练、测试和优化聊天机器人、语音识别系统、自然语言处理(NLP)模型等。语料库是大量人类语言数据的集合,这些数据经过处理和标注,可以供算法学习...
【深度学习语料库】常见金融领域词汇词典
浏览:89
深度学习语料库在金融领域的应用是现代金融科技发展的重要组成部分,尤其在自然语言处理(NLP)中,高质量的语料库是模型训练的关键。"【深度学习语料库】常见金融领域词汇词典"是一个专门针对金融行业的词汇资源,...
小黄鸡语料库(分词以及未分词)
浏览:108
5星 · 资源好评率100%
同时,提供分词和未分词两种形式,使得该语料库既适用于传统的基于规则或统计的处理方法,也适用于现代的深度学习模型。 此外,语料库的标注质量也是关键。小黄鸡语料库在分词处理上应该经过了专业人士的校对,确保...
digits_train.zip_corpus_speech corpus
浏览:183
《语音识别演讲语料库——digits_train.zip_corpus_speech corpus详解》 在信息技术领域,语音识别是一项关键的技术,它使得机器能够理解并转化人类的口头语言。为了实现这一目标,研究者们需要大量的数据来训练...
微博语料库WeiboNER.zip
浏览:126
利用微博语料库WeiboNER,研究者可以构建和优化NER模型,探索在微博数据上进行实体识别的新方法。同时,通过对比不同模型在该数据集上的表现,可以评估模型的泛化能力和适应性。对于学术研究,这个语料库提供了丰富...
zhiwiki_news.word2vec
浏览:199
wiki百科训练word2dev模型可以使用的语料库,wiki语料库zhwiki-latest-pages-articles.xml,希望可以有所帮助,该文件是训练好的
评论
收藏
内容反馈
立即下载
开通VIP(低至0.43/天)
买1年送3月
资源评论
资源反馈
评论星级较低,若资源使用遇到问题可联系上传者,3个工作日内问题未解决可申请退款~
联系上传者
评论
king_0281
粉丝: 5
资源:
5
私信
上传资源 快速赚钱
我的内容管理
展开
我的资源
快来上传第一个资源
我的收益
登录查看自己的收益
我的积分
登录查看自己的积分
我的C币
登录后查看C币余额
我的收藏
我的下载
下载帮助
前往需求广场,查看用户热搜
最新资源
线上翻转课堂-JAVA-基于springBoot医学电子技术线上翻转课堂系统设计与实现
AI抠图工具,无需联网即可!
第二十届智能车-第二十届全国大学生智能汽车竞赛规则解析与参与指南
一款用java写的简单打飞机游戏(包括素材).zip
基于曲率的手指检测matlab程序.zip
YOLO算法在计算机视觉中的原理与应用分析
C语言入门知识:数据类型与变量解析及应用
《电路》大作业:基于matlab实现的节点电压法计算.zip
C语言基础知识及其在嵌入式系统中的应用详解
C语言入门知识详解:语法基础、程序结构、函数设计及内存管理
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功