没有合适的资源?快使用搜索试试~
我知道了~
文库首页
行业
互联网
统计分词/无字典分词学习(1):介绍和语料准备-附件资源
统计分词/无字典分词学习(1):介绍和语料准备-附件资源
0 下载量
121 浏览量
2021-03-02
15:10:07
上传
评论
收藏
23B
TXT
举报
温馨提示
立即下载
统计分词/无字典分词学习(1):介绍和语料准备-附件资源
资源推荐
资源评论
icwb2-data等分词语料
浏览:101
分词相关训练语料数据icwb2-data icwb2-data icwb2-data
分词-词性标注-词典-中文语料库.zip
浏览:197
分类_分词@12大类5485文本1127万_搜狗.20151022 各种词库 用语分词、词性标注等自然语言处理NLP任务
sphinx中文语音训练手册
浏览:148
5星 · 资源好评率100%
本文档介绍Sphinx4在Windows下的中文训练过程及注意事项,与本文档配套的是我自己的训练实例bergtrain和用到的软件。 本文档编写日期 2013-04-23 1、为什么要训练? sphinx4目前的版本中仅提供了英文等语音识别库。...
cantonese-corpus:粤语分词工具
浏览:103
5星 · 资源好评率100%
粤语分析采用pycantonese作为粤语语料库以及预料分析工具分词工具采用jieba分词工具进行分词,jieba的分词字典需要从pycantonese里面获得用法./data/init_dict.txt 初始化的分词,可以加入一些常用的词,格式是[单词...
Java中通过HanLP实现文本分词、提取关键词、聚类(工具资源+实例)
浏览:26
4星 · 用户满意度95%
HanLP是由一系列模型与算法组成的工具包,目标是普及自然语言处理在生产环境中的应用。HanLP具备功能完善、性能高效、架构...提供词法分析(中文分词、词性标注、命名实体识别)、句法分析、文本分类和情感分析等功能。
正向分词字典
浏览:171
正向分词字典c++程序设计汉语分词词典代码
Chinese-Mandarin-Dictionaries:中文普通话词典-中文词典中文词典
浏览:42
基于单词语料库和HSK等级 ✓ 2。 让我成为汉字 动画和说明 ✓ 3。 成语 来自免费提供的论文以及免费提供的英语翻译? BCC成语词典-?license (要上传,请添加完整参考)检查法律条款 4, CC-Cedict 带有放大...
几乎最全的中文NLP资源库.zip
浏览:20
5星 · 资源好评率100%
语料/数据集、变量命名神器、分词语料库+代码、任务型对话英文数据集、ASR 语音数据集 + 基于深度学习的中文语音识别系统、笑声检测器、Microsoft多语言数字/单位/如日期时间识别包、中华新华字典数据库及api(包括...
python文本分析利用分类算法实现对文本的数据挖掘
浏览:9
语料库的数据预处理,包括文档建模,如去噪,分词,建立数据字典, 使用词袋模型或主题模型表达文档等; 注:使用主题模型,如LDA可以获得实验加分; 3. 选择分类算法(如朴素贝叶斯、SVM等),训练文本分类器,...
机器学习中文文本分类实战代码+数据
浏览:47
5星 · 资源好评率100%
2.语料库的数据预处理,包括文档建模,如去噪,分词,建立数据字典,使用词袋模型或主题模型表达文档等; 注:使用主题模型,如 LDA 可以获得实验加分; 3.选择分类算法(朴素贝叶斯(必做)、SVM/其他等),训练...
NLP资源库.zip
浏览:163
3星 · 编辑精心推荐
语料/数据集、变量命名神器、分词语料库+代码、任务型对话英文数据集、ASR 语音数据集 + 基于深度学习的中文语音识别系统、笑声检测器、Microsoft多语言数字/单位/如日期时间识别包、中华新华字典数据库及api(包括...
CWS_Dict:AAAI 2018年论文“带有用于中文分词的词典的神经网络”的源代码-tensorflow source code
浏览:146
3星 · 编辑精心推荐
本文提出了中文分词算法的源代码和语料库。 张琦,刘晓宇,付金兰。 结合字典进行中文分词的神经网络。 AAAI 2018 依存关系 目录结构 CWS_dict same-domain: In-domain evaluation for CWS (SIGHAN2005,CTB6) ...
结合关联置信度与结巴分词的新词发现算法
浏览:5
在中文自然语言处理领域中,分词是非常重要的步骤之一,它是关键词抽取、文本自动摘要、文本聚类的基础,分词结果的好坏直接影响进一步文本处理的准确性.近年来随着微博平台、直播平台、朋友圈等自由舆情平台的兴起...
alice 加入ik分词,中文空格分词,hanlp 语义分词
浏览:76
添加处理alice智能应答中文识别,添加hanlp,自定义接口,处理外部接口,restful,cmd,DB标签文档使用描述,由于添加hanlp最新hanlp-1.6.7 字典,文件放百度网盘,如果下载不了,可以QQ联系:451832143
人工智能-项目实践-预训练-中文bigbird预训练模型.zip
浏览:115
简介 BigBird是由google与2020年发表的模型...jieba分词,按照词频创建字典(tiny、mini、small、base);用chinese-roberta-wwm-ext原版字典(wwm-base) 掩词预训练(tiny、mini、small、base);WWM掩字预训练(wwm-base)
基于朴素贝叶斯的文本数据的分类与分析实验
浏览:96
5星 · 资源好评率100%
实验要求 ...语料库的数据预处理,包括文档建模,如去噪,分词,建立数据字典。 自行实现朴素贝叶斯,训练文本分类器。 对测试集的文本进行分类 对测试集的分类结果利用正确率和召回率进行分析评价。
proofreadv1:中文文本自动纠错
浏览:8
二元语言模型与字典分词相结合的方法,命令Ui=WiWi+1(就是字符i和字符i+1结合起来的字符串在词频字典中的词频),假设一个字i不对,则 Ui=WiWi+1 ,Ui-1=Wi-1Wi Ui 和Ui-1都是0,说明这个词没有这种分词的存在,说明...
Java 面经手册·小傅哥.pdf
浏览:34
5星 · 资源好评率100%
这是一本以面试题为入口讲解 Java 核心内容的技术书籍,书中内容极力的向你证实代码是对数学逻辑的具体实现。当你仔细阅读书籍时,会发现Java中有大量的数学知识,包括:扰动函数、负载因子、拉链寻址、开放寻址、斐波那契(Fibonacci)散列法还有黄金分割点的使用等等。 适合人群 1. 具备一定编程基础,工作1-3年的研发人员 2. 想阅读 Java 核心源码,但总感觉看不懂的 3. 看了太多
解压后拖入浏览器扩展程序使用.zip
浏览:116
5星 · 资源好评率100%
解压后拖入浏览器扩展程序使用
103套PPT模板.zip
浏览:174
4星 · 用户满意度95%
读本科常用的100套PPT模板,里面的模板能应用于答辩、汇报、经验分享,风格各异,可以根据自己的喜欢进行挑选
Beyond Compare 免安装直接使用
浏览:105
5星 · 资源好评率100%
比较工具,用于比较任何文本文件,包括.c文件、.cpp文件、.h文件等,或者比较文件夹;Beyond Compare.zip 解压之后直接可以使用
notepad++.exe官网下载
浏览:130
4星 · 用户满意度95%
官网进不去着实很烦,找的软件下载网站都是改过了的,上传供收藏使用。
Mars4_5.zip
浏览:74
5星 · 资源好评率100%
MIPS Assembler and Runtime Simulator(MIPS汇编程序和运行时模拟器)
QT自制精美Ui模板系列(一)桃子风格模板 - 二次开发专用
浏览:167
5星 · 资源好评率100%
本模板为美化QT界面系列中的一个,整体风格为桃子风格(效果预览链接:https://blog.csdn.net/hwc3737/article/details/108377607),搭配美化大部分常用控件,可直接使用。同时自带部分有用系统功能(最小化托盘运行),可在其基础上进行二次开发。需要基于QT Creator进行使用。
Postman9.12.2安装包
浏览:89
5星 · 资源好评率100%
Postman_win64-9.12.2安装包;是exe文件,直接下载安装即可。给自己也留个底,有需要的大家可以下载吧,做API测试相当有用
keygen_2032.rar
浏览:174
5星 · 资源好评率100%
KEIL 2032 KEIL 2032 KEIL 2032
python爬虫数据可视化分析大作业.zip
浏览:147
3星 · 编辑精心推荐
python爬虫,并将数据进行可视化分析,数据可视化包含饼图、柱状图、漏斗图、词云、另附源代码和报告书。
WinRAR 6.01 简体中文版_x64(无广告).exe
浏览:6
5星 · 资源好评率100%
WinRAR 6.01 简体中文版_x64(无广告) 双击即可安装
智能门锁 指纹锁 密码锁 蓝牙锁 门禁锁.rar
浏览:84
5星 · 资源好评率100%
CSDN博客链接:https://blog.csdn.net/mbs520/article/details/106987758 可通过指纹模块增删查改家庭成员的指纹信息,增删查改是否成功的相关信息显示在OLED屏幕上 2、在指纹匹配过程中,如果采集的指纹与指纹模块库相匹配,OLED显示匹配成功,并转动步进电机一圈 3、可通过按键设定智能门锁密码,密码可设置为两个(密码六位),如果匹配两个中的一个成
评论
收藏
内容反馈
立即下载
资源评论
资源反馈
评论星级较低,若资源使用遇到问题可联系上传者,3个工作日内问题未解决可申请退款~
联系上传者
评论
顾阑
粉丝: 14
资源:
2万+
私信
上传资源 快速赚钱
我的内容管理
展开
我的资源
快来上传第一个资源
我的收益
登录查看自己的收益
我的积分
登录查看自己的积分
我的C币
登录后查看C币余额
我的收藏
我的下载
下载帮助
前往需求广场,查看用户热搜
最新资源
SQL中row-number函数用法
耶鲁人脸数据库的数据集
电赛数据集-数字5,6,7,8识别
基于Vue的长沙理工大学Java大作业设计源码
matlab基于线性准则的考虑风力发电不确定性的分布鲁棒优化机组组合
基于C语言+stm32f4的modbus tcp上下位机通信项目+上位机由LabVIEW编写+源码+开发文档+视频教程(高分项目
基于Python的Struts2漏洞扫描器设计源码
HTML+CSS制作的个人博客网页.zip
基于htmlde 爱心代码,但HTML网页源码.zip
51单片机实现LED流水灯
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功