没有合适的资源?快使用搜索试试~
我知道了~
文库首页
后端
C#
基于出现概率的中文分词实验
基于出现概率的中文分词实验
中文分词
需积分: 11
6 下载量
92 浏览量
2017-11-18
21:15:04
上传
评论
收藏
13.19MB
ZIP
举报
温馨提示
立即下载
基于出现概率的分词实验,没有试验过在读取大量样本书籍后的效果,就是娱乐一下。
资源推荐
资源评论
基于最大匹配的中文分词概率算法研究 (2010年)
浏览:157
结合顺序表和跳跃表的快速查询特性,提出一种改进的整词分词词典结构,主要采用哈希法和二分法进行分词匹配,并针对机械分词算法的特点,引入随机数,探讨一种基于最大匹配的分词概率算法。实验表明,该算法具有较高的分词效率和准确率,对消去歧义词也有较好的性能。
基于MP最大概率的Ngram汉语切分(北邮计算机语言学基础)
浏览:151
4星 · 用户满意度95%
基于MP最大概率的Ngram汉语切分(北邮计算机语言学基础) 有简洁的说明文档和python源代码
基于字位置概率特征的条件随机场中文分词方法 (2008年)
浏览:73
将分词看成是一个对汉字进行分类的过程,然后利用条件随机场( CRFs)模型对每个汉字进行标记,最后转换为相应的分词结果。在现有 CRFs模型的基础上,从字的构词能力角度出发,探索了字位置概率特征,提出了基于字位置概率特征的条件随机场中文分词方法。实验表明,字位置概率特征的引入,使得结果 F1值 提高了3.5%,达到94.5%。
基于EM算法的汉语自动分词
浏览:72
5星 · 资源好评率100%
汉语自动分词是中文信息处理中的基础课题。本文首先对汉语分词的基本概念与应用,以及汉语分词 的基本方法进行了概述。接着引出一种根据词的出现概率、基于极大似然原则构建的汉语自动分词的零阶马尔可 夫模型,并重点剖析了EM(Expectation2Maximization) 算法,对实验结果进行了分析。最后对算法进行了总结与讨论。
基于EM算法的汉语自动分词方法
浏览:144
汉语自动分词是中文信息处理中的基础课题。本文首先对汉语分词的基本概念与应用,以及汉语分词的基本方法进行了概述。接着引出一种根据词的出现概率、基于极大似然原则构建的汉语自动分词的零阶马尔可夫模型,并重点剖析了EM算法,对实验结果进行了分析。最后对算法进行了总结与讨论。
Python 最大概率法进行汉语切分的方法
浏览:164
今天小编就为大家分享一篇Python 最大概率法进行汉语切分的方法,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
中文分词(实验一)
浏览:185
一种新的基于最大概率路径的中文分词.pdf
浏览:33
一种新的基于最大概率路径的中文分词.pdf
贝叶斯网络概率中文分词算法
浏览:119
5星 · 资源好评率100%
贝叶斯网络概率中文分词算法。贝叶斯网络能够利用简明的图形方式定性地表示事件之间复杂的因果关系或概率关系,在给定某些先验信息后,还可以定量地表示这些关系。
基于中文分词的文本校对
浏览:163
一种较新的文本自动校对方法 中文文本自动校对是自然语言处理领域中有着广阔应用前景的一个研究方向。依据中文分词的结果以及常见错误的特点,结合三元字模型的特点,提出了一种有效的文本校对方法,实验表明,该方法具有较高的准确率和召回率。
实验2-中文分词实验.zip
浏览:74
实验2-中文分词实验.zip
基于HMM的中文分词
浏览:48
/***************************/ 该资源中的代码为隐马尔科夫的demo案例,适用于已经了解HMM原理进行实践的读者。
Seg_CRF:CRF中文分词实验
浏览:181
Seg_CRF CRF中文分词实验 Windows x64 python 2.7.9 CRF++-0.58 评测采用 icwb2-data 中的评测脚本 ref:
BiLSTM-CRF中文分词实验
浏览:41
可以联系我,有配套报告文件。 requirements.txt已导出,环境配置简单。 用的是PKU和MSR的数据集。
基于VC++中文分词
浏览:95
4星 · 用户满意度95%
改程序完成了对中文分词的基本操作,提供了分词词典和基本的功能模块
基于逆向匹配的中文分词
浏览:111
基于逆向匹配的中文分词算法实现,产生词典和测试数据,分词后具有结果分析功能,计算精确度,召回率,F值
中文分词及词语出现的次数计算.zip
浏览:185
随便下载一篇中文的文本文档,通过这个程序可以将文档进行分词处理,还能够统计词语出现的次数
用stanfordCoreNLP进行中文分词时出现json编码错误(csdn)————程序.pdf
浏览:137
5星 · 资源好评率100%
用stanfordCoreNLP进行中文分词时出现json编码错误(csdn)————程序
基于隐马尔科夫的中文分词
浏览:80
基于隐马尔科夫的中文分词
基于java的中文分词系统
浏览:110
4星 · 用户满意度95%
基于java的中文分词系统,直接更改扩展名为jar即可。暂无源码提供
基于matlab对一篇诗歌出现字母的统计概率进行哈夫曼编码
浏览:182
实验目的: 对一篇诗歌出现字母的统计概率进行哈夫曼编码 实验要求: - 对一篇诗歌出现字母的统计概率进行哈夫曼编码 - 未知概率进行等长编码 - 求两种方法的平均码长 【实验环境】 操作系统:Windows 10 【实验过程】 一、实验步骤: - 将诗歌保存到文件 - 读取文件内容 - 统计诗歌出现的各个字母的概率 - 根据概率进行哈夫曼编码,得到平均码长
基于遗传算法的中文分词的论文
浏览:69
4星 · 用户满意度95%
基于遗传算法的中文分词论文,供大家参考。
基于结巴分词词库的中文分词_matlab_结巴分词_
浏览:32
5星 · 资源好评率100%
基于结巴分词词库的中文分词,机械分词,matlab语言
ILSpy 安装包和压缩包
浏览:135
3星 · 编辑精心推荐
这是一份包含ILSpy 7.1的【ILSpy.AddIn.vsix(用户安装在Visual Studio 2019扩展工具)】和独立的【ILSpy_binaries_7.1.0.6543.zip】压缩包
DevExpress22.X完美Patch资源
浏览:97
5星 · 资源好评率100%
参考笔者文章“使用DevExpress22.X(Patch)控件库在VisualStudio2022使用C#进行Winform、WPF应用的开发,看这一篇就够了!”,手把手一键完成部署,链接:https://blog.csdn.net/qq_23958061/article/details/130129612 ———————————————————————————————————— 鉴于csdn版
基于C#与Sql Server的智慧星学生选课管理系统.rar
浏览:113
3星 · 编辑精心推荐
基于C#与Sql Server的智慧星学生选课管理系统.rar
CefFlashBrowser - Flash浏览器
浏览:175
默认支持Flash的简易浏览器 GitHub: https://github.com/Mzying2001/CefFlashBrowser
用c# 自己封装的Modbus工具类库源码
浏览:124
Modbus通讯协议在工控行业的应用是很多的,并且也是上位机开发的基本技能之一。相关的类库也很多也很好用。以前只负责用,对其并没有深入学习和了解。前段时间有点空就在这块挖了挖。想做到知其然还要知其所以然。所以就有了自己封装的Modbus工具类库的想法。一来是练练手,二来是自己封装的用的更顺手。 Modbus通讯协议我在工作中目前只用到了两种一个是串口通讯ModbusRTU,还有一
vscode 1.77 安装包
浏览:84
vscode 1.77 安装包
评论
收藏
内容反馈
立即下载
资源评论
资源反馈
评论星级较低,若资源使用遇到问题可联系上传者,3个工作日内问题未解决可申请退款~
联系上传者
评论
@CAPRICA@
粉丝: 89
资源:
10
私信
上传资源 快速赚钱
我的内容管理
展开
我的资源
快来上传第一个资源
我的收益
登录查看自己的收益
我的积分
登录查看自己的积分
我的C币
登录后查看C币余额
我的收藏
我的下载
下载帮助
前往需求广场,查看用户热搜
最新资源
菜单栏实现增加数据,修改数据,查询数据,删除数据
全国省市区三级联动json文件,带code
C8_全局&局部&static.zip
Unity和安卓交互插件Unity调Android Native Goodies PRO
基于PHP的校园二手信息网站的设计与开发(源代码).tar
labview.doc
基于HOG和SVM的人脸口罩识别算法
oracle 19c jdbc驱动包 ,含ojdbc8.jar、ojdbc8.jar
ADS8865IDGSR 产品规格书pdf
CentOS-7.5-x86-64
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功