字符串:冮 频数:1 权重:0
字符串:劼人 频数:1 权重:0
字符串:勍 频数:1 权重:0
字符串:喆 频数:3 权重:0
字符串:揳入 频数:1 权重:0
字符串:、 频数:23116 权重:0
字符串:。 频数:35983 权重:0
字符串:· 频数:25 权重:0
字符串:— 频数:306 权重:0
字符串:—— 频数:157 权重:0
字符串:——— 频数:479 权重:0
字符串:——- 频数:8 权重:0
字符串:—0.3 频数:1 权重:0
字符串:—0.4% 频数:1 权重:0
字符串:—0.8% 频数:1 权重:0
字符串:—1·2% 频数:1 权重:0
字符串:…… 频数:348 权重:0
字符串:‘ 频数:128 权重:0
字符串:’ 频数:205 权重:0
字符串:“ 频数:7970 权重:0
字符串:” 频数:7943 权重:0
字符串:〈 频数:5 权重:0
字符串:〈民音〉 频数:1 权重:0
字符串:〉 频数:5 权重:0
字符串:《 频数:1940 权重:0
字符串:》 频数:1940 权重:0
字符串:『 频数:698 权重:0
字符串:』 频数:698 权重:0
字符串:± 频数:3 权重:0
字符串:±% 频数:3 权重:0
字符串:× 频数:7 权重:0
字符串:×× 频数:2 权重:0
字符串:∶ 频数:1 权重:0
字符串:° 频数:2 权重:0
字符串:℃ 频数:10 权重:0
字符串:‰ 频数:1 权重:0
字符串:○ 频数:1 权重:0
字符串:● 频数:77 权重:0
字符串:△ 频数:14 权重:0
字符串:▲ 频数:12 权重:0
字符串:⑵ 频数:6 权重:0
字符串:① 频数:4 权重:0
字符串:② 频数:4 权重:0
字符串:③ 频数:4 权重:0
字符串:④ 频数:2 权重:0
字符串:⑤ 频数:2 权重:0
字符串:⑥ 频数:2 权重:0
字符串:⑦ 频数:1 权重:0
字符串:Ⅱ 频数:5 权重:0
字符串:Ⅲ 频数:1 权重:0
字符串:! 频数:665 权重:0
字符串:% 频数:24 权重:0
字符串:( 频数:4316 权重:0
字符串:(长)江 频数:1 权重:0
字符串:(凡音)生 频数:1 权重:0
字符串:(黄)河 频数:1 权重:0
字符串:(申音) 频数:1 权重:0
字符串:) 频数:4316 权重:0
字符串:* 频数:29 权重:0
字符串:+ 频数:2 权重:0
字符串:, 频数:74921 权重:0
字符串:- 频数:4 权重:0
字符串:-0·3 频数:1 权重:0
字符串:-0·56 频数:1 权重:0
字符串:-0·90 频数:1 权重:0
字符串:-0.1 频数:6 权重:0
字符串:-0.2 频数:7 权重:0
字符串:-0.3 频数:4 权重:0
字符串:-0.4 频数:11 权重:0
字符串:-0.5 频数:6 权重:0
字符串:-0.6 频数:7 权重:0
字符串:-0.7 频数:5 权重:0
字符串:-0.8 频数:3 权重:0
字符串:-0.9 频数:3 权重:0
字符串:-1.0 频数:3 权重:0
字符串:-1.1 频数:3 权重:0
字符串:-1.2 频数:4 权重:0
字符串:-1.3 频数:2 权重:0
字符串:-1.4 频数:1 权重:0
字符串:-1.5 频数:1 权重:0
字符串:-1.6 频数:3 权重:0
字符串:-1.7 频数:1 权重:0
字符串:-1.8 频数:2 权重:0
字符串:-1.9 频数:2 权重:0
字符串:-2.1 频数:2 权重:0
字符串:-2.2 频数:2 权重:0
字符串:-2.4 频数:2 权重:0
字符串:-2.5 频数:1 权重:0
字符串:-2.7 频数:1 权重:0
字符串:-3·1 频数:1 权重:0
字符串:-3.0 频数:1 权重:0
字符串:-3.1 频数:1 权重:0
字符串:-3.3 频数:1 权重:0
字符串:-3.4 频数:1 权重:0
字符串:-3.5 频数:1 权重:0
字符串:-3.8 频数:1 权重:0
字符串:-4.2 频数:1 权重:0
字符串:-5.3 频数:1 权重:0
字符串:. 频数:2 权重:0
字符串:/ 频数:27 权重:0
字符串:0 频数:5 权重:0
字符串:0·0 频数:2 权重:0
字符串:0·02 频数:1 权重:0
字符串:0·1% 频数:1 权重:0
字符串:0·38 频数:1 权重:0
字符串:0·4% 频数:1 权重:0
字符串:0·5 频数:1 权重:0
字符串:0·64% 频数:1 权重:0
字符串:0·67 频数:1 权重:0
字符串:0·74 频数:2 权重:0
字符串:0·9 频数:1 权重:0
字符串:0∶0 频数:1 权重:0
字符串:0∶2 频数:1 权重:0
字符串:0∶3 频数:6 权重:0
字符串:0∶6 频数:1 权重:0
字符串:0.0 频数:3 权重:0
字符串:0.001% 频数:1 权重:0
字符串:0.01% 频数:1 权重:0
字符串:0.013 频数:1 权重:0
字符串:0.04 频数:1 权重:0
字符串:0.06 频数:1 权重:0
字符串:0.1 频数:9 权重:0
字符串:0.12 频数:2 权重:0
字符串:0.13% 频数:1 权重:0
字符串:0.16% 频数:1 权重:0
字符串:0.2 频数:6 权重:0
字符串:0.23 频数:2 权重:0
字符串:0.24 频数:1 权重:0
字符串:0.25 频数:1 权重:0
字符串:0.25% 频数:1 权重:0
字符串:0.26 频数:1 权重:0
字符串:0.28 频数:1 权重:0
字符串:0.29 频数:1 权重:0
字符串:0.3 频数:8 权重:0
字符串:0.3% 频数:1 权重:0
字符串:0.33 频数:1 权重:0
字符串:0.35 频数:1 权重:0
字符串:0.37 频数:1 权重:0
字符串:0.4 频数:4 权重:0
字符串:0.4% 频数:2 权重:0
字符串:0.42 频数:1 权重:0
字符串:0.43% 频数:1 权重:0
字符串:0.45 频数:1 权重:0
字符串:0.5 频数:14 权重:0
字符串:0.5% 频数:3 权重:0
字符串:0.51 频数:1 权重:0
字符串:0.53 频数:1 权重:0
字符串:0.55 频数:1 权重:0
字符串:0.56 频数:1 权重:0
字符串:0.58 频数:1 权重:0
字符串:0.5亿 频数:1 权重:0
字符串:0.6 频数:5 权重:0
字符串:0.6% 频数:4 权重:0
字符串:0.60 频数:1 权重:0
字符串:0.61 频数:1 权重:0
字符串:0.625亿 频数:1 权重:0
字符串:0.65 频数:2 权重:0
字符串:0.68 频数:1 权重:0
字符串:0.7 频数:12 权重:0
字符串:0.7% 频数:2 权重:0
字符串:0.72 频数:1 权重:0
字符串:0.74 频数:2 权重:0
字符串:0.74% 频数:1 权重:0
字符串:0.75 频数:2 权重:0
字符串:0.768 频数:1 权重:0
字符串:0.8 频数:18 权重:0
字符串:0.8% 频数:3 权重:0
字符串:0.80 频数:1 权重:0
字符串:0.82 频数:1 权重:0
字符串:0.82% 频数:1 权重:0
字符串:0.83 频数:1 权重:0
字符串:0.9 频数:6 权重:0
字符串:0.9% 频数:3 权重:0
字符串:0.90 频数:1 权重:0
字符串:0.94% 频数:1 权重:0
字符串:007 频数:14 权重:0
字符串:01 频数:2 权重:0
字符串:010 频数:2 权重:0
字符串:027 频数:1 权重:0
字符串:05分 频数:1 权重:0
字符串:06 频数:1 权重:0
字符串:07 频数:1 权重:0
字符串:0717 频数:1 权重:0
字符串:08 频数:1 权重:0
字符串:1 频数:599 权重:0
字符串:1· 频数:8 权重:0
字符串:1·02 频数:1 权重:0
字符串:1·05 频数:1 权重:0
字符串:1·062亿 频数:1 权重:0
字符串:1·1% 频数:2 权重:0
字符串:1·14 频数:1 权重:0
字符串:1·166亿 频数:1 权重:0
字符串:1·1万 频数:1 权重:0
字符串:1·1亿 频数:1 权重:0
字符串:1·2 频数:2 权重:0
字符串:1·25% 频数:1 权重:0
字符串:1·2万 频数:2 权重:0
字符串:1·3 频数:1 权重:0
字符串:1·35% 频数:1 权重:0
字符串:1·3万 频数:3 权重:0
字符串:1·4万 频数:4 权重:0
字符串:1·4亿 频数:1 权重:0
字符串:1·5 频数:3 权重:0
字符串:1·5% 频数:1 权重:0
字符串:1·5万 频数:3 权重:0
字符串:1·67 频数:1 权重:0
字符串:1·6万 频数:1 权重:0
字符串:1·6亿 频数:3 权重:0
字符串:1·76亿 频数:1 权重:0
字符串:1·78亿 频数:1 权重:0
字符串:1·8 频数:1 权重:0
字符串:1·8% 频数:1 权重:0
字符串:1·8万 频数:1 权重:0
字符串:1·8亿 频数:1 权重:0
字符串:1·9% 频数:2 权重:0
字符串:1·91 频数:1 权重:0
字符串:1∶0 频数:1 权重:0
字符串:1∶1 频数:2 权重:0
字符串:1∶11 频数:1 权重:0
字符串:1∶2 频数:3 权重:0
字符串:1∶2.4 频数:1 权重:0
字符串:1∶2.75 频数:1 权重:0
字符串:1∶3 频数:3 权重:0
字符串:1∶3.46 频数:1 权重:0
字符串:1∶5.9 频数:1 权重:0
字符串:1∶6000 频数:1 权重:0
字符串:1∶8 频数:1 权重:0
字符串:1‰ 频数:1 权重:0
字符串:1% 频数:12 权重:0
字符串:1. 频数:6 权重:0
字符串:1.0 频数:4 权重:0
字符串:1.02 频数:1 权重:0
字符串:1.07% 频数:1 权重:0
字符串:1.08% 频数:1 权重:0
字符串:1.09 频数:1 权重:0
字符串:1.1 频数:6 权重:0
字符串:1.1% 频数:1 权重:0
字符串:1.10 频数:1 权重:0
字符串:1.14 频数:1 权重:0
字符串:1.14亿 频数:1 权重:0
字符串:1.17万 频数:1 权重:0
字符串:1.1万 频数:8 权重:0
字符串:1.1亿 频数:1 权重:0
字符串:1.2 频数:4 权重:0
字符串:1.23亿 频数:1 权重:0
字符串:1.24 频数:1 权重:0
字符串:1.25亿 频数:1 权重:0
字符串:1.26亿 频数:1 权重:0
字符串:1.28 频数:1 权重:0
字符串:1.29 频数:2 权重:0
字符串:1.2万 频数:9 权重:0
字符串:1.2亿 频数:7 权重:0
字符串:1.3 频数:6 权重:0
字符串:1.3% 频数:2 权重:0
字符串:1.30 频数:1 权重:0
字符串:1.30亿 频数:1 权重:0
字符串:1.31万 频数:1 权重:0
字符串:1.37% 频数:1 权重:0
字符串:1.39 频数:1 权重:0
字符串:1.3万 频数:4 权重:0
字符串:1.3亿 频数:2 权重:0
字符串:1.4 频数:5 权重:0
字符串:1.4% 频数:2 权重:0
字符串:1.47 频数:1 权重:0
字符串:1.495亿 频数:1 权重:0
字符串:1.4万 频数:4 权重:0
字符串:1.4亿 频数:3 权重:0
字符串:1.5 频数:11 权重:0
字符串:1.55亿 频数:2 权重:0
字符串:1.5万 频数:15 权重:0
字符串:1.5亿 频数:5 权重:0
字符串:1.6 频数:7 权重:0
字符串:1.6% 频数:4 权重:0
字符串:1.65万 频数:1 权重:0
字符串:1.66 频数:2 权重:0
字符串:1.
没有合适的资源?快使用搜索试试~ 我知道了~
温馨提示
感知器分词软件是基于机器学习的自然语言处理技术,主要应用于中文文本处理。在这个VC++实现的项目中,开发者运用了感知器算法来解决中文分词问题,这是计算机科学领域的一个经典应用,特别是在信息检索、文本分析和自然语言理解中。 感知器是一种简单但强大的监督学习模型,它在二分类问题上表现尤为出色。在这个分词软件中,感知器被用来学习如何将连续的汉字序列分割成有意义的词汇。通过训练数据集,感知器可以学习每个字符边界是否应该作为词的分隔点。在训练过程中,算法会不断更新权重,以最小化预测边界与实际边界的差异。 Viterbi算法,通常用于隐马尔可夫模型(HMM)中,被引入到这个项目中是为了实现全局最优的分词决策。Viterbi算法能够找到最有可能的词序列,考虑到每个词出现的概率以及前后词的关系。在中文分词中,这种方法能提高分词的准确性,尤其是在处理歧义词或复杂句子结构时。 在VC++环境下,该项目采用纯C语言编写,这展示了C语言在现代计算任务中的灵活性和效率。尽管C++提供了更多的高级特性,如面向对象编程,但选择C语言可能是因为其对内存管理的直接控制,这有助于优化性能,尤其是在处理大量文本数据时。 项目包含的"Debug"文件夹很可能包含了编译后的可执行文件、调试信息和其他支持文件。这些文件对于运行和分析程序的行为至关重要,尤其是对于开发者调试和优化代码的过程。 在实际应用中,这样的感知器分词软件可以用于各种场景,例如搜索引擎的索引构建、社交媒体分析、智能客服系统的对话理解等。通过不断地迭代和优化,该软件的准确性和效率都能得到提升,更好地服务于实际需求。同时,这个项目也为学习和理解机器学习、自然语言处理以及C语言编程提供了宝贵的实践素材。
资源推荐
资源详情
资源评论
收起资源包目录
Debug.rar (21个子文件)
Debug
测试.txt 4KB
感知器分词软件.exe 176KB
错误.txt 73B
vc60.pdb 60KB
感知器分词软件.pdb 481KB
感知器分词软件.opt 43KB
vc60.idb 57KB
感知器分词软件.bsc 121KB
Dict_Binary.txt 929KB
感知器分词软件.pch 227KB
perceptron.sbr 0B
Dictionary.obj 13KB
感知器分词软件.ilk 215KB
Training.sbr 0B
Dictionary.sbr 0B
Training.obj 4KB
Sentence.sbr 0B
特征词典.txt 1.44MB
Sentence.obj 14KB
切分结果.txt 6KB
perceptron.obj 8KB
共 21 条
- 1
资源评论
- _Dayeh2014-03-05??难道没有源码!!!!!
- Ms_Galaxy2015-12-27好像没有源码???
- 小白的编程日志2013-03-26一直想学一下这文件的知识 。谢谢楼主提供这么好的例子。
wwc775119626
- 粉丝: 0
- 资源: 4
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- json的合法基色来自红包东i请各位
- 项目采用YOLO V4算法模型进行目标检测,使用Deep SORT目标跟踪算法 .zip
- 针对实时视频流和静态图像实现的对象检测和跟踪算法 .zip
- 部署 yolox 算法使用 deepstream.zip
- 基于webmagic、springboot和mybatis的MagicToe Java爬虫设计源码
- 通过实时流协议 (RTSP) 使用 Yolo、OpenCV 和 Python 进行深度学习的对象检测.zip
- 基于Python和HTML的tb商品列表查询分析设计源码
- 基于国民技术RT-THREAD的MULTInstrument多功能电子测量仪器设计源码
- 基于Java技术的网络报修平台后端设计源码
- 基于Python的美食杰中华菜系数据挖掘与分析设计源码
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功