没有合适的资源?快使用搜索试试~
我知道了~
文库首页
开发技术
其它
搜狗实验室词典
搜狗实验室词典
中文分词
UTF-8
需积分: 17
8 下载量
90 浏览量
2014-03-07
00:58:31
上传
评论
收藏
2.82MB
DIC
举报
温馨提示
立即下载
词库比较全,可以用于基于机械分词的小型中文分词系统
资源推荐
资源评论
搜狗实验室文本分类语料库
浏览:54
5星 · 资源好评率100%
文本分类语料库来源于Sohu新闻网站保存的大量经过编辑手工整理与分类的新闻语料与对应的分类信息。其分类体系包括几十个分类节点,网页规模约为十万篇文档。 语料库统计的意义:提供一个较大规模的标准中文文本分类测试平台。 应用案例:中文文本分类,主题跟踪与检测等。
搜狗实验室文本(整理版)
浏览:100
4星 · 用户满意度95%
搜狗实验室1个月数据,我已经整理过,做好了分类,并且去除了无用数据
搜狗互联网词库
浏览:100
搜狗词库,也可直接在搜狗实验室直接下载,统计出的词条数约为15万条高频词,除标出这部分词条的词频信息之外,还标出了常用的词性信息。
搜狗输入法-所有细胞词库-txt-不含词频-截止20200520
浏览:82
搜狗输入法官网上的所有细胞词典,截止到2020年5月20号,并且转换为txt形式。有需要的同学自取。共11104个。 搜狗输入法官方词库地址:https://pinyin.sogou.com/dict/cate/index/1
搜狗实验室 文本分类语料库
浏览:55
5星 · 资源好评率100%
搜狗实验室 文本分类语料库。可用于进行文本开发等相应实验练习
搜狗实验室文本分类语料
浏览:26
3星 · 编辑精心推荐
搜狗实验室用于文本分类的语料库,包含财经、互联网、健康、教育、军事、旅游、体育、文化、招聘9个类别文本数据,每个类别包含1990篇文本。
搜狗实验室(用户查询日志)
浏览:151
4星 · 用户满意度95%
搜狗实验室(用户查询日志)SogouQ.reduced,用于做大数据分析的数据
搜狗实验室新闻分类语料库
浏览:77
搜狗实验室新闻分类语料库,主要有10个分类,共50多万条记录 0 汽车 1 财经 2 IT 3 健康 4 体育 5 旅游 6 教育 7 招聘 8 文化 9 军事
搜狗实验室新闻数据 文本分类
浏览:30
搜狗实验室新闻数据 文本分类
机器学习中搜狗实验室发布的搜狗新闻数据集
浏览:109
机器学习中搜狗实验室发布的搜狗新闻数据集
搜狗实验室新闻数据整理.zip
浏览:154
其中包含的val(已整理的搜狗实验室新闻文本数据)、stopwords数据来源于网课资源,能够帮助新手尽快完成一次新闻文本分类的实战项目
搜狗实验室技术交流文档 解决socket tcp C10K问题.zip
浏览:41
搜狗实验室技术交流文档 解决C10K问题.zip
整理后的搜狗实验室全网新闻数据样例(word2vec用)
浏览:186
用来测试word2vec的数据样本,从搜狗实验室全网新闻数据库http://www.sogou.com/labs/resource/list_news.php 下载并提取出新闻内容的数据。
sogou 词典 搜狗最新词典
浏览:34
4星 · 用户满意度95%
sogou 词典 搜狗最新词典,对于做分词程序作用。。
AI-翻译和搜索:划词AI翻译+搜索。AI翻译按质量排序。调用:金山词霸,阿里翻译,百度翻译,搜狗翻译,腾讯翻译,彩云小译,DeepL,沪江日语词典等。搜索包含:知乎,b站,百科,youtube,twitter等。去掉了原作者提供的大量不常用词典
浏览:131
AI翻译和搜索 划词AI翻译+搜索: AI翻译按质量和热度综合排名。调用:金山翻译,阿里翻译,百度翻译,搜狗翻译,腾讯翻译,彩云小译,DeepL,沪江日语词典等。 搜索包含:知乎,b站,微博,百科,wiki,youtube,twitter等。 设置:展开后,单击“设置”可以调整排序和是否显示。 预览图 选择一段文本后: 展开后: 安装 github地址: 脚本安装地址: Chrome类浏
Mining-Frequent-Pattern-from-Search-History:《大数据挖掘技术》@复旦 课程项目,试图从搜狗实验室用户查询日志数据(2008)中找出搜索记录中有较高支持度关键词的频繁二项集。在实现层面上,我搭建了一个由五台服务器组成的微型 Hadoop 集群,并且用 Python 实现了 Parallel FP-Growth 算法中的三个 MapReduce 过程
浏览:146
搜索记录频繁模式挖掘 这是一个《大数据挖掘技术》@复旦课程项目,试图从搜狗实验室用户查询日志数据(2008)中找出搜索记录中有较高支持度关键词的频繁二项集。在实现层面上,我搭建了一个由五台服务器组成的微型 Hadoop 集群,并且用 Python 实现了 Parallel FP-Growth 算法中的三个 MapReduce 过程。 一、Demo 1.1 快速开始 请确保 Python 以及 ji
搜狗词典转txt
浏览:10
py3脚本-py3脚本-py3脚本-py3脚本-py3脚本-py3脚本-py3脚本-py3脚本-
sougou-corpus-lda:有感于自己学习LDA的时候没有一个完整的从语料到分类结果的例子,决定开一小项目来实现,原始的数据是搜狗实验室提供的新闻语料
浏览:181
sougou-corpus-lda 有感于自己学习LDA的时候没有一个完整的从语料到分类结果的例子,决定开一小项目来实现,原始的数据是搜狗实验室提供的新闻语料
搜狗标准词库词典,txt格式,不含词频
浏览:124
搜狗标准词库词典,txt格式,不含词频
搜狗实验室技术交流文档C10K问题
浏览:115
网络服务在处理数以万计的客户端连接时,往往出现效率低下甚至完全瘫痪,这被 称为C10K 问题。
搜狗新闻分类语料
浏览:113
整理自搜狗实验室中的新闻分类。含有金融、体育、军事等11个分类集。
搜狗中文文本分析语料库
浏览:109
5星 · 资源好评率100%
搜狗实验室新闻数据精简版,将xml文本进行处理后分类如下: 奥运 5595个txt 房产 14695 个txt 互联网 2200个txt 健康 1153个txt 教育 2075个txt 旅游 1802个txt 汽车 1405个txt 商业 12465个txt 时尚 3490 个txt ...
浏览器 搜狗浏览器 搜狗浏览器 搜狗
浏览:12
浏览器 搜狗浏览器 搜狗浏览器 搜狗浏览器 搜狗浏览器 搜狗
hadoop.ziphadoop实现的搜狗实验用java实现的
浏览:107
hadoop实现的搜狗实验用java实现的
Qt 5实现串口调试助手 (源工程文件、0积分下载)
浏览:45
5星 · 资源好评率100%
基于Qt 5实现串口调试助手,程序仅供参考,修改了之前十六进制接收0xA0--0xFF有误的问题,新增了窗口自适应(ui文件设置栅格),文件详情可看博客链接https://blog.csdn.net/m0_51294753/article/details/121405661。
【SystemVerilog】路科验证V2学习笔记(全600页).pdf
浏览:13
5星 · 资源好评率100%
SystemVerilog的听课学习笔记,包括讲义截取、知识点记录、注意事项等细节的标注。 目录如下: 第一章 SV环境构建常识 1 1.1 数据类型 1 四、二值逻辑 4 定宽数组 9 foreach 13 动态数组 16 队列 19 关联数组 21 枚举类型 23 字符串 25 1.2 过程块和方法 27 initial和always 30 func
AutoSAR标准协议4.2.2
浏览:90
5星 · 资源好评率100%
AutoSAR标准协议规范4.2.2,里面包含了AutoSAR组织所规定的AutoSAR架构的标准规范协议原文档。对AutoSAR的学习有一定的借鉴意义
光伏-储能并网系统仿真.rar
浏览:85
5星 · 资源好评率100%
该文件是清华大学储能课的期末大作业。用SIMULINK搭建了一个完整的光伏-储能并网系统。我的博客中介绍了系统实现的具体方法,欢迎查看!
NPPJSONViewer.zip
浏览:127
4星 · 用户满意度95%
NodePad++ JSON格式化插件
评论
收藏
内容反馈
立即下载
资源评论
资源反馈
评论星级较低,若资源使用遇到问题可联系上传者,3个工作日内问题未解决可申请退款~
联系上传者
评论
camelycy
粉丝: 0
资源:
1
私信
上传资源 快速赚钱
我的内容管理
展开
我的资源
快来上传第一个资源
我的收益
登录查看自己的收益
我的积分
登录查看自己的积分
我的C币
登录后查看C币余额
我的收藏
我的下载
下载帮助
前往需求广场,查看用户热搜
最新资源
2023NOC创客智慧编程赛项真题图形化-选拔赛(有解析)
1714297745580.jpg
ol-点击显示实时交通(day05)
c++大纲资料.txt
mysql大纲资料.txt
【资料】欧盟电池法.zip
onenet_chongwukanhu_v06.apk
2022NOC软件创意编程赛项真题C++初中-决赛(有解析)
2022NOC软件创意编程赛项真题python初中-决赛(有解析)
openLayer-本地数据加载 (day5)
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功