下载  >  课程资源  >  Java  > 数据挖掘语料库

数据挖掘语料库 评分:

这是为学习数据挖掘的朋友们做的一个语料库,用此语料库作为训练集训练数据,对数据进行预处理等,帮助大家更好的学习数据挖掘!本语料库所有文档均下载自新浪网站!

...展开详情
2013-12-27 上传 大小:17.31MB
举报 收藏 (3)
分享

评论 下载该资源后可以进行评论 共5条

hideaway6 不错。挺好的,谢谢分享!
2015-08-03
回复
u013768044 哟这资源不错,采集自新浪新闻,可以用来训练模型进行主题分类
2015-04-02
回复
u011226214 还可以,能用
2014-08-23
回复
zhangpinghao 还可以,可以用
2014-03-26
回复
yeyefengiswo 还可以,说明出处就好了
2014-01-14
回复
数据挖掘语料库

这是为学习数据挖掘的朋友们做的一个语料库,用此语料库作为训练集训练数据,对数据进行预处理等,帮助大家更好的学习数据挖掘!本语料库所有文档均下载自新浪网站!

立即下载
数据挖掘文本分类语料库

包含多种类别,如政治、经济、体育、计算机、教育等等

立即下载
基于数据和语料库的复述综述

对复述(paraphrasing)问题的一个综述性总结,介绍复述是什么以及应用,主要介绍了基于语料库的复述抽取和生成方法。

立即下载
自行整理的英中翻译对齐数据集语料

可以用于深度学习机器翻译模型训练,英中数据集,英文中文对齐语料

立即下载
中文新闻数据语料

这是本人自己爬取的今日头条新闻数据。包括了6个类别:军事,体育,娱乐,时尚,汽车,游戏。每个类别有2000左右的数据。包含有新闻的题目,正文。还有一些类别中包含了新闻的发布时间,新闻来源等信息。

立即下载
中文语料数据

中文语料数据

立即下载
谭松波情感挖掘酒店评论语料

谭松波整理的中文酒店评论语料。数据规模有10000篇,每条评论已经标注好情感方向。适合当作中文情感分析的语料库。

立即下载
中文情感挖掘的酒店评论语料

1.ChnSentiCorp-Htl-ba-2000: 平衡语料,正负类各1000篇。 2.ChnSentiCorp-Htl-ba-4000: 平衡语料,正负类各2000篇。 3.ChnSentiCorp-Htl-ba-6000: 平衡语料,正负类各3000篇。 4.ChnSentiCorp-Htl-unba-10000: 非平衡语料,正类为7000篇。

立即下载
libsvm分类训练和测试数据语料

用于libsvm分类的语料,包含训练数据和测试数据,格式为libsvm要求的格式,可用于libsvm工具的练习

立即下载
中文语料数据5

数据部分5

立即下载
中文语料数据3

数据部分3

立即下载
文本分类微博性别分类数据语料库

文本分类微博性别分类数据语料库

立即下载
中文语料库中文语料库中文语料库

中文语料库中文语料库中文语料库中文语料库中文语料库中文语料库

立即下载
coae2014测评语料数据

语料规模大,包括新闻文本、微博等各种语料。部分情感文本采用手工标注。只需下载压缩包并解压后即可使用。

立即下载
facebook 评论数据 语料 google play 爬虫抓取

爬虫抓取2016.3-2016.4 google play上facebook的英文评论(有少部分西语没有处理)共计10W条

立即下载
中文情感分析 语料数据

数据分析

立即下载
中文语料数据 20w

文本分类实验20w数据,测试集训练集,10类,每类1w,上传量有限,全部数据可以联系我

立即下载
python数据挖掘学习代码.rar

本文档为python数据挖掘学习代码,代码为:Robert Layton (作者) 杜春晓 (译者) 所编写的《Python数据挖掘入门与实践 》一书全部代码,代码可以自己学习,也可以跟随书籍学习,相对比较入门。主要项目为:(代码顺序依次为下面序号+1) 1、用scikit-learn估计器分类 2、用决策树预测获胜球队 3、用亲和性分析方法推荐电影 4、用转换器抽取特征 5、使用朴素贝叶斯进行社会媒体挖掘 6、用图挖掘找到感兴趣的人 7、用神经网络破解验证码 8、作者归属问题 9、新闻语料分类 10、用深度学习方法为图像中的物体进行分类 11、大数据处理

立即下载
英语语料库LOB语料库

LOB语料库 创建时间: 1970年代初 创建单位:英国Lancaster大学和挪威Oslo大学以及Bergen大学 规模层级: 100万词次 基本情况:研究当代英国英语,与美国英语对比,使用了TAGIT系统,以统计方式建立换算几率矩阵,提高标注正确率。 The Lancaster-Oslo Bergen Corpus (LOB) was compiled by researchers in Lancaster, Oslo and Bergen. It consists of one million words of British En glish texts from 1961. The

立即下载