HAWQ数据仓库与数据挖掘实战
电子书推荐
-
《RapidMiner数据分析与挖掘实战(中文版)》第1章 数据挖掘基础Word版 评分:
基础篇 第1章 数据挖掘基础 1.1 某知名连锁餐饮企业的困惑 国内某餐饮连锁有限公司(以下简称T餐饮)成立于1998年,主要经营粤菜,兼顾湘菜、川菜、中餐等综合菜系。至今已经发展成为在国内具有一定知名度、美誉度,多品牌、立体化的大型餐饮连锁企业。属下员工1000多人,拥有16家直营分店,经营总面积近13000平方米,年营业额近亿元。其旗下各分店均坐落在繁华市区主干道,雅致的装潢,配之以精致的饰品、灯具、器物,出品精美,服务规范。
上传时间:2018-06 大小:149KB
- 1.39MB
《RapidMiner数据分析与挖掘实战》第11章 决策树与神经网络
2018-06-30决策树方法在分类、预测、规则提取等领域有着广泛应用。在20世纪70年代后期和80年代初期,机器学习研究者J.Ross Quinilan提出了ID3[5-2]算法以后,决策树在机器学习、数据挖掘邻域得到极大的发展。Quinilan后来又提出了C4.5,成为新的监督学习算法。1984年几位统计学家提出了CART分类算法。ID3和ART算法大约同时被提出,但都是采用类似的方法从训练样本中学习决策树。
- 52.39MB
rapidminer 5.3.015源代码
2016-11-23rapidminer5.3.015是开源的,这是它的源代码,大家可以下载它,并且运行它,正确运行的网址: http://blog.csdn.net/wodedipang_/article/details/53310811 大家可以参考这个网站
- 6.63MB
rapidminer二次开发
2018-09-05rapidminer二次开发入门教程PPTrapidminer二次开发入门教程
- 6.45MB
Rapidminer中文手册
2018-05-12RapidMiner中文手册,对于初学RapidMiner者有很好的帮助
- 1.22MB
数据挖掘工具Rapidminer基础介绍
2018-05-15数据挖掘工具rapidminer的基础知识介绍,应用实例,以及数据分析内容。
- 9.56MB
rapidminer使用手册 [RapidMiner数据分析与挖掘实战] 全17章
2022-04-26第1章 RAPIDMINER STUDIO简介 第2章 设计分析流程 第3章 数据和结果可视化 第4章 数据管理:资源库 第5章 数据探索 第6章 数据预处理 第7章 关联分析与关联规则 第8章 K-MEANS 聚类、辨别分析 第9章 线性回归与逻辑...
- 19.84MB
RapidMiner数据分析与挖掘实战
2017-09-19关于RapidMiner实战的一个教程,有关于算子的用法,已经多种数据挖掘算法的分析,介绍,详解,以及相关的rapidMiner实战,非常实用
- 67.12MB
RapidMiner数据分析与挖掘实战——中文
2018-05-24学习RapidMiner挺不错的中文资料,很详细。 学习RapidMiner挺不错的中文资料,很详细。
- 301KB
《RapidMiner数据分析与挖掘实战》第12章 文本挖掘
2018-06-30我们将建立一个RapidMiner挖掘流程,来学习垃圾短信和我们实际想阅读的短信之间的区别。然后我们将应用此学习到的模型到新的短信中,来确定其是否为垃圾短信。垃圾短信是许多熟悉主题中的一种,自然地,我们由此就...
- 361KB
《RapidMiner数据分析与挖掘实战》第9章 K-Means 聚类、辨别分析
2018-06-30与分类不同,聚类分析是在没有给定划分类别的情况下,根据数据相似度进行样本分组的一种方法。与分类模型需要使用有类标记样本构成的训练数据不同,聚类模型可以建立在无类标记的数据上,是一种非监督的学习算法。...
- 760KB
快速数据挖掘数据分析实战RapidMiner工具应用第11章 决策树与神经网络V1.1.pdf
2021-08-0711.1 理解决策树 决策树方法在分类、预测、规则提取等领域有着广泛应用。在20世纪70年代后期和80年代初期,机器学习研究者J.Ross Quinilan提出了ID3[5-2]算法以后,决策树在机器学习、数据挖掘邻域得到极大的发展。Quinilan后来又提出了C4.5,成为新的监督学习算法。1984年几位统计学家提出了CART分类算法。ID3和ART算法大约同时被提出,但都是采用类似的方法从训练样本中学习决策树。 决策树是一树状结构,它的每一个叶节点对应着一个分类,非叶节点对应着在某个属性上的划分,根据样本在该属性上的不同取值将其划分成若干个子集。对于非纯的叶节点,多数类的标号给出到达这个节点的样本所属的类。构造决策树的核心问题是在每一步如何选择适当的属性对样本做拆分。对一个分类问题,从已知类标记的训练样本中学习并构造出决策树是一个自上而下,分而治之的过程。
- 1.45MB
《RapidMiner数据分析与挖掘实战》第7章 数据预处理
2018-06-30在数据挖掘中,海量的原始数据中存在着大量不完整(有缺失值)、不一致、有异常的数据,严重影响到数据挖掘建模的执行效率,甚至可能导致挖掘结果的偏差,所以进行数据清洗就显得尤为重要,数据清洗完成后接着进行或者同时进行数据集成、转换、规约等一系列的处理,该过程就是数据预处理。数据预处理一方面是要提高数据的质量,另一方面是要让数据更好地适应特定的挖掘技术或工具。统计发现,在数据挖掘的过程中,数据预处理工作量占到了整个过程的60%。 数据预处理的主要内容包括数据清洗,数据集成,数据变换和数据规约。处理过程如图7 1所示。
- 721KB
《RapidMiner数据分析与挖掘实战》第17章 宏、循环和数据集处理
2018-07-01经过前面几章的学习,我们已经知道了数据挖掘的基本流程,在真实的数据挖掘工作中,算法模型的建立所许付出的时间只占一小部分,数据的清洗、转换、加工部分往往占据很大一部分,在这一章中,我们将在学习前面数据处理的基础上,详细介绍数据集处理的高级部分。
- 871KB
《RapidMiner数据分析与挖掘实战》第16章 时间序列
2018-07-01拿到一个观察值序列后,首先要对它的纯随机性和平稳性进行检验,这两个重要的检验称为序列的预处理。根据检验结果可以将序列分为不同的类型,对不同类型的序列会采取不同的分析方法。 对于纯随机序列,又叫白噪声序列,序列的各项之间没有任何相关关系,序列在进行完全无序的随机波动,可以终止对该序列的分析。白噪声序列是没有信息可提取的平稳序列;
- 685KB
数据挖掘之神经网络分析实验报告
2012-06-27数据挖掘之神经网络分析实验报告,里面有数据集和实验报告,操纵步骤很详细!
- 527KB
快速数据挖掘数据分析实战RapidMiner工具应用第1章 数据挖掘基础V4.1.pdf
2021-08-07这种从数据中“淘金”,从大量数据(包括文本)中挖掘出隐含的、未知的、对决策有潜在价值的关系、模式和趋势,并用这些知识和规则建立用于决策支持的模型,提供预测性决策支持的方法、工具和过程,就是数据挖掘;...
- 6.95MB
《Rapid Miner数据分析与挖掘实战》第20章 航空公司客户价值分析
2019-05-03《Rapid Miner数据分析与挖掘实战》第20章 航空公司客户价值分析,word文档及相关数据
- 539KB
《RapidMiner数据分析与挖掘实战》第18章 异常检测
2018-07-01离群点检测是数据挖掘中重要的一部分,它的任务是发现与大部分其他对象显著不同的对象。大部分数据挖掘方法都将这种差异信息视为噪声而丢弃,然而在一些应用中,罕见的数据可能蕴含着更大的研究价值。
- 1.30MB
《RapidMiner数据分析与挖掘实战》第4章 数据和结果可视化
2018-06-30前面的部分中,我们已经看到了RapidMiner Studio图形用户界面是如何建立起来的,以及如何用它来定义和执行分析流程。在流程的最后,流程结果会显示在结果视图中。现在在工具栏上点击一下就能跳转到结果视图了。这一...
- 3.56MB
《Rapidminer数据分析与挖掘实战(中文版)》第2章 RapidMiner简介 Word版
2018-06-30第2章 RapidMiner Studio简介 RapidMiner Studio 结合技术性和适用性,为最新的及已建立的人性化数据挖掘技术提供服务。通过推拽算子,设置参数及组合算子,在RapidMiner Studio中定义分析流程。
- 656KB
快速数据挖掘数据分析实战RapidMiner工具应用第6章 数据探索V1.1.pdf
2021-08-07数据质量分析是数据挖掘中数据准备过程的重要一环,是数据预处理的前提,也是数据挖掘分析结论有效性和准确性的基础,没有可信的数据,数据挖掘构建的模型将是空中楼阁。 数据质量分析的主要任务是检查原始数据中...
- 655KB
《RapidMiner数据分析与挖掘实战》第8章 关联分析与关联规则
2018-06-30关联规则分析是数据挖掘中最活跃的研究方法之一,目的是在一个数据集中找出各项之间的关联关系,而这种关系并没有在数据中直接表示出来。 8.1.1 常用关联规则算法 常用关联算法如所表8 1所示。
- 19.9MB
RapidMiner数据分析与挖掘实战_中文版
2016-10-31 - 890KB
快速数据挖掘数据分析实战RapidMiner工具应用第17章 宏、循环和数据集处理V4.1.pdf
2021-08-07我们已经知道了数据挖掘的基本流程,在真实的数据挖掘工作中,算法模型的建立所许付出的时间只占一小部分,数据的清洗、转换、加工部分往往占据很大一部分,在这一章中,我们将在学习前面数据处理的基础上,详细介绍...
- 500KB
《RapidMiner数据分析与挖掘实战》第6章 数据探索
2018-06-30根据观测、调查收集到初步的样本数据集后,接下来要考虑的问题是:样本数据集的数量和质量是否满足模型构建的要求?有没有出现从未设想过的数据状态?...本章从数据质量分析和数据特征分析两个角度对数据进行探索。
- 383KB
《RapidMiner数据分析与挖掘实战》第15章 模型评估与优化
2018-06-30 如何评估判断某个挖掘算法对挖掘分析预测结果的准确性影响? 对某一个业务数据集进行预测时,如何在多个可选的挖掘模型之间选择最佳模型?为什么选择模型A,而不是模型B?凭经验?还是。。。各个模型的特性...
- 161KB
第十五届蓝桥杯大赛软件赛省赛-C/C++ 研究生组
2024-04-13第十五届蓝桥杯大赛软件赛省赛_C/C++ 研究生组
- 1.66MB
数学建模国赛:无人机遂行编队飞行中的纯方位无源定位分析
2023-07-29国家二等奖获奖论文。本文基于平面几何分析以及正弦定理建立了三角分区定位模型,针对发射与接收信号的 无人机的相对位置不同的问题,提出了分区控制算法,并结合三角形相似定理和控制变量的 思想,提出了互反馈方位调整模型。 对于问题一的第一小问,利用三角分区定位模型、以及分区控制算法对接收信号的无人 机进行定位,该定位模型适用于所有包含 FY00 在内的任意三架无人机发射信号进行定位的 情况,即编号为 FY00、FY01、FY0M(M∈{2,3,4,5,6,7,8,9})的无人机发射信号, 当队列中某架飞机 FY0N 接收到的方向信息为?、?、?(?、?、?的定义见符号说明),根 据各个区间的的无人机之间的平面几何关系,可以得到各个区域的无人机的位置信息的关于 (?、θ)的通解公式(见正文 5.1.2 公式(9)(10)(11)(12)),之后再利用分区控制 算法分别对各个区域对应的通解公式进行求解,即可得到队列中任意无人机的位置信息。
- 6.54MB
最值得收藏的 数据结构 全部知识点思维导图整理(王道考研), 附带经典题型整理.emmx
2021-03-27用mindmaster打开文件, 本文的思维导图根据王道的数据结构书本整理而来并标记出重点内容,包括了知识点和部分课后习题
- 4KB
利用SVM(支持向量机)进行图像分割/提取-MATLAB
2023-06-15利用SVM(支持向量机)进行图像分割/提取。对给定的图像进行分割,将图像中的需要的区域和背景区域进行区分,并生成相应的分割图像和边界图像。