Hadoop大数据挖掘从入门到进阶实战(视频教学版)
电子书推荐
-
主流实用易学数据挖掘工具Rapidminer速成 评分:
数据挖掘课程Rapidminer,主流实用易学数据挖掘工具Rapidminer速成
上传时间:2018-07 大小:67B
- 191KB
数据挖掘 工具 大比拼
2009-11-30SAS公司的 Enterprise Miner IBM公司的 Intelligent Miner SPSS公司的 Clementine Statsoft公司的Statistica Data Miner DB Miner公司的 DBMiner NCR公司的Teradata Warehouse Miner Unica公司的Affinium Model Insightful公司的Insightful Miner Data Miner 公司的RIK, EDM and DMSK Information Discovery 公司的Data Mining Suite Angoss 公司的 KnowledgeSTUDIO Data Mining Technologies 公司的 Nuggets Fujitsu公司的 GhostMiner Oracle公司的 Darwin
- 365KB
三大数据挖掘工具的比较(用于软件选型)
2008-09-17要做数据挖掘,当然需要工具。但若靠传统的自我编程来实现,未免有些费时费力,而且其性能也不一定比商业工具来得强和稳定。目前,世界上已经有很多商业公司和研究机构开发出了各自的数据挖掘产品,而且功能和使用简易性也在日益提高。例如:SAS公司的Enterprise Miner以及IBM公司的 Intelligent Miner,等等。 直接采用商业数据挖掘工具来帮助项目实施,是一个很好的选择。它既节省了大量的开发费用,又可以节约维护和升级的开销。本文是目前国内第一份对主流数据挖掘工具的评估报告,该报告综合了国内一流业务专家和数据挖掘专家的意见,为帮助企业进行类似评估提供了很高的参考价值。
- 648KB
数据挖掘工具rapidminer
2018-05-15继数据挖掘rapidminer1之后,的rapidminer2,介绍数据的导入导出以及预处理。
- 1.22MB
数据挖掘工具Rapidminer基础介绍
2018-05-15数据挖掘工具rapidminer的基础知识介绍,应用实例,以及数据分析内容。
- 9.56MB
rapidminer使用手册 [RapidMiner数据分析与挖掘实战] 全17章
2022-04-26第1章 RAPIDMINER STUDIO简介 第2章 设计分析流程 第3章 数据和结果可视化 第4章 数据管理:资源库 第5章 数据探索 第6章 数据预处理 第7章 关联分析与关联规则 第8章 K-MEANS 聚类、辨别分析 第9章 线性回归与逻辑...
- 890KB
快速数据挖掘数据分析实战RapidMiner工具应用第17章 宏、循环和数据集处理V4.1.pdf
2021-08-07经过前面几章的学习,我们已经知道了数据挖掘的基本流程,在真实的数据挖掘工作中,算法模型的建立所许付出的时间只占一小部分,数据的清洗、转换、加工部分往往占据很大一部分,在这一章中,我们将在学习前面数据...
- 1.4MB
快速数据挖掘数据分析实战RapidMiner工具应用第2章 RapidMiner简介V1.1.pdf
2021-08-07RapidMiner Studio包含了1500多个专业数据分析流程:从数据划分到以市场为基础的分析,再到属性生成,它包含了所有您需要的数据挖掘工具。同时也包含了文本挖掘,网页挖掘,对来自网络论坛的信息的自动情感分析...
- 527KB
快速数据挖掘数据分析实战RapidMiner工具应用第1章 数据挖掘基础V4.1.pdf
2021-08-07这种从数据中“淘金”,从大量数据(包括文本)中挖掘出隐含的、未知的、对决策有潜在价值的关系、模式和趋势,并用这些知识和规则建立用于决策支持的模型,提供预测性决策支持的方法、工具和过程,就是数据挖掘;...
- 1.15MB
RapidMiner.01.数据挖掘及工具简介
2014-05-25这是一个快速数据挖掘的工具rapidminer,希望对大家学习数据挖掘有帮助!
- 287.51MB
RapidMiner Studio Developer数据挖掘工具
2022-06-07RapidMiner是世界领先的数据挖掘解决方案,在一个非常大的程度上有着先进技术,特点是图形用户界面的互动原型。 特点:拖拽操作,无需编程,运算速度快。 RapidMiner具有丰富数据挖掘分析和算法功能,常用于解决各种...
- 741KB
快速数据挖掘数据分析实战RapidMiner工具应用第18章 异常检测.pdf
2021-08-07大部分数据挖掘方法都将这种差异信息视为噪声而丢弃,然而在一些应用中,罕见的数据可能蕴含着更大的研究价值。 在数据的散布图中,如图18-1离群点远离其它数据点。因为离群点的属性值明显偏离期望的或常见的属性值...
- 1.45MB
《RapidMiner数据分析与挖掘实战》第7章 数据预处理
2018-06-30数据预处理一方面是要提高数据的质量,另一方面是要让数据更好地适应特定的挖掘技术或工具。统计发现,在数据挖掘的过程中,数据预处理工作量占到了整个过程的60%。 数据预处理的主要内容包括数据清洗,数据集成,...
- 725KB
快速数据挖掘数据分析实战RapidMiner工具应用第3章 设计分析流程.pdf
2021-08-07不管是在透视图主页选择“新建”选项,还是点击RapidMiner Studio主工具栏左边的“新建”图标,还是进入“文件”菜单,都可以新建一个分析流程,以供接下来的使用。 提示:我们建议您把新建的流程保存在您的资源库中...
- 442KB
快速数据挖掘数据分析实战RapidMiner工具应用第12章 文本挖掘V1.1.pdf
2021-08-07 在 RapidMiner 中开发一个文本挖掘模型,其中包括常用的文本操作符,例如tokenization、stop word filtering等。 对文本挖掘结果应用其他数据挖掘模型,以便根据文本分析结果预测或分类。 12.3文本挖掘概览 本...
- 543KB
快速数据挖掘数据分析实战RapidMiner工具应用第10章 线性回归与逻辑回归V1.1.pdf
2021-08-07回归分析是通过建立模型来研究变量之间相互关系的密切程度、结构状态及进行模型预测的一种有效工具,在工商管理、经济、社会...在数据挖掘环境下,自变量与因变量具有相关关系,自变量的值是已知的,因变量是要预测的。
- 705KB
快速数据挖掘数据分析实战RapidMiner工具应用第7章 数据预处理V1.1.pdf
2023-10-29数据预处理一方面是要提高数据的质量,另一方面是要让数据更好地适应特定的挖掘技术或工具。统计发现,在数据挖掘的过程中,数据预处理工作量占到了整个过程的60%。 7.1.1缺失值处理 从统计上说,缺失的数据可能会...
- 740KB
快速数据挖掘数据分析实战RapidMiner工具应用第13章 Web挖掘V1.1.pdf
2021-08-07我们将建立一个RapidMiner挖掘流程,来学习如何通过连接到生物医学期刊网站,获取蛋白质相关论文的web数据,从中找到用户关心的某些信息内容:某蛋白质近年来论文发表数量趋势,及该蛋白质论文的作者、联系邮箱、...
- 715KB
快速数据挖掘数据分析实战RapidMiner工具应用第8章 关联分析与关联规则V1.2.pdf
2021-08-07菜品的合理搭配是有规律可循的:顾客的饮食习惯、菜品的荤素和口味,有些菜品之间是相互关联的,而有些菜品之间是对立或竞争关系(负关联),这些规律都隐藏在大量的历史菜单数据中,如果能够通过数据挖掘发现客户...
- 940KB
快速数据挖掘数据分析实战RapidMiner工具应用第2章 RapidMiner简介V1.1.rar
2021-09-29快速数据挖掘数据分析实战RapidMiner工具应用第2章 RapidMiner简介V1.1.rar
- 630KB
快速数据挖掘数据分析实战RapidMiner工具应用第9章 K-Means 聚类、辨别分析V1.rar
2021-09-29快速数据挖掘数据分析实战RapidMiner工具应用第9章 K-Means 聚类、辨别分析V1.rar
- 754KB
快速数据挖掘数据分析实战RapidMiner工具应用第4章 数据和结果可视化.pdf
2021-08-07前面的部分中,我们已经看到了RapidMiner Studio图形用户界面是如何建立起来的,以及如何用它来定义和执行分析流程。在流程的最后,流程结果会显示在结果视图中。现在在工具栏上点击一下就能跳转到结果视图了。这一...
- 656KB
快速数据挖掘数据分析实战RapidMiner工具应用第6章 数据探索V1.1.pdf
2021-08-07数据质量分析是数据挖掘中数据准备过程的重要一环,是数据预处理的前提,也是数据挖掘分析结论有效性和准确性的基础,没有可信的数据,数据挖掘构建的模型将是空中楼阁。 数据质量分析的主要任务是检查原始数据中...
- 15KB
第一讲:python网络爬虫基础知识
2024-04-22本讲主要内容包括Python常见数据类型、循环与控制流以及常见的错误处理方法。这些Python基础知识非常重要,是后面进行爬虫练习必备也是最少基础内容。
- 341KB
Python基于机器学习实现的股票价格预测、股票预测源码+数据集,机器学习大作业
2023-04-18python数据分析,因为股票价格的影响因素太多,通过k线数据预测未来的价格变化基本不可行,只有当天之内的数据还有一定的关联,故feature与target都选择的是当天的数据。 加载数据 为了加快数据的处理速度,提前将mariadb数据库中的数据查询出来,保存成feather格式的数据,以提高加载数据的速度。 经过处理,不同股票的数据保存在了不同的文件中,列名还保持着数据库中的字段名。我选择了股票代码为sh600010的这只股票作为数据分析的数据来源。预测出来的结果与真实值变化趋势相近,说明线性回归模型在一定程度上能够解释收盘价与选取的feature之间的关系
- 115KB
身份证前6位对应的省市区代码(超详细)
2023-05-11身份证前6位对应的省市区代码(超详细)
- 12.37MB
【Python实战】-Python+Opencv是实现车牌自动识别(源码+数据+字符匹配模板)
2024-03-09在这个实战项目中,我们将利用Python结合OpenCV库来实现车牌识别功能。整个过程涵盖图像预处理、车牌定位、车牌字符分割以及模板匹配识别等关键步骤,对智能交通、车辆管理等实际应用领域具有显著价值。 首先,我们需要对获取的车辆图像进行预处理,这通常包括灰度化、二值化、滤波去噪等操作,以便更好地凸显车牌区域。接着,利用OpenCV的图像处理功能,我们可以实现车牌定位。这通常涉及边缘检测、轮廓查找以及形态学操作,以准确提取出车牌区域。 在车牌定位完成后,我们需要对车牌进行字符分割。这一步的目的是将车牌中的每个字符独立提取出来,以便后续进行识别。常用的字符分割方法包括垂直投影法、滑动窗口法等。通过这些方法,我们可以将车牌图像划分为多个字符区域。 最后,我们利用模板匹配的方法对分割出的字符进行识别。通过预先准备的字符模板库,我们将每个字符区域与模板库中的字符进行匹配,从而确定字符的具体内容。经过这一过程,我们可以得到完整的车牌号码。 该项目不仅可用于车牌识别技术的学习和研究,还具有实际应用价值。通过自动识别车牌号码,我们可以实现车辆追踪、违章查询、停车场管理等功能,从而提高交通管理的
- 143.21MB
抖音用户浏览行为数据集
2024-02-15抖音用户浏览行为数据集 文章: [ 数据挖掘实战 —— 抖音用户浏览行为数据分析与挖掘(一)](https://blog.csdn.net/m0_53054984/article/details/136121177) [ 数据挖掘实战 —— 抖音用户浏览行为数据分析与挖掘(二)](https://blog.csdn.net/m0_53054984/article/details/136123131) [ 数据挖掘实战 —— 抖音用户浏览行为数据分析与挖掘(总)](https://blog.csdn.net/m0_53054984/article/details/136122988) [ 数据挖掘实战 —— 抖音用户浏览行为数据分析与挖掘(代码部分)](https://blog.csdn.net/m0_53054984/article/details/136455033)
- 104.35MB
基于在线教学平台的数据挖掘与学习行为分析超星集团数据集
2024-03-23基于在线教学平台的数据挖掘与学习行为分析超星集团数据集
- 1.23MB
两阶段鲁棒优化/综合能源系统/需求响应/微电网/多目标优化/优化调度matlab-yalmip-cplex/gurobi文章复现
2022-08-04基于多目标灰狼的冷热电联拱型微电网允许优化/ 考虑用户侧柔性负荷的社区综合能源系统日前优化调度(完美复现)matlab-yalmip-cplex/gurobi代码/ 基于场景的多区域综合能源优化调度(随机优化)(完美复现)matlab-yalmip-cplex/gurobi代码/ 考虑阶梯式碳交易机制与电制氢的综合能源系统热电优化(完美复现)matlab-yalmip-cplex/gurobi代码/ 基于概率距离的场景快速削减法的风光场景生成与削减方法/ 微电网两阶段鲁棒优化经济调度方法(完美复现)matlab-yalmip-cplex/gurobi非答疑版本/ 两阶段鲁棒优化入门到编程/ 并网型微电网光储协同优化调度/matlab-yalmip-cplex/ 含集群电动汽车的微电网多种需求侧资源经济协同调度/
- 829B
regress函数实例代码
2024-01-15regress函数功能十分强大,它可以用来做多元线性回归分析,它不仅能得出线性回归函数中各个系数,还会返回一系列有意义的统计参数,有助于我们对回归函数的分析。本文件包含regress函数实例代码一份。