Hadoop大数据挖掘从入门到进阶实战(视频教学版)
电子书推荐
-
统计学学习基础,数据挖掘,推理,预测 评分:
统计学学习基础,数据挖掘,推理,预测.书籍
上传时间:2016-02 大小:46.53MB
- 8.21MB
统计学基础—数据挖掘、推理与预测(斯坦福大学)
2010-04-26世界知名大学教材,显现出统计学的强大生命力
- 58.83MB
大数据学习经典教材:统计学习基础 数据挖掘、推理与预测 中英文及课后习题答案
2019-04-10该资源为经典的大数据学习教材,当然大数据分析核心为统计内容,这个也是统计学中经典教材,值得大家下载学习! 资源中包含:1)英文版本为 第二版 ; 2)中文为第一版教材的翻译; 3)习题答案对应的是英文版本,...
- 13.30MB
数据挖掘在各行业的应用论文
2010-04-19试论数据挖掘与机器学习、统计学、数据库的关系.caj 数据挖掘技术及其在营销中的应用.caj 基于约束的多维数据挖掘技术.caj 在IDS中利用数据挖掘技术提取用户行为特征.caj 数据挖掘与数据库知识发现.caj 数据挖掘技术...
- 256KB
数据挖掘与数据分析.pdf
2022-12-23统计学:数据分析最早的依赖基础,通常和概率论⼀起应⽤,现在的机器学习和数据挖掘很多都是基于统计的,常见的均值、⽅差、协⽅差 等都要熟练掌握。 2 编程基础 数据挖掘需要⼀定的编程基础,因为要实现模型以及...
- 10.0MB
数据挖掘论文合集-242篇(part1)
2009-01-13试论数据挖掘与机器学习、统计学、数据库的关系.caj 遗传算法的自适应代沟的替代策略研究.pdf 金融数据挖掘中的非线性相关跟踪技术(英文).caj 非线性控制系统的近似化方法.pdf 非线性时延对象的神经网络控制.pdf 非...
- 5.1MB
数据挖掘论文合集-242篇(part3)
2009-01-13试论数据挖掘与机器学习、统计学、数据库的关系.caj 遗传算法的自适应代沟的替代策略研究.pdf 金融数据挖掘中的非线性相关跟踪技术(英文).caj 非线性控制系统的近似化方法.pdf 非线性时延对象的神经网络控制.pdf 非...
- 10.0MB
数据挖掘论文合集-242篇(part2)
2009-01-13试论数据挖掘与机器学习、统计学、数据库的关系.caj 遗传算法的自适应代沟的替代策略研究.pdf 金融数据挖掘中的非线性相关跟踪技术(英文).caj 非线性控制系统的近似化方法.pdf 非线性时延对象的神经网络控制.pdf 非...
- 138KB
浅谈数据挖掘与数据分析?.pdf
2022-12-24从分析的⽬的来看,数据分析⼀般是对历史数据进⾏ 统计学上的⼀些分析,数据挖掘更侧重于机器对未来的预测,⼀般应⽤于分类、聚类、推荐、关联规则等。 数据分析(狭义)与数据挖掘的本质都是⼀样的,都是从数据⾥⾯...
- 168KB
大数据分析方法.pdf
2022-12-24数据挖掘是一种决策支持过程, 它主要基于人 工智能、机器学习、模式识别、统计学、数据库、可视化技术等,高度自动化地分析企业的 数据,做出归纳性的推理,从中挖掘出潜在的模式,帮助决策者调整市场策略,减少...
- 26KB
大数据常用的算法.docx
2022-12-24虽然神经网络有多种模型及算法,但在特定领域的数据挖掘中使用何种模型及算法并没有统一的规则,而且人们很难理解网络的学习及决策过程。 (6)Web数据挖掘。Web数据挖掘是一项综合性技术,指Web 从文档结构和使用的...
- 56.12MB
STAT-724:数据科学和机器学习简介
2021-02-26STAT-724 数据科学与机器学习简介 描述: 该课程从统计学的角度概述了数据科学及其核心机器学习模型和算法。 它提供了有关这些方法如何工作以及如何将统计...[ESLII]统计学习的要素-数据挖掘,推理和预测,作者Trevor
- 51KB
商业智能的概念.doc
2023-06-02数据挖掘(DM)是一种决策支持过程,它主要基于AI、机器学习、统计学等技术, 高度自动化地分析企业原有的数据,做出归纳性的推理,从中挖掘出潜在的模式,预测 客户的行为,帮助企业的决策者调整市场策略,减少...
- 15KB
第一讲:python网络爬虫基础知识
2024-04-22本讲主要内容包括Python常见数据类型、循环与控制流以及常见的错误处理方法。这些Python基础知识非常重要,是后面进行爬虫练习必备也是最少基础内容。
- 341KB
Python基于机器学习实现的股票价格预测、股票预测源码+数据集,机器学习大作业
2023-04-18python数据分析,因为股票价格的影响因素太多,通过k线数据预测未来的价格变化基本不可行,只有当天之内的数据还有一定的关联,故feature与target都选择的是当天的数据。 加载数据 为了加快数据的处理速度,提前将mariadb数据库中的数据查询出来,保存成feather格式的数据,以提高加载数据的速度。 经过处理,不同股票的数据保存在了不同的文件中,列名还保持着数据库中的字段名。我选择了股票代码为sh600010的这只股票作为数据分析的数据来源。预测出来的结果与真实值变化趋势相近,说明线性回归模型在一定程度上能够解释收盘价与选取的feature之间的关系
- 115KB
身份证前6位对应的省市区代码(超详细)
2023-05-11身份证前6位对应的省市区代码(超详细)
- 143.21MB
抖音用户浏览行为数据集
2024-02-15抖音用户浏览行为数据集 文章: [ 数据挖掘实战 —— 抖音用户浏览行为数据分析与挖掘(一)](https://blog.csdn.net/m0_53054984/article/details/136121177) [ 数据挖掘实战 —— 抖音用户浏览行为数据分析与挖掘(二)](https://blog.csdn.net/m0_53054984/article/details/136123131) [ 数据挖掘实战 —— 抖音用户浏览行为数据分析与挖掘(总)](https://blog.csdn.net/m0_53054984/article/details/136122988) [ 数据挖掘实战 —— 抖音用户浏览行为数据分析与挖掘(代码部分)](https://blog.csdn.net/m0_53054984/article/details/136455033)
- 1.23MB
两阶段鲁棒优化/综合能源系统/需求响应/微电网/多目标优化/优化调度matlab-yalmip-cplex/gurobi文章复现
2022-08-04基于多目标灰狼的冷热电联拱型微电网允许优化/ 考虑用户侧柔性负荷的社区综合能源系统日前优化调度(完美复现)matlab-yalmip-cplex/gurobi代码/ 基于场景的多区域综合能源优化调度(随机优化)(完美复现)matlab-yalmip-cplex/gurobi代码/ 考虑阶梯式碳交易机制与电制氢的综合能源系统热电优化(完美复现)matlab-yalmip-cplex/gurobi代码/ 基于概率距离的场景快速削减法的风光场景生成与削减方法/ 微电网两阶段鲁棒优化经济调度方法(完美复现)matlab-yalmip-cplex/gurobi非答疑版本/ 两阶段鲁棒优化入门到编程/ 并网型微电网光储协同优化调度/matlab-yalmip-cplex/ 含集群电动汽车的微电网多种需求侧资源经济协同调度/
- 5.75MB
SPSS中介效应分析插件(Process和mediate插件)
2022-03-09包含Process和mediate插件
- 104.35MB
基于在线教学平台的数据挖掘与学习行为分析超星集团数据集
2024-03-23基于在线教学平台的数据挖掘与学习行为分析超星集团数据集
- 829B
regress函数实例代码
2024-01-15regress函数功能十分强大,它可以用来做多元线性回归分析,它不仅能得出线性回归函数中各个系数,还会返回一系列有意义的统计参数,有助于我们对回归函数的分析。本文件包含regress函数实例代码一份。
- 1KB
Fragstats V4.2 软件计算景观指数的参数文件示例
2023-12-18Fragstats V4.2 软件计算景观指数的参数文件示例。
- 1.12MB
新闻数据集(对应新闻文本分类案例)
2023-03-19该新闻数据集与 https://blog.csdn.net/weixin_47176703/article/details/124304692?spm=1001.2014.3001.5501此篇python项目-新闻文本分类详细对应,代码详尽,读者可自取实现。
- 13.85MB
2001-2021中国城市统计年鉴数据(EXCEL数据面板)
2022-05-08县区+地级市 中国城市统计年鉴数据2001-2021(EXCEL数据面板)
- 27.17MB
2022年mathercup数学建模比赛d题题解
2022-04-182022年mathercup数学建模比赛d题题解,其中包含思路和论文代码。
- 4.1MB
组合预测模型给你了,核主成分分析+经验模态分解+LSTM(附matlab代码实现).pdf
2024-04-17程序名称:基于EMD(经验模态分解)-KPCA(核主成分分析)-LSTM的光伏功率预测模型 实现平台:matlab 代码简介:提高光伏发电功率预测精度,对于保证电力系统的安全调度和稳定运行具有重要意义。提出 一种经验模态分解 (EMD)、核主成分分析(KPCA)和长短期记忆神经网络(LSTM)相结合的光伏 功率预测模型。充分考虑制约光伏输出功率的4种环 境因素,首先利用EMD将环境因素序列进行分解, 得到数据信号在不同时间尺度上的变化情况,降低环境因素序列的非平稳 性;其次利用KPCA提取特征 序列的关键影响因子,消除原始序列的相关性和冗余性,降低模型输入的维度;最终利用LSTM网络 对 多变量特征序列进行动态时间建模,实现对光伏发电功率的预测。实验结果表明,该预测模型较传统光 伏功率预测方法有更高的精确度。附带参考文献。本代码在原文献上进行了改进,采用KPCA代替 PCA,进一步提升了预测精度。代码具有一定创新性,且模块化编写,可自由根据需要更改完善模型, 如将EMD替换成VMD CEEMD CEEMDAN EEMD等分解算法,对LSTM进一步改善,替换为GRU, BILSTM等。代
- 12.37MB
【Python实战】-Python+Opencv是实现车牌自动识别(源码+数据+字符匹配模板)
2024-03-09在这个实战项目中,我们将利用Python结合OpenCV库来实现车牌识别功能。整个过程涵盖图像预处理、车牌定位、车牌字符分割以及模板匹配识别等关键步骤,对智能交通、车辆管理等实际应用领域具有显著价值。 首先,我们需要对获取的车辆图像进行预处理,这通常包括灰度化、二值化、滤波去噪等操作,以便更好地凸显车牌区域。接着,利用OpenCV的图像处理功能,我们可以实现车牌定位。这通常涉及边缘检测、轮廓查找以及形态学操作,以准确提取出车牌区域。 在车牌定位完成后,我们需要对车牌进行字符分割。这一步的目的是将车牌中的每个字符独立提取出来,以便后续进行识别。常用的字符分割方法包括垂直投影法、滑动窗口法等。通过这些方法,我们可以将车牌图像划分为多个字符区域。 最后,我们利用模板匹配的方法对分割出的字符进行识别。通过预先准备的字符模板库,我们将每个字符区域与模板库中的字符进行匹配,从而确定字符的具体内容。经过这一过程,我们可以得到完整的车牌号码。 该项目不仅可用于车牌识别技术的学习和研究,还具有实际应用价值。通过自动识别车牌号码,我们可以实现车辆追踪、违章查询、停车场管理等功能,从而提高交通管理的
- 3.36MB
R语言期末大作业(全面带报告,带数据集)
2022-05-24按照后期进行数据分析的需求,对数据进行预处理。 -描述性统计:选择合适的方法对数据进行统计分析。包括对数值型和类别型属性的统计,并对分析结果进行图形化的展示(使用ggplot2或者lattice包)。 -推断性统计:选择合适的假设检验方法,分析属性间的相关性、两组数据间是否具有显著性差异,分析结果并给出结论及必要的图形展示。 - 数据挖掘 根据数据特征及需求,利用分类、聚类或时间序列方法挖掘蕴含在数据中的模式及必要的图形展示,用回归模型预测走势 注意:对聚类结果分析聚簇特征 对分类结果计算准确性。 使用时间序列分析方法可判断数据是否存在趋势、周期性等特征,或对数据进行预测。 (分类、聚类、时间序列,回归模型至少使用2种方法)
- 1.2MB
5-8抖音数据分析数据集
2023-05-08这个数据集对应我写的一篇博客,下载此数据集即可运行我的代码。
- 113KB
开源代码分享(1)-考虑经济性的储能运行优化(matlab代码)
2023-06-05参考文献: [1]Practical operation strategies for pumped hydroelectric energy storage (PHES) utilising electricity price arbitrage - ScienceDirect [2]Towards an objective method to compare energy storage technologies: development and validation of a model to determine the upper boundary of revenue available from electrical price arbitrage 这份代码做的是储能的运行优化,以经济效益最大为目标。使用了三种不同的方法求解储能最优运行策略。 1 运行策略搜索 2.蒙特卡洛模拟法 3.fmincon函数优化方法
- 162.28MB
时间序列数据集TSdatasets.rar
2024-02-13内含常用时间序列预测数据集如:ETT(电力变压器温度)、Traffic(交通数据集)、Electricity(电力消耗数据集)、Exchage_rate(汇率数据集)、Weather(天气数据集)、PEMS、Solar等数据集