Hadoop大数据实战权威指南(第2版)
电子书推荐
-
大数据-互联网大规模数据挖掘与分布式处理]完整中文扫描版.part1.rar 评分:
大数据-互联网大规模数据挖掘与分布式处理]完整中文扫描版 好资源应当无条件共享
上传时间:2013-11 大小:50MB
- 119.10MB
大数据-互联网大规模数据挖掘与分布式处理.pdf
2021-04-09大数据-互联网大规模数据挖掘与分布式处理
- 15KB
第一讲:python网络爬虫基础知识
2024-04-22本讲主要内容包括Python常见数据类型、循环与控制流以及常见的错误处理方法。这些Python基础知识非常重要,是后面进行爬虫练习必备也是最少基础内容。
- 341KB
Python基于机器学习实现的股票价格预测、股票预测源码+数据集,机器学习大作业
2023-04-18python数据分析,因为股票价格的影响因素太多,通过k线数据预测未来的价格变化基本不可行,只有当天之内的数据还有一定的关联,故feature与target都选择的是当天的数据。 加载数据 为了加快数据的处理速度,提前将mariadb数据库中的数据查询出来,保存成feather格式的数据,以提高加载数据的速度。 经过处理,不同股票的数据保存在了不同的文件中,列名还保持着数据库中的字段名。我选择了股票代码为sh600010的这只股票作为数据分析的数据来源。预测出来的结果与真实值变化趋势相近,说明线性回归模型在一定程度上能够解释收盘价与选取的feature之间的关系
- 115KB
身份证前6位对应的省市区代码(超详细)
2023-05-11身份证前6位对应的省市区代码(超详细)
- 143.21MB
抖音用户浏览行为数据集
2024-02-15抖音用户浏览行为数据集 文章: [ 数据挖掘实战 —— 抖音用户浏览行为数据分析与挖掘(一)](https://blog.csdn.net/m0_53054984/article/details/136121177) [ 数据挖掘实战 —— 抖音用户浏览行为数据分析与挖掘(二)](https://blog.csdn.net/m0_53054984/article/details/136123131) [ 数据挖掘实战 —— 抖音用户浏览行为数据分析与挖掘(总)](https://blog.csdn.net/m0_53054984/article/details/136122988) [ 数据挖掘实战 —— 抖音用户浏览行为数据分析与挖掘(代码部分)](https://blog.csdn.net/m0_53054984/article/details/136455033)
- 1.23MB
两阶段鲁棒优化/综合能源系统/需求响应/微电网/多目标优化/优化调度matlab-yalmip-cplex/gurobi文章复现
2022-08-04基于多目标灰狼的冷热电联拱型微电网允许优化/ 考虑用户侧柔性负荷的社区综合能源系统日前优化调度(完美复现)matlab-yalmip-cplex/gurobi代码/ 基于场景的多区域综合能源优化调度(随机优化)(完美复现)matlab-yalmip-cplex/gurobi代码/ 考虑阶梯式碳交易机制与电制氢的综合能源系统热电优化(完美复现)matlab-yalmip-cplex/gurobi代码/ 基于概率距离的场景快速削减法的风光场景生成与削减方法/ 微电网两阶段鲁棒优化经济调度方法(完美复现)matlab-yalmip-cplex/gurobi非答疑版本/ 两阶段鲁棒优化入门到编程/ 并网型微电网光储协同优化调度/matlab-yalmip-cplex/ 含集群电动汽车的微电网多种需求侧资源经济协同调度/
- 5.75MB
SPSS中介效应分析插件(Process和mediate插件)
2022-03-09包含Process和mediate插件
- 104.35MB
基于在线教学平台的数据挖掘与学习行为分析超星集团数据集
2024-03-23基于在线教学平台的数据挖掘与学习行为分析超星集团数据集
- 829B
regress函数实例代码
2024-01-15regress函数功能十分强大,它可以用来做多元线性回归分析,它不仅能得出线性回归函数中各个系数,还会返回一系列有意义的统计参数,有助于我们对回归函数的分析。本文件包含regress函数实例代码一份。
- 1KB
Fragstats V4.2 软件计算景观指数的参数文件示例
2023-12-18Fragstats V4.2 软件计算景观指数的参数文件示例。
- 1.12MB
新闻数据集(对应新闻文本分类案例)
2023-03-19该新闻数据集与 https://blog.csdn.net/weixin_47176703/article/details/124304692?spm=1001.2014.3001.5501此篇python项目-新闻文本分类详细对应,代码详尽,读者可自取实现。
- 13.85MB
2001-2021中国城市统计年鉴数据(EXCEL数据面板)
2022-05-08县区+地级市 中国城市统计年鉴数据2001-2021(EXCEL数据面板)
- 27.17MB
2022年mathercup数学建模比赛d题题解
2022-04-182022年mathercup数学建模比赛d题题解,其中包含思路和论文代码。
- 4.1MB
组合预测模型给你了,核主成分分析+经验模态分解+LSTM(附matlab代码实现).pdf
2024-04-17程序名称:基于EMD(经验模态分解)-KPCA(核主成分分析)-LSTM的光伏功率预测模型 实现平台:matlab 代码简介:提高光伏发电功率预测精度,对于保证电力系统的安全调度和稳定运行具有重要意义。提出 一种经验模态分解 (EMD)、核主成分分析(KPCA)和长短期记忆神经网络(LSTM)相结合的光伏 功率预测模型。充分考虑制约光伏输出功率的4种环 境因素,首先利用EMD将环境因素序列进行分解, 得到数据信号在不同时间尺度上的变化情况,降低环境因素序列的非平稳 性;其次利用KPCA提取特征 序列的关键影响因子,消除原始序列的相关性和冗余性,降低模型输入的维度;最终利用LSTM网络 对 多变量特征序列进行动态时间建模,实现对光伏发电功率的预测。实验结果表明,该预测模型较传统光 伏功率预测方法有更高的精确度。附带参考文献。本代码在原文献上进行了改进,采用KPCA代替 PCA,进一步提升了预测精度。代码具有一定创新性,且模块化编写,可自由根据需要更改完善模型, 如将EMD替换成VMD CEEMD CEEMDAN EEMD等分解算法,对LSTM进一步改善,替换为GRU, BILSTM等。代
- 12.37MB
【Python实战】-Python+Opencv是实现车牌自动识别(源码+数据+字符匹配模板)
2024-03-09在这个实战项目中,我们将利用Python结合OpenCV库来实现车牌识别功能。整个过程涵盖图像预处理、车牌定位、车牌字符分割以及模板匹配识别等关键步骤,对智能交通、车辆管理等实际应用领域具有显著价值。 首先,我们需要对获取的车辆图像进行预处理,这通常包括灰度化、二值化、滤波去噪等操作,以便更好地凸显车牌区域。接着,利用OpenCV的图像处理功能,我们可以实现车牌定位。这通常涉及边缘检测、轮廓查找以及形态学操作,以准确提取出车牌区域。 在车牌定位完成后,我们需要对车牌进行字符分割。这一步的目的是将车牌中的每个字符独立提取出来,以便后续进行识别。常用的字符分割方法包括垂直投影法、滑动窗口法等。通过这些方法,我们可以将车牌图像划分为多个字符区域。 最后,我们利用模板匹配的方法对分割出的字符进行识别。通过预先准备的字符模板库,我们将每个字符区域与模板库中的字符进行匹配,从而确定字符的具体内容。经过这一过程,我们可以得到完整的车牌号码。 该项目不仅可用于车牌识别技术的学习和研究,还具有实际应用价值。通过自动识别车牌号码,我们可以实现车辆追踪、违章查询、停车场管理等功能,从而提高交通管理的
- 3.36MB
R语言期末大作业(全面带报告,带数据集)
2022-05-24按照后期进行数据分析的需求,对数据进行预处理。 -描述性统计:选择合适的方法对数据进行统计分析。包括对数值型和类别型属性的统计,并对分析结果进行图形化的展示(使用ggplot2或者lattice包)。 -推断性统计:选择合适的假设检验方法,分析属性间的相关性、两组数据间是否具有显著性差异,分析结果并给出结论及必要的图形展示。 - 数据挖掘 根据数据特征及需求,利用分类、聚类或时间序列方法挖掘蕴含在数据中的模式及必要的图形展示,用回归模型预测走势 注意:对聚类结果分析聚簇特征 对分类结果计算准确性。 使用时间序列分析方法可判断数据是否存在趋势、周期性等特征,或对数据进行预测。 (分类、聚类、时间序列,回归模型至少使用2种方法)
- 1.2MB
5-8抖音数据分析数据集
2023-05-08这个数据集对应我写的一篇博客,下载此数据集即可运行我的代码。
- 113KB
开源代码分享(1)-考虑经济性的储能运行优化(matlab代码)
2023-06-05参考文献: [1]Practical operation strategies for pumped hydroelectric energy storage (PHES) utilising electricity price arbitrage - ScienceDirect [2]Towards an objective method to compare energy storage technologies: development and validation of a model to determine the upper boundary of revenue available from electrical price arbitrage 这份代码做的是储能的运行优化,以经济效益最大为目标。使用了三种不同的方法求解储能最优运行策略。 1 运行策略搜索 2.蒙特卡洛模拟法 3.fmincon函数优化方法
- 162.28MB
时间序列数据集TSdatasets.rar
2024-02-13内含常用时间序列预测数据集如:ETT(电力变压器温度)、Traffic(交通数据集)、Electricity(电力消耗数据集)、Exchage_rate(汇率数据集)、Weather(天气数据集)、PEMS、Solar等数据集
- 107.44MB
小O地图EXE版0.9.4.0
2021-08-11小O地图是一款互联网地图数据挖掘、处理、分析及可视化图表的地图工具软件。具有易用、高效、稳定的特点,能够满足地图数据处理及应用需求,也可提供个性化定制开发服务。
- 3.29MB
携程旅游景区景点 信息 ,含全国各城市
2024-04-11全国 a-z 各城市景区景点 信息 ,包含字段 城市,景点名,地点,距离,坐标,评论数,评论分,热评分,封面,是否免费,价格,原价,类别信息,标签,是否5A 总数据量 17500
- 9KB
python爬虫利用selenium爬取淘宝和京东商品信息
2024-01-19python爬虫利用selenium爬取淘宝和京东商品信息。实现了无头浏览器进行爬取,即不需要启动自己的浏览器即可完成爬取信息的功能,而且避免了网站的反爬机制。python爬虫利用selenium爬取淘宝和京东商品信息。实现了无头浏览器进行爬取,即不需要启动自己的浏览器即可完成爬取信息的功能,而且避免了网站的反爬机制。python爬虫利用selenium爬取淘宝和京东商品信息。实现了无头浏览器进行爬取,即不需要启动自己的浏览器即可完成爬取信息的功能,而且避免了网站的反爬机制。python爬虫利用selenium爬取淘宝和京东商品信息。实现了无头浏览器进行爬取,即不需要启动自己的浏览器即可完成爬取信息的功能,而且避免了网站的反爬机制。python爬虫利用selenium爬取淘宝和京东商品信息。实现了无头浏览器进行爬取,即不需要启动自己的浏览器即可完成爬取信息的功能,而且避免了网站的反爬机制。python爬虫利用selenium爬取淘宝和京东商品信息。实现了无头浏览器进行爬取,即不需要启动自己的浏览器即可完成爬取信息的功能,而且避免了网站的反爬机制。python爬虫利用selenium爬取
- 6.77MB
中国城市统计年鉴面板数据 来源:各城市面板数据
2023-04-09中国城市统计年鉴面板数据。来源:各城市面板数据。中国城市统计年鉴面板数据。来源:各城市面板数据。中国城市统计年鉴面板数据。来源:各城市面板数据。中国城市统计年鉴面板数据。来源:各城市面板数据。中国城市统计年鉴面板数据。来源:各城市面板数据。中国城市统计年鉴面板数据。来源:各城市面板数据。中国城市统计年鉴面板数据。来源:各城市面板数据。中国城市统计年鉴面板数据。来源:各城市面板数据。中国城市统计年鉴面板数据。来源:各城市面板数据。中国城市统计年鉴面板数据。来源:各城市面板数据。中国城市统计年鉴面板数据。来源:各城市面板数据。中国城市统计年鉴面板数据。来源:各城市面板数据。中国城市统计年鉴面板数据。来源:各城市面板数据。
- 486KB
windows下python3.11的Ta-Lib库
2023-02-20windows下python3.11的Ta-Lib库。
- 122KB
分类分析数据集-bc-data.csv"
2023-11-11分类分析数据集-bc-data.csv"
- 6.28MB
小软件POI数据下载神器
2023-09-21今天分享一个能够实现零代码获取高德地图POI数据的工具。 该工具当前版本号为v1.3,主要功能特点包括: 支持通过拉框多边形以及点选省或地级市的方式输入POI数据下载范围 支持多选输入POI数据类型,例如酒店住宿、旅游景点、商业购物等 (新增功能)支持输入POI数据关键词。例如添加“瑞幸”为关键词,则下载的POI均包含瑞幸,也就是说下载了瑞幸咖啡门店数据 该功能可实现全国POI数据下载,用户可通过点选的方式输入获取的省或市(必需),然后通过点选的方式输入想要下载的POI类型(必需),最后手动输入POI必须包含的关键词(可选)。
- 69.59MB
智联人岗匹配数据集、测试集和说明
2023-03-31推荐模型推荐算法天池大数据阿里云智联人岗匹配数据集、测试集、说明字符
- 14KB
小红书评论数据采集数据
2023-04-11小红书评论数据采集,包含笔记ID、评论ID、评论时间、内容、昵称、user_ID...小红书评论数据采集,包含笔记ID、评论ID、评论时间、内容、昵称、user_ID...小红书评论数据采集,包含笔记ID、评论ID、评论时间、内容、昵称、user_ID...小红书评论数据采集,包含笔记ID、评论ID、评论时间、内容、昵称、user_ID...小红书评论数据采集,包含笔记ID、评论ID、评论时间、内容、昵称、user_ID...小红书评论数据采集,包含笔记ID、评论ID、评论时间、内容、昵称、user_ID...小红书评论数据采集,包含笔记ID、评论ID、评论时间、内容、昵称、user_ID...小红书评论数据采集,包含笔记ID、评论ID、评论时间、内容、昵称、user_ID...
- 223KB
SAS 9.4 SID续订更新SAS SID 2022 更新-用至2023年1月 sas sid 2023 最新sas更新sid
2022-04-26截止日期:2022.11.30 宽限期:15天(于2022.12.15结束) 警告期:19天(于2023.1.3结束) 代码使用之后:所以最终这个代码可以使用到2023年1月3日 SAS 9.4 S-ID更新,亲测可用,准确说可用至2023年1月3日 sas s-id 大家可自测, 使用方法: 复制附件中的代码,打开S-A-S粘贴,直接运行即可 到期之后再分享其他SID资源 代码的使用方法也在附件里面包含了。大家可以参照着来更新自己的SAS,如果出现问题可私信联系,谢谢
- 2.94MB
图数据库neo4j实战完整资料.zip
2023-12-26随着社交、电商、金融、零售、物联网等行业的快速发展,现实社会织起了了一张庞大而复杂的关系网,传统数据库很难处理关系运算。大数据行业需要处理的数据之间的关系随数据量呈几何级数增长,急需一种支持海量复杂数据关系运算的数据库,图数据库应运而生。 世界上很多著名的公司都在使用图数据库,比如: 社交领域:Facebook, Twitter,Linkedin用它来管理社交关系,实现好友推荐零售领域:eBay,沃尔玛使用它实现商品实时推荐,给买家更好的购物体验金融领域:摩根大通,花旗和瑞银等银行在用图数据库做风控处理 汽车制造领域:沃尔沃,戴姆勒和丰田等顶级汽车制造商依靠图数据库推动创新制造解决方案电信领域:Verizon, Orange和AT&T 等电信公司依靠图数据库来管理网络,控制访问并支持客户 360 酒店领域:万豪和雅高酒店等顶级酒店公司依使用图数据库来管理复杂且快速变化的库存图数据库并非指存储图片的数据库,而是以图数据结构存储和查询数据。 图数据库是基于图论实现的一种NoSQL数据库,其数据存储结构和数据查询方式都是以图论为基础的,图数据库主要用于存储更多的连接数据。