Hadoop大数据实战权威指南(第2版)
电子书推荐
-
大数据-互联网大规模数据挖掘与分布式处理.part1 评分:
第 1 章 数据挖掘基本概念 ............................... 1 1.1 数据挖掘的定义 ........................................... 1 1.1.1 统计建模 .......................................... 1 1.1.2 机器学习 .......................................... 1 1.1.3 建模的计算方法 ............................... 2 1.1.4 数据汇总 .......................................... 2 1.1.5 特征抽取 .......................................... 3 1.2 数据挖掘的统计限制 ................................... 4 1.2.1 整体情报预警 ................................... 4 1.2.2 邦弗朗尼原理 ................................... 4 1.2.3 邦弗朗尼原理的一个例子 ............... 5 1.2.4 习题 .................................................. 6 1.3 相关知识 ...................................................... 6 1.3.1 词语在文档中的重要性 ................... 6 1.3.2 哈希函数 .......................................... 7 1.3.3 索引 .................................................. 8 1.3.4 二级存储器 .................................... 10 1.3.5 自然对数的底 e .............................. 10 1.3.6 幂定律 ............................................ 11 1.3.7 习题 ................................................ 12 1.4 本书概要 .................................................... 13 1.5 小结 ............................................................ 14 1.6 参考文献 .................................................... 14 第 2 章 大规模文件系统及 Map- Reduce ................................................. 16 2.1 分布式文件系统 ......................................... 16 2.1.1 计算节点的物理结构 ..................... 17 2.1.2 大规模文件系统的结构 ................. 18 2.2 Map-Reduce ................................................ 18 2.2.1 Map任务 ........................................ 19
上传时间:2017-09 大小:59.5MB
- 119.10MB
大数据-互联网大规模数据挖掘与分布式处理.pdf
2021-04-09大数据-互联网大规模数据挖掘与分布式处理
- 818KB
大数据:互联网大规模数据挖掘.pptx
2022-12-24大数据:互联网大规模数据挖掘.pptx该文档详细且完整,值得借鉴下载使用,欢迎下载使用,有问题可以第一时间联系作者~
- 3.62MB
算法导论第二版+习题答案part3
2007-12-07算法导论第二版+习题答案part3
- 49.38MB
人工智能+智能运维平台解决方案(1).pptx
2023-06-01服务器数据 存储数据 网络数据 应用数据 用户体验数据 流量数据 日志数据 交易数据 任意IT数据 OneAPM AIOps 大数据实时多维分析 机器学习 大规模事务处理 海量数据实时接入 服务分析 深度挖掘 场景可视化 多维指标...
- 49.56MB
人工智能+智能运维平台解决方案.pptx
2023-06-01服务器数据 存储数据 网络数据 应用数据 用户体验数据 流量数据 日志数据 交易数据 任意IT数据 OneAPM AIOps 大数据实时多维分析 机器学习 大规模事务处理 海量数据实时接入 服务分析 深度挖掘 场景可视化 多维指标...
- 49.62MB
人工智能+智能运维平台建设综合解决方案.pptx
2023-06-01服务器数据 存储数据 网络数据 应用数据 用户体验数据 流量数据 日志数据 交易数据 任意IT数据 OneAPM AIOps 大数据实时多维分析 机器学习 大规模事务处理 海量数据实时接入 服务分析 深度挖掘 场景可视化 多维指标...
- 55.26MB
基于AI(人工智能)智能运维可视化平台解决方案.pptx
2023-06-02服务器数据 存储数据 网络数据 应用数据 用户体验数据 流量数据 日志数据 交易数据 任意IT数据 OneAPM AIOps 大数据实时多维分析 机器学习 大规模事务处理 海量数据实时接入 服务分析 深度挖掘 场景可视化 多维指标...
- 161KB
第十五届蓝桥杯大赛软件赛省赛-C/C++ 研究生组
2024-04-13第十五届蓝桥杯大赛软件赛省赛_C/C++ 研究生组
- 149KB
甲骨文卷积神经网络识别-RTL(甲骨文识别)
2024-04-13甲骨文识别 甲骨文卷积神经网络识别-RTL(
- 1.66MB
数学建模国赛:无人机遂行编队飞行中的纯方位无源定位分析
2023-07-29国家二等奖获奖论文。本文基于平面几何分析以及正弦定理建立了三角分区定位模型,针对发射与接收信号的 无人机的相对位置不同的问题,提出了分区控制算法,并结合三角形相似定理和控制变量的 思想,提出了互反馈方位调整模型。 对于问题一的第一小问,利用三角分区定位模型、以及分区控制算法对接收信号的无人 机进行定位,该定位模型适用于所有包含 FY00 在内的任意三架无人机发射信号进行定位的 情况,即编号为 FY00、FY01、FY0M(M∈{2,3,4,5,6,7,8,9})的无人机发射信号, 当队列中某架飞机 FY0N 接收到的方向信息为?、?、?(?、?、?的定义见符号说明),根 据各个区间的的无人机之间的平面几何关系,可以得到各个区域的无人机的位置信息的关于 (?、θ)的通解公式(见正文 5.1.2 公式(9)(10)(11)(12)),之后再利用分区控制 算法分别对各个区域对应的通解公式进行求解,即可得到队列中任意无人机的位置信息。
- 6.54MB
最值得收藏的 数据结构 全部知识点思维导图整理(王道考研), 附带经典题型整理.emmx
2021-03-27用mindmaster打开文件, 本文的思维导图根据王道的数据结构书本整理而来并标记出重点内容,包括了知识点和部分课后习题
- 22KB
VRPTW 的 Solomon 标准测试数据集
2023-11-27CVRP问题下的VRPTW变体的测试数据集,常用来测试验证算法性能
- 4KB
利用SVM(支持向量机)进行图像分割/提取-MATLAB
2023-06-15利用SVM(支持向量机)进行图像分割/提取。对给定的图像进行分割,将图像中的需要的区域和背景区域进行区分,并生成相应的分割图像和边界图像。
- 7KB
变分模态分解(VMD)代码
2022-03-26VMD算法的原matlab原代码 在代码中本人添加了详细的注释,看源代码期间配合本人发表的博客会实现VMD的快速入门
- 265KB
最新版Notepad++十六进制查看的插件x64HexEditor0.9.12
2023-09-27最新版Notepad++十六进制查看的插件
- 31KB
自适应模糊PID控制器simulink仿真
2024-03-19在matlab下simulink环境中,实现自适应模糊PID控制器仿真设计。用户可以自行修改PID参数与模糊规则,调整出属于自己的控制系统。
- 4.66MB
《Spring Cloud Alibaba 从入门到实战》.pdf
2021-03-10《Spring Cloud Alibaba 从入门到实战》
- 0B
origin2021下载免费分享
2022-11-14origin2021 下载途径:百度网盘、阿里云盘下载
- 2KB
基于分时电价,采用改进粒子群算法,基于V2G的电动汽车充放电优化调度策略
2024-04-08基于分时电价,采用改进粒子群算法,基于V2G的电动汽车充放电优化调度策略
- 644.62MB
PSG 3D 三维测绘系统
2023-04-14裸眼三维测绘系统
- 60KB
采用K-means聚类,实现多维矩阵的聚类,并进行可视化展示(matlab)
2019-03-05我的数据是115*64维的,需要进行聚类操作,于是自己动手进行了实验,运用的是matlab语言,最后选取部分进行可视化展示,效果还不错。(代码注释完整)
- 359KB
秋招面试python很全的八股文总结
2023-04-26亲身总结的python八股文适合秋招找算法、软件类工作的同学的面试经验
- 11.28MB
数据资产管理实践白皮书6.0
2023-05-18来源:信通院云大所 信通院数据资产管理实践白皮书6.0》是一份深入探讨数据资产管理(DAM)的权威指南,为组织提供了一套全面的理论和实践框架。本白皮书由信通院专家团队撰写,内容涵盖了数据资产的定义、分类、管理流程以及在现代企业中的应用策略。 内容概要: 白皮书首先定义了数据资产的概念,阐释了其在企业中的价值和重要性。接着,详细介绍了数据资产的生命周期管理,包括数据的识别、分类、整合、质量控制、安全保护和价值实现等关键环节。此外,还探讨了数据资产管理的组织架构、技术工具和标准规范。 通过阅读本白皮书,读者将获得以下知识: 数据资产管理的核心原则和实践方法。 如何构建有效的数据资产管理体系,以支持企业的业务决策和运营效率。 数据资产评估、监测和优化的技术手段。 数据安全和合规性管理的最佳实践。 行业案例分析,了解不同企业如何通过数据资产管理提升竞争力。 面对数据资产管理挑战时的解决策略和建议。 《信通院数据资产管理实践白皮书6.0》是数据管理人员、IT专业人士、企业决策者以及对数据驱动决策感兴趣的学者和研究人员的宝贵资源,旨在帮助组织更好地理解和利用其数据资产,实现数据的最大价值
- 3.56MB
蜣螂优化算法(DBO)源代码+DBO原始Paper+23个经典测试函数
2023-04-28以蜣螂优化算法(Dung Beetle Optimizer,DBO)为例,测试函数为23个经典单目标测试函数,能直接运行,可二次开发。资源包括:23个经典单目标测试函数+DBO算法+DBO原始paper。
- 42.8MB
最全PyCharm 中文使用手册.pdf
2021-01-08最全PyCharm 中文使用手册,python环境编译器
- 1KB
SEIR 2(Matlab源码)
2020-04-12只有代码,只需要代码来这边只有代码,
- 53.40MB
全国5级行政区划数据(省市区县乡镇村).txt
2019-08-07全国五级行政区划数据(省市区县乡镇村),共计74万多条,有需要的请下载,记得关注、点赞哦!
- 1.34MB
永磁同步电机矢量控制+MTPV+MTPA算法(弱磁控制)仿真simulink模型
2021-08-17本文件包含永磁同步电机矢量控制+MTPV+MTPA算法(弱磁控制)仿真simulink模型及其说明文档,是日常工作中就用的东西,可以完全正常仿真,输出流畅。本文档不仅包括simulink模型和说明文档,适合初学者和日常工程技术人员使用。
- 1KB
matlab随机森林回归模型代码
2020-03-19matlab软件随机森林法回归模型代码,可直接matlab打开运行!精简版,包括数据导入、模型建立、误差计算、保存模型,绘制对比图的多个功能!
- 55.81MB
矩阵计算-中文版-Gene H. Golub-袁亚湘-人民邮电出版社.pdf
2019-07-18本书是数值计算领域的名著,系统介绍了矩阵计算的基本理论和方法。内容包括:矩阵乘法、矩阵分析、线性方程组、正交化和最小二乘法、特征值问题、Lanczos 方法、矩阵函数及专题讨论等。书中的许多算法都有现成的软件包实现,每节后附有习题,并有注释和大量参考文献。新版增加约四分之一内容,反映了近年来矩阵计算领域的飞速发展。