Hadoop大数据实战权威指南(第2版)
电子书推荐
-
Hadoop大数据分析与挖掘实战 高清版 评分:
10多位技术专家结合自己10多年的经验,以电信、航空、医疗等多个行业的实战案例为主线,深入浅出地讲解了如何基于Hadoop架构技术进行大数据挖掘建模、数据分析和二次开发。 本书共16章,分三个部分:基础篇、实战篇、高级篇。 基础篇(第1~6章),第1章的主要内容是数据挖掘概述、大数据餐饮行业应用;第2章针对大数据理论知识进行基础讲解,简明扼要地对Hadoop安装、原理等做了介绍;第3章介绍了大数据仓库Hive的安装、原理等内容;第4章介绍了大数据数据库HBase的安装、原理等内容;第5章介绍了几种大数据挖掘建模平台,同时重点介绍了本书使用的开源TipDM-HB大数据挖掘平台;第6章对数据挖掘的建模过程,各种挖掘建模的常用算法与原理及其在大数据挖掘算法库Mahout的实现原理进行了介绍。 实战篇(第7~14章),重点对大数据挖掘技术在法律咨询、电子商务、航空、移动通信、互联网、生产制造以及公共服务等行业的应用进行了分析。在案例结构组织上,本书是按照先介绍案例背景与挖掘目标,再阐述大数据时代针对大数据的分析方法与过程,最后完成模型构建的顺序进行,对建模过程等关键环节进行了详细的分析。最后通过上机实践,加深对大数据挖掘技术以及分析流程的认识。 高级篇(第15~16章),介绍了基于Hadoop大数据开发的相关技术以及开发步骤,同时使用实例来展示这些步骤,使读者可以自己动手实践,亲自体会开发的乐趣;同时,还介绍了基于TipDM-HB大数据挖掘平台的二次开发实例,借助TipDM-HB大数据挖掘平台二次开发工具,可以更加快捷、高效地完成相关大数据应用的二次开发,降低开发难度,使读者更方便地体会到大数据分析与挖掘的强大魅力。
上传时间:2019-02 大小:39.84MB
- 698KB
Hadoop 大数据分析与挖掘实战 下载并安装虚拟机说明.pdf
2021-08-07Hadoop 大数据分析与挖掘实战 下载并安装虚拟机说明.pdf
- 291.72MB
上机实验源数据-Hadoop大数据分析与挖掘实战 数据源 共16个章节.rar
2021-08-07上机实验源数据-Hadoop大数据分析与挖掘实战 数据源 共16个章节 大数据的出现催生出产业人才缺口瓶颈,在大数据挖掘项目的实施方面,被调查公司普遍缺乏相关的技术能力。 75% 以上的公司表示在人员和培训方面存在...
- 661KB
Hadoop 大数据分析与挖掘实战 下载并安装虚拟机说明.rar
2021-09-29Hadoop 大数据分析与挖掘实战 下载并安装虚拟机说明.rar
- 72B
10G的python数据分析与挖掘实战学习视频
2023-03-10内容概要:10G的Python数据分析与挖掘实战学习视频,包括了Python3数据科学入门与实战,大数据入门到实战篇(Hadoop2.80),Python3实战Spark大数据分析及调度,数据分析与数据挖掘高级实战案例 适合人群:具备一定...
- 246KB
hadoop 大数据集 数据并行挖掘
2014-12-25基于 [:分布式计算平台,给出一种适用于大数据集的并行挖掘算法%该算法对非结构化的原始大数据集以 及中间结果文件进行垂直划分以确保能够获得完整的频繁项集,将各个垂直分块数据分配给不同的 [:计算节点进 行处理...
- 74B
开源力量——数据挖掘原理与实战
2015-07-10整套大数据课程从hadoop入门开始,由浅入深,...第6周 数据挖掘实战 要点(以目标客户挖掘为例,从业务分析、方案制定、数据处理、数据准备、变量筛选、建模、评测、部署各个环节,使用Modeler工具,讲述建模的全过程)
- 4.11MB
Hadoop应用案例分析:雅虎、eBay、百度、Facebook.pdf
2014-05-25,Hadoop 技术已经在互联网领域得到了广泛的应用。...同样也得到了许多公司的青睐,如百度主要将Hadoop 应用于日志分析和网页数据库的数据 挖掘;阿里巴巴则将Hadoop 用于商业数据的排序和搜索引擎的优化等。
- 752KB
基于Python爬虫实现天气预报和数据可视化分析,应付数据分析大作业
2022-12-23基于Python爬虫实现天气预报和数据可视化分析,应付数据分析大作业,内含Python原文件及所需库说明
- 28.70MB
EDA探索式数据分析案例数据集
2024-02-25EDA探索式数据分析案例数据集
- 1.2MB
5-8抖音数据分析数据集
2023-05-08这个数据集对应我写的一篇博客,下载此数据集即可运行我的代码。
- 5.83MB
Python数据分析项目实践,包括数据读取、评估、清洗、分析、可视化机器学习相关内容等
2024-01-16Python数据分析项目实践,包括数据读取、评估、清洗、分析、可视化机器学习相关内容等
- 116KB
python数据分析大作业-爬虫、建立模型、可视化、结论分析
2023-06-09包括代码文件
- 407.36MB
统计数模历年优秀论文-全国大学生统计建模大赛
2023-05-16为在大学生中倡导学习统计、应用统计的良好氛围,促进大学生关注经济社会热点难点问题,适应大数据时代下高校及统计部门对统计人才的培养要求,中国统计教育学会、全国应用统计专业学位研究生教育指导委员会联合举办2021年(第七届)全国大学生统计建模大赛,本届大赛主题为“数据新动能的统计测度研究”,旨在提高大学生数据挖掘、数据分析、运用统计方法及计算机技术处理数据的能力,加强创新思维意识,助力推进统计现代化改革。经过一年的筹备、征集和筛选评议工作,最终选出这26篇优秀论文集结成册,展示当代大学生的统计应用能力和研究水平。 欢迎扫描以上二维码订阅 扫一扫在手机打开 上一篇: 《2022年(第八届)... 下一篇: 关于公布2022年(第... 评论262 0/150 提交 热门评论 相关推荐 关于公布2023年(第九届)全国大学生统计建模大赛报名信息的通知 大赛动态 2023-04-10 10:00595451143 《2023年(第九届)全国大学生统计建模大赛主题解读》(视频) 大赛动态 2023-04-06 09:0046299990 “全国大学生统计建模大赛”成功入
- 0B
origin2021下载免费分享
2022-11-14origin2021 下载途径:百度网盘、阿里云盘下载
- 1KB
r语言数据分析案例数据分析、数据预测和机器学习案例
2023-03-29如果您正在寻找一份完整的R语言数据分析、数据预测和机器学习案例,那么我们的资源库将为您提供一切所需。本资源库提供了一系列案例,包括数据可视化、数据清洗、机器学习模型构建和数据预测等内容。我们的案例旨在帮助您更好地了解R语言的使用和机器学习的基础知识。 我们的资源库包括以下主题: 数据可视化:使用ggplot2包和其他R语言可视化工具,展示如何将数据可视化,从而更好地理解数据并做出更明智的决策。 数据清洗:展示如何使用dplyr包和其他数据清洗工具来清洗和准备数据,使其可以用于机器学习模型的训练。 机器学习模型构建:使用caret包和其他机器学习工具,构建和训练各种类型的机器学习模型,包括回归、分类和聚类模型等。 数据预测:展示如何使用机器学习模型来预测未来数据,并对预测结果进行评估和优化。 每个案例都包含完整的代码和数据集,可以帮助您更好地了解每个步骤的细节和操作。我们的资源库适合各种级别的用户,包括初学者和有经验的用户。您可以根据自己的兴趣和需求选择不同的主题,并按照自己的步骤和想法来运行代码和修改案例。 如果正在寻找一份完整的R语言数据分析、数据预测和机器学习案例,
- 5.29MB
2023高教社数学建模C题 - 蔬菜类商品的自动定价与补货决策【数据处理详细代码】
2023-09-09商超(超市和零售店)在现代经济中扮演着至关重要的角色,然而,它们在蔬菜商品管理中面临着多重挑战。这些挑战包括如何准确预测销售趋势、合理制定价格策略、以及有效制定补货计划等问题。 解决这些问题对于商超来说至关重要,因为它们直接影响着销售收益、库存成本和客户满意度。因此,本研究旨在为商超提供一套全面的蔬菜商品管理策略,以帮助它们更好地应对这些挑战。 针对问题一,在蔬菜商品管理中,首要问题之一是如何准确预测销售趋势。这包括了不同蔬菜品类的销售模式,如季节性销售高峰和低谷。我们需要深入了解哪些蔬菜在特定时间段内销售最活跃,以及它们之间的差异。这个问题的解决有助于商超更有针对性地制定促销策略和补货计划。 针对问题二,制定合理的价格策略对于商超至关重要,因为它们需要平衡销售利润和客户价格敏感度。我们需要建立一个定价模型,考虑商品成本、预期销售量和销售利润等因素。这个模型将为每个蔬菜品类提供合理的售价建议,确保商超实现销售利润的最大化,同时提供具有竞争力的价格。 针对问题三,如何确定每个单品的补货量以及建议的定价策略是另一个重要问题。我们需要通过组合优化方法,确定每个单品的最佳补货量和定价策
- 11KB
python数据分析与可视化
2024-04-27Python数据分析与可视化资源描述 Python数据分析与可视化领域拥有丰富的资源,这些资源为数据科学家、分析师和开发者提供了强大的支持。 首先,Python拥有众多强大的数据分析库,如Pandas、Numpy和SciPy等。Pandas库提供了数据清洗、转换、聚合等多种功能,使数据处理变得简单高效。Numpy则专注于数值计算,提供了多维数组对象和一系列用于操作这些数组的函数。SciPy则是一个用于数学、科学和工程领域的开源软件库,提供了许多高级数学函数和算法。 在数据可视化方面,Python同样表现出色。Matplotlib和Seaborn是两个最常用的可视化库。Matplotlib提供了丰富的绘图工具,支持创建各种静态、动态和交互式图表。Seaborn则基于Matplotlib,提供了更高级的统计图形绘制功能,使数据可视化更加美观和直观。 此外,Python社区还提供了大量的在线教程、书籍和实战案例,帮助初学者快速入门,并为进阶用户提供深入的学习资源。这些资源涵盖了从基础语法到高级应用的各个方面,为Python数据分析与可视化提供了全方位的支
- 18.32MB
摩拜共享单车数据分析项目数据、代码、图表
2020-09-30摩拜共享单车数据分析项目的数据、代码、图表,基于上海摩拜单车的2016年8月份随机抽样大约10万条的开放订单数据进行分析
- 197KB
大乐透第一期至今全部期数的开奖结果(2007年-2023年5月共2423期)
2023-05-26我们使用大数据进行数据分析的时候,数据为基础中的基础。很多彩民进行杀号分析的时候,需要花费不少时间进行数据统计。这个csv版本统计汇总了历年的开奖结果,一目了然。方便进行号码分析。
- 1.19MB
besnew-超强二进制文件查看工具
2022-03-21右键属性 支持16进制,10进制,二进制,8进制查看。 可自定义列数,独特码查找、不定帧长查看。方便数据帧分析。 免安装。 使用时可能需要先使用管理员权限启动。 注意事项: 1,一定要解压出来再用。 2,默认需要先打开bes,然后再从左上角打开要查看分析的文件。 最好设置一下管理员权限执行: 选中bes.exe文件,右键属性-》兼容性-》选中以管理员身份运行。 然后就可以找到数据文件,右键选择打开方式为bes.exe即可。
- 111.52MB
python数据分析课程设计
2021-03-17其中包含4个案例,以毕业论文的格式写出。包含原始数据。代码可复制粘贴。
- 1.49MB
基于Hadoop的电影影评数据分析
2023-04-04是大数据课程大作业,基于Hadoop的电影影评数据分析,需要安装Hadoop,了解MapReduce 和HDFS。
- 342KB
用于本项目的数据分析及可视化部分的源码
2022-05-25用于本项目的数据分析及可视化部分的源码
- 80KB
2023年数学建模C题思路分析
2023-09-10对于国赛问题二的问题分析
- 118.50MB
matlab2020a官方pdf文档
2020-09-29目前是matlab2020a的最新官方文档,其中涵盖了matlab入门基础、桌面工具和开发环境以及数据导入导出、matlab数学、数据分析、编程基础、面向对象编程、matlab图形、3d可视化等等。
- 3.36MB
R语言期末大作业(全面带报告,带数据集)
2022-05-24按照后期进行数据分析的需求,对数据进行预处理。 -描述性统计:选择合适的方法对数据进行统计分析。包括对数值型和类别型属性的统计,并对分析结果进行图形化的展示(使用ggplot2或者lattice包)。 -推断性统计:选择合适的假设检验方法,分析属性间的相关性、两组数据间是否具有显著性差异,分析结果并给出结论及必要的图形展示。 - 数据挖掘 根据数据特征及需求,利用分类、聚类或时间序列方法挖掘蕴含在数据中的模式及必要的图形展示,用回归模型预测走势 注意:对聚类结果分析聚簇特征 对分类结果计算准确性。 使用时间序列分析方法可判断数据是否存在趋势、周期性等特征,或对数据进行预测。 (分类、聚类、时间序列,回归模型至少使用2种方法)
- 1.61MB
2023高教社数学建模国赛C题 - 蔬菜类商品的自动定价与补货决策(完整参考论文)附word文档
2023-09-09要 商超(超市和零售店)在现代经济中扮演着至关重要的角色,然而,它们在蔬菜商品管理中面临着多重挑战。这些挑战包括如何准确预测销售趋势、合理制定价格策略、以及有效制定补货计划等问题。 解决这些问题对于商超来说至关重要,因为它们直接影响着销售收益、库存成本和客户满意度。因此,本研究旨在为商超提供一套全面的蔬菜商品管理策略,以帮助它们更好地应对这些挑战。 针对问题一,在蔬菜商品管理中,首要问题之一是如何准确预测销售趋势。这包括了不同蔬菜品类的销售模式,如季节性销售高峰和低谷。我们需要深入了解哪些蔬菜在特定时间段内销售最活跃,以及它们之间的差异。这个问题的解决有助于商超更有针对性地制定促销策略和补货计划。 针对问题二,制定合理的价格策略对于商超至关重要,因为它们需要平衡销售利润和客户价格敏感度。我们需要建立一个定价模型,考虑商品成本、预期销售量和销售利润等因素。这个模型将为每个蔬菜品类提供合理的售价建议,确保商超实现销售利润的最大化,同时提供具有竞争力的价格。 针对问题三,如何确定每个单品的补货量以及建议的定价策略是另一个重要问题。我们需要通过组合优化方法,确定每个单品的最佳补货量和
- 7.77MB
Python数据分析与可视化大作业 + 源代码 + 数据 + 详细文档
2024-04-30Python数据分析与可视化大作业 + 源代码 + 数据 + 详细文档
- 1.35MB
2022泰迪杯数据分析技能赛B题代码 Jupyter Notebook
2022-12-142022泰迪杯数据分析技能赛B题一等奖 方案及赛后总结:https://blog.csdn.net/u014111377/article/details/127905972 欢迎学习交流 任务1:数据探索与清洗 任务2:产品营销数据可视化分析 任务3:客户流失因素可视化分析 任务4:特征构建 任务5:银行客户长期忠诚度预测建模
- 15KB
中国新能源汽车销量数据
2023-06-06中国新能源汽车销量数据以及市场渗透率