- 整理了1年!整整38页数据仓库干货!5 2918浏览¥ 9.90
- 南京大学《大数据》期末试卷题5 1982浏览¥ 4.90
- 大数据一千道选择题(含答案)5 1679浏览¥ 20.90
- 健康医疗大数据标签体系构建方法研究.pdf5 537浏览¥ 4.90
- 中国信通院-大数据平台安全研究报告(2021年).pdf5 621浏览¥ 4.90
- 数据治理体系建设方案,包含数据治理战略、组织架构、解决方案等内容。5 1036浏览¥ 11.90
- 2021中国大数据产业发展白皮书5 446浏览¥ 11.90
- 北京林业大学大数据技术基础期末复习提纲(PDF版)5 246浏览¥ 5.90
- “互联网+”大数据平台下动态返贫风险监测及预警机制研究.pdf5 334浏览¥ 4.90
- 中国肠道菌群研究近20年文献大数据分析.pdf5 398浏览¥ 4.90
- 大数据集群规划 hadoop集群软件硬件规划,报告一个规模超上千个节点Hadoop集群的【硬件规划,软件规划, 网络规划,应用规划】设计,综合考虑了集群头节点的高可用设计, 元数据的备份恢复设计,读写流量分离,多租户,安全审计设计,集 群冗余设,结合应用场景,结构化(文本和数据表)和非结构化数据 (影像)的等不同并行处理方式,并探索深度学习和Hadoop分布式融 合等规划。5 547浏览¥ 20.90
- 大数据技术之高频面试题8.0.2.pdf5 366浏览¥ 49.90
- 1、内容概要:Hadoop+Spark+Hive+HBase+Oozie+Kafka+Flume+Flink+Elasticsearch+Redash等大数据集群及组件搭建指南(详细搭建步骤+实践过程问题总结)。 2、适合人群:大数据运维、大数据相关技术及组件初学者。 3、能学到啥:大数据集群及相关组件搭建的详细步骤,了解大数据各组件的用途,深入认识各大数据组件工作原理及优化方案。 4、阅读建议:使用过以上大数据组件进行简单开发、了解以上大数据组件的相关功能。 5、资源价值:大数据组件搭建的详细实践步骤、一次性提供较全面的常用大数据集群及组件安装部署内容、资源是博主结合官网文档+网上各类搭建文档+本人亲自实践后总结整合的文档(包括过程踩坑记录+对应解决方案)。5 2278浏览¥ 109.90
- 大数据面试,flume、kafka、hbase、spark、hive、flink等常用大数据组件面试题,刷题不容错过的利器5 664浏览¥ 9.90
- 大数据平台应用案例5 219浏览¥ 4.90
- 基于大数据的检验检测信息化平台设计.pdf5 91浏览¥ 4.90
- Apache Superset 1.2.0教程 (一)—— 安装(Windows版) superset安装过程4 380浏览¥ 11.90
- 基于大数据的电力监控信号统计信息可视化传输系统.pdf5 62浏览¥ 4.90
- hadoop集群配置之————flume安装配置(详细版)5 652浏览¥ 5.90
- Hadoop的安装部署与配置实验 共11页.pdf5 123浏览¥ 5.90
- 基于大数据Hadoop的企业财务管理系统研究.pdf5 197浏览¥ 4.90
- 国家文化大数据体系建设研究.pdf5 203浏览¥ 4.90
- 1、Hadoop生态 2、部署架构 3、运营 4、问题 5、相关开发5 102浏览¥ 4.90
- 大数据与认知、思维和决策方式的变革.pdf5 174浏览¥ 4.90
- 分布式计算期末复习总结.pdf5 91浏览¥ 2.90
- 大数据视域下网络招聘数据信息挖掘的研究.pdf5 150浏览¥ 4.90
- 290+页真实企业大数据面试真题,辅助回顾每一个真题知识点,直接封神!5 92浏览¥ 4.90
- 大数据技术方法在审计工作中的创新应用研究.pdf5 126浏览¥ 4.90
- 基于视频监控融合大数据在市域社会治理现代化应用的探讨.pdf5 89浏览¥ 4.90
- 亚马逊AWS大数据架构模式和最佳实践5 296浏览¥ 11.90
- 大型集团企业经营管控大数据决策分析应用研究.pdf5 83浏览¥ 4.90
- “大数据+”海尔智家股份有限公司发展能力分析.pdf5 193浏览¥ 4.90
- 大数据平台技术实践 四.HDFS原理和安装教程5 86浏览¥ 2.90
- 数据分析平台演进及数据分析方法应用5 198浏览¥ 4.90
- 2021中国大数据区域发展水平评估白皮书5 177浏览¥ 11.90
- 数字经济与大数据企业跨境数据合规专栏之--大数据企业数据跨境实践的壁垒.pdf5 130浏览¥ 4.90
- “互联网+”和大数据背景下对供应链金融模式的创新研究.pdf5 94浏览¥ 4.90
- 大数据在医用耗材管理系统中的应用与设计.pdf5 67浏览¥ 4.90
- 基于大数据的测井智能解释系统开发与应用.pdf5 98浏览¥ 4.90
- 浅析大数据与云计算的关系及发展趋势.pdf5 123浏览¥ 4.90
- 基于大数据的上海张江高科园区交通拥堵治理方法研究.pdf5 179浏览¥ 4.90
- 由于大数据里面涉及到非关系型数据库如hive、kudu、hbase等的数据迁移,目前涉及到的迁移工具都没有支持hive数据库的事务表的迁移,如果hive库里面存在大量的事务表的时候,目前的工具都是不支持的,例如华为的CDM,阿里研发的datax,hadoop的distcp都是不支持大数据事务表的迁移。但是目前很多公司随着数据量的增涨和上云的趋势,出现了喝多公司迁移大数据平台上云的需求,如果进行上云就要涉及到数据的迁移和各个不同平台数据版本的适配等问题。 下面为从自建的数据中心迁移hadoop到华为云上适配大数据平台MRS的一次项目迁移,此项目涉及到hive、kudu、hbase 的数据迁移,数据总量达到了15T,此文档是耗时5月时间和时间的检验,通过脚本编辑批量迁移完成大数据迁移上云的最终目标,里面涉及具体的迁移方案、解决方案、迁移流程、迁移脚本5 1028浏览¥ 109.90
- hadoop原理介绍ppt.pdf5 89浏览¥ 11.90
- 试分析大数据环境下的商业银行审计风险.pdf5 44浏览¥ 4.90
- 1. Windows下eclipse开发环境配置 1.1 安装开发hadoop插件 将hadoop安装包hadoop\contrib\eclipse-plugin\hadoop-0.20.2-eclipse-plugin.jar拷贝到eclipse的插件目录plugins下。 需要注意的是插件版本(及后面开发导入的所有jar包)与运行的hadoop一致,否则可能会出现EOFException异常。 重启eclipse,打开windows->open perspective->other->map/reduce 可以看到map/reduce开发视图。 1.2 设置连接参数 打开windows->show view->other-> map/reduce Locations视图,在点击大象后弹出的对话框(General tab)进行参数的添加:5 117浏览¥ 5.90
- 大数据时代强化税收风险管理分析.pdf5 160浏览¥ 4.90
- Apache Superset 1.2.0教程 (二)——快速入门(可视化王者英雄数据)5 241浏览¥ 11.90
- 基于BIM+GIS城市大数据平台的智慧临港应用示范.pdf5 297浏览¥ 4.90
- ⼤数据开发IDE之Scriptis-讲解、安装部署、使用全教程5 411浏览¥ 5.90
- 数字运政大数据管理平台功能架构浅析.pdf5 133浏览¥ 4.90
- 基于大数据+AI的初中数学精准教学研究——以“一起中学”平台为例.pdf5 121浏览¥ 4.90
- 以大数据为核心的预算执行审计全覆盖探究.pdf5 47浏览¥ 4.90
- 我国大数据交易存在的主要问题及其应对.pdf5 80浏览¥ 4.90
- 大数据背景下信息通信网络安全管理策略研究.pdf5 54浏览¥ 4.90
- 基于大数据探寻初中强校提质的对策.pdf5 89浏览¥ 4.90
- 第三期“中国基础教育大数据发展蓝皮书”项目核心成果.pdf1 121浏览¥ 4.90
- 大数据技术 数据仓库设计与开发技术 ETL构建数据仓库五步法 共9页.pdf0 29浏览¥ 9.90
- 实际当中经常有这些场景:每天有一个大任务,这个大任务可以分成A,B,C,D四个小任务,A,B任务之间没有依赖关系,C任务依赖A,B任务的结果,D任务依赖C任务的结果。一般的做法是,开两个终端同时执行A,B,两个都执行完了再执行C,最后再执行D。这样的话,整个的执行过程都需要人工参加,并且得盯着各任务的进度。但是我们的很多任务都是在深更半夜执行的,通过写脚本设置crontab执行。其实,整个过程类似于一个有向无环图(DAG)。每个子任务相当于大任务中的一个流,任务的起点可以从没有度的节点开始执行,任何没有通路的节点之间可以同时执行,比如上述的A,B。总结起来的话,我们需要的就是一个工作流的调度器,而azkaban就是能解决上述问题的一个调度器。0 273浏览¥ 1.90
- 大数据背景下高职院校图书馆信息服务模式研究.pdf0 100浏览¥ 4.90
- 基于Hadoop集群的自然语言处理平台实-现方案0 41浏览¥ 9.90