- 引导性提问需要教师根据教材内容和学生实际水平,提出问题,启发引导学生去解决问 题,提问,从而达到理解、掌握知识,发展各种能力和提高思想觉悟的目的。 (1)你听到过“大数据”这个概念吗? (2) 你听到过“Hadoop”这个软件吗? (3) 你知道Hadoop最主要的用处吗? (4) 你觉得Hadoop更常用于哪方面?0 9浏览会员免费
- 大数据开发教学手册,包含Hadoop、Zookeeper、HBASE、Hive、Kafka等主流大数据技术的实操讲解0 8浏览免费
- 《大数据降本提效实战手册》0 8浏览会员免费
- 私有云迁移到公有云的大数据迁移方案0 8浏览会员免费
- 主要介绍了Hadoop在windows上伪分布式的安装过程、在Linux单节点伪分布式的安装过程、Eclipse开发环境介绍0 32浏览会员免费
- 介绍了Hadoop bin下所有脚本以及Hadoop Shell使用介绍0 21浏览会员免费
- 主要介绍了Hadoop的MapReduce的Java编程接口,包括Mapper API和Reducer API,Job的运行模式、工作流0 28浏览会员免费
- 主要介绍了HDFS、HDFS架构设计、HDFS概念、命令行接口等信息0 16浏览会员免费
- 大数据架构:大数据技术架构的思想和原理是什么 大数据技术其实是分布式技术在数据处理领域的创新性应用,本质和我们此前讲到的分布式技术思路一脉相承:用更多的计算机组成一个集群,提供更多的计算资源,从而满足更大的计算压力要求。 分布式文件存储 HDFS 架构 大数据计算 MapReduce 架构 大数据仓库 Hive 架构 快速大数据计算 Spark 架构 大数据流计算架构0 24浏览会员免费
- Hadoop是什么?怎么部署.pdf0 17浏览会员免费
- hadoop YARN应用开发与核心源码剖析0 10浏览免费
- hadoop YARN监控管理与资源管理0 15浏览免费
- YARN框架概述与集群部署.pdf0 16浏览免费
- 当应聘者面试大数据开发岗位时,以下是一些常见的面试题: - 1. 请解释一下什么是大数据(Big Data),并列举大数据的特征和应用场景。 - 2. 你熟悉的大数据技术栈有哪些?请简要介绍每种技术的作用和特点。 - 3. 什么是Hadoop?请解释一下Hadoop的架构和组件,以及它在大数据处理中的作用。 - 4. 请说明一下什么是MapReduce,以及它在Hadoop中的角色和工作流程。 - 5. 什么是Spark?与Hadoop相比,Spark有哪些优点和特点? - 6. 请介绍一下你对Hive的理解,以及在大数据处理中如何使用Hive进行数据查询和分析。 - 7. 什么是HDFS?它的特点是什么?请说明HDFS的数据一致性和容错机制。 - 8. 请解释一下什么是数据仓库(Data Warehouse),以及数据仓库在大数据处理中的重要性。 - 9. 你在大数据开发中常用的编程语言是什么?请说明你的选择理由。 - 10. 请简要介绍一下你在以往项目中的大数据处理经验,包括数据采集、存储、处理和分析等方面。 - 11. 什么是数据分区(Data Partitioning)?在大0 177浏览会员免费
- 【Ambari】Ansible自动化部署大数据集群.docx0 131浏览会员免费
- 拉钩交互式查询工具Impala0 18浏览会员免费
- Flume是一个分布式、可靠和高可用性的数据采集工具,用于将大量数据从各种源采集到Hadoop生态系统中进行处理。在大型互联网企业的数据处理任务中,Flume被广泛应用。 Flume逻辑上分三层架构:agent,collector,storage。agent用于采集数据,agent是Flume中产生数据流的地方,同时,agent会将产生的数据流传输到collector。collector的作用是将多个agent的数据汇总后,加载到storage中。storage是存储系统,可以是一个普通file,也可以是HDFS,HIVE,HBase等。0 38浏览会员免费
- Azkaban是由Linkedin公司推出的一个开源的批量工作流任务调度器,主要用于在一个工作流内以一个特定的顺序运行一组工作和流程。 Azkaban的配置是通过简单的key:value对的方式,通过配置中的dependencies 来设置依赖关系。Azkaban使用job配置文件建立任务之间的依赖关系,并提供一个易于使用的web用户界面维护和跟踪你的工作流。 它有如下特点: 兼容任何版本的hadoop 易于使用的Web用户界面 简单的工作流的上传 方便设置任务之间的关系 工作流和任务日志记录和审计 调度工作流 模块化和可插拔的插件机制 认证/授权(权限的工作) 能够杀死并重新启动工作流 有关失败和成功的电子邮件提醒0 58浏览会员免费
- qfedu_数据仓库学习大纲0 12浏览免费
- 集群搭建教程0 34浏览会员免费
- 林子雨大数据编程课程实验答案0 101浏览会员免费
- MapReduce经典常见面试实操题,面试题,实操题,练习题,练手题0 91浏览免费
- 大数据治理平台解决方案 包含下面几个方面: 数据治理概述 某行数据现状及问题 数据治理阶段目标 成效和特点 金舟PDF数据管理系统建设情况 编辑器4.0.0 27浏览免费
- Impala的JDBC Driver 使用教程0 26浏览会员免费
- hadoop安装与配置,虚拟机伪分布式安装hadoop的配置,虚拟机必须NAT 模式。在虚拟机设置界⾯去设置0 85浏览免费
- hadoop安装与配置,Hadoop集群搭建Hive的安装配置,掌握数据仓库⼯具Hive的安装和配置0 218浏览免费
- 7_0大数据技术之Hadoop(HDFS)0 32浏览会员免费
- 6_大数据技术之Hadoop运行环境搭建(重点)0 43浏览会员免费
- 5_大数据技术之模板虚拟机环境准备0 22浏览会员免费
- 4_0大数据技术之Hadoop(MapReduce) (1)0 36浏览会员免费
- 3_客户端环境(windows开发环境)准备0 23浏览会员免费
- 2_大数据技术之Hadoop(入门)0 29浏览会员免费
- hadoop安装与配置,hadoop的伪分布式模式配置与安装伪分布式模式,讲解hadoop的伪分布式模式进⾏对hadoop的基本模拟部署0 121浏览免费
- TMYTEK 棱研科技:XRifle RIS 智能超表面; 包含有固定角度数值。 智能超表面的英文简称是RIS,全称是Reconfigurable intelligent surface。 智能超表面是在平面上集成大量低成本的反射元件,通过智能地调整、配置这些元器件,可以对无线传播环境进行调控,从而提高无线通信网络的性能。 智能超表面最大的特点是可编程,因为智能超表面是由很多独立的由超材料组成的反射单元组成的,通过调整这些反射独立单元的工作状态,就可以影响电磁波的传输特性,包括相位控制、幅度控制等,从而对被反射的无线信号产生调控的效果。 智能超表面有下面的优点: 成本低,超表面材料可以大规模生产,技术成熟; 功耗低,因为超材料是用于反射无线电波的,并不需要放大信号等耗能的处理; 噪声低,不会增加无线噪声; 重量轻,可以按需灵活部署; 便于利用AI技术,通过AI可以实现复杂的算法,赋能无线波形控制,提升无线网络的性能,AI在智能超表面领域大有潜力; 智能超表面的应用场景很多,比如: 无线覆盖补盲,把无线信号反射到被建筑物直接挡住的地方; 无线覆盖扩展,把无线信号反射到更大的覆盖范围;0 113浏览会员免费
- 字节大数据面试面经,三面+加面0 136浏览会员免费
- 很全0 18浏览会员免费
- 大数据面试题目大全,包含hadoop,spark,hive,flink等关键框架,值得拥有0 57浏览会员免费
- 从安装虚拟机到部署成功所有详细步骤0 162浏览会员免费
- 基于Zookeeper搭建Hadoop高可用集群0 71浏览免费
- Hadoop集群环境搭建0 71浏览免费
- Schedulis 是一个基于 LinkedIn 的开源项目 Azkaban 开发的工作流任务调度系统。该调度系统具备高性能,高可用(去中心化多调度中心和多执行器)和多租户资源隔离等金融级特性;现已被集成到数据应用开发门户 DataSphere Studio。 Schedulis 支持常规的 Command Shell 和 Linkis(HadoopMR、 Hive、Spark、Sqoop、 Python)大数据任务;同时还支持特色的数据检查和工作流之间的依赖任务;支持完善的告警和工作流执行策略;提供多种类型的参数设置,动态全局变量和简单易用的 UI。0 95浏览免费
- Qualitis是一个支持多种异构数据源的质量校验、通知、管理服务的数据质量管理平台,用于解决业务系统运行、数据中心建设及数据治理过程中的各种数据质量问题。 Qualitis基于Spring Boot,依赖于Linkis进行数据计算,提供数据质量模型构建,数据质量模型执行,数据质量任务管理,异常数据发现保存以及数据质量报表生成等功能。并提供了金融级数据质量模型资源隔离,资源管控,权限隔离等企业特性,具备高并发,高性能,高可用的大数据质量管理能力。0 176浏览会员免费
- 什么是CDMP? DAMA数据管理专业认证(Certified Data Management Professional,CDMP)是DAMA官方的一项国际专业认证。 在通过专业的数据治理知识考试,有的高级别还会做一些职业资格认证以后,就可以获取证书。0 260浏览会员免费
- 大数据大小:398KB这篇文章名为《大数据方向学习路线》,它是一份指导人们如何学习大数据领域的路线图。在当今数字时代,数据成为了企业决策的关键因素,因此大数据技术的需求也越来越高。这篇文章将为那些想要在大数据领域发展的人们提供一个清晰的学习路线图,帮助他们系统地学习大数据相关的技术和工具。文章从基础知识开始,逐步深入探讨了数据处理、数据分析、机器学习、人工智能等方面的技术,同时介绍了一些在实际应用中必不可少的工具和技巧。如果你想要深入了解大数据技术并且想要在这个领域有所作为,这篇文章将会是一个非常有价值的指南。这篇文章名为《大数据方向学习路线》,它是一份指导人们如何学习大数据领域的路线图。在当今数字时代,数据成为了企业决策的关键因素,因此大数据技术的需求也越来越高。这篇文章将为那些想要在大数据领域发展的人们提供一个清晰的学习路线图,帮助他们系统地学习大数据相关的技术和工具。文章从基础知识开始,逐步深入探讨了数据处理、数据分析、机器学习、人工智能等方面的技术,同时介绍了一些在实际应用中必不可少的工具和技巧。如果你想要深入了解大数据技术并且想要在这个领域有所作为,这篇文章将会是一个非常有价值的指南。0 185浏览会员免费
- 大数据平台-HDFS培训.pdf0 47浏览会员免费
- 基于hadoop的电商销售预测分析系统HDFS+MapReduce+springboot报告文档 源码:https://download.csdn.net/download/weixin_46115961/863388940 440浏览会员免费
- 数仓规范化—菜鸟数据模型管理实践 PDF0 68浏览会员免费
- 美团外卖数据仓库主要是收集各种用户终端业务、行为数据,通过统一口径加工处理,通过多种数据服务支撑主题报表、数据分析等多种方式的应用。数据组作为数据基础部门,支持用户端、商家端、销售、广告、算法等各个团队的数据需求。本文主要介绍美团外卖离线数仓的历史发展历程,在发展过程中碰到的痛点问题,以及针对痛点做的一系列优化解决方案0 155浏览会员免费
- 星环科技大数据产品解决方案0 38浏览会员免费
- 华为云 EI 解决方案-方案0 50浏览会员免费
- 11110 69浏览会员免费
- 1.本机已安装好 VMware Workstation Pro 虚拟机,及 Ubuntu 版本的 Linux 系统。 2.进行 Hadoop 伪分布式安装。 3.运行 Hadoop 自带的 WordCount 实例检测是否运行正常。0 263浏览会员免费
- CDH6.3.1版本离线部署,包含:集群初始化、JDK部署、MySQL离线部署、部署CM server和agent rpm0 111浏览会员免费
- 华为云大数据平台方案简介0 57浏览会员免费
- 2019年中国BI商业智能行业报告0 68浏览会员免费
- 阿里云大数据产品详细介绍0 159浏览会员免费
- 华为大数据中台架构解决方案分享0 202浏览会员免费
- 世上最权威项目管理资料0 46浏览会员免费
- 史上最佳数据资源目录建设规范0 816浏览会员免费
- 华为数据湖治理方案详解0 131浏览会员免费