- spark大小:1MBHiveHBaseTableOutputFormat cannot be cast to org.apache.hadoop.hive.ql.io.HiveOutputFormat 问题的补丁,替换jars文件夹下的对应jar包即可,版本spark2.1HiveHBaseTableOutputFormat cannot be cast to org.apache.hadoop.hive.ql.io.HiveOutputFormat 问题的补丁,替换jars文件夹下的对应jar包即可,版本spark2.15 492浏览会员免费
- Apache大小:2MB关于学习 Spark 的部分,英文好点的话,跟着 Spark 官方文档的英文版走就行了。 如果英语不是很好,可以阅读下由 ApacheCN 组织翻译的 Spark 2.2.0 官方文档中文版。 从概述开始,然后编程指南的快速入门,Spark 编程指南,Spark streaming 一步一步往下走。 文档中附带了一些基础的案例,也附带了相应的代码,可用于基础性学习,一开始不要急着写代码,先看文档,一些基本的概念懂了之后,再开始试着慢慢的写代码,即可入门 。。。 当然,学习 Spark 时最好还是有一些前置技能比较好,比如使用过 Storm 之类的,就更容易上手了。 欢迎提出任何建议,更欢迎加入我们一起来学习,go far,go together.关于学习 Spark 的部分,英文好点的话,跟着 Spark 官方文档的英文版走就行了。 如果英语不是很好,可以阅读下由 ApacheCN 组织翻译的 Spark 2.2.0 官方文档中文版。 从概述开始,然后编程指南的快速入门,Spark 编程指南,Spark streaming 一步一步往下走。 文档中附带了一些基础的案例,也附带了相应的代码,可用于基础性学习,一开始不要急着写代码,先看文档,一些基本的概念懂了之后,再开始试着慢慢的写代码,即可入门 。。。 当然,学习 Spark 时最好还是有一些前置技能比较好,比如使用过 Storm 之类的,就更容易上手了。 欢迎提出任何建议,更欢迎加入我们一起来学习,go far,go together.4 178浏览会员免费
- spark大小:36MBspark的底层源码,版本2.1.1,可以解压后直接使用idea打开,特别注意:里面包含大量的maven依赖,初始加载时,时间较长。spark的底层源码,版本2.1.1,可以解压后直接使用idea打开,特别注意:里面包含大量的maven依赖,初始加载时,时间较长。5 322浏览会员免费
- scala大小:28MB搭建hadoop与spark集成环境所需的工具scala-2.11.12.tgz搭建hadoop与spark集成环境所需的工具scala-2.11.12.tgz1 243浏览会员免费
- python大小:9MB该项目是大三下学期的课程设计,选取了共541909条数据,以Python为编程语言,使用大数据框架Spark对数据进行了预处理,然后分别从多个方面对数据进行了分类和分析,并对分析结果进行可视化。里面包含我的课程设计报告和完整的代码。希望对你们有帮助。该项目是大三下学期的课程设计,选取了共541909条数据,以Python为编程语言,使用大数据框架Spark对数据进行了预处理,然后分别从多个方面对数据进行了分类和分析,并对分析结果进行可视化。里面包含我的课程设计报告和完整的代码。希望对你们有帮助。5 4574浏览¥ 20.90
- LOG大小:132MB这个是你所需要的日志数据,当你需要进行日志测试的时候可以用这个是你所需要的日志数据,当你需要进行日志测试的时候可以用0 416浏览会员免费
- Doris(原百度 Palo)是一款<strong>基于大规模并行处理技术的分布式 SQL 数据库</strong>,由百度在 2017 年开源,2018 年 8 月进入 Apache 孵化器。0 1148浏览会员免费
- idea插件大小:64MB在官网上下载太慢了,上传到CSDN,在这里下载,比国外网站要快很多,省了很多时间。在官网上下载太慢了,上传到CSDN,在这里下载,比国外网站要快很多,省了很多时间。5 1000浏览会员免费
- 大数据分析实战大小:75B上百节课详细讲解,需要的小伙伴自行百度网盘下载,链接见附件,永久有效。 课程介绍: 讲解一个真实的、复杂的大型企业级大数据项目,是Spark的大型项目实战课程。 通过本套课程的学习,可以积累大量Spark项目经验,迈入Spark高级开发行列。 课程特色: 1、项目中全面覆盖了Spark Core、Spark SQL和Spark Streaming这三个技术框架几乎全部的初级和高级的技术点和知识点, 让学员学以致用,通过一套课程,即掌握如何将Spark所有的技术点和知识点应用在真实的项目中,来实现业务需求! 2、项目中的4个功能横块,全郃是实际企业项目中提取出来的,并进行技术整合和改良过的功能模块.全都是企业级的复杂和真实的需求,业务模块非常之复杂,绝对不是市面上的Dem级别的大数据项目能够想比拟的,学习过后,真正帮助学员增加实际 企业级项目的实战经验。 3、项目中通过实际的功能模块和业务场景,以及讲师曾经开发过的处理十亿、甚至百亿以上数据级别的SparK作业的经验积累,贯穿讲解了大量的高级复杂的性能调优技术和知识、troubleshooting解决线上报错和故障的经验、高端的全方位数据倾斜处理和解决方案.真正帮助学员掌握高精尖的Spark技术! 4、项目中采用完全还原企业大数据项目开发场景的方式来讲解,每一个业务模块的讲解都包括了需求分析、方案设计、数据设计、编码实现、功能测试、性能调优等环节,真实还原企业级大数据项目开发场景。 模块简介: 1、用户访问session分析,该模块主要是对用户访问session进行统计分析.包括session的聚合指标计算、 按时间比例随机抽取session、获取每天点击、下单和购买排名前10的品类、并获取top10品类的点击量排名前10的session.该模块可以让产品经理、数据分析师以及企业管理层形象地看到各种条件下的具体用户行为以及统计指标.从而对公司的产品设计以及业务发展战略做出调整.主要使用Spark Core实现. 2、页面单跳转化率统计,该模块主要是计算关键页面之间的单步跳转转化率,涉及到页面切片算法以及页面流匹配算法.该模块可以让产品经理、数据分析师以及企业管理层看到各个关键页面之间的转化率.从而对网页布局,进行更好的优化设计。主要使用Spark Core实现. 3、热门商品离线统计,该模块主要实现每天统计出各个区域的top3热门商品.然后使用Oozie进行离线统计任务的定时调度,使用Zeppeline进行数据可视化的报表展示.该模块可以让企业管理层看到公司售卖的 商品的整体情况,从而对公司的商品相关的战略进行调螫.主要使用Spark SQL实现。 4、广告流量实时统计.该模块负责实时统计公司的广告流量.包括广告展现流量和广告点击流量,实现动态黑名单机制以及黑名单过滤,实现滑动窗口内的各城市的广告展现流立和广告点击流直的统计,实现 每个区域诲个广告的点击流置实时统计,实现每个区域top3点击量的广告的统计,主要使用Spark Streaming实现.上百节课详细讲解,需要的小伙伴自行百度网盘下载,链接见附件,永久有效。 课程介绍: 讲解一个真实的、复杂的大型企业级大数据项目,是Spark的大型项目实战课程。 通过本套课程的学习,可以积累大量Spark项目经验,迈入Spark高级开发行列。 课程特色: 1、项目中全面覆盖了Spark Core、Spark SQL和Spark Streaming这三个技术框架几乎全部的初级和高级的技术点和知识点, 让学员学以致用,通过一套课程,即掌握如何将Spark所有的技术点和知识点应用在真实的项目中,来实现业务需求! 2、项目中的4个功能横块,全郃是实际企业项目中提取出来的,并进行技术整合和改良过的功能模块.全都是企业级的复杂和真实的需求,业务模块非常之复杂,绝对不是市面上的Dem级别的大数据项目能够想比拟的,学习过后,真正帮助学员增加实际 企业级项目的实战经验。 3、项目中通过实际的功能模块和业务场景,以及讲师曾经开发过的处理十亿、甚至百亿以上数据级别的SparK作业的经验积累,贯穿讲解了大量的高级复杂的性能调优技术和知识、troubleshooting解决线上报错和故障的经验、高端的全方位数据倾斜处理和解决方案.真正帮助学员掌握高精尖的Spark技术! 4、项目中采用完全还原企业大数据项目开发场景的方式来讲解,每一个业务模块的讲解都包括了需求分析、方案设计、数据设计、编码实现、功能测试、性能调优等环节,真实还原企业级大数据项目开发场景。 模块简介: 1、用户访问session分析,该模块主要是对用户访问session进行统计分析.包括session的聚合指标计算、 按时间比例随机抽取session、获取每天点击、下单和购买排名前10的品类、并获取top10品类的点击量排名前10的session.该模块可以让产品经理、数据分析师以及企业管理层形象地看到各种条件下的具体用户行为以及统计指标.从而对公司的产品设计以及业务发展战略做出调整.主要使用Spark Core实现. 2、页面单跳转化率统计,该模块主要是计算关键页面之间的单步跳转转化率,涉及到页面切片算法以及页面流匹配算法.该模块可以让产品经理、数据分析师以及企业管理层看到各个关键页面之间的转化率.从而对网页布局,进行更好的优化设计。主要使用Spark Core实现. 3、热门商品离线统计,该模块主要实现每天统计出各个区域的top3热门商品.然后使用Oozie进行离线统计任务的定时调度,使用Zeppeline进行数据可视化的报表展示.该模块可以让企业管理层看到公司售卖的 商品的整体情况,从而对公司的商品相关的战略进行调螫.主要使用Spark SQL实现。 4、广告流量实时统计.该模块负责实时统计公司的广告流量.包括广告展现流量和广告点击流量,实现动态黑名单机制以及黑名单过滤,实现滑动窗口内的各城市的广告展现流立和广告点击流直的统计,实现 每个区域诲个广告的点击流置实时统计,实现每个区域top3点击量的广告的统计,主要使用Spark Streaming实现.5 4995浏览¥ 9.90
- Spark Structured Streaming的一些基本概念和工作原理4 699浏览会员免费
- 汽车之家大小:9MB因为要做一个项目,搞到了一份2018年汽车之家的,汽车车型配置200多个字段信息,1万多条车型信息,Excel文件。因为要做一个项目,搞到了一份2018年汽车之家的,汽车车型配置200多个字段信息,1万多条车型信息,Excel文件。5 210浏览会员免费
- spark;入门大小:1MB分享的spark简单的应用代码(入门级),使用IDEA开发的java与scala代码,与博客关联。分享的spark简单的应用代码(入门级),使用IDEA开发的java与scala代码,与博客关联。5 698浏览会员免费
- 掌握数据挖掘/机器学习技术的应⽤场景,从事量化策略⼯程师、量化策略分析师⽅向的必备图书5 454浏览会员免费
- spark大小:7MBSpark: The Definitive Guide: Big Data Processing Made Simple 英文高清pdf版,绝对好资源。Spark: The Definitive Guide: Big Data Processing Made Simple 英文高清pdf版,绝对好资源。0 248浏览会员免费
- spark配置大小:2KBspark2.3的配置文件log4j.properties,修改部分是为了只显示ERROR信息,隐藏INFO信息spark2.3的配置文件log4j.properties,修改部分是为了只显示ERROR信息,隐藏INFO信息5 2201浏览会员免费
- 用户画像大小:13KB大数据项目千面电商平台实战(用户画像)大数据项目千面电商平台实战(用户画像)0 650浏览会员免费
- 推荐系统大小:6MB关于推荐系统的资料,有实时推荐系统的介绍,还有一些论文(基于Storm的分布式在线推荐系统.pdf 基于混合算法的推荐系统的研究与实现.pdf 实时推荐系统.pdf)关于推荐系统的资料,有实时推荐系统的介绍,还有一些论文(基于Storm的分布式在线推荐系统.pdf 基于混合算法的推荐系统的研究与实现.pdf 实时推荐系统.pdf)5 137浏览会员免费
- IOS端是埋点技术方案,可落地实施的。包括整体概述、应用启动退出、页面浏览事件、控件点击事件、用户标志、数据采集数据同步存储等等技术知识点。1 1142浏览会员免费
- 手机基站数据大小:4KB手机基站数据,用于练习spark 实践,已经测试过,手机基站数据,用于练习spark 实践,已经测试过手机基站数据,用于练习spark 实践,已经测试过,手机基站数据,用于练习spark 实践,已经测试过2 1376浏览会员免费
- 讲解SparkContext的初始化、存储体系、任务提交与执行、计算引擎及部署模式的原理和源码分析5 143浏览会员免费
- pyspark大小:6MB最近在使用spark的过程中,发现自己对spark的包了解的不够,网上查也是这一点那一点的,所以自己整理的一张脑图,然后做了些实验,记录下来,上传到CSDN上需要的自取最近在使用spark的过程中,发现自己对spark的包了解的不够,网上查也是这一点那一点的,所以自己整理的一张脑图,然后做了些实验,记录下来,上传到CSDN上需要的自取0 339浏览会员免费
- 全国人口大小:39KB全国在第六次人口普查的数据,各身份分年龄、性别,格式为Excel。可用于数据分析。全国在第六次人口普查的数据,各身份分年龄、性别,格式为Excel。可用于数据分析。0 1123浏览会员免费
- GDP大小:2KB中国31个省级行政区域GDP数据地图热点图(暂时不包括港澳台).rar中国31个省级行政区域GDP数据地图热点图(暂时不包括港澳台).rar0 1723浏览会员免费
- spark-sql 基础理论教程。详细介绍了spark sql的工作原理。以及hive在spark上如何工作。0 1633浏览会员免费
- EXE大小:636KB微信加好友软件,走动添加好友,安全无病毒。最近更新微信加好友软件,走动添加好友,安全无病毒。最近更新1 1674浏览会员免费
- 大数据,处理平台构架设计说明书doc大数据处理平台构架设计说明书doc大数据处理平台构架设计说明书doc2 238浏览会员免费
- 大数据大小:103KBspark-streaming-flume_2.11-2.1.0.jarspark-streaming-flume_2.11-2.1.0.jar0 992浏览免费
- 本资源是《Spark大数据技术与应用》配套资源【完整版】,包含源数据和代码。 本书采用了以任务为导向的教学模式,按照解决实际任务的工作流程路线,逐步展开学习相关的理论知识点,推导生成可行的解决方案,最后落实在任务实现环节。全书大部分章节紧扣任务需求展开,不堆积知识点,着重于解决思路的启发与解决方案的实施。通过从任务需求到实现这一完整工作流程的体验,有助于读者对Spark大数据技术真正的理解与掌握。 如果分享链接失效,请留言告知,会及时补上。0 3993浏览会员免费
- spark大小:145MB搜狗实验室(用户查询日志)SogouQ.reduced,用于做大数据分析的数据搜狗实验室(用户查询日志)SogouQ.reduced,用于做大数据分析的数据4 1459浏览会员免费
- 经纬度查询大小:964KB经纬度批量查询工具经纬度批量查询工具经纬度批量查询工具经纬度批量查询工具经纬度批量查询工具经纬度批量查询工具经纬度批量查询工具经纬度批量查询工具1 2186浏览会员免费
- 电影数据集大小:5MB推荐系统常用的电影数据集,推荐系统常用的电影数据集。推荐系统常用的电影数据集,推荐系统常用的电影数据集。0 674浏览会员免费
- 大数据大小:2MBspark2.0官方文档。欢迎下载学习spark2.0官方文档。欢迎下载学习0 208浏览会员免费
- 1.Spark及其生态圈简介.pdf 2.Spark编译与部署(上)--基础环境搭建.pdf 2.Spark编译与部署(下)--Spark编译安装.pdf 2.Spark编译与部署(中)--Hadoop编译安装.pdf 3.Spark编程模型(上)--概念及SparkShell实战.pdf 3.Spark编程模型(下)--IDEA搭建及实战.pdf 4.Spark运行架构.pdf 5.Hive(上)--Hive介绍及部署.pdf 5.Hive(下)--Hive实战.pdf 6.SparkSQL(上)--SparkSQL简介.pdf 6.SparkSQL(下)--Spark实战应用.pdf 6.SparkSQL(中)--深入了解运行计划及调优.pdf 7.SparkStreaming(上)--SparkStreaming原理介绍.pdf 7.SparkStreaming(下)--SparkStreaming实战.pdf 8.SparkMLlib(上)--机器学习及SparkMLlib简介.pdf 8.SparkMLlib(下)--SparkMLlib实战.pdf 9.SparkGraphX介绍及实例.pdf 10.分布式内存文件系统Tachyon介绍及安装部署.pdf0 1271浏览会员免费
- Java大小:3MB使用Spark实现对一个文档中的每一行的单词进行词配对计数,要求去标点符号,将大写符号统一转化成为小写单词。使用Spark实现对一个文档中的每一行的单词进行词配对计数,要求去标点符号,将大写符号统一转化成为小写单词。2 589浏览会员免费
- Get acquainted with transformations and database-level interactions, and ensure the reliability of messages processed using StormImplement strategies to solve the challenges of real-time data processingLoad datasets, build queries, and make recommendations using Spark SQL0 321浏览会员免费
- Complete guide to automating Big Data solutions using Artificial Intelligence techniques0 147浏览会员免费
- 数据源大小:5MBspark机器学习电影推荐系统ml-100k.zip数据源spark机器学习电影推荐系统ml-100k.zip数据源0 372浏览会员免费
- DMP大小:186MBDMP项目的项目需求、介绍,计算逻辑,以及开发代码和源数据等,DMP项目的项目需求、介绍,计算逻辑,以及开发代码和源数据等,0 387浏览会员免费
- scala大小:33MB快学Scala pdf(含目录) scala 快速入门书箱 scala经典图书 Core Java作者最新力作 中文版 快学Scala Scala for the Impatient 中文版 [美]C S 霍斯曼 2012 电子工业出版社 非常感谢原制作者快学Scala pdf(含目录) scala 快速入门书箱 scala经典图书 Core Java作者最新力作 中文版 快学Scala Scala for the Impatient 中文版 [美]C S 霍斯曼 2012 电子工业出版社 非常感谢原制作者0 116浏览会员免费
- spark Streaming和structed streaming分析,理解整个 Spark Streaming 的模块划分和代码逻辑。0 1018浏览会员免费
- Effective scala ,scala 学习丛书 Effective scala ,scala 学习丛书0 95浏览会员免费
- 统计分析软件大小:26MB绝对有用,可支持各类数据的统计分析,亲测,绝对可行!!!!!!!!!绝对有用,可支持各类数据的统计分析,亲测,绝对可行!!!!!!!!!1 491浏览会员免费
- .Kubernetes.Cookbook. 英文版 .Kubernetes.Cookbook. 英文版5 109浏览会员免费
- spark大小:330MBspark-summit-north-america-2018-06全部PPT,下载。spark-summit-north-america-2018-06spark-summit-north-america-2018-06全部PPT,下载。spark-summit-north-america-2018-065 105浏览会员免费
- Spark源码大小:20MBspark源码,学习大数据的必备资料spark源码,学习大数据的必备资料4 112浏览会员免费
- 大数据大小:8MB城市公交数据源-在城市数据派中下载,包含南京、上海、深圳、天津、武汉、西安、重庆等城市的公交线路的数据源城市公交数据源-在城市数据派中下载,包含南京、上海、深圳、天津、武汉、西安、重庆等城市的公交线路的数据源0 494浏览会员免费
- 数据治理 资产盘点 监控质量标准。数据治理 资产盘点 监控质量标准 数据治理 资产盘点 监控质量标准4 747浏览会员免费
- Spark大小:33MB从sarifi离线保存打包而来,是2017年12月版本,应该很接近最后的发布版本了从sarifi离线保存打包而来,是2017年12月版本,应该很接近最后的发布版本了4 94浏览会员免费
- 亲手在Centos7上安装,所用软件列表 apache-flume-1.8.0-bin.tar.gz apache-phoenix-4.13.0-HBase-1.3-bin.tar.gz hadoop-2.7.4.tar.gz hbase-1.3.1-bin.tar.gz jdk-8u144-linux-x64.tar.gz kafka_2.12-1.0.0.tgz scala-2.12.4.tar.gz scala-2.12.4.tgz spark-2.2.0-bin-hadoop2.7.tgz spark-2.2.0.tgz zookeeper-3.4.11.tar.gz4 446浏览会员免费
- 大数据大小:150MBsparkspark0 899浏览免费
- Scala 之父第三版作品,英文版,写得比较深入浅出,强烈推荐!0 243浏览会员免费
- 自动识别和推荐有趣的可视化。该系统可以同时管理大规模的数据分析视图,协助用户发现众多视图中趋势相似的,或者趋势明显不同的视图。支持用户修改查询条件,调整被分析的属性,进行交互式的可视化分析。0 1514浏览会员免费
- 01Spark部署 02Spark编程模型(1) 03Spark运行架构(1) 04Spark SQL原理和实践(4) 05Spark Streaming原理和实践 06Spark 机器学习入门 07GraphX 入门0 814浏览会员免费
- 涛哥最新出品的体系化《用户画像综合项目教程》,涵盖用户画像技术架构设计、用户画像标签模型设计、各类事实标签、统计标签、模型标签、策略标签等的具体实现,包含idmapping,图计算spark graphx,朴素贝叶斯模型,评论文本NLP分析等各类算法 非常适合有一定大数据开发技术基础,但缺乏综合项目经验的同学学习5 395浏览会员免费
- spark大小:9MBspark高性能开发宝典spark高性能开发宝典5 84浏览会员免费
- Spark2.3即将发布,会带来哪些新特性及性能提高,尽在databricks超级大牛李老板呕心历血近60页文档,首发!首发!首发!(版权属于DataBricks和smilegator)。5 387浏览会员免费
- hbase大小:3KB使用spark读取hbase中的数据,并插入到mysql中使用spark读取hbase中的数据,并插入到mysql中0 2633浏览会员免费
- 大数据大小:3MBBig-Data-Landscape-2017-Matt-Turck-FirstMark(2017年大数据版图)Big-Data-Landscape-2017-Matt-Turck-FirstMark(2017年大数据版图)0 212浏览会员免费
- 本文26000字,囊括spark调优所有方面,所有方式,包括,资源分配,算子调优,JVM,Shuffle,troubleshooting,数据倾斜等等,以上大数据spark面试必问0 276浏览会员免费
- 最新azkaban大小:34MBazkaban3最新编译版本,已在服务器上测试,可以使用。azkaban3最新编译版本,已在服务器上测试,可以使用。1 577浏览会员免费