Apache Kylin权威指南(第2版)
电子书推荐
-
Stream Processing with Apache Flink 评分:
Stream Processing with Apache Flink: Fundamentals, Implementation, and Operation of Streaming Applications 亚马逊最新的flink书籍, OREILLY出版社出版, epub格式原版 This book will teach you everything you need to know about stream processing with Apache Flink. It consists of 11 chapters that hopefully tell a coherent story. While some chapters are descriptive and aim to introduce high-level design concepts, others are more hands-on and contain many code examples.
上传时间:2019-04 大小:6.9MB
- 10.84MB
Stream Processing with Apache Flink.pdf
2019-08-21每天尽可能拿出40min进行翻译,希望年前可以译完。像锻炼一样,今年坚持做的其中一件事,做完了,相信也蛮酷的。翻译水平有限,同时也需要个人学习提升,因此,想可以为Flink添砖加瓦,贡献自己的一份力量。
- 10.58MB
《剑指大数据——Flink学习精要(Java版)》(最终修订版).pdf
2022-03-25《剑指大数据——Flink学习精要(Java版)》(最终修订版).pdf
- 509KB
Flink 欺诈识别项目代码
2023-10-19Flink 欺诈识别项目代码
- 1KB
实战Flink+Doris实时数仓
2023-06-21给大家分享一套课程——实战Flink+Doris实时数仓课程,附源码+文档+虚拟机。
- 2.9MB
2023大数据面试题,很全
2023-06-08此套面试题来自于各大厂的真实面试题及常问的知识点,如果能理解吃透这些问题, 你的大数据能力将会大大提升,进入大厂指日可待,包含Hadoop spark flink hive hbase kafka doris clickhouse
- 754B
基于Flink+FlinkCDC+FlinkSQL+Clickhouse构建实时数据仓库(2022新课,基于flink1.14)
2022-12-27《基于Flink+FlinkCDC+FlinkSQL+Clickhouse构建实时数据仓库》——本课程为大数据实时数仓项目实战课程,以大数据实时数仓项目为主线,理论和实战相结合,全方位、全流程、无死角讲解数仓项目的数仓基础、项目规划、需求分析、架构设计与技术选型、大数据平台构建、项目业务介绍、数据采集、数仓建模理论、数仓设计规范、数仓搭建、实时分析以及数据大屏制作。学完本课程,零基础的学员能入行大数据仓库工程师,有开发基础的学员也能快速积累项目实战经验
- 6.13MB
数据湖技术Iceberg的探索与实践.pdf
2021-01-19文章分享
- 1.33MB
Flink在字节跳动的实践.pdf
2019-01-02Flink在字节跳动的实践.pdf(公司:字节跳动职位:大数据工程师演讲者:邹丹)
- 152KB
Flink 流数据批量写入数据库
2023-12-26Flink常常存在将流数据写入数据库的场景,一般是通过继承RichSinkFunction来实现对数据的写入。如果sink之前不做优化处理,写入时都是单条写入。单条写入有许多弊端: 1、写入频繁造成数据库压力大 2、写入速度慢、效率低,造成反压 所以需要使用批量写入的方式,那如何实现呢?
- 2.46MB
实验8 Flink初级编程实践
2022-06-28实验内容与完成情况: 1. 使用IntelliJ IDEA工具开发WordCount程序 在Linux操作系统中安装IntelliJ IDEA,然后使用IntelliJ IDEA工具开发WordCount程序,并打包成JAR包,提交到Flink中运行。 安装Flink并启动: 安装maven: 使用IntelliJ IDEA写java: 使用maven打包JAR包 运行JAR包结果: 2. 数据流词频统计 使用Linux操作系统自带的NC程序模拟生成数据流,不断产生单词并发送出去。编写Fink程序对NC程序发来的单词进行实时处理,计算词频,并输出词频统计结果。要求首先在IntelliJ IDEA中开发和调试程序,然后打包成JAR包部署到Flink中运行。 使用IntelliJ IDEA写java: 运行NC并输入数据: 运行JAR包:
- 6.49MB
flink-connector-clickhouse-1.12.0.jar
2022-02-15flink 以connector形式连接clickhouse,资源稀缺,阿里云已经找不到了 id Int, age Int, sex Int, create_date Date ) WITH ( 'connector' = 'clickhouse', 'url' = 'jdbc:clickhouse://10.1.3.176:8123/test', 'table-name' = 'tb_user', 'username' = '', 'password' = '', 'format' = 'json' )
- 6.86MB
flink源码分析.pdf
2019-09-17flink源码解析文档分析,一起学习
- 15.66MB
flink学习资料(包含网盘视频地址)
2019-02-27该压缩包包含flink目前紧缺的高清PDF学习资料,以及网盘的资料地址,包含flink的学习视频
- 56.63MB
flink-shaded-hadoop-3-uber-3.1.1.7.1.1.0-565-9.0.jar
2020-11-16Flink-1.11.2与Hadoop3集成JAR包,放到flink安装包的lib目录下,可以避免Caused by: org.apache.flink.core.fs.UnsupportedFileSystemSchemeException: Hadoop is not in the classpath/dependencies.这个报错,实现Flink与Hadoop的集成
- 984B
Flink+ClickHouse构建用户画像平台(2020最新).rar
2020-12-11Flink+ClickHouse构建用户画像平台(2020最新),本课程采用Flink+ClickHouse技术架构实现我们的画像系统,通过学习完本课程可以节省你摸索的时间,节省企业成本,提高企业开发效率。 希望本课程对一些企业开发人员和对新技术栈有兴趣的伙伴有所帮助,如对我录制的教程内容有建议请及时交流。项目中采用到的算法包含Logistic Regression、Kmeans、TF-IDF等,Flink暂时支持的算法比较少,对于以上算法,本课程将手把手带大家用Flink实现,并且结合真实场景,学完即用。
- 193.43MB
dinky依赖flink1.14.6相关jar包
2023-05-25dinky依赖flink1.14.6相关jar包,包含mysql-cdc、doris驱动、jdbc、mysql-connector等: flink-doris-connector-1.14_2.12-1.1.1.jar、flink-sql-connector-mysql-cdc-2.1.1.jar、dlink-connector-jdbc-1.14-0.7.2.jar、mysql-connector-java-5.1.27-bin.jar、flink-faker-0.5.0.jar、flink-connector-jdbc_2.12-1.14.6.jar等基础jar包,下载后替换dinky/plugins/flink1.14即可
- 321.34MB
CDH6.3.2集成Flink1.12.2-parcel包(apache Flink-1.12.2-bin-scala_2.12.tgz)
2021-04-15源码编译制作的parcel包,linux+cdh6.3.2+scala2.12必然可用,内附文章的教程地址。
- 164.78MB
2020美赛数学建模C题参考思路及可用代码.7z
2020-03-082020美赛数学建模C题参考思路及可用代码2020美赛数学建模C题参考思路及可用代码2020美赛数学建模C题参考思路及可用代码2020美赛数学建模C题参考思路及可用代码2020美赛数学建模C题参考思路及可用代码2020美赛数学建模C题参考思路及可用代码2020美赛数学建模C题参考思路及可用代码2020美赛数学建模C题参考思路及可用代码2020美赛数学建模C题参考思路及可用代码
- 978B
基于Flink+FlinkCDC+FlinkSQL+Clickhouse构建实时数据仓库2022
2022-10-26分享一套flink实时数仓的课程——《基于Flink+FlinkCDC+FlinkSQL+Clickhouse构建实时数据仓库》,2022年10月完结的新课,课程基于flink1.14版本,视频+源码+课件+软件包,一起提供下载!
- 82.98MB
flink1.14.3 cdc jar包
2022-03-13flink-1.14.3 的所有flink cdc jar包,包含 oracle,mysql,postgres,sqlserver,mongodb
- 1.75MB
Flink 流批一体的技术架构以及在阿里 的实践.pdf
2019-10-24Apache Flink 在诞生之初就确立了使用同一个引擎支持多种计算形态的目标,包括流计算,批处理和机器学习等等。阿里巴巴在选择 Flink 作为新一代大数据引擎时也坚定不移的在贯彻这一目标。在我们的内部版本 Blink 中,我们使用了 SQL 作为流批一体的统一入口,并且在流计算和批处理上都做了大量的优化。流批一体也开始真正的发挥出了价值,在我们的搜索离线数据处理和机器学习平台上均获得了较好的效果。本演讲将分享 Blink 针对流批一体化的场景做了哪些优化,在支持实际业务上碰到了哪些问题,我们又是怎么解决的。
- 210B
基于Flink+FlinkCDC+FlinkSQL+Clickhouse构建实时数据仓库课程
2022-10-26基于Flink+FlinkCDC+FlinkSQL+Clickhouse构建实时数据仓库课程,2022年新课,flink1.14版本
- 195.19MB
flink1.14.6版本 lib目录依赖jar包
2023-05-25flink-connector-jdbc_2.12-1.14.6.jar、flink-doris-connector-1.14_2.12-1.1.1.jar、flink-sql-connector-mysql-cdc-2.2.1.jar、mysql-connector-java-5.1.27-bin.jar、flink-dist_2.12-1.14.6.jar、flink-faker-0.5.0.jar、flink-table_2.12-1.14.6.jar等等
- 41.86MB
Flink原理、实战与性能优化-高级进阶培训(小白请勿下载)
2023-06-07Flink原理、实战与性能优化-高级进阶培训(小白请勿下载) Apache Flink 是一个框架和分布式处理引擎,用于在无边界和有边界数据流上进行有状态的计算。Flink 能在所有常见集群环境中运行,并能以内存速度和任意规模进行计算。 Apache Flink 功能强大,支持开发和运行多种不同种类的应用程序。它的主要特性包括:批流一体化、精密的状态管理、事件时间支持以及精确一次的状态一致性保障等。Flink 不仅可以运行在包括 YARN、 Mesos、Kubernetes 在内的多种资源管理框架上,还支持在裸机集群上独立部署。在启用高可用选项的情况下,它不存在单点失效问题。事实证明,Flink 已经可以扩展到数千核心,其状态可以达到 TB 级别,且仍能保持高吞吐、低延迟的特性。世界各地有很多要求严苛的流处理应用都运行在 Flink 之上。
- 15.66MB
大数据实时计算系统实践Flink+Druid配套PPT
2019-01-28大数据实时计算系统实践Flink+Druid配套PPT
- 436KB
基于Flink和规则引擎的实时风控解决方案.pdf
2021-03-11基于Flink和规则引擎的实时风控解决方案.pdf
- 6.33MB
flink-connector-clickhouse.jar
2021-10-19flinkSQL clickhouse连接器
- 295KB
flink状态管理示例代码大全完整中文注释
2023-10-191.广播状态 2.checkpoint 3.键控状态 4.操作状态 5.查询状态 6.savepoint 7.状态后端 8.状态机