Delta Lake数据湖 English Version
Delta Lake - The Definitive Guide 基于Delta Lake的湖仓一体的现代数据架构,主要包括常规的基本代码用例,历史审计和时间旅行管理,流批一体等原理讲解和使用代码样例讲解和分析
Delta Lake - The Definitive Guide 基于Delta Lake的湖仓一体的现代数据架构,主要包括常规的基本代码用例,历史审计和时间旅行管理,流批一体等原理讲解和使用代码样例讲解和分析
DataStage 可以从多个不同的业务系统中,从多个平台的数据源中抽取数据,完成转换和清洗,装载到各种系统里面。其中每步都可以在图形化工具里完成,同样可以灵活的被外部系统调度,提供专门的设计工具来设计转换规则和清洗规则等,实现了增量抽取、任务调度等多种复杂而实用的功能。其中简单的数据转换可以通过在界面上拖拉操作和调用一些 DataStage 预定义转换函数来实现,复杂转换可以通过编写脚本或结合其他语言的扩展来实现,并且 DataStage 提供调试环境,可以极大提高开发和调试抽取、转换程序的效率
是关于图数据库TigerGraph的基本操作,包括vertex、edge、graph的操作,而且还包含累加器、函数、GraphStudio的操作、图算法的应用等
本书是经典教程的全新改版,作者根据Python 3.0版本的种种变化,全面改写了书中内容,做到既能“瞻前”也能“顾后”。本书层次鲜明、结构严谨、内容翔实,特别是在最后几章,作者将前面讲述的内容应用到了10个引人入胜的项目中,并以模板的形式介绍了项目的开发过程。本书既适合初学者夯实基础,又能帮助Python程序员提升技能,即使是 Python方面的技术专家,也能从书里找到令你耳目一新的东西。
hadoop海量数据处理技术详解,包括hdfs、MapReduce、hive、sqoop等相关技术和伪代码,代码是使用python语言写的。
eclipse工具中配置svn插件得jar包,直接使用第三方的svnjar包方便大家配置svn插件,把svn包下的features/*和plugins/*分别复制到eclipse下的features和plugins路径下