Apache Kudu 1.4.0 中文文档.pdf
Apache Kudu是一款为Apache Hadoop平台开发的列式存储管理器,它能够在商品硬件上运行,具备水平扩展性和高可用性。Kudu旨在解决在Hadoop生态系统中难以实现的应用需求,特别是对于那些需要快速处理OLAP工作、实时更新数据以及处理时间序列数据的应用场景。 Kudu的核心特性包括: 1. 高性能的列式存储,优化了OLAP操作的速度。 2. 与Hadoop生态系统中的其他组件,如MapReduce和Spark进行集成。 3. 紧密集成Apache Impala,为用户提供了一个与Apache Parquet在HDFS上协同使用的可变替代方案。 4. 强大而灵活的一致性模型,允许用户根据每个请求的一致性要求选择不同的选项,包括严格可序列化的一致性。 5. 支持同时运行顺序和随机工作负载,并保持高性能。 6. 使用Raft一致性算法确保Tablet Server和Master节点的高可用性。 7. 通过Cloudera Manager简化了Kudu的维护和管理任务。 Kudu的常见应用场景包括: - 实时更新的应用:新数据刚到达即可供终端用户使用访问。 - 时间序列数据应用:需要支持对海量历史数据的查询,同时快速返回细粒度查询结果。 - 实时预测模型:能够根据所有历史数据周期性地更新模型。 Kudu的安装和配置指南会介绍如何在你的Hadoop集群中部署和配置Kudu服务。此外,文档还会提供故障排除、后台维护任务、配置参考以及命令行工具的使用方法。 对于想要使用Kudu进行应用程序开发的用户,文档中会提供Schema Design(模式设计)、Security(安全)、Transaction Semantics(事务语义)等开发指南,以便用户更有效地使用Kudu来构建应用。 文档中还提到了Kudu与Apache Impala的集成特性,支持使用标准SQL语法创建、修改、删除表(CREATE/ALTER/DROP TABLE)。 为了促进知识的准确、高效和有效传递,文档的构建者进击的皇虫使用了书栈(***)平台。书栈提供文档编写、整理、归类等功能,以及文档内容的生成和导出工具。文档内容由网友编写和整理,因此书栈本身难以确认文档内容知识点是否有错漏。如果用户在阅读过程中发现内容不妥,应向文档提供者反馈。 文档中还提到了文档的开源和构建时间,为知识的传承献上一份力量,并鼓励用户在书栈(***)分享有价值的知识文档,共同推动知识的更新换代。
剩余92页未读,继续阅读
- 粉丝: 9
- 资源: 61
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助