目录
1. 项目概述 .............................................................................................................................. 4
1.1. 项目概述 ........................................................................................................................... 4
1.2. 建设目标 ........................................................................................................................... 5
2. 技术方案 .............................................................................................................................. 6
2.1. 设计原则 ........................................................................................................................... 6
2.2. 技术设计思路 ................................................................................................................... 7
2.3. 技术选型 ........................................................................................................................... 8
2.4. 物理架构设计 ................................................................................................................. 10
2.5. 关键技术 ......................................................................................................................... 11
2.5.1. 优化的列式存储和计算 ...................................................................................... 11
2.5.2. 行列混存 .............................................................................................................. 13
2.5.3. 主动压缩 .............................................................................................................. 15
2.5.4. 无共享大规模并行计算和可扩展性 .................................................................. 16
2.5.5. 分级存储 .............................................................................................................. 17
2.5.6. 自动优化设计 ...................................................................................................... 18
2.6. 高性能和稳定性 ............................................................................................................. 19
2.6.1. 高性能和高并发 .................................................................................................. 19
2.6.2. 高可用和稳定性 .................................................................................................. 19
2.6.3. 大规模集群和容错组 .......................................................................................... 21
2.7. 数据分析处理 ................................................................................................................. 22
2.7.1. 混合存储和实时分析 .......................................................................................... 22
2.7.2. 大数据实时聚合 .................................................................................................. 23
2.7.3. 混合负载 .............................................................................................................. 24
2.7.4. 强大的库内分析挖掘 .......................................................................................... 25
2.7.5. 结构化和非结构化融合分析 .............................................................................. 25
2.8. 开发和扩展能力 ............................................................................................................. 27
2.8.1. SDK和分析扩展 ................................................................................................... 27
2.8.2. 系统扩展性 .......................................................................................................... 28
2.9. 数据库安全 ..................................................................................................................... 28
2.9.1. 数据加密和访问控制 .......................................................................................... 28
2.9.2. 多租户和沙箱 ...................................................................................................... 28
2.9.3. 数据备份与恢复 .................................................................................................. 29
2.10. 监控和管理 ................................................................................................................... 30
2.10.1. 部署的灵活性 .................................................................................................... 30
2.10.2. 基于 HTML5 的图形化管理监控 ...................................................................... 30
2.11. 产品管理和升级 ........................................................................................................... 31
2.12. 系统集成 ....................................................................................................................... 32
2.12.1. Hadoop 集成 ....................................................................................................... 32
2.12.2. Spark 集成 ........................................................................................................... 35
2.12.3. Kafka 集成 ........................................................................................................... 37
2.12.4. Informatica 集成 ................................................................................................. 39
2.12.5. Tableau 集成 ....................................................................................................... 46