clickhouse_zh_官方中文文档 v21.10(ClickHouse v21.10, 2021-10-16).pdf
ClickHouse是一个专为在线分析(OLAP)设计的高性能列式数据库管理系统(DBMS)。相较于传统的行式数据库,如MySQL、Postgres和MS SQL Server,ClickHouse采用了列式存储方式,这种方式在处理大数据分析时展现出显著的优势。 在行式数据库中,数据按行存储,同一行内的所有数据物理上紧密相邻。但在列式数据库,如Vertica、Amazon Redshift、SAP HANA等,数据则是按列存储,每一列的数据被集中存储,这使得对某一列的查询能更快地读取和处理大量数据。 OLAP场景的关键特征包括: 1. 高度的读取需求,通常涉及大批量数据(>1000行),而非单行更新。 2. 数据一旦写入,通常不可修改,以支持高效读取。 3. 查询时往往需要提取大量行,但只是其中少数列。 4. 表结构宽,包含大量列,而查询频率相对较低。 5. 对简单查询的延迟容忍度较高(约50毫秒)。 6. 数据类型简单,如数字和短字符串。 7. 高吞吐量查询处理能力,每秒可处理数亿行。 8. 不强求事务处理和数据一致性。 9. 查询通常针对大型表,结果相对较小,常经过过滤或聚合。 列式数据库在OLAP场景中的优势: 1. 只读取所需列,减少I/O操作,提高效率。 2. 列式存储利于压缩,降低数据存储需求,进一步优化I/O。 3. 压缩数据可以更好地利用系统缓存,加快查询速度。 4. 解压速度快,即使面对高数据量,也能保持高速处理能力。 例如,查询广告平台ID的数量,列式存储允许快速解压并处理大量数据,使得单服务器可以处理每秒数十亿行的查询速度。这种性能在OLAP场景中远胜于传统OLTP或Key-Value数据库,如MongoDB和Redis。 ClickHouse v21.10的官方中文文档提供了关于其设计理念、优势和适用场景的详细信息,对于理解如何利用列式数据库进行大数据分析有着重要的指导价值。无论是开发者、数据分析师还是数据库管理员,都能从中获益,学习如何优化查询性能,提升数据分析效率。
剩余1215页未读,继续阅读
- 粉丝: 4
- 资源: 18
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- 基于ssh员工管理系统
- 5G SRM815模组原理框图.jpg
- T型3电平逆变器,lcl滤波器滤波器参数计算,半导体损耗计算,逆变电感参数设计损耗计算 mathcad格式输出,方便修改 同时支持plecs损耗仿真,基于plecs的闭环仿真,电压外环,电流内环
- 毒舌(解锁版).apk
- 显示HEX、S19、Bin、VBF等其他汽车制造商特定的文件格式
- 操作系统实验 Ucore lab5
- 8bit逐次逼近型SAR ADC电路设计成品 入门时期的第三款sarADC,适合新手学习等 包括电路文件和详细设计文档 smic0.18工艺,单端结构,3.3V供电 整体采样率500k,可实现基
- 操作系统实验 ucorelab4内核线程管理
- 脉冲注入法,持续注入,启动低速运行过程中注入,电感法,ipd,力矩保持,无霍尔无感方案,媲美有霍尔效果 bldc控制器方案,无刷电机 提供源码,原理图
- Matlab Simulink#直驱永磁风电机组并网仿真模型 基于永磁直驱式风机并网仿真模型 采用背靠背双PWM变流器,先整流,再逆变 不仅实现电机侧的有功、无功功率的解耦控制和转速调节,而且能实
评论1