ClickHouse 技术分享
ClickHouse 技术分享 ClickHouse 是一个用于联机分析(OLAP)的列式数据库管理系统(DBMS),产生自 Yandex 公司的 Metrica 产品。 Metrica 是一款 Web 流量分析工具,根据用户行为数据采集,进行数据 OLAP 分析。数据采集的 Event 由页面的点击(click)产生,然后进入数据仓库进行 OLAP 分析。 ClickHouse 的特性: * 绝大多数是读请求 * 宽表,即每个表包含着大量的列 * 列式数据库特点:快 * 针对分析类查询,通常只需要读取表的一小部分列 * 数据总是打包成批量读取的,所以压缩是非常容易的 * 由于 I/O 的降低,这将帮助更多的数据被系统缓存 ClickHouse 的特点功能: * MergeTree 表引擎:支持数据分区,如果指定了分区键的话。在相同数据集和相同结果集的情况下 ClickHouse 中某些带分区的操作会比普通操作更快 * MergeTree 系列的引擎被设计用于插入极大量的数据到一张表当中 * 数据可以以数据片段的形式一个接着一个的快速写入,数据片段在后台按照一定的规则进行合并 * 相比在插入时不断修改(重写)已存储的数据,这种策略会高效很多 ClickHouse 的应用场景: * 需要进行大规模数据分析的场景 * 需要快速处理大量数据的场景 * 需要进行实时数据分析的场景 * 需要对数据进行多维度分析的场景 ClickHouse 的数据类型: * 基础类型:数值、字符串、时间 * 复合类型:Array 数组、Tuple 元组、Enum 枚举 * 特殊类型:Nullable,表示某个基础数据类型可以是 Null 值 ClickHouse 的性能比较: * ClickHouse 与 MySQL 性能比较快速上手 点击 House 的作者王行一对 ClickHouse 的技术分享,介绍了 ClickHouse 的技术特点、应用场景、数据类型等。
剩余13页未读,继续阅读
- 粉丝: 62
- 资源: 5
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- cd35f259ee4bbfe81357c1aa7f4434e6.mp3
- 机器学习金融反欺诈项目数据
- 虚拟串口VSPXD软件(支持64Bit)
- 多边形框架物体检测18-YOLO(v5至v11)、COCO、CreateML、TFRecord、VOC数据集合集.rar
- Python个人财务管理系统(Personal Finance Management System)
- 大数据硬核技能进阶 Spark3实战智能物业运营系统完结26章
- CHM助手:制作CHM联机帮助的插件使用手册
- SecureCRT.9.5.1.3272.v2.CN.zip
- 人大金仓(KingBase)备份还原文档
- 完结17章SpringBoot3+Vue3 开发高并发秒杀抢购系统