apachekylin操作使用教程_麒麟系统命令大全资源-CSDN文库

3星 · 超过75%的资源需积分: 48 22 浏览量 2016-07-07 16:58:56 上传评论 4 收藏 1.35MB PDF 举报

Apache Kylin是一款开源的大数据分析平台，提供了对大数据集的在线分析处理（OLAP）功能。它能够运行在Hadoop集群之上，与Hive和HBase紧密集成，支持将Hive表中的数据构建成Cube，从而加速SQL查询响应，尤其适合于对海量数据的多维分析。在操作使用Kylin之前，需要了解的是Kylin依赖于Hadoop集群，同时需要安装Hive和HBase。由于Kylin的数据立方体构建是基于Hive中的事实表和维度表的，因此在使用Kylin之前，你的Hive中需要有数据表存在。文档中提到的使用教程主要步骤包括： 1. 新建工程：在Model界面中，通过点击左上角新建项目，输入项目名称和相关说明，这是构建cube的第一步。 2. 导入HIVE表格元数据：选择工程后，切换到datasource界面，从HIVE中导入需要用于构建cube的事实表和维度表。 3. Model创建：切换到Models界面，在这里需要创建Model，填写Model相关信息，并指定事实表和维度表。 4. Cube创建：基于Model进行Cube的创建，选择维度和度量（度量值一般与数值有关，比如销售额等），设置刷新时间，还可以进行高级设置。 5. 数据可视化：通过Insight界面，选择已创建好的工程，查看sql查询结果，并进行分类查询和可视化。为了使用Kylin，首先需要通过指定地址访问Kylin的Web管理界面。安装好Kylin后，可以通过访问***<服务器IP>:7070/kylin来进入管理界面。登录需要用户名和密码，默认为 ADMIN/KYLIN。登录后，用户可以看到已经建立好的cube和相关的model。在进行Cube的创建前，用户需要先进行模型的设计，即Model的创建。在Model创建阶段，用户要定义模型的元数据，包括表的关联、维度的定义以及度量的添加。在选择度量值时，应选择日期列作为度量值，这是因为Kylin在处理多维数据时需要一个时间维度来组织数据。在创建Cube时，用户需要基于刚才创建的Model选择需要构建的Cube，并填写相关信息。Cube构建包含维度和度量的选择，这些维度和度量应从Model中指定的表中获得。构建Cube时，用户还需要设置Cube的刷新时间，这涉及到数据更新的频率，通常保持默认即可，但也可以根据实际业务需求进行调整。用户还可以进行一些高级设置，比如调整存储参数以优化Cube的性能。 Cube创建完成后，用户可以监控Cube构建过程，包括查看构建状态和查看MapReduce的详细信息。构建状态通常显示为disabled，用户需要点击action进行构建。构建完成后，用户可以查看构建的结束时间和详细构建日志。在数据可视化方面，用户可以利用Kylin提供的Insight界面，对已创建的工程进行可视化操作。用户可以对数据进行SQL查询，并查看查询结果。Kylin还提供了SQL的可视化查询功能，能够帮助用户直观地进行数据分析和展示。文档还指出目前网络上关于Kylin的资料较少，本教程旨在弥补这一空缺，并以实际操作作为出发点，帮助用户逐步学习和深入理解Kylin的操作使用。在实际操作Kylin的过程中，随着对平台的熟悉，用户可以进一步探索Kylin的高级功能，以实现更高效的数据分析和处理。

资源推荐

资源详情

资源评论