apache kylin操作使用教程
Apache Kylin是一款开源的大数据分析平台,提供了对大数据集的在线分析处理(OLAP)功能。它能够运行在Hadoop集群之上,与Hive和HBase紧密集成,支持将Hive表中的数据构建成Cube,从而加速SQL查询响应,尤其适合于对海量数据的多维分析。 在操作使用Kylin之前,需要了解的是Kylin依赖于Hadoop集群,同时需要安装Hive和HBase。由于Kylin的数据立方体构建是基于Hive中的事实表和维度表的,因此在使用Kylin之前,你的Hive中需要有数据表存在。 文档中提到的使用教程主要步骤包括: 1. 新建工程:在Model界面中,通过点击左上角新建项目,输入项目名称和相关说明,这是构建cube的第一步。 2. 导入HIVE表格元数据:选择工程后,切换到datasource界面,从HIVE中导入需要用于构建cube的事实表和维度表。 3. Model创建:切换到Models界面,在这里需要创建Model,填写Model相关信息,并指定事实表和维度表。 4. Cube创建:基于Model进行Cube的创建,选择维度和度量(度量值一般与数值有关,比如销售额等),设置刷新时间,还可以进行高级设置。 5. 数据可视化:通过Insight界面,选择已创建好的工程,查看sql查询结果,并进行分类查询和可视化。 为了使用Kylin,首先需要通过指定地址访问Kylin的Web管理界面。安装好Kylin后,可以通过访问***<服务器IP>:7070/kylin来进入管理界面。登录需要用户名和密码,默认为 ADMIN/KYLIN。登录后,用户可以看到已经建立好的cube和相关的model。 在进行Cube的创建前,用户需要先进行模型的设计,即Model的创建。在Model创建阶段,用户要定义模型的元数据,包括表的关联、维度的定义以及度量的添加。在选择度量值时,应选择日期列作为度量值,这是因为Kylin在处理多维数据时需要一个时间维度来组织数据。 在创建Cube时,用户需要基于刚才创建的Model选择需要构建的Cube,并填写相关信息。Cube构建包含维度和度量的选择,这些维度和度量应从Model中指定的表中获得。构建Cube时,用户还需要设置Cube的刷新时间,这涉及到数据更新的频率,通常保持默认即可,但也可以根据实际业务需求进行调整。用户还可以进行一些高级设置,比如调整存储参数以优化Cube的性能。 Cube创建完成后,用户可以监控Cube构建过程,包括查看构建状态和查看MapReduce的详细信息。构建状态通常显示为disabled,用户需要点击action进行构建。构建完成后,用户可以查看构建的结束时间和详细构建日志。 在数据可视化方面,用户可以利用Kylin提供的Insight界面,对已创建的工程进行可视化操作。用户可以对数据进行SQL查询,并查看查询结果。Kylin还提供了SQL的可视化查询功能,能够帮助用户直观地进行数据分析和展示。 文档还指出目前网络上关于Kylin的资料较少,本教程旨在弥补这一空缺,并以实际操作作为出发点,帮助用户逐步学习和深入理解Kylin的操作使用。在实际操作Kylin的过程中,随着对平台的熟悉,用户可以进一步探索Kylin的高级功能,以实现更高效的数据分析和处理。
剩余11页未读,继续阅读
- 犀利的蛙2019-02-14不错的。。。。。。。。。。。。。
- a9202593102018-10-22谢谢 分享 还行吧
- fihser2017-03-15垃圾东西下载下来打不开wxkrain2019-07-01pdf都不开?建议看看自己的电脑
- jinm153388388052016-12-14好资源 谢谢
- 粉丝: 0
- 资源: 2
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助