带你读《Apache Kylin权威指南》之三:Cube优化
点击查看第一章点击查看第二章 第3章 Cube优化 Apache Kylin的核心思想是根据用户的数据模型和查询样式对数据进行预计算,并在查询时直接利用预计算结果返回查询结果。相比普通的大规模并行处理解决方案,Kylin具有响应时间快、查询时资源需求小、吞吐量大等优点。用户的数据模型包括维度、度量、...
Apache Kylin优化之—Cube的高级设置
随着维度数目的增加,Cuboid 的数量会爆炸式地增长。为了缓解 Cube 的构建压力,Apache Kylin 引入了一系列的高级设置,帮助用户筛选出真正需要的 Cuboid。这些高级设置包括聚合组(Aggregation Group)、联合维度(Joint Dimension)、层级维度(Hie...
Apache Kylin权威指南3.4 管理Cube碎片
3.4 管理Cube碎片 增量构建的Cube每天都可能会有新的增量。日积月累,这样的Cube中最终可能包含上百个Segment,这将会导致查询性能受到严重的影响,因为运行时的查询引擎需要聚合多个Segment的结果才能返回正确的查询结果。从存储引擎的角度来说,大量的Segment会带来大量的文件,这...
Apache Kylin权威指南3.2 设计增量Cube
3.2 设计增量Cube 3.2.1 设计增量Cube的前提 并非所有的Cube都适用于增量构建,Cube的定义必须包含一个时间维度,用来分割不同的Segment,我们将这样的维度称为分割时间列(Partition Date Column)。尽管由于历史原因该命名中存在“date”的字样,但是分割时...
Apache Kylin权威指南2.5 查询Cube
2.5 查询Cube 本节将简要介绍如何查询Cube。更多内容请参考后续的章节(如第5章)。 Cube构建好以后,状态变为“READY”,就可以进行查询了。Kylin的查询语言是标准SQL的SELECT语句,这是为了获得与大多数BI系统和工具无缝集成的可能性。通常的一个查询语句类似于如下的SQL: ...
Apache Kylin权威指南2.4 构建Cube
2.4 构建Cube 本节将快速介绍构建Cube相关的操作说明和设置,因受到篇幅的限制,许多具体内容无法深入展开,读者可以从后续的第3章和第4章中获得更详细的介绍。 新创建的Cube只有定义,而没有计算的数据,它的状态是“DISABLED”,是不会被查询引擎挑中的。要想让Cube有数据,还需要对它进...
Apache Kylin权威指南2.3 设计Cube
2.3 设计Cube 如果数据已经在Hive中准备好了,并且已经满足了2.2节中介绍的条件,那么就可以开始设计和创建Cube了。本节将按通常的步骤介绍Cube是如何进行创建的。 2.3.1 导入Hive表定义 登录Kylin的Web界面,创建新的或选择一个已有的项目之后,需要做的就是将Hive表的定...
Apache Kylin Cube 的构建过程
1、 Cube的物理模型 Cube物理模型 如上图所示,一个常用的3维立方体,包含:时间、地点、产品。假如data cell 中存放的是产量,则我们可以根据时间、地点、产品来确定产量,同时也可以根据时间、地点来确定所有产品的总产量等。 Apache K...
Apache Kylin Cube 的存储
简单的说Cuboid的维度会映射为HBase的Rowkey,Cuboid的指标会映射为HBase的Value。 Cube映射成HBase存储 如上图原始表所示:Hive表有两个维度列year和city,有一个指标列pric...
本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。
社区圈子
Apache cube相关内容
Apache您可能感兴趣
- Apache入门
- Apache tomcat
- Apache web
- Apache pdf
- Apache文本
- Apache mod_proxy
- Apache负载均衡
- Apache配置
- Apache svn
- Apache服务器
- Apache flink
- Apache rocketmq
- Apache安装
- Apache php
- Apache dubbo
- Apache linux
- Apache spark
- Apache开发
- Apache报错
- Apache服务
- Apache微服务
- Apache从入门到精通
- Apache hudi
- Apache doris
- Apache mysql
- Apache日志
- Apache kafka