Flink+Hologres搭建实时数仓

本方案将Hologres与Flink深度集成，提供一体化的实时数仓联合解决方案，实现了数仓分层之间实时数据的高效流动，解决实时数仓分层问题。本方案能够支撑实时推荐、实时风控等多种实时数仓应用场景，满足企业的实时分析需求，具有中间层数据可查、支持数仓分层复用和架构简单等优势。

通过Flink将数据源写入Hologres，形成ODS层。Flink订阅ODS层的Binlog进行加工，形成DWD层再次写入Hologres。Flink订阅DWD层的Binlog，通过计算形成DWS层，再次写入Hologres。最后由Hologres对外提供应用查询。

解决问题：中间层不易查

Hologres的每一层数据都支持高效更新与修正、写入即可查，解决了传统实时数仓解决方案的中间层数据不易查、不易更新、不易修正的问题。

解决问题：数据不可复用

Hologres的每一层数据都可单独对外提供服务，使得数据可以高效复用，真正实现数仓分层复用的目标。

解决问题：链路复杂，架构冗余

实时ETL链路均基于Flink SQL实现；ODS层、DWD层和DWS层的数据统一存储在Hologres中，可以降低架构复杂度，提高数据处理效率。

高性能

Hologres与Flink原生深度集成，通过内置连接器，支持源表、结果表、维度表多种场景，支持宽表Merge、局部更新等操作，支持海量数据高性能的实时写入与更新，数据写入即可查询。

高可用

Hologres提供了主从多实例部署方式或计算组实例实现资源强隔离，写入、读取、分析等作业之间互不干扰，从而保证Flink对Hologres Binlog的数据拉取不影响线上服务。

低运维

全链路通过Flink和Hologres完成，实时ETL链路通过Flink SQL实现，数据统一存储在Hologres，Hologres提供对外提供在线服务和OLAP查询，每层数据可复用、可查，只需一套系统就能满足业务需求，降低运维压力和运维成本。

实时报表查询

支持各个业务方快速查询交易数据、行为数据、用户画像标签等报表。

实时推荐

基于实时用户行为数据，分析用户行为和兴趣，为用户提供针对性的推荐。

实时推荐

通过对业务数据进行实时处理和分析，实现对业务的实时监控，及时发现业务异常和问题。

01准备资源

这一步骤将帮助您完成所需资源的创建，包括RDS实例、Hologres实例和Flink工作空间。

02搭建实时数仓

这一步骤将引导您完成实时数仓的搭建。

03数据探查及应用

此方案的每一层数据都实现了持久化，这一步骤将进行中间数据探查，以及简单的实时报表应用场景查询。

04清理资源

完成教程学习后，你可以将模拟环境的资源释放掉，避免产生额外的费用。