E-MapReduce Serverless StarRocks 版
E-MapReduce Serverless StarRocks 版是阿里云提供的 Serverless StarRocks 全托管服务,提供高性能、全场景、极速统一的数据分析体验,具备开箱即用、弹性扩展、监控管理、慢 SQL 诊断分析等全生命周期能力。内核 100% 兼容 StarRocks,性能比传统 OLAP 引擎提升 3-5 倍,助力企业高效构建大数据应用。

产品优势

极速湖仓分析体验
全场景高性能
向量化执行引擎、SIMD 指令集、 CBO 优化器、全新 Pipeline 执行引擎,高效实时数据写入与更新,较传统 OLAP 性能提升 3~10 倍
OLAP 统一分析
一套系统解决多维分析、万级高并发查询、实时查询分析等场景,根据业务实时性要求统一管理数据仓库和数据湖,并提供多种数据模型
企业级运维及易用性
全托管免运维,极大降低运维成本及使用的复杂度,开箱即用,提供弹性伸缩、可视化监控运维、SQL Editor 及慢 SQL 分析等能力
兼容开源生态
兼容 MySQL 协议,兼容多种 BI 报表工具,与 DLF、Flink VVP、MaxCompute 等阿里云产品深度集成,与 OSS 集成构建存算分离架构

产品功能

构建企业级全托管免运维的云原生湖仓统一分析服务
极速统一 OLAP 分析
极速数据处理与分析采用 MPP(Massively Parallel Processing) 分布式执行框架、全面向量化执行引擎、基于代价的优化器(CBO),为用户提供了极速的任意维度 OLAP 分析和 ad-hoc 查询。
高性能实时业务查询采用实时可更新的列式存储引擎保证数据秒级更新可见,并提供智能的物化视图对查询加速,为用户提供实时的业务洞察。
全场景统一数据分析统一数据模型提供卓越的单表和多表查询性能。统一分析场景针对实时、离线、高并发、ad-hoc 等均能提供卓越性能。统一湖仓架构对接多种数据生态,支持联邦查询,可作为数据湖引擎的加速器,提供统一查询服务。
全托管分析平台
开箱即用开箱即用,分钟级交付实例。根据客户业务特点提供丰富的存储能力选择,包括云盘、本地盘、对象存储。提供企业级 SLA 保障,极大降低了集群运维的复杂度。
轻松易用的管控能力灵活易用的实例扩缩容、升降配、弹性伸缩等。提供贴合社区发布节奏的版本升级能力,无需为版本而担心。提供易用的配置管理、审计日志、省时省力的 StarRocks 产品迁移工具等能力。
全链路监控分钟级别的监控报表,针对 StarRocks 核心数十项 metrics 无间断采集,提供准确的实时监控告警。对集群概览、计算、存储及查询、导入等提供诊断分析报告,以优化集群到更加的健康状态。
企业级 StarRocks Manager 服务
可视化运维可视化的 StarRocks 实例管理控制台,使得实例的整体运维和管理更方便。
易用的数据查询分析支持可视化 SQL Editor 编辑器,随时进行查询分析。提供丰富的元数据的查询能力,支持用户安全及权限管理,导入任务管理。
慢查询分析支持慢 SQL 诊断分析能力,通过 Profile 分析轻松对语句进行优化。
超越开源版本的能力及生态集成
存算分离支持存储计算分离架构,免 AK 集成访问 OSS 对象存储,弹性可扩展的计算能力,支持高性能的热数据本地 Cache 缓存,在不损失查询性能的情况下极大的降低了存储成本。
数据湖分析可通过外表 External Catalog,轻松高效查询存储在 Apache Hive、Apache Iceberg、Apache Hudi、Delta Lake 等数据湖上的数据,无需数据迁移。并支持 Apache Paimon 构建 Streaming Lakehouse 实时湖仓架构。
丰富的云上生态集成兼容 MySQL 协议,兼容多种 BI 报表工具,与 DLF、Flink VVP、MaxCompute 等阿里云产品深度集成。

应用场景

OLAP 通用分析场景
湖仓分析场景
实时数据分析场景
OLAP 通用分析
针对企业的 GMV 分析、订单分析、物流运单、推荐系统、用户洞察等业务场景中的离线或者实时分析过程中,传统解决方案依靠不同的 OLAP 引擎来满足不同场景的需求,烟囱式搭建各自业务,运维难度非常大,开发人员费时费力。通过 EMR Serverless StarRocks,可以统一 OLAP 引擎分析,满足各类业务需求。
能够提供
统一 OLAP 引擎
统一 OLAP 引擎,满足各类分析需求
兼容 MySQL 协议
运维简单,兼容 MySQL 协议,可对接各类 BI 分析工具
相关产品
湖仓分析
近年来,湖仓融合架构被越来越多的企业所采用,但是构建湖仓融合架构也有很多问题。第一,如何统一湖仓的元数据和建表语句,让用户获得一个统一的数据目录和表结构;第二,如何完善湖仓的实时能力,来解决不同场景的实时性需求;第三,如何让湖仓架构能够有超过数仓的性能。EMR Serverless StarRocks 非常好的解决了湖仓架构遇到的难题。
能够提供
实时摄入
屏蔽了解底层数据源细节,异构数据源数据联合分析,实时和离先联合分析
查询加速
就近计算,表达式下推、聚合下推;分布式读取,数据源针对性优化;向量化解释 ORC、Parquet 格式、字典过滤、延迟物化等
性能提升
TPC-H,查询 Hive、同等条件,与 Presto(OR) 相比,性能提升3 倍+;使用 1/3 的 presto 资源就可以获得同样的性能体验
相关产品
实时数据分析
随着互联网以及很多行业线上业务的快速发展,数据时效性在企业运营中的重要性日益凸现。针对企业的实时分析场景,EMR Serverless StarRocks 在实时摄入、实时数据建模、实时数据分析等方面效果显著,结合 Flink、Kafka 等,为企业打造实时分析链路,助力企业业务实时化。
能够提供
实时摄入
直接订阅 Kafka 的数据,提供 Flink-connector,flink 直接写入,exactly-one;适配 Flink-CDC 捕捉 TP 数据更新,实时更新 StarRocks
实时数据建模
聚合表提供实时聚合的能力;强大的执行引擎、优化器保证了数据库实时建模
实时数据分析
生成的数据可以直接 Serving;实现实时、离线数据统一融合
实时更新
delete-and-Insert;读取时无主键 merage 开销;相比 merage-on-read(unique),性能提升 3-15 倍
相关产品

最佳实践

文档与工具