概述

应用场景 实时数据分析是Apache Druid最典型的使用场景。该场景涵盖的面很广,例如:实时指标监控 推荐模型 广告平台 搜索模型 Apache Druid架构 Apache Druid拥有优秀的架构设计,多个组件协同工作,共同完成数据从摄取到索引、存储和查询...

E-MapReduce本地盘实例大规模数据集测试

需要将线下自建大数据集群迁移到阿里云云上E-MapReduce+本地盘进行大数据分析和性能对比测试的用户。最佳实践概述 为了满足大数据场景下的存储需求,阿里云在云上推出了本地盘D1机型。本地盘D1机型使用本地盘而非云盘作为存储,解决了之前...

EMR包年包月优惠活动到期公告

2023年4月1日至2024年3月31日期间,为进一步帮助EMR老用户平滑过渡到EMR新平台,EMR老用户 新购*和 续费 数据湖(DataLake)、数据分析(OLAP)、实时数据流(DataFlow)、数据服务(DataServing)、自定义集群(Custom)等新集群类型,EMR...

Loghub数据

本文介绍如何使用Loghub数据源进行数据分析或者交互式开发。建表语法 CREATE TABLE tbName(columnName dataType[,columnName dataType]*)USING loghub OPTIONS(propertyName=propertyValue[,propertyName=propertyValue]*);Table Schema ...

API概览

GetDoctorHDFSDirectory 获取HDFS特定目录分析结果 通过EMR Doctor获取集群HDFS特定目录数据分析结果,目录不超过5级。ListDoctorJobsStats 批量获取任务运行汇总数据 通过EMR Doctor批量获取任务基本运行汇总信息。ListDoctorReports 批量...

低成本历史库

大数据生态 无缝对接Spark、Hive、Flink、Presto等开源大数据生态产品,支持API访问和文件读取等多种对接方式,简单高效满足用户海量数据分析需求。典型应用 用户交易记录通过App写入MySQL,LTS将MySQL中实时同步到Lindorm,近三个月状态...

Lindorm实时入湖建仓分析

在 SQL执行 页面,系统已经选中了目标库,您可以直接输入SQL语句进行数据分析。Lindorm与DLA的字段类型转换表 目前支持的字段类型转换如下。Lindorm字段类型 DLA字段类型 long、usigned_long、short、unsigned_short、int、unsigned_...

低成本RDS历史库

大数据生态 无缝对接Spark、Hive、Flink、Presto等开源大数据生态产品,支持API访问和文件读取等多种对接方式,简单高效满足用户海量数据分析需求。典型应用 用户交易记录通过App写入MySQL,LTS将MySQL中实时同步到Lindorm,近三个月状态...

应用场景:低成本历史库

大数据生态 无缝对接Spark、Hive、Flink、Presto等开源大数据生态产品,支持API访问和文件读取等多种对接方式,简单高效满足用户海量数据分析需求。典型应用 用户交易记录通过APP写入MySQL,LTS将MySQL中实时同步到Lindorm,近三个月状态...

Kafka实时入湖建仓分析

在 SQL执行 页面,系统已经选中了目标库,您可以直接输入SQL语句进行数据分析。(可选)OSS数据存储管理。在 湖仓列表 页签单击 存储路径 下的OSS路径链接。在OSS控制台查看已经从Kafka数据源同步过来的库表路径以及表文件。数据库路径:/...

为RAM用户授权

在E-MapReduce中,RAM的典型使用场景如下:用户:如果您购买了多台E-MapReduce集群实例,您的组织里有多个用户(如运维、开发或数据分析)需要使用这些实例,您可以创建一个策略允许部分用户使用这些实例。避免了将同一个AccessKey泄露给...

为RAM用户授权

在EMR Serverless StarRocks中,RAM的典型使用场景如下:用户:如果您购买了EMR Serverless StarRocks实例,您的组织里有多个用户(例如运维、开发或数据分析)需要使用这些实例,您可以创建一个策略允许部分用户使用这些实例。避免将同...

HBase数据

本文介绍如何使用HBase数据源进行数据分析或者交互式开发。建表语法 CREATE TABLE tbName USING hbase OPTIONS(propertyName=propertyValue[,propertyName=propertyValue]*);Table Schema 创建HBase表时,无需显式地定义表的字段信息,示例...

TableStore数据

本文介绍如何使用TableStore数据源进行数据分析或者交互式开发。建表语法 CREATE TABLE tbName USING tablestore OPTIONS(propertyName=propertyValue[,propertyName=propertyValue]*);Table Schema 创建TableStore表时,无需显式定义表的...

管理尽力交付

前提条件 已创建数据湖(DataLake)、数据分析(OLAP)、实时数据流(DataFlow)、数据服务(DataServing)、机器学习(Data Science)或自定义集群(Custom),详情请参见 创建集群。使用限制 手动扩容场景:仅按量付费类型的节点组,支持...

管理工作空间

工作空间管理员可以加入成员至工作空间,并赋予工作空间管理员、数据分析、数据开发或访客角色,以实现多角色协同工作。本文为您介绍工作空间的基本操作。前提条件 已开通数据湖构建DLF并创建数据目录,详情请参见 快速入门 和 数据目录。...

Druid数据

本文介绍如何使用Druid数据源进行数据分析或者交互式开发。建表语法 create table tbName using druid options(propertyKey=propertyValue[,propertyKey=propertyValue]*);Table Schema 创建Druid数据表时,无需显式地定义表的字段信息,...

冷热分层

在数据湖架构设计中,通常会应用HTAP(Hybrid Transaction and Analytical Process)体系结构,通过合理地选择分层存储组件和计算引擎,既能支持海量数据分析和快速的事务更新写入,又能有效地降低冷热数据分离的成本。更多介绍请参见 结构...

Spark Shell和RDD基础操作

启动Spark Shell Spark的Shell作为一个强大的交互式数据分析工具,提供了一个简单的方式学习API。Spark既可以使用Scala,也可以使用Python。您可以按照以下操作步骤来启动Spark Shell。通过SSH方式连接集群,详情请参见 登录集群。执行以下...

Kafka数据

本文介绍如何使用Kafka数据源进行数据分析或者交互式开发。建表语法 CREATE TABLE tbName[(columnName dataType[,columnName dataType]*)]USING kafka OPTIONS(propertyName=propertyValue[,propertyName=propertyValue]*);配置参数说明 ...

快速入门

MySQL快速入门 SQL Server快速入门 PostgreSQL快速入门 MariaDB快速入门 数据库引擎 以下是对四种数据库引擎的介绍:云数据库RDS MySQL MySQL是全球受欢迎的开源数据库之一,作为开源软件组合LAMP(Linux+Apache+MySQL+Perl/PHP/Python)中...

图扑案例

如图3所示,阿里 云原生多模数据库 Lindorm 在云端单实例融合了宽表、索引、时序等多种数据引擎能力,通过阿里云DTS/DMS或第三方开源数据交换/ETL软件(如Apache nifi、Sqoop等)打通多引擎数据交互通道,根据应用场景业务来适配数据。...

EMR Studio概述

覆盖了大数据处理ETL、交互式数据分析、机器学习和实时计算等多种应用场景。EMR Studio核心优势 优势 描述 兼容开源 EMR Studio提供深度优化的开源组件使用体验,100%兼容开源大数据生态。您无需修改任务代码,即可平滑迁移上云。通过EMR ...

Trino概述

应用场景 Trino是定位在数据仓库和数据分析业务的分布式SQL引擎,适合以下应用场景:ETL Ad-Hoc查询 海量结构化数据或半结构化数据分析 海量多维数据聚合或报表分析 重要 Trino是一个数仓类产品,因为其对事务支持有限,所以不适合在线业务...

自研内核

AliPG PostgreSQL(简称PG)是一款全球流行的企业级开源数据库,被业界誉为“最先进的开源数据库”。AliPG兼容PostgreSQL开源数据库,于2015年正式商用,目前支持10及以上的大版本,已稳定运行多年,支撑了大量阿里巴巴集团内部以及云上的...

管理LDAP认证

EMR-5.11.0及之前版本,EMR-3.45.0及之前版本 重要 如果您的EMR版本较低,没有相应的LDAP认证配置按钮,则需要参考开源软件的社区文档进行手动配置,以启用LDAP认证功能。在 组件列表 区域,选择 SparkThriftServer 操作列的>enableLDAP。...

Presto概述

应用场景 Presto是定位在数据仓库和数据分析业务的分布式SQL引擎,适合以下应用场景:ETL Ad-Hoc查询 海量结构化数据或半结构化数据分析 海量多维数据聚合或报表分析 重要 Presto是一个数仓类产品,因为其对事务支持有限,所以不适合在线...

SQL Editor

您可以直接在控制台上编写、运行和管理SQL查询语句,无需下载或安装任何本地客户端软件,极大地方便了数据分析师和开发人员对数据进行实时查询与分析。前提条件 已创建StarRocks实例,详情请参见 创建实例。进入SQL Editor 进入EMR ...

概述

Flume最终会将数据落地到实时计算平台(例如Flink、Spark Streaming和Storm)、离线计算平台上(例如MR、Hive和Presto),也可仅落地到数据存储系统中(例如HDFS、OSS、Kafka和Elasticsearch),为后续分析数据和清洗数据做准备。...

快速使用EMR StarRocks Manager

EMR StarRocks Manager是阿里云EMR团队针对Serverless StarRocks实例提供的数据管理控制台,为您提供对实例内数据的管理、诊断与分析,以及安全权限配置等能力。前提条件 已创建StarRocks实例,详情请参见 创建实例。操作流程 步骤一:进入...

管理健康报告

该健康报告提供了前一天(T+1)的数据,并包括SQL查询、表分析和导入任务三个核心部分。查看健康报告 进入EMR Serverless StarRocks实例列表页面。登录 E-MapReduce控制台。在左侧导航栏,选择 EMR Serverless>StarRocks。在顶部菜单栏处,...

管理审计日志

StarRocks将所有审计日志存储在本地文件 fe/log/fe.audit.log 中,并且这些日志无法通过系统内部数据库访问。启用审计日志功能将安装AuditLoader插件,该插件能够从本地文件中读取日志,并通过HTTP PUT方法将其导入StarRocks数据库,方便您...

什么是EMR on ECS

EMR on ECS将EMR的大数据处理功能与ECS的容器化部署优势相结合,使得您可以更加灵活地配置和管理EMR集群,从而更好地适应复杂的数据处理和分析场景。通过EMR on ECS,您可以快速创建、管理和运维EMR集群,同时也能够更加高效地使用计算和...

产品优势

提高开源组织版本管理效率,快速支持业务创新 更多开源软件支持 更高软件版本支持 覆盖从边缘到AI全场景 企业级的服务支持,降低运维成本,缩短故障处理时间 来自阿里云和Cloudera的7*24小时大数据专家服务支持 快速定位使用中遇到的问题,...

发展历程

产品荣誉 年份 产品荣誉 2023年 进入Gartner云数据库、数据分析第一象限Leader象限。2022年 自研一体化大数据计算平台和数据仓库产品ODPS获世界互联网领先科技成果奖。在TPCx-BB 100TB标准测试中,连续6次获得全球冠军,保持性能和性价比第...

StarRocks概述

集群规模可以灵活伸缩,支持10 PB级别的数据分析。支持MPP框架,并行加速计算。支持多副本,具有弹性容错能力。说明 本文部分内容来源于开源StarRocks的 什么是StarRocks。StarRocks特性 StarRocks的架构设计融合了MPP数据库,以及分布式...

Serverless Spark概述

DLA Spark基于云原生架构,提供面向数据湖场景的数据分析和计算功能。开通DLA服务后,您只需简单的配置,就可以提交Spark作业,无需关心Spark集群部署。重要 云原生数据湖分析(DLA)产品已退市,云原生数据仓库 AnalyticDB MySQL 版 湖仓...

数据上云工具

具体示例请参见 Logstash+DataHub+MaxCompute和StreamCompute 进行实时数据分析。OGG(DataHub通道系列)OGG的DataHub插件可以支持将Oracle数据库的数据实时地以增量方式同步到DataHub中,并最终归档到MaxCompute表中。详情请参见 基于OGG ...

什么是MaxCompute

MaxCompute是适用于数据分析场景的企业级SaaS(Software as a Service)模式云数据仓库,以Serverless架构提供快速、全托管的在线数据仓库服务,消除了传统数据平台在资源扩展性和弹性方面的限制,最小化用户运维投入,使您可以经济并高效...

功能特性

查看作业列表 EMR Serverless 功能集 功能 功能描述 参考文档 Serverless StarRocks 实例管理 通过创建StarRocks实例,您可以快速获取一个托管的且高性能的环境,无需自行搭建和维护基础设施,轻松进行大规模数据分析和查询。创建实例 扩缩...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
数据库备份 云数据库 RDS 检索分析服务 Elasticsearch版 弹性公网IP 短信服务 人工智能平台 PAI
新人特惠 爆款特惠 最新活动 免费试用