概述

Flink(VVR)是基于Apache Flink(以下简称Flink)开发的商业版,VVR引擎接口完全兼容Flink开源版本,且提供GeminiStateBackend等高增值功能,以提升作业性能及稳定性。背景信息 Flink核心是一个流式的数据流执行引擎,其针对数据流的分布...

释放集群

当集群不再使用时,您可以释放集群以删除对应的Namespace以及该Namespace下的所有软件服务,但不会释放实际的物理资源。本文为您介绍如何释放集群。前提条件 请确保待释放集群的状态是创建中、运行中或空闲中。操作步骤 登录 EMR on ACK。...

EMR Doctor概述

E-MapReduce Doctor(简称EMR Doctor)是E-MapReduce产品自研的面向开源大数据集群的智能运维诊断系统。通过EMR Doctor(即集群管理页面的“健康检查”功能)可以全局了解集群的健康状况和动态走势,为运维决策和资源优化提供有力的信息...

管理日志

E-Mapreduce(简称EMR)开源组件运行过程中会产生大量的日志。日志管理功能将EMR与日志服务SLS相结合,允许您在EMR控制台直接查询开源组件的日志。前提条件 已在EMR控制台上创建集群,具体操作请参见 创建集群。已开通SLS服务,具体操作请...

技术支持的范围和方式

阿里云E-MapReduce(简称EMR)是云原生开源大数据平台,能够为用户提供简单易集成的开源大数据解决方案。EMR on ECS集群主要构建于ECS之上,集群资源归属于用户,EMR提供基于该资源的半托管云服务能力,用户对集群拥有完全的管理操作权限,...

Paimon概述

目前阿里云开源大数据平台E-MapReduce常见的计算引擎(例如Flink、Spark、Hive或Trino)都与Paimon有着较为完善的集成度。您可以借助Apache Paimon快速地在HDFS或者云端OSS上构建自己的数据湖存储服务,并接入上述计算引擎实现数据湖的分析...

EMR Serverless StarRocks服务等级协议更新

开源大数据平台E-MapReduce Serverless服务等级协议》已于2024年02月02日修订,并将于2024年03月01日生效。当前服务等级协议详情,请在 服务等级协议 中查看。变更生效时间 2024年03年01日 变更范围 EMR Serverless StarRocks(标准版)...

访问Web UI

访问开源组件的Web UI。单击上方的 访问链接与端口 页签。在 访问链接与端口 页面,单击服务所在行的链接,即可正常的访问Web UI页面。常见问题 问题描述:ACK集群未安装Ingress组件,该如何处理?解决方法:访问Web UI,需要ACK集群具备...

Impala Web UI

访问Impala Web UI 您可以通过SSH隧道和控制台两种方式访问Impala Web UI,详情请参见 通过SSH隧道方式访问开源组件Web UI 和 访问链接与端口。说明 使用Knox访问UI的前提条件是,Master节点必须具备公网IP地址,并且只允许对Catalogd和...

Workflow商业化发布

EMR Workflow是一个全托管的工作流和任务调度服务,100%兼容开源Apache DolphinScheduler。它提供了易于使用的调度服务,您可以通过可视化的操作界面轻松地管理工作流和任务,高效构建数据仓库,并为生产任务的稳定运行提供保障。产品文档 ...

Trino概述

Trino(即原PrestoSQL)是一个开源的分布式SQL查询引擎,适用于交互式分析查询。EMR-3.44.0和EMR-5.10.0版本开始改用社区正式名称Trino,之前各版本控制台显示为Presto,内核其实是Trino,使用时请注意区分。基本特性 Trino使用Java语言...

什么是EMR Serverless Spark

高性能 基于Fusion Engine(Spark Native Engine),性能体验最高可达开源Spark的2倍。高扩展性 基于阿里云Serverless底座,提供资源弹性能力,满足ETL作业突发高峰的同时,进一步降低实际计算资源成本。高扩展性 提供资源和任务实例级别的可...

ScalingRule

名称 类型 描述 示例值 object 伸缩规则配置。RuleName string 规则名称。必填参数,不允许为空字符串。scalingByYarnMemory TriggerType string 伸缩规则类型。必填参数。取值范围:TIME_TRIGGER:按时间伸缩。METRICS_TRIGGER:按负载...

Flink(VVR)作业配置

EMR-3.27.x及之前版本使用Flink社区开源版本,EMR-3.27.x之后版本使用完全兼容开源Flink的企业版(VVR)。本文介绍如何配置Flink(VVR)类型的作业。背景信息 Flink企业版由Apache Flink创始团队官方出品,拥有全球统一商业化品牌。VVR提供...

Delta Lake概述

开源Delta Lake对比 EMR-Delta Lake丰富了开源Delta Lake的特性,例如对SQL和Optimize的支持等。下表列出了Delta Lake的基本特性,并对比EMR-Delta Lake与开源Delta Lake(0.6.1)。特性 EMR-Delta 开源Delta SQL ALTER CONVERT CREATE ...

CostOptimizedConfig

名称 类型 描述 示例值 object 成本优化模式配置。OnDemandBaseCapacity integer 按量实例个数的最小值。节点组所需要按量实例个数的最小值,取值范围:0~1000。当按量实例个数少于该值时,将优先创建按量实例。80 ...

什么是EMR on ACK

您可以将开源大数据服务部署在阿里云容器服务Kubernetes版(ACK)之上,利用ACK在服务部署和容器应用管理的优势,减少对底层集群资源的运维投入,以便于您可以更加专注大数据任务本身。形态对比 阿里云EMR提供on ECS和on ACK两种方式,以...

概述

JindoSDK:为EMR各种开源计算引擎提供统一的SDK,支持Java、C、C++和Python语言,提供多种访问和API接口,包括HCFS文件系统接口、POSIX接口和Table表格接口。工具集:提供相关的工具集,例如Jindo tool和迁移工具Jindo DistCp。各种...

滚动窗口

本文为您介绍如何使用Spark SQL流式处理中的滚动窗口函数。什么是滚动窗口 滚动窗口(TUMBLING)将每个元素分配到一个指定大小的窗口中。通常滚动窗口有一个固定的大小,并且不会出现重叠。例如,如果指定了一个5分钟大小的滚动窗口,无限...

滑动窗口

本文介绍如何使用Spark SQL流式处理中的滑动窗口函数。什么是滑动窗口 滑动窗口(HOPPING),也被称作Sliding Window。不同于滚动窗口,滑动窗口的窗口可以重叠。滑动窗口有windowDuration和slideDuration两个参数。windowDuration为窗口的...

Hadoop DistCp介绍

Hadoop DistCp和Jindo DistCp的区别 DistCp类型 功能 使用场景 Hadoop DistCp 开源Hadoop内置的DistCp工具,用于大型集群间或集群内数据的复制。HDFS到HDFS间的数据复制。Jindo DistCp JindoFS的数据迁移工具,支持OSS、OSS-HDFS服务、兼容...

概述

EMR-3.4.0及后续版本支持Kafka服务。创建Kafka集群 如果需要新建包含Kafka的集群,请登录E-MapReduce新版控制台创建DataFlow类型集群,创建集群详情请参见 创建DataFlow Kafka集群。本地盘Kafka集群 当在本地盘上部署Kafka服务时,您需要在...

Script

名称 类型 描述 示例值 object ScriptName string 脚本名称。必填。...可以包含中文、英文、数字、下划线(_)、或者短划线(-)脚本名-1 ScriptPath string 脚本所在 OSS 路径。必填。以 oss:/开头。oss:/bucket1/update_hosts.sh ScriptArgs...

产品概述

什么是E-MapReduce 开源大数据开发平台E-MapReduce(简称EMR),是运行在阿里云平台上的一种大数据处理的系统解决方案。EMR基于开源的Apache Hadoop和Apache Spark,让您可以方便地使用Hadoop和Spark生态系统中的其他周边系统分析和处理...

Presto概述

与EMR软件栈完美结合,支持DLF和OSS或OSS-HDFS。无需运维,EMR提供一站式服务。基本概念 数据模型 数据模型即数据的组织形式。Presto使用Catalog、Schema和Table三层结构来管理数据。Catalog:一个Catalog可以包含多个Schema,物理上指向...

基本概念

可用区之间内网互通,可用区内网络延时更。StarRocks实例 每一个创建的StarRocks集群(包括多台FE及多台BE节点)统称为一个StarRocks实例。FE(Frontend)FE是StarRocks的前端节点,负责管理元数据,管理客户端连接,进行查询规划,查询...

导出和导入服务配置

阿里云E-MapReduce(简称EMR)提供的导出服务配置...在 软件配置 的 高级设置 区域,打开 软件自定义配置 开关。复制导出的JSON格式服务配置中的内容到配置框中。单击 下一步:硬件配置,继续创建集群。创建集群的具体操作,请参见 创建集群。

产品简介

开源大数据开发平台E-MapReduce(简称EMR)是运行在阿里云平台上的一种大数据处理系统解决方案。EMR基于开源的Apache Hadoop和Apache Spark,让您可以方便地使用Hadoop和Spark生态系统中的其他周边系统分析和处理数据。EMR还可以与阿里云...

升级大版本

EMR Serverless StarRocks版本更新分为版本和大版本。大版本更新(例如,2.x升级到3.x)通常涉及较大规模的功能改进、新特性或架构变化等。您可以一键升级实例的版本,实现版本的无缝切换。前提条件 已创建StarRocks实例,详情请参见 ...

基本概念

本文介绍开源大数据平台E-MapReduce使用过程中遇到的常用名词的基本概念和简要描述。集群 E-MapReduce产品中的一个独立的机器组合,为上层业务提供一些基础的引擎服务。一个E-MapReduce集群是由一个或多个阿里云ECS实例组成的。ECS实例 在E...

EMR-3.28.x版本说明

更新内容 服务 变更点 Flink 已将开源Flink升级为企业版Ververica Platform,基于开源Flink 1.10深度定制,提供自研存储引擎Gemini等增值功能。Bigboot 升级至2.7.0版本。Delta 升级至0.6.0版本。解耦Delta与Spark代码。Spark 升级至2.4.5...

参数说明

本文介绍Hadoop代码中的参数。Hadoop代码中可使用如下参数配置。属性名 默认值 说明 fs.jfs.cache.oss-accessKeyId 无 访问OSS所需的AccessKey ID(可选)。fs.jfs.cache.oss-accessKeySecret 无 访问OSS所需的AccessKey Secret(可选)。...

SQL Editor

您可以直接在控制台上编写、运行和管理SQL查询语句,无需下载或安装任何本地客户端软件,极大地方便了数据分析师和开发人员对数据进行实时查询与分析。前提条件 已创建StarRocks实例,详情请参见 创建实例。进入SQL Editor 进入EMR ...

配置自定义软件

如果您需要调整这些服务的配置项,则可以在集群创建时使用软件自定义配置功能,以修改现有配置或添加新的配置项。使用限制 软件配置操作仅在集群创建时执行一次。操作步骤 登录 E-MapReduce控制台。在顶部菜单栏处,根据实际情况选择地域 ...

创建工作空间

工作空间类型说明 对比项 基础版 专业版 主要特点 100%兼容开源Spark。支持阿里云Fusion Engine(Spark Native Engine)。100%兼容开源Spark。支持阿里云Fusion Engine(Spark Native Engine)。内置Celeborn来增强Spark在计算过程中的...

EMR on ACK商业化公告

您可以将开源大数据服务部署在阿里云容器服务Kubernetes版(ACK)之上,利用ACK在服务部署和容器应用管理的优势,减少对底层集群资源的运维投入,以便于您可以更加专注大数据任务本身。收费标准 阿里云EMR on ACK正式商业化后,将根据集群...

开启数据盘加密

加密数据盘后,数据盘上的动态数据传输以及静态数据都会被加密。如果您的业务存在安全合规要求,则可以使用该功能。...创建集群时,您还需要对集群进行软件配置、硬件配置、基础配置和确认订单,配置详情请参见 创建集群。

E-MapReduce Serverless服务等级协议(SLA)

2023年6月1日起,E-MapReduce Serverless服务等级协议(SLA)生效。详情请参见 开源大数据平台E-MapReduce Serverless服务等级协议。

配置集群管理密码

说明 这些命令和软件包的具体使用方式可能因系统版本和配置而有所不同,建议您根据实际情况使用。单击 保存。在弹出的对话框中,输入 执行原因,单击 保存。重启Presto服务。单击上方的 服务详情 页签。在 组件列表 区域,单击 ...

克隆集群

集群创建后,您在EMR控制台修改的服务配置目前不会克隆到新集群,但创建集群时自定义软件配置中配置的参数,则会克隆最新的修改值到新集群。创建集群后,您手动在集群机器上修改的文件或内容,例如JAR包等,无法克隆到新集群。注意事项 在...
共有180条 < 1 2 3 4 ... 180 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
云数据库 RDS 微服务引擎 检索分析服务 Elasticsearch版 弹性公网IP 短信服务 人工智能平台 PAI
新人特惠 爆款特惠 最新活动 免费试用