迁移方案

分批迁移,在迁移重要作业之前,先迁移优先比较低的作业。甚至可以在条件允许的情况下,您可以继续运行原来的作业,将迁移过来的作业试运行,如果没有问题,再下掉原来的作业。迁移和运行作业 类型 描述 迁移Checkpoint文件 将Checkpoint...

OSS/OSS-HDFS概述

JindoData是阿里云开源大数据团队自研的数据湖存储加速套件,面向大数据和AI生态,为阿里云和业界主要数据湖存储系统提供全方位访问加速解决方案。JindoData套件基于统一架构和内核实现,主要包括 JindoFS 存储系统(原JindoFS Block模式)...

创建集群

Flink on Ack基于EMR on Ack底座与社区Flink Kubernetes Operator 1.0.1版本开发,默认使用Flink官方团队推出的企业版内核,旨在为用户提供开箱即用的Flink on K8s体验。Data Science:请参见 创建Data Science集群。产品版本 默认最新的...

Kerberos概述

在这种高安全级别的集群中,所有开源组件均采用Kerberos安全模式启动,确保只有经过Kerberos认证的客户端能够访问集群提供的服务(例如HDFS)。背景信息 集群开启Kerberos之后:客户端:可以对可信任的客户端提供认证,使得可信任客户端...

产品架构

从上图可以看出EMR由四部分组成:社区开源产品 集成Apache社区开源大数据组件,例如Hadoop、Hive和HBase,随着EMR版本更新,开源软件也会相应的升级,详情请参见 版本概述 下各版本的版本说明。注意 已经创建好的EMR集群不支持组件升级。...

OpenLDAP

OpenLDAP是LDAP协议(Lightweight Directory Access Protocol)的开源实现,在EMR集群中主要提供用户管理和身份认证的功能。服务集成OpenLDAP 在EMR集群中,Knox服务默认与OpenLDAP服务对接。当您通过EMR控制台的 访问链接与端口 功能访问...

EMR Studio概述

EMR Studio是E-MapReduce提供的开源大数据开发套件,包含Apache Zeppelin、Jupyter Notebook和Apache Airflow等开源组件。能够无缝关联EMR集群(EMR on ECS和EMR on ACK)的计算引擎提交任务,并提供了交互式开发、任务调度和任务监控等...

开源产品对比

开源产品同样可以实现分布式任务调度,本文介绍SchedulerX和开源产品的对比,帮助您更好的了解分布式任务调度和SchedulerX。产品名称 定时调度 工作流 分布式任务 白屏化任务治理 任务类型 报警监控 使用成本 Quartz Cron 不支持 不支持 ...

实践教程

针对各种业务需求,E-MapReduce提供相关的实践教程,您可以根据本文查看适合您业务的实践教程文档。EMR on ECS 手工缩容节点组 更换集群损坏的本地盘 为集群配置弹性伸缩...即席查询 数仓场景:增量数据实时统计 数仓场景:分钟准实时分析

Zeppelin常见问题

EMR Studio上的Zeppelin与开源版本一致吗?如何设置Zeppelin Note的权限?Zeppelin执行时无法正常启动Interpreter EMR Studio上的Zeppelin与开源版本一致吗?EMR Studio上的Zeppelin是增强版的Zeppelin,与开源版本不一致。E-MapReduce的...

相关的云服务

本文为您介绍典型场景下,使用开源大数据平台E-MapReduce时通常会使用到的其他云服务。云服务名称 说明 云服务器ECS 使用云服务器ECS(Elastic Compute Service)作为集群的节点,每个ECS实例集群中的一个节点。专有网络VPC 专有网络VPC...

支持倚天云服务器

阿里云E-MapReduce支持使用倚天云服务器构建开源大数据集群。适用客户 全网用户 新增功能/规格 阿里云E-MapReduce(简称EMR)支持使用倚天云服务器构建开源大数据集群。与现有X86架构实例体验完全相同的情况下,具有更高的性价比,帮助用户...

访问链接与端口

通过访问链接与端口功能,您可以方便地通过控制台方式访问集群中已安装开源组件Web UI的地址。本文将介绍如何设置安全组规则和访问链接,以便查看集群中开源组件的UI界面。前提条件 已创建E-MapReduce集群,详情请参见 创建集群。背景信息 ...

使用OpenAPI

本文为您介绍使用开源大数据平台E-MapReduce OpenAPI的基本信息。关于使用阿里云OpenAPI的详细介绍,请参见 使用OpenAPI。基本信息 版本说明 版本号 说明 2021-03-20 推荐使用。接入点说明 根据实例所在的地域,选择对应的服务接入点地址,...

Hive概述

Hive是一个基于Hadoop的数据仓库框架,在大数据业务场景中,主要用来...Hive语法 EMR产品最大程度的保持了开源社区的语法以及体验,在Hive语法上保持与开源社区Hive语法100%的兼容性。关于Apache Hive的更多介绍,请参见 Apache Hive官网。

Shell

开源Zeppelin相比,E-MapReduce(简称EMR)数据开发集群中的Shell解释器支持在不同EMR集群环境里切换。本文通过示例为您介绍如何在Zeppelin中使用Shell。使用示例 运行hadoop命令 执行如下命令会显示当前EMR集群根目录下的所有文件,切换...

查看账单

在 明细账单 页签中,设置查询 账期,并在列表中筛选产品为 开源大数据平台E-MapReduce,产品明细为 EMR StarRocks Serverless按量 或 EMR StarRocks Serverless包年包月。您还可以通过 统计项 和 统计周期 选择账单的展示内容。账单详细...

SUB_PROCESS

任务优先 流程运行的优先。支持以下级别:HIGHEST:最高。HIGH:高。MEDIUM(默认):中。LOW:低。LOWEST:最低。超时告警 该开关默认关闭。打开 超时告警 开关,勾选 超时告警、超时失败,当任务超过 超时时长 后,会发送告警邮件...

Flink DataStream参考

DataFlow集群的Flink DataStream API完全兼容开源的Flink版本,关于Flink DataStream API的详细信息,请参见 Flink DataStream API Programming Guide。上下游存储(Connector)开源Flink的上下游存储,请参见 DataStream Connectors。...

什么是EMR Notebook

兼容开源 EMR Notebook兼容开源Jupyter Notebook,您可以通过文件导入、导出的方式实现开发工具的自由切换,从而降低了使用门槛。产品功能 交互式编程环境 支持逐步执行SQL和Python代码,并根据运行结果调整后续代码。多种数据源类型 支持...

NodeAttributes

EMR 只支持普通安全组,不支持企业安全组。sg-hp3abbae8lb6lmb1*RamRole string ECS 访问资源绑定的角色。默认值:AliyunECSInstanceForEMRRole。AliyunECSInstanceForEMRRole KeyPairName string ECS ssh 登录密钥。emr_login ...

EMR Doctor概述

E-MapReduce Doctor(简称EMR Doctor)是E-MapReduce产品自研的面向开源大数据集群的智能运维诊断系统。通过EMR Doctor(即集群管理页面的“健康检查”功能)可以全局了解集群的健康状况和动态走势,为运维决策和资源优化提供有力的信息...

技术支持的范围和方式

阿里云E-MapReduce(简称EMR)是云原生开源大数据平台,能够为用户提供简单易集成的开源大数据解决方案。EMR on ECS集群主要构建于ECS之上,集群资源归属于用户,EMR提供基于该资源的半托管云服务能力,用户对集群拥有完全的管理操作权限,...

管理日志

E-Mapreduce(简称EMR)开源组件运行过程中会产生大量的日志。日志管理功能将EMR与日志服务SLS相结合,允许您在EMR控制台直接查询开源组件的日志。前提条件 已在EMR控制台上创建集群,具体操作请参见 创建集群。已开通SLS服务,具体操作请...

SWITCH

任务优先 流程运行的优先。支持以下级别:HIGHEST:最高。HIGH:高。MEDIUM(默认):中。LOW:低。LOWEST:最低。失败重试次数 工作流运行失败自动重试的次数。失败重试间隔 每次失败重试的间隔。单位:分。延时执行时间 任务延迟执行...

ApplicationConfig

名称 类型 描述 示例值 object 参数 配置 ApplicationName string 应用名称。从 EMR 控制台集群创建页面可查看到各 EMR 发行版的应用名称列表。HDFS ConfigFileName string ...NodeGroupId 参数优先高于 NodeGroupName。ng-869471354ecd*

Script

host 10.0.10.5-m 30 Priority integer 脚本执行优先。取值范围:1~100。1 NodeSelector NodeSelector 节点选择器。ExecutionMoment string 脚本的执行时机。取值范围:BEFORE_INSTALL:应用安装前。AFTER_STARTED:应用启动后。BEFORE_...

Flink Table Store概述

Flink Table Store是一个流批统一的湖存储格式,支持高吞吐的...支持秒数据新鲜度的批查询和OLAP查询。支持消费与产生增量数据,可作为传统与流式数仓的各级存储。关于Flink Table Store更多特性与用法,请参见 Apache Flink Table Store。

SQOOP

任务优先 是 流程运行的优先。支持以下级别:HIGHEST:最高。HIGH:高。MEDIUM(默认):中。LOW:低。LOWEST:最低。失败重试次数 否 工作流运行失败自动重试的次数。失败重试间隔 否 每次失败重试的间隔。单位:分。延时执行时间 否 ...

HTTP

任务优先 流程运行的优先。支持以下级别:HIGHEST:最高。HIGH:高。MEDIUM(默认):中。LOW:低。LOWEST:最低。失败重试次数 工作流运行失败自动重试的次数。失败重试间隔 每次失败重试的间隔。单位:分。延时执行时间 延时执行时间...

DEPENDENT

任务优先 流程运行的优先。支持以下级别:HIGHEST:最高。HIGH:高。MEDIUM(默认):中。LOW:低。LOWEST:最低。失败重试次数 工作流运行失败自动重试的次数。失败重试间隔 每次失败重试的间隔。单位:分钟。超时告警 该开关默认关闭...

EMR Serverless StarRocks服务等级协议更新

开源大数据平台E-MapReduce Serverless服务等级协议》已于2024年02月02日修订,并将于2024年03月01日生效。当前服务等级协议详情,请在 服务等级协议 中查看。变更生效时间 2024年03年01日 变更范围 EMR Serverless StarRocks(标准版)...

访问Web UI

访问开源组件的Web UI。单击上方的 访问链接与端口 页签。在 访问链接与端口 页面,单击服务所在行的链接,即可正常的访问Web UI页面。常见问题 问题描述:ACK集群未安装Ingress组件,该如何处理?解决方法:访问Web UI,需要ACK集群具备...

Impala Web UI

访问Impala Web UI 您可以通过SSH隧道和控制台两种方式访问Impala Web UI,详情请参见 通过SSH隧道方式访问开源组件Web UI 和 访问链接与端口。说明 使用Knox访问UI的前提条件是,Master节点必须具备公网IP地址,并且只允许对Catalogd和...

EMR Spark功能增强

阿里云E-MapReduce产品构建于阿里云云服务器ECS上,基于开源的Apache Hadoop和Apache Spark,做了大量优化。本文为您介绍E-MapReduce(简称EMR)Spark相对开源增强的功能。背景信息 阿里云EMR 100%采用社区开源组件,随开源版本升级迭代,...

Workflow商业化发布

EMR Workflow是一个全托管的工作流和任务调度服务,100%兼容开源Apache DolphinScheduler。它提供了易于使用的调度服务,您可以通过可视化的操作界面轻松地管理工作流和任务,高效构建数据仓库,并为生产任务的稳定运行提供保障。产品文档 ...

IMPALASHELL

任务优先 流程运行的优先。支持以下级别:HIGHEST:最高。HIGH:高。MEDIUM(默认):中。LOW:低。LOWEST:最低。失败重试次数 工作流运行失败自动重试的次数。失败重试间隔 每次失败重试的间隔。单位:分。延时执行时间 延时执行时间...

如何创建秒调度任务

任务适合对实时性要求比较高的业务,例如不停做轮询的准实时业务,通过内存网格和秒调度,可以让您不停地处理海量的数据。本文将以一个实例介绍如何创建秒调度任务。SchedulerX的秒级别任务属于定时调度类型,适用于简单Java任务、...

CONDITIONS

任务优先 流程运行的优先。支持以下级别:HIGHEST:最高。HIGH:高。MEDIUM(默认):中。LOW:低。LOWEST:最低。失败重试次数 工作流运行失败自动重试的次数。失败重试间隔 每次失败重试的间隔。单位:分。状态 上游节点的执行状态,...

访问JindoFS Web UI

前提条件 通过SSH隧道方式才能访问Web UI,详情请参见 通过SSH隧道方式访问开源组件Web UI。访问JindoFS Web UI 打通SSH隧道后,您可以访问JindoFS Web UI功能。JindoFS 3.1.x版本提供总览信息(Overview)、Namespace信息、存储节点信息...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
云数据库 RDS 检索分析服务 Elasticsearch版 域名 商标服务 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用