EMR Spark功能增强

阿里云E-MapReduce产品构建于阿里云云服务器ECS上,基于开源的Apache Hadoop和Apache Spark,做了大量优化。本文为您介绍E-MapReduce(简称EMR)Spark相对开源增强的功能。背景信息 阿里云EMR 100%采用社区开源组件,随开源版本升级迭代,...

Workflow商业化发布

EMR Workflow是一个全托管的工作流和任务调度服务,100%兼容开源Apache DolphinScheduler。它提供了易于使用的调度服务,您可以通过可视化的操作界面轻松地管理工作流和任务,高效构建数据仓库,并为生产任务的稳定运行提供保障。产品文档 ...

Script

取值范围:BEFORE_INSTALL:应用安装前。AFTER_STARTED:应用启动后。BEFORE_INSTALL ExecutionFailStrategy string 执行失败策略。取值范围:FAILED_CONTINUE:失败后不阻塞集群创建或者阻塞集群扩容。FAILED_BLOCK:失败后阻塞集群创建...

Presto概述

产品优势 E-MapReduce(简称EMR)中的Presto与开源Presto比较,还具备如下优势:即买即用,快速完成上百节点的Presto集群搭建。弹性扩缩容,简单快速。与EMR软件栈完美结合,支持DLF和OSS或OSS-HDFS。无需运维,EMR提供一站式服务。基本...

Flink(VVR)作业配置

EMR-3.27.x及之前版本使用Flink社区开源版本,EMR-3.27.x之后版本使用完全兼容开源Flink的企业版(VVR)。本文介绍如何配置Flink(VVR)类型的作业。背景信息 Flink企业版由Apache Flink创始团队官方出品,拥有全球统一商业化品牌。VVR提供...

Delta Lake概述

开源Delta Lake对比 EMR-Delta Lake丰富了开源Delta Lake的特性,例如对SQL和Optimize的支持等。下表列出了Delta Lake的基本特性,并对比EMR-Delta Lake与开源Delta Lake(0.6.1)。特性 EMR-Delta 开源Delta SQL ALTER CONVERT CREATE ...

访问JindoFS Web UI

前提条件 通过SSH隧道方式才能访问Web UI,详情请参见 通过SSH隧道方式访问开源组件Web UI。访问JindoFS Web UI 打通SSH隧道后,您可以访问JindoFS Web UI功能。JindoFS 3.1.x版本提供总览信息(Overview)、Namespace信息、存储节点信息...

访问JindoFS Web UI

前提条件 通过SSH隧道方式才能访问Web UI,详情请参见 通过SSH隧道方式访问开源组件Web UI。访问JindoFS Web UI 打通SSH隧道后,您可以访问JindoFS Web UI功能。JindoFS 3.1.x版本提供总览信息(Overview)、Namespace信息、存储节点信息...

访问JindoFS Web UI

前提条件 通过SSH隧道方式才能访问Web UI,详情请参见 通过SSH隧道方式访问开源组件Web UI。访问JindoFS Web UI 打通SSH隧道后,您可以访问JindoFS Web UI功能。JindoFS 3.1.x版本提供总览信息(Overview)、Namespace信息、存储节点信息...

访问JindoFS Web UI

前提条件 通过SSH隧道方式才能访问Web UI,详情请参见 通过SSH隧道方式访问开源组件Web UI。访问JindoFS Web UI 打通SSH隧道后,您可以访问JindoFS Web UI功能。JindoFS 3.1.x版本提供总览信息(Overview)、Namespace信息、存储节点信息...

访问JindoFS Web UI

前提条件 通过SSH隧道方式才能访问Web UI,详情请参见 通过SSH隧道方式访问开源组件Web UI。访问JindoFS Web UI 打通SSH隧道后,您可以访问JindoFS Web UI功能。JindoFS 3.1.x版本提供总览信息(Overview)、Namespace信息、存储节点信息...

访问JindoFS Web UI

前提条件 通过SSH隧道方式才能访问Web UI,详情请参见 通过SSH隧道方式访问开源组件Web UI。访问JindoFS Web UI 打通SSH隧道后,您可以访问JindoFS Web UI功能。JindoFS 3.1.x版本提供总览信息(Overview)、Namespace信息、存储节点信息...

访问JindoFS Web UI

前提条件 通过SSH隧道方式才能访问Web UI,详情请参见 通过SSH隧道方式访问开源组件Web UI。访问JindoFS Web UI 打通SSH隧道后,您可以访问JindoFS Web UI功能。JindoFS 3.1.x版本提供总览信息(Overview)、Namespace信息、存储节点信息...

访问JindoFS Web UI

前提条件 通过SSH隧道方式才能访问Web UI,详情请参见 通过SSH隧道方式访问开源组件Web UI。访问JindoFS Web UI 打通SSH隧道后,您可以访问JindoFS Web UI功能。JindoFS 3.1.x版本提供总览信息(Overview)、Namespace信息、存储节点信息...

访问JindoFS Web UI

前提条件 通过SSH隧道方式才能访问Web UI,详情请参见 通过SSH隧道方式访问开源组件Web UI。访问JindoFS Web UI 打通SSH隧道后,您可以访问JindoFS Web UI功能。JindoFS 3.1.x版本提供总览信息(Overview)、Namespace信息、存储节点信息...

访问JindoFS Web UI

前提条件 通过SSH隧道方式才能访问Web UI,详情请参见 通过SSH隧道方式访问开源组件Web UI。访问JindoFS Web UI 打通SSH隧道后,您可以访问JindoFS Web UI功能。JindoFS 3.1.x版本提供总览信息(Overview)、Namespace信息、存储节点信息...

访问JindoFS Web UI

前提条件 通过SSH隧道方式才能访问Web UI,详情请参见 通过SSH隧道方式访问开源组件Web UI。访问JindoFS Web UI 打通SSH隧道后,您可以访问JindoFS Web UI功能。JindoFS 3.1.x版本提供总览信息(Overview)、Namespace信息、存储节点信息...

访问JindoFS Web UI

前提条件 通过SSH隧道方式才能访问Web UI,详情请参见 通过SSH隧道方式访问开源组件Web UI。访问JindoFS Web UI 打通SSH隧道后,您可以访问JindoFS Web UI功能。JindoFS 3.1.x版本提供总览信息(Overview)、Namespace信息、存储节点信息...

访问JindoFS Web UI

前提条件 通过SSH隧道方式才能访问Web UI,详情请参见 通过SSH隧道方式访问开源组件Web UI。访问JindoFS Web UI 打通SSH隧道后,您可以访问JindoFS Web UI功能。JindoFS 3.1.x版本提供总览信息(Overview)、Namespace信息、存储节点信息...

访问JindoFS Web UI

前提条件 通过SSH隧道方式才能访问Web UI,详情请参见 通过SSH隧道方式访问开源组件Web UI。访问JindoFS Web UI 打通SSH隧道后,您可以访问JindoFS Web UI功能。JindoFS 3.1.x版本提供总览信息(Overview)、Namespace信息、存储节点信息...

访问JindoFS Web UI

前提条件 通过SSH隧道方式才能访问Web UI,详情请参见 通过SSH隧道方式访问开源组件Web UI。访问JindoFS Web UI 打通SSH隧道后,您可以通过 http://emr-header-1:8101/ 访问JindoFS Web UI功能。JindoFS 3.0版本提供总览信息(Overview)、...

访问JindoFS Web UI

前提条件 通过SSH隧道方式才能访问Web UI,详情请参见 通过SSH隧道方式访问开源组件Web UI。访问JindoFS Web UI 打通SSH隧道后,您可以通过 http://emr-header-1:8101/ 访问JindoFS Web UI功能。JindoFS 3.0.x版本提供总览信息(Overview)...

概述

JindoSDK:为EMR各种开源计算引擎提供统一的SDK,支持Java、C、C++和Python语言,提供多种访问和API接口,包括HCFS文件系统接口、POSIX接口和Table表格接口。工具集:提供相关的工具集,例如Jindo tool和迁移工具Jindo DistCp。各种...

Hadoop DistCp介绍

Hadoop DistCp和Jindo DistCp的区别 DistCp类型 功能 使用场景 Hadoop DistCp 开源Hadoop内置的DistCp工具,用于大型集群间或集群内数据的复制。HDFS到HDFS间的数据复制。Jindo DistCp JindoFS的数据迁移工具,支持OSS、OSS-HDFS服务、兼容...

PySpark Python环境介绍

EMR DataLake和自定义集群安装的Spark版本对Python环境的依赖各不相同。本文以Python3为例,介绍不同Spark版本所对应的Python版本,以及安装Python第三方库的方法。Spark版本与Python版本对应关系 EMR版本 Spark版本 Python版本 Python路径...

开启数据盘加密

加密数据盘后,数据盘上的动态数据传输以及静态数据都会被加密。如果您的业务存在安全合规要求,则可以使用该功能。...创建集群时,您还需要对集群进行软件配置、硬件配置、基础配置和确认订单,配置详情请参见 创建集群。

查看集群服务信息

在集群服务页面,您可以查看集群中已安装服务(例如,HDFS和YARN等)的运行状态,组件列表及配置项信息。前提条件 已创建集群,详情请参见 创建集群。操作步骤 进入集群服务页面。登录 E-MapReduce控制台。在左侧导航栏,单击 EMR on ECS。...

EMR on ACK计费说明

通过阅读本文,您可以快速了解EMR on ACK的计费资源和相关产品计费等信息。计费资源 2024年04月01日起阿里云E-MapReduce(简称EMR)on...容器服务Kubernetes 基于ACK的资源安装部署大数据服务组件,并在容器内运行。收费详情请参见 产品计费。

安装第三方插件

安装第三方插件,可以在不修改Flume源码的情况下,以插件的方式定制您需要的功能。例如,添加数据源和存储组件等。通过添加JindoFS SDK的插件,可以支持通过Flume直接将数据写入OSS。本文为您介绍如何安装第三方插件。前提条件 已获取第三...

Python使用说明

Python文件安装目录为/usr/bin/python3.6。EMR-2.10.0和EMR-3.10.0之前版本默认不支持Python 3版本,您需要自行下载安装,步骤如下:下载Python 3软件包:Python-3.6.4.tgz。使用文件传输工具(SSH Secure File Transfer Client),上传JAR...

配置集群管理密码

对于Ubuntu,您可以通过 apt-get install apache2-utils 命令安装httpd,然后使用 htpasswd 命令。说明 这些命令和软件包的具体使用方式可能因系统版本和配置而有所不同,建议您根据实际情况使用。单击 保存。在弹出的对话框中,输入 执行...

开源PostgreSQL性能对比

简介 相较于开源PostgreSQL 14,PolarDB for PostgreSQL 14在以下几方面进行了优化,提升了整体性能:采用了领先硬件技术,包括使用3DXpoint存储介质的Optane存储卡、NVMeSSD和RoCE RDMA网络等。基于新的硬件,实现了一整套在用户态运行的...

基本概念

本文介绍开源大数据平台E-MapReduce使用过程中遇到的常用名词的基本概念和简要描述。集群 E-MapReduce产品中的一个独立的机器组合,为上层业务提供一些基础的引擎服务。一个E-MapReduce集群是由一个或多个阿里云ECS实例组成的。ECS实例 在E...

SQL Editor

您可以直接在控制台上编写、运行和管理SQL查询语句,无需下载或安装任何本地客户端软件,极大地方便了数据分析师和开发人员对数据进行实时查询与分析。前提条件 已创建StarRocks实例,详情请参见 创建实例。进入SQL Editor 进入EMR ...

EMR Hive功能增强

本文为您介绍E-MapReduce(简称EMR)各版本对应的Hive组件版本,以及各版本中Hive相对开源增强的功能。Hive针对开源功能增强的功能如下表。EMR版本 组件版本 功能增强 EMR-5.2.1 Hive 3.1.2 修复使用DLF元数据执行 show create table 命令...

访问Web UI

说明 关联的ACK集群需已安装Ingress组件,如果未安装Ingress组件,请先参见 常见问题 追加Ingress组件。已获取其他阿里云账号或RAM用户的账号ID。操作步骤 进入配置页面。登录 EMR on ACK控制台。在EMR on ACK页面,单击目标集群操作列的 ...

导出和导入服务配置

阿里云E-MapReduce(简称EMR)提供的导出服务配置功能,支持以XML或JSON格式导出服务配置,便于备份、迁移和恢复EMR服务的配置。导出的JSON格式的服务配置可以...单击 下一步:硬件配置,继续创建集群。创建集群的具体操作,请参见 创建集群。

EMR on ACK商业化公告

您可以将开源大数据服务部署在阿里云容器服务Kubernetes版(ACK)之上,利用ACK在服务部署和容器应用管理的优势,减少对底层集群资源的运维投入,以便于您可以更加专注大数据任务本身。收费标准 阿里云EMR on ACK正式商业化后,将根据集群...

E-MapReduce Serverless服务等级协议(SLA)

2023年6月1日起,E-MapReduce Serverless服务等级协议(SLA)生效。详情请参见 开源大数据平台E-MapReduce Serverless服务等级协议。

常见问题

报错“The bucket you access does not belong to you”问题 如何在仅部分worker节点安装了依赖环境的集群中执行PySpark?报错“The bucket you access does not belong to you”问题 问题详情 当您的任务或者工作流运行失败时,日志信息中...
共有149条 < 1 2 3 4 ... 149 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
微服务引擎 云数据库 RDS 检索分析服务 Elasticsearch版 弹性公网IP 短信服务 人工智能平台 PAI
新人特惠 爆款特惠 最新活动 免费试用