EMR Studio概述

EMR Studio是E-MapReduce提供的开源大数据开发套件,包含Apache Zeppelin、Jupyter Notebook和Apache Airflow等开源组件。能够无缝关联EMR集群(EMR on ECS和EMR on ACK)的计算引擎提交任务,并提供了交互式开发、任务调度和任务监控等...

GitOps概述

GitOps是使用Git仓库来管理应用的部署模板,将Git仓库作为Kubernetes集群中部署应用的唯一来源,实现应用的持续部署。ACK One舰队的Fleet实例托管了ArgoCD,同时集成ACK One多集群能力,实现多集群的GitOps持续交付,满足应用的高可用部署...

开源项目

开源项目扩展了Kubernetes集群的功能。本文介绍阿里云容器服务Kubernetes版主要使用的开源项目。项目分类 项目名称 项目简介 项目地址 参考文档 核心组件 Kubernetes Cloud Controller Manager for Alibaba Cloud 为Kubernetes应用创建负载...

概述

Alluxio是一个面向基于云的数据分析和人工智能的开源的数据编排技术。Alluxio为数据驱动型应用和存储系统构建了桥梁,将数据从存储层移动到距离数据驱动型应用更近的位置,从而能够更容易被访问,同时使得应用程序能够通过一个公共接口连接...

功能与优势

本文为您介绍阿里云实时计算Flink全托管产品的功能点和价值,以及和开源Flink的对比优势。类型 功能 描述 价值 性能与成本 兼容性 全面兼容开源Flink,包括各层API、参数配置及SQL语法等。更好的引擎性能和更细粒度资源配置使得整体TCO优于...

基本概念

本文介绍开源大数据平台E-MapReduce使用过程中遇到的常用名词的基本概念和简要描述。集群 E-MapReduce产品中的一个独立的机器组合,为上层业务提供一些基础的引擎服务。一个E-MapReduce集群是由一个或多个阿里云ECS实例组成的。ECS实例 在E...

功能特性

部分支持 支持Istio资源的历史版本管理 支持多集群模式下使用数据面K8s集群通过KubeAPI访问Istio资源 数据面组件管理 功能 开源社区 标准版 企业版 旗舰版 多维度(全局、命名空间、Workload级)的Sidecar代理的配置管理 部分支持 基于UI...

功能特性

开源与生态 功能集 功能 功能描述 参考文档 Terraform Terraform Terraform是一种开源工具,用于安全高效地预览,配置和管理云基础架构和资源、构建、变更、和安全有效的版本化管理基础设施的工具。可以通过Terraform高效的创建和配置OOS云...

技术支持的范围和方式

阿里云E-MapReduce(简称EMR)是云原生开源大数据平台,能够为用户提供简单易集成的开源大数据解决方案。EMR on ECS集群主要构建于ECS之上,集群资源归属于用户,EMR提供基于该资源的半托管云服务能力,用户对集群拥有完全的管理操作权限,...

管理用户

本文为您介绍如何通过E-MapReduce(简称EMR)的用户管理功能,管理集群中的EMR用户。背景信息 EMR用户信息存储在集群自带的OpenLDAP中,主要用于E-MapReduce集群内的身份认证。EMR用户可以用于访问链接与端口,查看开源组件Web UI时的用户...

OSS/OSS-HDFS概述

基于统一的元数据管理能力,在完全兼容HDFS文件系统接口的同时,提供充分的POSIX能力支持,能更好地满足大数据和AI等领域的数据湖计算场景。更多信息,请参见 OSS-HDFS服务概述。JindoData是阿里云开源大数据团队自研的数据湖存储加速套件...

快速使用EMR Notebook

EMR Notebook提供了全托管的兼容开源Jupyter的Notebook服务,同时内置了SQL Editor的功能。支持SparkSQL、Hive、StarRocks、PySpark等应用程序的开发和运行。本文以Hive查询为例,为您介绍如何使用EMR Notebook。前提条件 已完成系统角色...

功能特性

EMR on ECS 功能集 功能 功能描述 参考文档 集群管理 创建集群 您可以轻松构建和运行Hadoop、Spark、Hive、Presto等开源大数据框架,以进行大规模数据处理和分析等操作。创建集群 释放集群 在完成EMR集群任务后及时释放集群,可以释放资源...

Trino概述

Trino(即原PrestoSQL)是一个开源的分布式SQL查询引擎,适用于交互式分析查询。EMR-3.44.0和EMR-5.10.0版本开始改用社区正式名称Trino,之前各版本控制台显示为Presto,内核其实是Trino,使用时请注意区分。基本特性 Trino使用Java语言...

StarRocks概述

管理员只需要专注于StarRocks系统,无需学习和管理任何其他外部系统。全面向量化引擎 StarRocks的计算层全面采用了向量化技术,将所有算子、函数、扫描过滤和导入导出模块进行了系统性优化。通过列式的内存布局、适配CPU的SIMD指令集等手段...

ClickHouse概述

EMR ClickHouse完全兼容开源版本的产品特性,同时提供集群快速部署、集群管理、扩容、缩容和监控告警等云上产品功能,并且在开源的基础上优化了ClickHouse的读写性能,提升了ClickHouse与EMR其他组件快速集成的能力。特性 特性 描述 列式...

新功能发布记录

2023-08-29 管理配置项 2023年7月 功能名称 功能概述 发布时间 相关文档 新增弹性伸缩管理模块 为了更方便地管理集群弹性功能,EMR新增了专属管理模块,您可以在该模块中便捷地管理伸缩规则、查看集群弹性资源用量和费用成本,以评估集群...

Presto概述

本文介绍Presto的基本特性、系统组成和优势等信息。注意事项 EMR-3.45.0和EMR-5.11.0版本开始支持Presto,其版本号通常为0.2XX。此前各版本中的组件版本号为3XX的Presto,其内核均为PrestoSQL或Trino,相关信息请参见 Trino概述。基本特性 ...

什么是EMR Serverless Spark

高安全性 基于阿里云专有网络(VPC)部署,提供专有网络访问,同时提供更细力度访问控制及更高安全等级保护。开放架构与生态集成 EMR Serverless Spark与阿里云OSS-HDFS/OSS,数据湖构建DLF,以及DataWorks无缝对接,为客户提供了最大程度...

登录集群

通过与集群主节点建立SSH连接,您可以使用终端上的Linux命令来管理和与集群进行交互操作。此外,您还可以使用SSH连接创建隧道,以便通过Web浏览器查看开源组件的Web页面。本文为您介绍如何在Windows和Linux环境中使用SSH方式(SSH密钥对或...

Catalog概述

说明 本文图片和部分内容来源于开源StarRocks的 概述。Internal Catalog:内部数据目录,用于管理StarRocks所有内部数据。例如,执行 CREATE DATABASE 和 CREATE TABLE 语句创建的数据库和数据表都由Internal Catalog管理。每个StarRocks...

创建StarRocks集群

前提条件 已在目标地域创建一个专有网络和交换机,详情请参见 创建和管理专有网络 和 创建和管理交换机。操作步骤 进入创建集群页面。登录EMR on ECS控制台。可选:在顶部菜单栏处,根据实际情况选择地域和资源组。地域:创建的集群将会在...

快速使用EMR Workflow

EMR Workflow是一个全托管的工作流和任务调度服务,100%兼容开源Apache DolphinScheduler。它提供了易于使用的调度服务,您可以通过可视化的操作界面轻松地管理工作流和任务,高效构建数据仓库,并为生产任务的稳定运行提供保障。本文以...

合作伙伴及开源生态

(数据统计截止时间为 2021 月 7 月 22 日)SOFAStack 目前涵盖的开源项目有:主要项目:基于 Spring Boot 的研发框架 SOFABoot、生产级 Java RPC 框架 SOFARPC、分布式链路跟踪系统 SOFATracer、高可用服务注册中心 SOFARegistry。...

Kafka Manager

Kafka Manager是专为Kafka设计的集群管理工具,提供了WebUI界面,允许用户通过图形化界面便捷地管理Kafka集群。本文为您介绍如何访问Kafka Manager的WebUI,并将集群添加至Kafka Manager的WebUI界面。前提条件 已创建选择了Kafka服务的...

EMR Hive功能增强

本文为您介绍E-MapReduce(简称EMR)各版本对应的Hive组件版本,以及各版本中Hive相对开源增强的功能。Hive针对开源功能增强的功能如下表。EMR版本 组件版本 功能增强 EMR-5.2.1 Hive 3.1.2 修复使用DLF元数据执行 show create table 命令...

方案介绍

方案架构 单人演唱方案 多人合唱方案 方案优势 优势 描述 低延迟实时合唱 依托阿里云GRTN品牌网络,全球覆盖3200+节点,并实现直播网络、WebRTC网络100%的资源复用,实现全球高可靠服务、低延迟通讯。通过NTP时间同步,精准同步伴奏进度。...

JindoFS块存储模式

应用场景 E-MapReduce目前提供了三种大数据存储系统,E-MapReduce OssFileSystem、E-MapReduce HDFS和E-MapReduce JindoFS,其中OssFileSystem和JindoFS都是云上存储的解决方案,下表为这三种存储系统开源OSS各自的特点。特点 开源OSS E-...

迁移方案

由于E-MapReduce集群是在VPC网络中,而很多用户的业务系统还存在于经典网络中,为了解决此问题,阿里云推出了ClassicLink方案,您可以参见此方案进行网络互访,详情请参见 建立ClassicLink连接。VPC网络之间连通:选择新旧集群处在同一个...

创建工作空间

工作空间是Serverless Spark的基本单元,用于管理任务、成员、角色和权限。所有的任务开发都需要在具体的工作空间内进行。因此,在开始任务开发之前,您需要先创建工作空间。本文将为您介绍如何在EMR Serverless Spark页面快速创建工作空间...

创建实例

选择已有的专有网络,或者单击 创建VPC 前往专有网络控制台即时创建专有网络,详情请参见 创建和管理专有网络。交换机 交换机(vSwitch)是组成专有网络VPC的基础网络模块,用来连接不同的云资源。选择已有的交换机,或者单击 创建交换机 ...

X-Pack高级特性

X-Pack高级特性(开源Elasticsearch白金版)是基于开源Elasticsearch原X-Pack商业版插件开发的,包含了安全、SQL、机器学习、告警、监控等多个高级特性,从应用开发和运维管理等方面增强了Elasticsearch的服务能力。阿里云Elasticsearch...

快速创建Milvus实例

通过创建阿里云向量检索Milvus实例,能够迅速搭建起具备高性能、弹性伸缩特性的AI向量检索数据库,并借助内置可视化管理工具Attu实现高效运维与监控。本文为您介绍如何快速创建Milvus实例。前提条件 已拥有阿里云账号。如果您还没有阿里云...

开源对比

本文从稳定性、内核能力、治理能力以及使用习惯等方面,对比阿里云 云消息队列 Kafka 版 与开源Apache Kafka。稳定性 项目 云消息队列 Kafka 版 Apache Kafka 磁盘水位 磁盘写满删除旧数据。磁盘写满直接宕机。线程池隔离 读冷数据仍可以...

通过SSH隧道方式访问开源组件Web UI

在E-MapReduce(简称EMR)集群中,为了确保集群安全,Hadoop、Spark和Flink等开源组件的Web UI的端口均未对外开放。鉴于此安全机制,您无法直接访问这些组件的管理界面。EMR提供了控制台和SSH隧道两种方式进行安全访问。本文为您介绍如何...

添加开源Elastic Search数据源

通过开源Elastic Search和DataV结合使用,可以实现数据分析和搜索结果的大屏展示。本文介绍在DataV中添加并使用开源Elastic Search数据源的方法。前提条件 已准备好待添加的开源Elastic Search数据源。添加开源Elastic Search数据源 登录 ...

Impala概述

注意事项 如果使用Impala组件,请勿直接通过系统文件删除hive表分区目录,请使用Impala或者Hive命令删除,否则会导致该表不可用。优点 为了避免延迟,Impala没有使用MapReduce,而是使用分布式查询引擎直接访问数据,该引擎与RDBMS中的查询...

权限功能

本文介绍JindoFS的namespace的存储模式(Block或Cache)支持的文件系统权限功能。Block模式和Cache模式不支持切换。背景信息 根据您namespace的存储模式,JindoFS支持的系统权限如下:当您namespace的存储模式是Block模式时,支持Unix和...

权限功能

本文介绍JindoFS的namespace的存储模式(Block或Cache)支持的文件系统权限功能。Block模式和Cache模式不支持切换。背景信息 根据您namespace的存储模式,JindoFS支持的系统权限如下:当您namespace的存储模式是Block模式时,支持Unix和...

权限功能

本文介绍JindoFS的namespace的存储模式(Block或Cache)支持的文件系统权限功能。Block模式和Cache模式不支持切换。背景信息 根据您namespace的存储模式,JindoFS支持的系统权限如下:当您namespace的存储模式是Block模式时,支持Unix和...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
开源大数据平台 E-MapReduce 物联网络管理平台 云数据库 RDS 负载均衡 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用