管理LDAP认证

EMR-5.11.0及之前版本,EMR-3.45.0及之前版本 重要 如果您的EMR版本较低,没有相应的LDAP认证配置按钮,则需要参考开源软件的社区文档进行手动配置,以启用LDAP认证功能。在 组件列表 区域,选择 TrinoMaster 操作列的>enableLDAP。在弹出...

什么是EMR on ECS

100%采用社区开源组件,适配并优化开源组件,性能远高于开源版本。基于时间的弹性伸缩能力,抢占式实例可进一步降低成本。解耦了计算与存储之间的绑定关系,实现了资源的弹性利用。分钟级别创建和扩容集群,无需手动部署和启动服务。产品...

Lindorm for Cassandra应用实践

可调一致性(无需repair数据)服务模式 自建 集群托管或者Serverless可选 可靠性 无SLA保障,开源软件BUG需要自行修复。SLA保障,并具备主备双活、备份、异地容灾等能力。冷热分离 不支持 透明冷热分离降低成本 全文检索 不支持 兼容CQL...

Presto

无需配置,所有配置都是自动完成。Zeppelin的Presto解释器提供以下主要功能:支持任何Presto SQL语句(包括DDL和DML等)。支持多行SQL,每条SQL语句以分号;结尾。支持注释功能。支持并发执行多条SQL。支持参数功能。支持图表展示SQL结果。...

产品优势

阿里云E-MapReduce(简称EMR)为您提供相对方便可控的企业级开源大数据服务。您可以快速搭建开源大数据服务,例如Hadoop、Spark、Flink、Kafka和HBase服务。稳定可靠的开源组件 100%采用社区开源组件,随开源版本升级迭代,详情请参见 版本...

产品概述

什么是E-MapReduce 开源大数据开发平台E-MapReduce(简称EMR),是运行在阿里云平台上的一种大数据处理的系统解决方案。EMR基于开源的Apache Hadoop和Apache Spark,让您可以方便地使用Hadoop和Spark生态系统中的其他周边系统分析和处理...

Hive

您无需配置,所有配置都是自动完成。Zeppelin的Hive解释器提供以下主要功能:支持任何Hive SQL语句(包括DDL和DML等)。Hive解释器与Beeline支持的语言及功能一样。支持一个段落编写多条SQL语句,每条SQL语句以分号;结尾,按照从上到下的...

产品简介

开源大数据开发平台E-MapReduce(简称EMR)是运行在阿里云平台上的一种大数据处理系统解决方案。EMR基于开源的Apache Hadoop和Apache Spark,让您可以方便地使用Hadoop和Spark生态系统中的其他周边系统分析和处理数据。EMR还可以与阿里云...

EMR Studio概述

EMR Studio是E-MapReduce提供的开源大数据开发套件,包含Apache Zeppelin、Jupyter Notebook和Apache Airflow等开源组件。能够无缝关联EMR集群(EMR on ECS和EMR on ACK)的计算引擎提交任务,并提供了交互式开发、任务调度和任务监控等...

Paimon概述

目前阿里云开源大数据平台E-MapReduce常见的计算引擎(例如Flink、Spark、Hive或Trino)与Paimon有着较为完善的集成度。您可以借助Apache Paimon快速地在HDFS或者云端OSS上构建自己的数据湖存储服务,并接入上述计算引擎实现数据湖的分析...

大语言模型

模型简介 Qwen1.5 Qwen1.5是Qwen开源系列的下一个版本。与之前的版本相比,Qwen1.5显著提升了聊天模型与人类偏好的一致性,改善了它们的多语言能力,并具备了强大的链接外部系统能力。灵积上提供API服务的是新版本qwen模型的chat版本,在...

Trino概述

Trino(即原PrestoSQL)是一个开源的分布式SQL查询引擎,适用于交互式分析查询。EMR-3.44.0和EMR-5.10.0版本开始改用社区正式名称Trino,之前各版本控制台显示为Presto,内核其实是Trino,使用时请注意区分。基本特性 Trino使用Java语言...

Iceberg概述

而Iceberg简化了工作流程,整个数据处理过程是一条完整的、可靠的实时流,其数据的清洗、转换和特征化等操作都是流上的节点动作,无需处理历史数据和实时数据。此外,Iceberg还支持原生的Python SDK,对于机器学习算法的开发者非常友好。

什么是EMR Notebook

兼容开源 EMR Notebook兼容开源Jupyter Notebook,您可以通过文件导入、导出的方式实现开发工具的自由切换,从而降低了使用门槛。产品功能 交互式编程环境 支持逐步执行SQL和Python代码,并根据运行结果调整后续代码。多种数据源类型 支持...

免费体验Lindorm宽表性能&价格力

本文介绍了如何免费体验Lindorm宽表引擎和开源社区版HBase的性能&价格力对比。背景 云原生多模数据库Lindorm面向海量泛时序数据、半结构化数据和非结构化数据提供低成本存储、在线查询和检索、离线分析、AI 推理等一站式数据服务,支持...

Impala概述

Impala为存储在Apache Hadoop中的数据,提供了高性能和低延迟的SQL查询。使用Impala,您可以通过SELECT、JOIN和聚合函数实时查询存储在HDFS...由于所有的请求都是通过StateStore进程传递的,所以建议StateStore和Catalog运行在同一个节点上。

Presto概述

与EMR软件栈完美结合,支持DLF和OSS或OSS-HDFS。无需运维,EMR提供一站式服务。基本概念 数据模型 数据模型即数据的组织形式。Presto使用Catalog、Schema和Table三层结构来管理数据。Catalog:一个Catalog可以包含多个Schema,物理上指向...

EMR Serverless StarRocks商业化发布

EMR Serverless StarRocks介绍 EMR Serverless StarRocks是开源StarRocks在阿里云上的全托管服务,您可以通过EMR Serverless StarRocks灵活的创建和管理StarRocks实例以及数据。StarRocks作为一款兼容MySQL协议的OLAP分析引擎,提供了极致...

EMR Spark功能增强

阿里云E-MapReduce产品构建于阿里云云服务器ECS上,基于开源的Apache Hadoop和Apache Spark,做了大量优化。本文为您介绍E-MapReduce(简称EMR)Spark相对开源增强的功能。背景信息 阿里云EMR 100%采用社区开源组件,随开源版本升级迭代,...

Kafka Manager

说明 当选择了Kafka服务,系统将默认安装Kafka Manager软件服务,并开启Kafka Manager的认证功能。注意事项 使用Kafka Manager进行partition reassign功能时,当前版本的Kafka Manager是没有提供限流功能的。如果需要限流,您可以通过 ...

EMR Workflow商业化公告

地域名称 地域ID 美国(硅谷)us-west-1 新加坡 ap-southeast-1 德国(法兰克福)eu-central-1 马来西亚(吉隆坡)ap-southeast-3 优惠活动及产品计费 当您首次在支持地域开通EMR Workflow服务时,通常会获得以下资源:获得一个免费的默认...

E-MapReduce支持倚天云服务器

丰富的生态:倚天云服务器支持主流开源软件以及多款阿里云主流PaaS产品。最新网络架构:基于2*50 GB网络架构提供大带宽以及超强转发能力,对比上一代CIPU架构,网络带宽提升1倍。安全增强:支持vTPM特性,依托TPM/TCM芯片,实现从服务器到...

导出和导入服务配置

阿里云E-MapReduce(简称EMR)提供的导出服务配置...在 软件配置 的 高级设置 区域,打开 软件自定义配置 开关。复制导出的JSON格式服务配置中的内容到配置框中。单击 下一步:硬件配置,继续创建集群。创建集群的具体操作,请参见 创建集群。

扩容集群

EMR Serverless StarRocks不仅无缝兼容开源StarRocks,并且具备自动升级软件版本的功能,可省去手动管理版本的繁琐与风险。迁移方案详情,请参见 迁移StarRocks数据至EMR Serverless StarRocks。操作步骤 重要 集群扩容操作不会重启存量...

计量计费

ChatGLM开源双语对话语言模型 计费单元 模型服务 计费单元 ChatGLM2开源双语对话语言模型 token ChatGLM3开源双语对话语言模型 重要 Token是模型用来表示自然语言文本的基本单位,可以直观的理解为“字”或“词”。对于中文文本来说,1个...

迁移方案

如果您希望不同版本的Flink作业可以在DataFlow集群中运行,详细方法如下:对于特定的Flink版本的作业,使用YARN per-job的方式提交。在该方式下,作业执行过程中所使用的Flink版本为提交作业的客户端所使用的Flink版本,因此只需要在提交...

计量计费

计费单价 模型服务 模型名 计费单价 ChatGLM2开源双语对话语言模型 chatglm-6b-v2 0.006元/1,000 tokens ChatGLM3开源双语对话语言模型 chatglm3-6b 限时免费免费额度 模型服务 模型名 免费额度 ChatGLM2开源双语对话语言模型 chatglm-6...

通过集群模板创建集群

使用现有的集群模板直接一键创建集群,可以省去重复选择各配置项的时间。本文为您介绍如何通过集群模板创建集群。前提条件 已创建集群模板,具体操作请参见 创建集群模板。操作步骤 进入管理集群模板页面。登录 E-MapReduce控制台。...

参数说明

本文介绍Hadoop代码中的参数。Hadoop代码中可使用如下参数配置。属性名 默认值 说明 fs.jfs.cache.oss-accessKeyId 无 访问OSS所需的AccessKey ID(可选)。fs.jfs.cache.oss-accessKeySecret 无 访问OSS所需的AccessKey Secret(可选)。...

Catalog概述

说明 本文图片和部分内容来源于开源StarRocks的 概述。Internal Catalog:内部数据目录,用于管理StarRocks所有内部数据。例如,执行 CREATE DATABASE 和 CREATE TABLE 语句创建的数据库和数据表由Internal Catalog管理。每个StarRocks...

创建工作空间

所有的任务开发需要在具体的工作空间内进行。因此,在开始任务开发之前,您需要先创建工作空间。本文将为您介绍如何在EMR Serverless Spark页面快速创建工作空间。前提条件 已注册阿里云账号并完成实名认证。具体操作请参见 账号注册(PC...

数据服务集群

特性介绍 Apache HBase是具有高可靠性、高性能、列存储、可伸缩、实时读写的开源NoSQL分布式系统。特别适用于需要实时读写随机访问超大规模数据集的场景。Apache HBase和Apache Hadoop生态系统无缝集成,并且可以和Apache Phoenix搭配使用...

集群容灾能力

本文介绍E-MapReduce集群数据容灾和服务容灾能力。数据容灾 在Hadoop分布式文件系统(HDFS)中,每一个文件的数据均是分块存储的,每一个数据块保存有多个副本(默认为3),并且尽量保证这些数据块副本分布在不同的机架之上。...

功能特性

EMR on ECS 功能集 功能 功能描述 参考文档 集群管理 创建集群 您可以轻松构建和运行Hadoop、Spark、Hive、Presto等开源大数据框架,以进行大规模数据处理和分析等操作。创建集群 释放集群 在完成EMR集群任务后及时释放集群,可以释放资源...

迁移元数据上云

迁移元数据上云是指将开源RabbitMQ集群的元数据导出,并将其导入到阿里云 云消息队列 RabbitMQ 版 实例。云消息队列 RabbitMQ 版 会根据成功导入的元数据在目标 云消息队列 RabbitMQ 版 实例中创建对应的Vhost、Queue、Exchange、Binding,...

使用StarRocks Console

StarRocks Console是StarRocks的增值功能。本文为您介绍StarRocks Console的使用方法。前提条件 已创建选择了StarRocks和StarRocks-Console服务的集群,详情请参见 创建StarRocks集群。说明 仅EMR-3.43.0~EMR-3.44.1版本(均包含),EMR-5....

管理资源队列

应用环境 开发:开发者编写、测试和调试代码的地方,通常包括IDE(集成开发环境)、版本控制系统和各类调试工具,用于开发者进行软件的构建与调试。生产:供用户使用的实际运行环境,提供稳定、高效和安全的服务。修改并发上限 在 队列管理...

开源版和商业版介绍

SOFABoot 目前对外开放的有开源版和商业版,本文介绍这两个版本的特点及适用场景,您可以根据自身需求自由选择合适的版本。选型指南 各个版本的能力和适用场景信息见下表:版本 能力 场景 文档 开源版本 具有模块化开发、类隔离、日志隔离...

安装第三方插件

说明 EMR集群中,通常普通的插件直接放在/opt/apps/FLUME/flume-current/lib 目录中,如果需要上传有复杂依赖的插件,特别是有native依赖的插件,请创建/opt/apps/FLUME/flume-current/plugins.d 目录,并按照方式三部署。

Hadoop集群迁移至DataLake集群

(可选)软件自定义配置 如果您导出了旧平台集群中的服务配置,或计划在创建集群流程中预置配置,则可以在新平台集群创建流程中开启软件自定义配置,并将编辑好的配置粘贴输入框中,详细使用方法请参见 配置自定义软件。硬件配置 在 查看...
共有180条 < 1 2 3 4 ... 180 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
云数据库 RDS 检索分析服务 Elasticsearch版 微服务引擎 弹性公网IP 短信服务 人工智能平台 PAI
新人特惠 爆款特惠 最新活动 免费试用