产品架构

EMR开源优化 EMR基于开源社区版本的组件,增强了其性能和功能,例如:Spark中增加了Spark Streaming SQL,性能较开源版本有大幅提升,详情请参见 简介。Delta Lake相较开源版本增加了ZOrder和Data Skipping能力,详情请参见 Delta Lake概述...

OpenLDAP

OpenLDAP是LDAP协议(Lightweight Directory Access Protocol)的开源实现,在EMR集群中主要提供用户管理和身份认证的功能。服务集成OpenLDAP 在EMR集群中,...这种方式需要参考OpenLDAP开源社区的文档来进行操作。开源文档请参见 OpenLDAP。

什么是EMR on ECS

采用开源社区版本,性能需自行优化。易用性 分钟级别启动Hadoop集群,敏捷响应业务需求。采购服务器,部署Hadoop生态组件,周期长达数周。弹性 可根据作业临时启动和销毁集群。集群资源可根据时间周期或集群负载动态自动调整。基于JindoFS...

免费体验Lindorm宽表性能&价格力

本文介绍了如何免费体验Lindorm宽表引擎和开源社区版HBase的性能&价格力对比。背景 云原生多模数据库Lindorm面向海量泛时序数据、半结构化数据和非结构化数据提供低成本存储、在线查询和检索、离线分析、AI 推理等一站式数据服务,支持...

概述

MaxCompute Spark是MaxCompute提供的兼容开源Spark的计算服务。它在统一的计算资源和数据集权限...左侧是原生Spark的架构图,右侧的Spark on MaxCompute运行在阿里云自研的Cupid平台之上,该平台可以原生支持开源社区Yarn所支持的计算框架。

产品优势

稳定可靠的开源组件 100%采用社区开源组件,随开源版本升级迭代,详情请参见 版本概述。适配开源组件,避免开源组件之间的版本兼容性问题。基于开源组件,优化和增强阿里云部署环境,性能远高于开源版本。节约成本 通过有效弹性伸缩和数据...

三方开源大语言模型

促进中文对话大模型开源社区的发展,愿景是成为能够帮到每一个人的LLM Engine。相比如何做好大语言模型的预训练,BELLE更关注如何在开源预训练大语言模型的基础上,帮助每一个人都能够得到一个属于自己的、效果尽可能好的具有指令表现能力...

访问链接与端口

通过访问链接与端口功能,您可以方便地通过控制台方式访问集群中已安装开源组件Web UI的地址。本文将介绍如何设置安全组规则和访问链接,以便查看集群中开源组件的UI界面。前提条件 已创建E-MapReduce集群,详情请参见 创建集群。背景信息 ...

Flink(VVR)作业配置

EMR-3.27.x及之前版本使用Flink社区开源版本,EMR-3.27.x之后版本使用完全兼容开源Flink的企业版(VVR)。本文介绍如何配置Flink(VVR)类型的作业。背景信息 Flink企业版由Apache Flink创始团队官方出品,拥有全球统一商业化品牌。VVR提供...

EMR Spark功能增强

背景信息 阿里云EMR 100%采用社区开源组件,随开源版本升级迭代,基于开源组件,优化和增强阿里云部署环境。功能增强 Spark针对开源功能增强的功能如下表。EMR版本 组件版本 功能增强 EMR-5.2.1 Spark 3.1.1 支持数据湖格式Delta Lake和...

大语言模型

其中1.8B模型基于最新在魔搭社区开源的 最新版本,7B模型基于最新在魔搭社区开源的 V1.1版本,而14B模型同样基于魔搭社区上 最新版本 提供,72B模型基于魔搭社区开源的 最新版本 提供。模型服务 模型名称 模型描述 应用场景 通义千问72B ...

安装开源DedeCMS

本文以Linux独享虚拟主机高级版为例,介绍在云虚拟主机上安装开源DedeCMS的方法。前提条件 已购买并初始化云虚拟主机。具体操作,请参见 购买云虚拟主机。已安装FTP客户端。建议您使用FileZilla,具体操作,请参见 使用FileZilla管理文件。...

功能特性

导出和导入服务配置 访问链接与端口 通过访问链接与端口功能,您可以方便地通过控制台方式访问集群中已安装开源组件Web UI的地址。访问链接与端口 查看集群服务信息 可以查看集群中已安装服务(例如,HDFS和YARN等)的运行状态,组件列表及...

Hive概述

Hive是一个基于Hadoop的数据仓库框架,在大数据业务场景中,主要用来...Hive语法 EMR产品最大程度的保持了开源社区的语法以及体验,在Hive语法上保持与开源社区Hive语法100%的兼容性。关于Apache Hive的更多介绍,请参见 Apache Hive官网。

合作伙伴及开源生态

同时,SOFAStack 也积极参与了多个重要开源社区,如 SOFAStack 消息队列(SOFAStack MQ,简称 SOFAMQ)加入了 OpenMessaging 社区贡献能力。活动与社群 SOFALab 源码共建 SOFALab 为 SOFAStack 社区发起源码解析系列文章的共建活动,该系列...

通过OSS SDK接入开源生态

开源生态 说明 使用Hadoop或者Hive访问OSS 此系列文档由开源软件Apache社区提供。使用Flink访问OSS 将HBase快照保存在OSS 将Kafka数据导入OSS 此系列文档由面向开源项目的托管平台GitHub提供。使用Logstash将日志导入OSS 使用Fluentd访问...

功能特性

由ASM托管的控制面支持的功能 网格管理 功能 开源社区 标准版 企业版 旗舰版 基于UI控制台的网格实例部署、升级管理等全生命周期管理 支持ACK当前支持中的全部版本(包括ACK托管版和专有版集群,以及支持ECI on ACK模式)支持ASK当前支持中...

迁移场景

开源软件:开源软件指开发者从开源社区下载未做源码修改的软件或者所使用操作系统生态中默认携带的软件。当前大部分开源软件在倚天ARM平台上已经提供较好的应用生态,您可以直接使用操作系统提供的开源生态软件来安装部署。更多信息,请...

开源软件迁移

当前大部分应用系统都基于开源软件构建,并且大部分的开源软件在倚天ARM平台上已经提供较好的应用生态,您可以直接使用操作系统提供的开源生态软件来安装部署。本文介绍Nginx、MySQL、Redis、TensorFlow、PyTorch等开源软件如何在倚天...

数据上云工具

MaxCompute平台支持丰富的数据上传和下载工具(其中大部分工具已经在GitHub公开源代码,以开源社区的方式进行维护)。您可以根据实际应用场景,选择合适的工具进行数据的上传和下载。阿里云数加产品 MaxCompute客户端(Tunnel通道系列)...

产品概述

100%采用社区开源组件,适配并优化开源组件,性能远高于开源版本。基于时间的弹性伸缩能力,抢占式实例可进一步降低成本。解耦了计算与存储之间的绑定关系,实现了资源的弹性利用。分钟级别创建和扩容集群,无需手动部署和启动服务。EMR on...

产品简介

100%采用社区开源组件,适配并优化开源组件,性能远高于开源版本。基于时间的弹性伸缩能力,抢占式实例可进一步降低成本。解耦了计算与存储之间的绑定关系,实现了资源的弹性利用。分钟级别创建和扩容集群,无需手动部署和启动服务。EMR on...

EMR-3.22.x版本说明

Kudu版本基于开源社区Apache Kudu1.10.0版本。OpenLDAP 新增组件,取代ApacheDS,ApacheDS下线。高可用。更新内容 组件 详细信息 JindoFileSystem 多种存储模式 Block模式:数据以Block形式存储在后端存储OSS上,本地Namespace服务维护...

管理LDAP认证

EMR-5.11.0及之前版本,EMR-3.45.0及之前版本 重要 如果您的EMR版本较低,没有相应的LDAP认证配置按钮,则需要参考开源软件的社区文档进行手动配置,以启用LDAP认证功能。在 组件列表 区域,选择 SparkThriftServer 操作列的>enableLDAP。...

生命周期策略

开源大数据社区蓬勃发展的今天,新版本带来了更丰富、强大和易用的产品特性。随着引擎重构、计费计量、云原生部署等多种形态的不断涌现,已经投入使用的产品版本和形态会逐渐老化,无法满足不断增长的业务需求。从应用稳定性、资源弹性、...

管理LDAP认证

EMR-5.11.0及之前版本,EMR-3.45.0及之前版本 重要 如果您的EMR版本较低,没有相应的LDAP认证配置按钮,则需要参考开源软件的社区文档进行手动配置,以启用LDAP认证功能。在 组件列表 区域,选择 TrinoMaster 操作列的>enableLDAP。在弹出...

生命周期策略

开源大数据社区蓬勃发展的今天,新版本带来了更丰富、强大和易用的产品特性。随着引擎重构、计费计量、云原生部署等多种形态的不断涌现,已经投入使用的产品版本和形态会逐渐老化,无法满足不断增长的业务需求。从应用稳定性、资源弹性、...

关于MSE Nacos新版本取消开源控制台登录页的公告

Nacos社区自2.2.2版本开始,如果没有开启社区默认鉴权,开源控制台的登录页将不再出现。MSE Nacos 2.2.3.0版本以后开启开源控制台,也会关闭此登录页。Nacos社区提供的开源控制台在2.2.2版本前,无论是否开启 鉴权 功能,开源控制台都会...

什么是EMR on ACK

形态 描述 EMR on ECS EMR负责将开源Hadoop生态的组件安装部署在ECS上,并启动相应的服务。您可以在EMR控制台完成对集群ECS及服务的运维操作。您需要将其大数据任务提交至EMR集群。EMR on ACK 您需要先完成ACK集群的安装部署。当ACK集群...

开启Nacos开源控制台

Nacos引擎提供一个默认的控制台操作页面,即 开源控制台。由于此控制台安全能力较弱,MSE ...因此Nacos官方社区从2.2.2版本开始,在未开启社区默认鉴权时,此开源控制台的登录页将不再出现。MSE Nacos开启开源控制台后,也会 关闭 此登录页。

什么是EMR Serverless Milvus

兼容开源Milvus生态 全面兼容开源Milvus系统,提供了Attu等丰富的开源管理工具,更拥有丰富且活跃的生态社区资源。产品功能 构建企业级全托管的可扩展 AI 向量数据库相似性检索服务 高可用性 致力于为客户提供优质的产品体验,基于阿里云...

安装HBase Java SDK

如果客户端是开源HBase 1.x版本,您可以在Maven项目的 pom.xml 文件中添加以下依赖来安装HBase Java SDK。groupId>...

通过客户端方式连接StarRocks实例

使用开源MySQL客户端连接StarRocks 步骤一:下载MySQL客户端并安装数据库 下载 MySQL客户端。执行以下命令,解压缩安装包。tar-zxvf mysql-5.6.40-linux-glibc2.12-i686.tar.gz 执行以下命令,复制解压后的mysql目录到系统的本地软件目录。...

Hadoop DistCp介绍

说明 Hadoop DistCp的功能和使用方法等详细信息,请参见 Hadoop社区的DistCp使用文档。Hadoop DistCp和Jindo DistCp的区别 DistCp类型 功能 使用场景 Hadoop DistCp 开源Hadoop内置的DistCp工具,用于大型集群间或集群内数据的复制。HDFS到...

EMR Studio概述

EMR Studio是E-MapReduce提供的开源大数据开发套件,包含Apache Zeppelin、Jupyter Notebook和Apache Airflow等开源组件。能够无缝关联EMR集群(EMR on ECS和EMR on ACK)的计算引擎提交任务,并提供了交互式开发、任务调度和任务监控等...

Zeppelin常见问题

EMR Studio上的Zeppelin与开源版本一致吗?如何设置Zeppelin Note的权限?Zeppelin执行时无法正常启动Interpreter EMR Studio上的Zeppelin与开源版本一致吗?EMR Studio上的Zeppelin是增强版的Zeppelin,与开源版本不一致。E-MapReduce的...

授权信息

本文为您介绍 开源大数据平台 E-MapReduce(EMR)为RAM权限策略定义的操作(Action)、资源(Resource)和条件(Condition)。开源大数据平台 E-MapReduce(EMR)的RAM代码(RamCode)为 emr,emr-apm-server,ecm,emr-serverless-spark,dls...

相关的云服务

本文为您介绍典型场景下,使用开源大数据平台E-MapReduce时通常会使用到的其他云服务。云服务名称 说明 云服务器ECS 使用云服务器ECS(Elastic Compute Service)作为集群的节点,每个ECS实例集群中的一个节点。专有网络VPC 专有网络VPC...

迁移方案

重要 对于DataStream作业来说,开源Flink和VVR的state是完全兼容的,但是对于SQL作业来说,VVR相比社区Flink,做了大量的优化工作,不能保证state完全兼容。对于state不能兼容的作业,无法从开源Flink生成的Checkpoint中恢复。对于这部分...

支持倚天云服务器

阿里云E-MapReduce支持使用倚天云服务器构建开源大数据集群。适用客户 全网用户 新增功能/规格 阿里云E-MapReduce(简称EMR)支持使用倚天云服务器构建开源大数据集群。与现有X86架构实例体验完全相同的情况下,具有更高的性价比,帮助用户...
共有145条 < 1 2 3 4 ... 145 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
云数据库 ClickHouse 微服务引擎 云数据库 RDS 检索分析服务 Elasticsearch版 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用