HBase Replication

说明 如果要对大批量复制数据进行验证,可以使用VerifyReplication工具验证,该工具使用详情请参见 Verifying Replicated Data。相关文档 开启串行Replication,请参见 Serial Replication。开启同步Replication,请参见 Synchronous ...

基本概念

本文介绍开源大数据平台E-MapReduce使用过程中遇到的常用名词的基本概念和简要描述。集群 E-MapReduce产品中的一个独立的机器组合,为上层业务提供一些基础的引擎服务。一个E-MapReduce集群是由一个或多个阿里云ECS实例组成的。ECS实例 在E...

三方开源大语言模型

本文主要介绍阿里云百炼平台引入上架的三方开源大语言模型基本信息,计费情况等调用必备基础信息。基本信息 重要 三方开源大模型API调用需申请后开通体验,请点击“立即申请”,申请通过后才能调用。模型服务 模型名称 模型描述 特征 Llama...

EMR Hive功能增强

本文为您介绍E-MapReduce(简称EMR)各版本对应的Hive组件版本,以及各版本中Hive相对开源增强的功能。Hive针对开源功能增强的功能如下表。EMR版本 组件版本 功能增强 EMR-5.2.1 Hive 3.1.2 修复使用DLF元数据执行 show create table 命令...

创建工作空间

工作空间类型说明 对比项 基础版 专业版 主要特点 100%兼容开源Spark。支持阿里云Fusion Engine(Spark Native Engine)。100%兼容开源Spark。支持阿里云Fusion Engine(Spark Native Engine)。内置Celeborn来增强Spark在计算过程中的...

EMR on ACK商业化公告

您可以将开源大数据服务部署在阿里云容器服务Kubernetes版(ACK)之上,利用ACK在服务部署和容器应用管理的优势,减少对底层集群资源的运维投入,以便于您可以更加专注大数据任务本身。收费标准 阿里云EMR on ACK正式商业化后,将根据集群...

E-MapReduce Serverless服务等级协议(SLA)

2023年6月1日起,E-MapReduce Serverless服务等级协议(SLA)生效。详情请参见 开源大数据平台E-MapReduce Serverless服务等级协议。

Spark概述

机器学习 Spark的MLlib提供了较丰富的机器学习库,包括分类、回归、协同过滤、聚合,同时提供了模型选择、自动调参和交叉验证等工具来提高生产力。MLlib主要支持非深度学习的算法模块,详情请参见 Machine Learning Library(MLlib)Guide。...

EMR-3.23.x版本说明

Bigboot 更新小文件工具。更新OSS JAR,解决非daemon线程问题。Kafka 新增感知Deploymen Set特性。去掉fastjson依赖。HDFS 优化SmartData OSS JAR包部署逻辑。更新SmartData OSS JAR包。Flume 升级fastjson。Tensorflow on Spark 新增服务...

扩容集群

EMR Serverless StarRocks不仅无缝兼容开源StarRocks,并且具备自动升级软件版本的功能,可省去手动管理版本的繁琐与风险。迁移方案详情,请参见 迁移StarRocks数据至EMR Serverless StarRocks。操作步骤 重要 集群扩容操作不会重启存量...

数据服务集群

特性介绍 Apache HBase是具有高可靠性、高性能、列存储、可伸缩、实时读写的开源NoSQL分布式系统。特别适用于需要实时读写随机访问超大规模数据集的场景。Apache HBase和Apache Hadoop生态系统无缝集成,并且可以和Apache Phoenix搭配使用...

Kyuubi概述

Kyuubi支持JDBC和ODBC接口,您可以直接通过SQL或通过BI工具来访问Kyuubi并高效地运行查询。Kyuubi可以在用户级别缓存后台引擎实例,以更好的实现计算资源共享和快速响应,并行处理大量数据的查询并快速返回结果。批数据处理:Kyuubi提供了...

管理用户

EMR用户可以用于访问链接与端口,查看开源组件Web UI时的用户身份认证,也可以在开启组件LDAP认证之后进行身份认证。如果将Ranger的用户源设置为LDAP,则可以对用户管理中的用户进行权限控制。如果是高安全集群,EMR用户可以用于Kinit操作...

HDFS Web UI介绍

访问HDFS Web UI 您可以通过SSH隧道和控制台两种方式访问HDFS Web UI,具体操作请参见 通过SSH隧道方式访问开源组件Web UI 和 访问链接与端口。NameNode服务地址 版本 访问地址 说明 hadoop 3.x http://${namenode_hostname}:9870${...

Catalog概述

说明 本文图片和部分内容来源于开源StarRocks的 概述。Internal Catalog:内部数据目录,用于管理StarRocks所有内部数据。例如,执行 CREATE DATABASE 和 CREATE TABLE 语句创建的数据库和数据表都由Internal Catalog管理。每个StarRocks...

使用Kerberos认证

如果您是使用root用户,登录KDC(Kerberos的服务端程序)所在的master-1-1节点,则可以执行以下命令,直接进入admin工具。kadmin.local 当返回信息中包含如下信息时,表示已进入admin.local命令行。Authenticating as principal hadoop/...

EMR Serverless StarRocks商业化发布

EMR Serverless StarRocks介绍 EMR Serverless StarRocks是开源StarRocks在阿里云上的全托管服务,您可以通过EMR Serverless StarRocks灵活的创建和管理StarRocks实例以及数据。StarRocks作为一款兼容MySQL协议的OLAP分析引擎,提供了极致...

SparkSQL UDF基础操作

使用Hive UDF 使用文件传输工具,上传生成的JAR包至集群任意目录(本文以test目录为例)。上传JAR包至HDFS或OSS(本文以HDFS为例)。通过SSH方式登录集群,详情请参见 登录集群。执行以下命令,上传JAR包到HDFS。hadoop fs-put/test/...

SmartData 3.7.x版本简介

SmartData组件主要包括JindoFS、JindoTable和相关工具集。本文为您介绍SmartData(3.7.x)版本的新增内容。JindoFS 此版本中JindoFS的新特性如下表所示。特性 描述 JindoFS支持展示统计信息 SmartData 3.7.2及后续版本支持该特性。JindoFS...

EMR Workflow商业化公告

EMR Workflow介绍 EMR Workflow是一个全托管的工作流和任务调度服务,100%兼容开源Apache DolphinScheduler。它提供了易于使用的调度服务,您可以通过可视化的操作界面轻松地管理工作流和任务,高效构建数据仓库,并为生产任务的稳定运行...

选型配置说明

Flink、Kafka、YARN OLAP 数据分析场景,其中核心组件ClickHouse是一个面向联机分析处理(OLAP)的开源的面向列式存储的DBMS,与Hadoop和Spark相比,ClickHouse更轻量级。ClickHouse支持线性扩展,简单方便,具有高可靠性和高容错。...

概述

Apache Druid是一个分布式内存实时分析系统,用于解决如何在大规模数据集下快速的、交互式的查询和分析问题。...集成了Superset工具。方便地扩容和缩容(缩容针对Task节点)。丰富的监控指标和告警规则。故障迁移。具有高安全性。支持HA。

数据迁移

背景信息 EMR Kudu支持社区1.10以及1.11版本,可以使用社区提供的Backup和Restore的工具进行数据的迁移。基本流程示意图如下所示。操作步骤 执行以下命令,查看待迁移Kudu表的名称列表。Kudu table list {YourKuduMasterAddress} 说明 本文...

管理LDAP认证

EMR-5.11.0及之前版本,EMR-3.45.0及之前版本 重要 如果您的EMR版本较低,没有相应的LDAP认证配置按钮,则需要参考开源软件的社区文档进行手动配置,以启用LDAP认证功能。在 组件列表 区域,选择 SparkThriftServer 操作列的>enableLDAP。...

Python使用说明

使用文件传输工具(SSH Secure File Transfer Client),上传JAR包至Master节点的/usr/local 目录。解压下载文件并安装。登录Master节点,详情请参见 登录集群。创建Python 3的安装目录。sudo mkdir-p/usr/local/python3 解压缩下载文件。...

管理资源队列

应用环境 开发:开发者编写、测试和调试代码的地方,通常包括IDE(集成开发环境)、版本控制系统和各类调试工具,用于开发者进行软件的构建与调试。生产:供用户使用的实际运行环境,提供稳定、高效和安全的服务。修改并发上限 在 队列管理...

测试结果分析

本文介绍 云原生多模数据库 Lindorm 与开源HBase的吞吐量对比、毛刺率对比和压缩率对比的测试结果。前提条件 基于以下环境配置,性能测试工具和测试方法分析本文的测试结果。环境配置的详情请参见 测试环境。性能测试工具的使用请参见 性能...

Kerberos概述

在这种高安全级别的集群中,所有开源组件均采用Kerberos安全模式启动,确保只有经过Kerberos认证的客户端能够访问集群提供的服务(例如HDFS)。背景信息 集群开启Kerberos之后:客户端:可以对可信任的客户端提供认证,使得可信任客户端...

SmartData 3.0.x版本简介

SmartData组件主要包括JindoFS,JindoTable和相关工具集。本文介绍SmartData(3.0.x)版本的更新内容。JindoFS存储优化 改进Jindo Namespace服务单机配置,单机情况下也可以更新并异步写入元数据至Tablestore。移除Jindo Namespace服务的...

EMR-3.24.x版本说明

支持其他开源已有特性。Grafana 新增组件(Flink独立集群),版本6.4.2。Prometheus 新增组件(Flink独立集群),版本2.13.0。AlertManager 新增组件(Flink独立集群),版本0.19.0。TensorFlow on spark 支持TensorFlow框架置于Spark之上...

E-MapReduce支持倚天云服务器

阿里云E-MapReduce(简称EMR)支持使用倚天云服务器构建开源大数据集群。与现有X86架构实例体验完全相同的情况下,具有更高的性价比,帮助您降低成本并提高效率。本文为您介绍倚天云服务器的特性、优势,以及在E-Mapreduce上倚天云服务器的...

计费项

计费项 计费说明及付费方式 E-MapReduce服务费用 E-MapReduce会提供集群的多维度管理服务,包括页面的展示与控制、OpenAPI与SDK的支持、监控报警、运维工具和服务端后台的自动化运维等服务。关于E-MapReduce产品的详细定价,请根据您选择的...

Kerberos基础使用

本文为您介绍Kerberos的配置与基础操作,其中涵盖了核心配置文件krb5.conf和kdc.conf,详细说明了服务端如何使用KDC管理工具进行Principal管理及Keytab维护,以及客户端Ticket生命周期管理涉及的相关命令。前提条件 已创建开启Kerberos认证...

迁移方案

基于Flink on YARN的部署模式,在未设置 yarn.provided.lib.dirs 参数的情况下,Flink作业在YARN集群中运行时所使用的Flink Runtime为提交作业的客户端所使用的Flink(例如,开源Flink 1.13等)。因此如果您想使用特定的Flink版本运行作业...

生命周期策略

本文为您介绍开源大数据开发平台E-MapReduce(简称EMR)的产品生命周期策略及产品终止策略(包含产品粒度与发行版本粒度),以便您知晓详细规则,提早做好相应准备。背景信息 产品的更新换代是基础技术软件领域的常态。在开源大数据社区蓬勃...

提交Flink作业

方式二:通过kubectl工具提交作业 通过kubectl连接Kubernetes集群,详情请参见 获取集群KubeConfig并通过kubectl工具连接集群。您也可以通过API等方式连接Kubernetes集群,详情请参见 使用Kubernetes API。新建 basic-emr-example.yaml ...

开源RabbitMQ迁移上云

在使用开源RabbitMQ集群时,当您希望能够解决各种稳定性痛点(例如消息堆积、脑裂等问题)、实现高并发、分布式、灵活扩缩容时,您可以将开源RabbitMQ集群迁移至 云消息队列 RabbitMQ 版,本文介绍迁移上云的前提条件、操作步骤、注意事项...

生命周期策略

本文为您介绍开源大数据开发平台E-MapReduce(简称EMR)的产品生命周期策略及产品终止策略(包含产品粒度与发行版本粒度),以便您知晓详细规则,提早做好相应准备。背景信息 产品的更新换代是基础技术软件领域的常态。在开源大数据社区蓬勃...

EMR-5.2.x版本说明

优化CBO(Cost-Based Optimization)、DPP(DynamicPartitionPruning)以及Z-Order等功能,性能比开源Spark 3版本提升50%。支持阿里云Log Service、DataHub和消息队列RocketMQ版(简称ONS)等数据源。Tez 优化Tez默认参数,以提升作业性能...

开启Nacos开源控制台

Nacos引擎提供一个默认的控制台操作页面,即 开源控制台。由于此控制台安全能力较弱,MSE Nacos从 2.2.3.1 版本开始,将 默认关闭 开源控制台。本文介绍如何重新开启开源控制台的使用。前提条件 已 开通MSE。已创建Nacos引擎。具体操作,请...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
云数据库 RDS 检索分析服务 Elasticsearch版 微服务引擎 性能测试 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用