迁移概述

其中,软件迁移支持迁移自研软件和开源软件:自研软件:指开发者开发的或者基于开源软件增强开发的软件。具体操作,请参见 源码迁移。开源软件:指开发者从开源社区下载未做源码修改的软件或者所使用操作系统生态中默认携带的软件。更多...

访问OSS出现CopyNotExcecuted问题

本文介绍JindoSDK访问OSS时,出现CopyNotExcecuted问题的原因和解决方法。问题详情 java.io.IOException:ErrorCode:25201,ErrorMsg:OSS Op Error.[ErrorMessage]:Error in xxxxxxxxxx/.hive-staging_hive_xxxxxxxxxxx/_tmp.-ext-10002/...

访问OSS出现AccessDenied问题

本文为您介绍JindoSDK访问OSS出现AccessDenied问题的原因和解决方法。问题详情 Failed test connectivity,operation:getFileStatus,errMsg:[RequestId]:635B6DDE9A1F093434AC6A7C[HostId]:oss-cn-beijing-internal.aliyuncs.com ...

Spark对接Kafka

背景信息 E-MapReduce上的Hadoop集群Kafka集群都是基于纯开源软件,相关编程使用方法可参见官方相应文档。Spark官方文档:streaming-kafka-integration structured-streaming-kafka-integration。E-MapReduce-demo:github地址。访问...

如何排查EMR Kafka服务异常

本文介绍如何排查EMR Kafka服务异常常见的异常处理方法。排查异常 说明 本文以Kafka Broker服务为例说明。登录EMR on ECS控制台,确认服务状态。说明 当组件状态不是 运行中 或者健康状态不是 良好,则说明组件存在异常。查看服务日志。...

迁移场景

软件迁移主要包含以下两种场景:自研软件:指开发者开发的或者基于开源软件增强开发的软件。自研软件使用的编程语言主要包含以下两类:编译型语言:以C++/Go为代表的编译型语言,这些语言会将源代码编译成架构相关的二进制文件,因此迁移后...

应用市场

概述 应用市场的软件应用包括应用目录,应用目录中的软件是容器服务ACK基于开源软件做了适配二次开发,其中包含了运行一个应用所需要的镜像、依赖资源定义等。应用目录中有简介、安装步骤、参数配置项、注意事项等信息。您可以通过Helm...

开源软件迁移

当前大部分应用系统都基于开源软件构建,并且大部分的开源软件在倚天ARM平台上已经提供较好的应用生态,您可以直接使用操作系统提供的开源生态软件来安装部署。本文介绍Nginx、MySQL、Redis、TensorFlow、PyTorch等开源软件如何在倚天...

产品架构

从上图可以看出EMR由四部分组成:社区开源产品 集成Apache社区开源大数据组件,例如Hadoop、HiveHBase,随着EMR版本更新,开源软件也会相应的升级,详情请参见 版本概述 下各版本的版本说明。注意 已经创建好的EMR集群不支持组件升级。...

阿里云RPA软件用户协议

(2)保留开源软件中原有的许可声明版权、专利、商标情况等标识;(3)任何情況下,乙方保证不会使软件中不是开源软件的部分面临必须开源的风险。4.软件中某些部分可能是由第三方提供的或被认为是第三方的技术。本协议中未授予乙方与第三...

免费体验Lindorm宽表性能&价格力

构建资源环境配置对等的云原生多模数据库 Lindorm和开源社区版HBase,基于相同的性能测试工具测试方法,一键开启测试任务,直观展示对比结果,带您所见即所得地感受Lindorm和开源社区版HBase在 吞吐性能 P99时延 两方面的对比。...

Demo App《软件许可协议》

开源软件 阿里云授权给您的软件中可能包含开源软件,您对开源软件的使用应该符合如下要求:(1)遵守相应的开源协议规定,开源协议的约定优于本协议的约定;(2)保留开源软件中原有的许可声明版权、专利、商标情况等标识;(3)任何情況...

管理LDAP认证

EMR-5.11.0及之前版本,EMR-3.45.0及之前版本 重要 如果您的EMR版本较低,没有相应的LDAP认证配置按钮,则需要参考开源软件的社区文档进行手动配置,以启用LDAP认证功能。在 组件列表 区域,选择 SparkThriftServer 操作列的>enableLDAP。...

什么是EMR Serverless Milvus

开源兼容性 100%兼容开源Milvus全托管服务,提供与原生软件交互性一致的产品使用体验,并默认提供开源可视化工具Attu。高安全性 基于阿里云专有网络(VPC)部署,提供专有网络访问,同时提供更细力度访问控制及更高安全等级保护。实例可...

E-MapReduce支持倚天云服务器

丰富的生态:倚天云服务器支持主流开源软件以及多款阿里云主流PaaS产品。最新网络架构:基于2*50 GB网络架构提供大带宽以及超强转发能力,对比上一代CIPU架构,网络带宽提升1倍。安全增强:支持vTPM特性,依托TPM/TCM芯片,实现从服务器到...

Hadoop DistCp介绍

Hadoop DistCp(分布式复制)是一个用于大型集群间或集群内数据复制的工具,通过MapReduce实现复制过程中数据的分发、错误处理、恢复及报告。本文为您介绍Hadoop DistCp与Jindo DistCp的区别、Hadoop DistCp使用方法以及常见问题。说明 ...

管理LDAP认证

EMR-5.11.0及之前版本,EMR-3.45.0及之前版本 重要 如果您的EMR版本较低,没有相应的LDAP认证配置按钮,则需要参考开源软件的社区文档进行手动配置,以启用LDAP认证功能。在 组件列表 区域,选择 TrinoMaster 操作列的>enableLDAP。在弹出...

Lindorm for Cassandra应用实践

可调一致性(无需repair数据)服务模式 自建 集群托管或者Serverless可选 可靠性 无SLA保障,开源软件BUG需要自行修复。SLA保障,并具备主备双活、备份、异地容灾等能力。冷热分离 不支持 透明冷热分离降低成本 全文检索 不支持 兼容CQL...

访问Web UI

解决方法:访问Web UI,需要ACK集群具备公网Ingress Controller以提供公网可达的域名,并转发请求到相应Service。如果创建ACK集群时没有勾选Ingress组件,则可以按照以下步骤为已有的ACK集群开启公网Ingress服务。进入集群详情页面。登录 ...

什么是EMR on ECS

EMR on ECS将EMR的大数据处理功能与ECS的容器化部署优势相结合,使得您可以更加灵活地配置管理EMR集群,从而更好地适应复杂的数据处理和分析场景。通过EMR on ECS,您可以快速创建、管理运维EMR集群,同时也能够更加高效地使用计算...

Trino概述

Trino(即原PrestoSQL)是一个开源的分布式SQL查询引擎,适用于交互式分析查询。EMR-3.44.0EMR-5.10.0版本开始改用社区正式名称Trino,之前各版本控制台显示为Presto,内核其实是Trino,使用时请注意区分。基本特性 Trino使用Java语言...

常见问题

问题原因:可能是在分区字段包含/(正斜线)的情况下,分区字段个数实际分区目录级数不一致,导致Spark分区裁剪失效。解决方法:您在使用Spark DataFrame API写Hudi表时,需要加上 hoodie.datasource.write.partitionpath.urlencode=true...

生命周期策略

本文为您介绍开源大数据开发平台E-MapReduce(简称EMR)的产品生命周期策略及产品终止策略(包含产品粒度与发行版本粒度),以便您知晓详细规则,提早做好相应准备。背景信息 产品的更新换代是基础技术软件领域的常态。在开源大数据社区蓬勃...

生命周期策略

本文为您介绍开源大数据开发平台E-MapReduce(简称EMR)的产品生命周期策略及产品终止策略(包含产品粒度与发行版本粒度),以便您知晓详细规则,提早做好相应准备。背景信息 产品的更新换代是基础技术软件领域的常态。在开源大数据社区蓬勃...

EMR Studio概述

EMR Studio是E-MapReduce提供的开源大数据开发套件,包含Apache Zeppelin、Jupyter NotebookApache Airflow等开源组件。能够无缝关联EMR集群(EMR on ECSEMR on ACK)的计算引擎提交任务,并提供了交互式开发、任务调度任务监控等...

Presto概述

与EMR软件栈完美结合,支持DLFOSS或OSS-HDFS。无需运维,EMR提供一站式服务。基本概念 数据模型 数据模型即数据的组织形式。Presto使用Catalog、SchemaTable三层结构来管理数据。Catalog:一个Catalog可以包含多个Schema,物理上指向...

Hive作业异常排查及处理

本文介绍Hive作业异常的排查方法和解决方法。异常排查 如果客户端遇到作业异常或性能等问题,您可以按照如下步骤进行排查:查看Hive客户端日志。Hive CLI命令行提交的作业客户端日志位于集群或Gateway节点的/tmp/hive/$USER/hive.log 或者/...

常见问题

DataFlow集群提供了很多商业化Connector,例如Hologres、SLS、MaxCompute、DataHub、ElasticsearchClickHouse等,您在Flink作业中除了可以使用开源的Connector之外,还可以使用这些商业化Connector。下面以Hologres Connector为例,介绍...

开源对比

云消息队列 RabbitMQ 版 是一款基于高可用分布式存储架构实现的AMQP 0-9-1协议的消息产品,能够兼容开源RabbitMQ客户端,与开源RabbitMQ相比,能够解决各种稳定性痛点(例如消息堆积、脑裂等问题),同时具备高并发、分布式、灵活扩缩容等...

SmartData常见问题

JindoFS是阿里云开源大数据E-MapReduce产品提供的一套Hadoop文件系统,主要对HadoopSpark大数据生态系统使用阿里云OSS提供多层次的封装支持优化。基础功能提供适配OSS支持访问,您可以直接使用JindoFS SDK;标准功能针对OSS提供分布...

功能特性

EMR on ECS 功能集 功能 功能描述 参考文档 集群管理 创建集群 您可以轻松构建运行Hadoop、Spark、Hive、Presto等开源大数据框架,以进行大规模数据处理和分析等操作。创建集群 释放集群 在完成EMR集群任务后及时释放集群,可以释放资源...

创建EMR Studio集群

高级设置 软件自定义配置:可指定JSON文件对集群中的基础软件(例如Hadoop、SparkHive等)进行配置,详细使用方法请参见 软件配置。默认不开启。硬件配置。区域 配置项 描述 付费类型 付费类型 默认包年包月。当前支持的付费类型如下:...

Sqoop概述

Sqoop是一款Apache社区的开源软件,支持在Hadoop生态软件结构化数据集(例如数据库)之间进行高效的批量数据传输。背景信息 常见数据传输场景如下:将MySQL数据导入HDFS 将HDFS数据导入MySQL 将Hive数据导入MySQL 将MySQL数据导入Hive 将...

OpenLDAP

OpenLDAP是LDAP协议(Lightweight Directory Access Protocol)的开源实现,在EMR集群中主要提供用户管理身份认证的功能。服务集成OpenLDAP 在EMR集群中,Knox服务默认与OpenLDAP服务对接。当您通过EMR控制台的 访问链接与端口 功能访问...

迁移方案

重要 对于DataStream作业来说,开源FlinkVVR的state是完全兼容的,但是对于SQL作业来说,VVR相比社区Flink,做了大量的优化工作,不能保证state完全兼容。对于state不能兼容的作业,无法从开源Flink生成的Checkpoint中恢复。对于这部分...

常见问题

解决方法有两种:如果实时性要求不高,建议增大mini batch的trigger size。定期运行Optimize,对表进行合并小文件的操作。Optimize执行时间很长是什么原因?如果长时间没有进行Optimize操作,Delta内可能会累积相当数量的小文件,此时运行...

Hadoop集群迁移至DataLake集群

本文将详细阐述如何将您已有的旧版数据湖集群(Hadoop),高效地迁移至数据湖集群(DataLake),以下分别简称“旧集群”“新集群”。迁移过程将充分考虑旧集群的版本、元数据类型以及存储方式,并针对这些因素,提供适应新集群的迁移策略...

Kafka常见问题

本文介绍使用Kafka时可能遇到的问题及解决方法。如何清理Kafka组件输出日志 如何清理Kafka-Manager服务输出日志 是否可以停止Kafka-Manager服务 报错“ERROR:Wile executing topic command:Replication factor:1 larger than available ...

大语言模型

模型简介 Qwen1.5 Qwen1.5是Qwen开源系列的下一个版本。与之前的版本相比,Qwen1.5显著提升了聊天模型与人类偏好的一致性,改善了它们的多语言能力,并具备了强大的链接外部系统能力。灵积上提供API服务的是新版本qwen模型的chat版本,在...

快速使用EMR on ACK

集群类型 Spark 通用的分布式大数据处理引擎,提供了ETL、离线批处理和数据建模等能力。重要 创建Spark集群后,如果您需要关联集群,则所选产品版本的大版本号需要关联的Shuffle Service集群大版本号一致。例如,EMR-5.x-ack版本的Spark...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
云数据库 RDS 对象存储 检索分析服务 Elasticsearch版 弹性公网IP 短信服务 人工智能平台 PAI
新人特惠 爆款特惠 最新活动 免费试用