概述

Alluxio是一个面向基于云的数据分析和人工智能的开源的数据编排技术。Alluxio为数据驱动型应用和存储系统构建了桥梁,将数据从存储层移动到距离数据驱动型应用更近的位置,从而能够更容易被访问,同时使得应用程序能够通过一个公共接口连接...

快速入门

MySQL快速入门 SQL Server快速入门 PostgreSQL快速入门 MariaDB快速入门 数据库引擎 以下是对四种数据库引擎的介绍:云数据库RDS MySQL MySQL是全球受欢迎的开源数据库之一,作为开源软件组合LAMP(Linux+Apache+MySQL+Perl/PHP/Python)中...

EMR Studio概述

EMR Studio是E-MapReduce提供的开源数据开发套件,包含Apache Zeppelin、Jupyter Notebook和Apache Airflow等开源组件。能够无缝关联EMR集群(EMR on ECS和EMR on ACK)的计算引擎提交任务,并提供了交互式开发、任务调度和任务监控等...

产品优势

背景信息 云原生多模数据库 Lindorm 兼容HBase、Cassandra、S3、TSDB、HDFS、Solr等多种标准接口,支持宽表、时序、对象、文本、队列、空间等多种数据模型,适用于日志、账单、标签等多种数据的存储及分析,具有高性能、低成本等特点。...

添加开源Elastic Search数据

前提条件 已准备好待添加的开源Elastic Search数据源。添加开源Elastic Search数据源 登录 DataV控制台。在 我的数据 页签中选择 数据源管理,单击 添加数据。从 类型 列表中,选择 开源Elastic Search。填写开源Elastic Search数据服务...

添加开源Elastic Search数据

前提条件 已准备好待添加的开源Elastic Search数据源。添加开源Elastic Search数据源 登录 DataV控制台。在 工作台 页面,单击 数据准备>数据源,进入 数据源 页面,单击 新建数据源。从 类型 列表中,选择 开源Elastic Search。填写开源...

相关的云服务

专有网络VPC 专有网络VPC可以为开源数据平台E-MapReduce提供隔离、稳定、安全、快速交付、自主可控的网络环境。您可以自定义这个专有网络的拓扑和IP地址,适用于对网络安全性要求较高的用户。弹性公网IP 弹性公网IP位于阿里云的公网网关...

EMR Doctor概述

E-MapReduce Doctor(简称EMR Doctor)是E-MapReduce产品自研的面向开源数据集群的智能运维诊断系统。通过EMR Doctor(即集群管理页面的“健康检查”功能)可以全局了解集群的健康状况和动态走势,为运维决策和资源优化提供有力的信息...

Iceberg概述

而Iceberg简化了工作流程,整个数据处理过程是一条完整的、可靠的实时流,其数据的清洗、转换和特征化等操作都是流上的节点动作,无需处理历史数据和实时数据。此外,Iceberg还支持原生的Python SDK,对于机器学习算法的开发者非常友好。

管理网络配置

在EMR Notebook的使用过程中,需要确保外部集群、数据源与工作空间机器的网络连通性。本文为您介绍如何添加、修改工作空间的网络配置。前提条件 已创建工作空间,详情请参见 管理工作空间。使用限制 在网络配置阶段,仅支持使用以下指定...

在EMR上使用Sqoop与数据库同步数据的网络配置

如果您的E-MapReduce(EMR)集群需要和集群之外的数据库同步数据,确保网络是联通的。本文以RDS、ECS自建和云下私有数据库三种情况为例,分别介绍如何配置网络。云数据库RDS Sqoop是用map任务同步数据,可以在任意节点上运行,而Sqoop任务...

开通EMR Doctor(Hadoop集群类型)

功能介绍 EMR Doctor是开源数据集群的管家,提供了一站式的智能诊断和优化服务。通过EMR Doctor,您可以高效地运维大数据集群和服务,持续的优化集群的资源使用率,使集群处于健康稳定的状态,更好的为上层业务提供计算服务。EMR Doctor...

新功能发布记录

2024-03-14 管理尽力交付 2023年 2023年10月 功能名称 功能概述 发布时间 相关文档 EMR正式支持倚天云服务器 阿里云E-MapReduce(简称EMR)支持使用倚天云服务器构建开源数据集群。与现有X86架构实例体验完全相同的情况下,具有更高的性...

开源支持

本文将为您介绍MaxCompute相关的开源功能。SDK MaxCompute提供Java SDK和Python SDK接口实现创建、查看、删除MaxCompute表等操作。通过SDK,您可以通过编辑代码灵活地操作MaxCompute。MaxCompute提供的SDK如下:Java SDK Java SDK使用说明...

管理中心功能概览

例如,在配置数据集成任务前,可先在DataWorks数据源管理页面,配置好需同步的源端和目标端数据库或数据仓库的相关信息,并在同步过程中,通过数据源名称来控制读取和写入的数据库或数据仓库。开源集群 在 开源集群 处,可管理已绑定至...

产品概述

EMR基于开源的Apache Hadoop和Apache Spark,让您可以方便地使用Hadoop和Spark生态系统中的其他周边系统分析和处理数据。EMR还可以与阿里云其他的云数据存储系统和数据库系统(例如,阿里云OSS和RDS等)进行数据传输。阿里云EMR提供了on ...

产品简介

EMR基于开源的Apache Hadoop和Apache Spark,让您可以方便地使用Hadoop和Spark生态系统中的其他周边系统分析和处理数据。EMR还可以与阿里云其他的云数据存储系统和数据库系统(例如,阿里云OSS和RDS等)进行数据传输。产品介绍 阿里云EMR...

什么是EMR on ECS

产品优势 EMR为您提供了相对方便可控的企业级开源数据服务。您可以快速搭建开源数据服务,例如Hadoop、Spark、Flink、Kafka和HBase服务。100%采用社区开源组件,适配并优化开源组件,性能远高于开源版本。基于时间的弹性伸缩能力,抢占...

产品优势

稳定可靠的开源组件 100%采用社区开源组件,随开源版本升级迭代,详情请参见 版本概述。适配开源组件,避免开源组件之间的版本兼容性问题。基于开源组件,优化和增强阿里云部署环境,性能远高于开源版本。节约成本 通过有效弹性伸缩和数据...

JindoFS介绍和使用

JindoFS是基于阿里云对象存储OSS,为开源数据生态构建的Hadoop兼容文件系统(Hadoop Compatible File System,HCFS)。JindoFS提供兼容对象存储的纯客户端模式(SDK)和缓存模式(Cache),以支持与优化Hadoop和Spark生态大数据计算对OSS...

网络访问与安全设置

重要 StarRocks公网访问使用阿里云CLB功能,由此产生的网络费用按照 CLB计费概述 进行收费。如果StarRocks实例开启了公网访问,则会自动在您的阿里云账户下创建一系列的CLB实例,这些CLB实例开启了删除保护功能,不能随意删除。默认情况下...

查看监控报表

使用限制 仅保存最近30天内的报表数据,超出此期限的数据将不再保留。操作步骤 进入EMR Serverless StarRocks实例列表页面。登录 E-MapReduce控制台。在左侧导航栏,选择 EMR Serverless>StarRocks。在顶部菜单栏处,根据实际情况选择地域...

网络访问与安全设置

网络安全设置 您可以通过设置网络安全白名单来限制Milvus实例的访问,以保证您的服务数据安全。网络安全设置包含VPC内网访问安全组白名单和公网访问控制策略白名单两部分。VPC内网访问安全组白名单(内网访问控制)在目标实例的 实例详情 ...

产品优势

云消息队列 Kafka 版 100%兼容开源,支持0.10.x~2.6.x的开源版本,无需代码改造无缝迁移上云,体验全托管、免运维的分布式消息队列服务。开箱即用 云消息队列 Kafka 版 100%兼容开源,使您无缝迁移上云。兼容开源:云消息队列 Kafka 版 100...

Hudi概述

Apache Hudi是一种数据湖的存储格式,在Hadoop文件系统之上提供了更新数据和删除数据的能力以及消费变化数据的能力。Hudi表类型 Hudi支持如下两种表类型:Copy On Write 使用Parquet格式存储数据。Copy On Write表的更新操作需要通过重写...

Flink DataStream参考

DataFlow集群的Flink DataStream API完全兼容开源的Flink版本,关于Flink DataStream API的详细信息,请参见 Flink DataStream API Programming Guide。上下游存储(Connector)开源Flink的上下游存储,请参见 DataStream Connectors。...

DTS_BINLOG_PARSER

DTS_BINLOG_PARSER用于SELECT语句中,表示对数据传输服务(Data Transmission Service,简称DTS)传输的数据库binlog数据进行解析。背景信息 注意 当前只支持解析DTS同步的RDS binlog数据。DTS_BINLOG_PARSER解析结果是一个STRUCT类型,...

使用须知

访问Lindorm CDC数据的介绍 访问语法示例:Lindorm宽表引擎(lindorm_table)中有一个Database名称为DB1,DB1中有一个表名为tableX,可以通过以下两种方式查询表的数据。示例一 SELECT fieldA FROM lindorm_table.DB1.tableX;示例二 USE ...

内表数据

本文为您介绍什么是内表数据源(Default Catalog),以及如何使用Default Catalog查询StarRocks内部数据。Default Catalog StarRocks 2.3及以上版本提供了Internal Catalog(内部数据目录),用于管理StarRocks的内部数据。每个StarRocks...

JindoData概述

JindoData是阿里云开源数据团队自研的数据湖存储加速套件,面向大数据和AI生态,为阿里云和业界主要数据湖存储系统提供全方位访问加速解决方案。JindoData套件基于统一架构和内核实现,主要包括JindoFS存储系统(原JindoFS Block模式)、...

Default Catalog

StarRocks 2.3及以上版本提供了Internal Catalog(内部数据目录),用于管理StarRocks的内部数据。本文为您介绍如何查询内部数据。背景信息 每个StarRocks实例都有且只有一个Internal Catalog,名为 default_catalog。StarRocks暂不支持...

EMR Workbench

阿里云EMR Workbench是一个综合性的大数据分析和开发环境,作为阿里云E-MapReduce的一部分,它提供了EMR Notebook和EMR Workflow两个核心功能。通过EMR Workbench,您可以轻松进行数据开发,以及交互式数据分析,并设计复杂的数据处理工作...

集群容灾能力

在阿里云上,如果使用的是云盘技术,则每一个云盘在后台都会对应三个数据副本,当其中任一个出现问题时,副本数据都会自动进行切换并恢复,以保证数据的可靠性。Hadoop HDFS是一个经历了长时间考验且具有高可靠性的数据存储系统,已实现了...

使用Spark处理JindoFS上的数据

Spark中读写JindoFS上的数据,与处理其他文件系统的数据类似,以RDD操作为例,直接使用jfs的路径即可:val a=sc.textFile("jfs:/emr-jfs/README.md")写入数据:scala>a.collect().saveAsTextFile("jfs:/emr-jfs/output")SparkSQL 创建数据...

OSS/OSS-HDFS概述

使用OSS或OSS-HDFS存储数据可以有效节省成本,结合低频、归档和冷归档等方式,可以进一步优化冷数据的存储成本。可扩展性。OSS和OSS-HDFS具有更好的可扩展性,不受硬盘容量限制,无需人工扩容。特性 通过JindoSDK使用OSS和OSS-HDFS的特性...

SQL

SQL任务类型,用于连接数据库并执行相应SQL。本文为您介绍创建SQL类型任务时涉及的参数,并提供了SQL任务的示例。参数说明 参数 说明 节点名称 任务的名称。一个工作流定义中的节点名称是唯一的。运行标志 正常(默认):运行工作流时执行...

元数据管理常见问题

问题分析:由于删除OSS上的表数据之前,没有删除数据表对应的元数据,导致表的Schema还存在,但实际的数据已经不存在或已经移动到别的路径。解决方法:可以先修改表的Location为一个存在的路径,然后再删除表。alter table test set ...

Catalog概述

本文为您介绍什么是Catalog(数据目录),以及如何使用Catalog管理和查询内外部数据。基本概念 内部数据:保存在StarRocks中的数据。外部数据:保存在外部数据源(例如Apache Hive、Apache Iceberg和Apache Hudi)中的数据。Catalog ...

查看元数据

元数据管理功能主要为您展示当前实例的所有数据库,数据表,分区及各种任务等信息。本文为您介绍如何通过EMR StarRocks Manager查看元数据。前提条件 已创建StarRocks实例,详情请参见 创建实例。使用限制 普通用户无法查看数据库大小、...

Spark对接MaxCompute

本文介绍如何在Spark中进行MaxCompute数据的读写操作。操作步骤 初始化一个OdpsOps对象。在Spark中,MaxCompute的数据操作通过OdpsOps类完成。import ...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
云数据库 RDS 数据库备份 DBS 云数据库 Redis 版 弹性公网IP 短信服务 人工智能平台 PAI
新人特惠 爆款特惠 最新活动 免费试用