MongoDB

重要 云原生数据湖分析(DLA)产品已退市,云原生数据仓库 AnalyticDB MySQL 版 湖仓版支持DLA已有功能,并提供更多的功能和更好的性能。AnalyticDB for MySQL 相关使用文档,请参见 访问MongoDB数据源。前提条件 已经开通对象存储OSS...

测试方法

本次测试采用3种不同的测试场景,针对开源自建的Hadoop+Spark集群与阿里云云原生数据湖分析DLA Spark在执行Terasort基准测试的性能做了对比分析。您可以按照本文介绍自行测试对比,快速了解云原生数据湖分析(DLA)Spark引擎的性价比数据。...

ListSparkJob

调用ListSparkJob用于翻页提取某个数据湖分析Spark虚拟集群的历史作业详情信息。调试 您可以在OpenAPI Explorer中直接运行该接口,免去您计算签名的困扰。运行成功后,OpenAPI Explorer可以自动生成SDK代码示例。请求参数 名称 类型 是否必...

验证分析型查询请求能力

概念介绍 OLAP(Online Analytical Processing)是一种面向分析的、多维数据分析技术。它适用于处理大规模、多维的数据集,能够帮助用户进行数据分析、数据挖掘、业务决策等。并行执行 OceanBase 数据库的并行执行指的是在分布式架构下进行...

分析外部OSS上的数据

技术原理 列存索引(IMCI)是一个高性能的列存分析引擎,相关文档请参见 PolarDB HTAP实时数据分析技术解密,ORC和Parquet也是列存格式,OSS支持高并发读取,在高并发时可以获取更高的网络吞吐。因此,IMCI的并行扫描功能可以充分利用OSS的...

功能特性

实例会话 查询治理 通过离线数据分析技术,每天对所有数据库实例的慢SQL进行统计和打标,帮助您对慢SQL进行自动分类和划分治理优先级,同时提供治理建议。查询治理 慢日志分析 统计并分析数据库实例中执行时间超过阈值的SQL语句,并提供...

ETL工作流快速体验

该案例将通过数据分析技术,解析用户访问日志,结合用户信息,获取用户画像,并自动更新用户画像,实现网站的精细化运营。案例配套文档:简单用户画像分析(MaxCompute版)。电商漏斗模型分析 DataWorks MaxCompute 数据开发 基于漏斗模型...

性能优化与诊断简介

查询治理 通过离线数据分析技术,在每天凌晨1点将全部实例在昨天产生的慢SQL进行统计分析和自动打标,帮助您对慢SQL进行自动分类和划分治理优先级,同时提供治理建议和数据导出功能。SQL洞察和审计 在全量请求和安全审计的基础上,融合了...

Lindorm实时入建仓分析

前提条件 已在DLA中开通云原生数据湖分析服务。更多信息,请参见 开通云原生数据湖分析服务。已创建Spark引擎的虚拟集群。更多信息,请参见 创建虚拟集群。已创建Presto CU版虚拟集群。更多信息,请参见 DLA Presto CU版本快速入门。如果您...

DLA Lakehouse实时入

背景信息 数据湖分析(Data Lake Analytics)是⽬前炙⼿可热的⽅向,主要是以对象存储系统为核心,构建海量、低成本的结构化、半结构化、⾮结构化对象⽂件的入湖、存储和分析业务。⽬前各⼤云⼚商都在积极跟进,布局相关的业务能力,阿⾥云...

Paimon概述

您可以借助Apache Paimon快速地在HDFS或者云端OSS上构建自己的数据湖存储服务,并接入上述计算引擎实现数据湖分析。目前Apache Paimon提供以下核心能力:基于HDFS或者对象存储构建低成本的轻量级数据湖存储服务。支持在流模式与批模式下...

基于DLF、RDS或Flink、OSS支持Delta Lake或Hudi存储...

步骤六:基于MaxCompute分析数据湖数据 通过DataWorks控制台的数据湖集成界面创建External Project,对数据湖数据进行分析。步骤一:授予MaxCompute访问DLF和OSS的权限 操作MaxCompute项目的账号未经授权无法访问DLF、OSS服务,您需要执行...

Kafka实时入建仓分析

前提条件 已在DLA中开通云原生数据湖分析服务。更多信息,请参见 开通云原生数据湖分析服务。已创建Spark引擎的虚拟集群。更多信息,请参见 创建虚拟集群。如果您使用RAM子账号登录,还需要进行如下操作:已授予RAM子账号...

数据分析整体趋势

综上所述,数据分析技术趋势主要包括:云原生分布式:无论是OLTP还是OLAP,如今单机数据已无法满足企业业务和数据快速增长的需求,分布式数据库成为主流,同时数据库市场未来主要在云上("Gartner:The Future of the DBMS Market Is Cloud...

产品简介

StarRocks作为一款兼容MySQL协议的OLAP分析引擎,提供了极致的性能和丰富的OLAP场景模型,包括OLAP多维分析、数据湖分析、高并发查询以及实时数据分析。关于EMR Serverless的更多介绍,请参见 什么是EMR Serverless StarRocks。产品架构 ...

产品概述

StarRocks作为一款兼容MySQL协议的OLAP分析引擎,提供了极致的性能和丰富的OLAP场景模型,包括OLAP多维分析、数据湖分析、高并发查询以及实时数据分析。关于EMR Serverless的更多介绍,请参见 什么是EMR Serverless StarRocks。产品架构 ...

功能特性

OSS数据湖加速 通过创建外部表加速查询MaxCompute数据 开发工具和分析工具 HoloWeb Holoweb是基于Hologres引擎的可视化数据库管理和开发一站式平台,灵活适用于数据库管理、数据库接入、数据开发、数据分析、性能分析和诊断等用户场景。...

数据洞察

该功能利用AI技术辅助数据分析,帮助您解析复杂数据,并为业务决策提供支持。权限说明 已拥有数据分析权限,查看角色权限列表请参见:数据分析预设角色权限列表。角色授权,授权操作请参见:添加空间成员并管理成员角色权限。前提条件 数据...

基于Delta lake的一站式数据湖构建与分析实战

企业构建和应用数据湖一般需要经历数据入湖、数据湖存储与管理、数据湖探索与分析等几个过程。本文主要介绍基于阿里云数据湖构建(DLF)构建一站式的数据入湖与分析实战。背景信息 随着数据时代的不断发展,数据量爆发式增长,数据形式也变...

常见问题

数据湖后端存储使用OSS,用户使用数据湖构建面向大数据分析和机器学习场景可以获得集中式权限管理和统一的元数据视图,更容易对接云上大数据和分析产品。什么情况下我需要使用数据湖构建?在云上有数据分析和机器学习需求,希望构建云上的...

【通知】停止售卖云原生数据湖分析DLA

阿里云计划停止售卖云原生数据湖分析DLA,其湖分析功能将并入云原生数据仓库AnalyticDB MySQL版。停售对象 云原生数据湖分析DLA 停售计划 2023年06月01日起,停止新购云原生数据湖分析DLA实例和开通服务。2023年12月01日起,停止升级云原生...

Flink VVP+DLF数据分析实践

Flink任务可以利用数据湖统一存储的优势,使用Hudi结果表或Iceberg结果表,将作业的结果输出到数据湖中,实现数据湖分析。在写入数据湖的过程中,Flink可以通过设置DLF Catalog,将表的元数据同步到数据湖构建(DLF)中。依托数据湖构建...

概述

数据湖构建可以帮助用户快速构建云上数据湖,采用统一的管理视角治理数据湖。本产品目前处于公测阶段,您可以随时开通使用,目前数据湖构建所有功能均为免费使用阶段。用户使用流程 数据湖构建将帮助您快速简洁抽取源数据到统一数据湖的...

仓一体

有关SelectDB支持的外部数据源,请参见 数据湖分析 和 数据库分析。云数据库SelectDB 也提供表函数功能(Table-Value-Function或TVF),支持把S3、HDFS等常见远端存储中的文件数据,映射成 云数据库SelectDB 中的表,从而方便地对这些文件...

支持的数据

PolarDB分布式版(原DRDS)DTS 数仓版(3.0)通过DTS导入数据 仓版(3.0)通过DTS导入数据 DataWorks 数仓版(3.0)通过DataWorks导入数据 仓版(3.0)通过DataWorks导入数据 PolarDB MySQL 联邦分析 湖仓版(3.0)通过联邦分析功能...

关系数据库全量入

本文为您介绍如何在数据湖构建(Data Lake Formation,简称DLF)中使用关系数据库全量入湖任务将RDS或PolarDB数据批量同步到数据湖中。重要 数据入湖功能已经停止更新,如果您有数据入湖需求请参考:数据入湖停止更新公告。前提条件 已开通...

角色管理

本文档主要为您说明如何管理数据湖构建中的角色。说明 子账号需要具备admin(数据湖管理员)或 super_administrator(超级管理员)的权限,才可以进行角色相关操作。查看角色信息 1.打开 数据湖构建控制台,并打开数据权限管理-角色菜单。2...

基础操作

数据湖构建(Data Lake Formation,简称DLF)支持多种入湖任务类型用于快速构建数据湖,通过入湖任务,您可以定义数据入湖的方式和所消耗的资源。本文为您介绍入湖任务的基础操作。重要 数据入湖功能已经停止更新,如果您有数据入湖需求请...

数据湖构建之MaxCompute湖仓一体最佳实践

MaxCompute+DLF湖仓一体方案打破数据湖与数据仓库割裂的体系,架构上将数据湖的灵活性、生态丰富与数据仓库的企业级能力进行融合,构建数据湖和数据仓库融合的数据管理平台。本文介绍湖仓一体的具体方案。背景信息 大数据计算服务...

快速入门

数据湖构建(Data Lake Formation,DLF)产品主要使用流程如下。前提条件 注册阿里云账号,并完成 实名认证。创建数据源 创建数据湖的入湖来源,当前支持阿里云RDS MySQL和PolarDB作为数据来源。您需要输入RDS MySQL连接的用户名和密码。...

DLF中数据功能停止更新公告

数据湖构建(DLF)产品的数据入湖功能已于2023年02月15日停止更新,但会持续运维已有数据入湖作业。为了确保您业务连续性,建议您采用其他方式进行数据入湖,推荐使用 数据集成概述 或 Flink CDC:如 MySQL CDC DataStream Connector。停止...

服务等级协议

自2021年1月起,数据湖构建(DLF)服务等级协议(SLA)生效。详细内容参考 数据湖构建服务等级协议。

使用限制

您在使用数据湖构建(Data Lake Formation,简称DLF)控制台和接口时,产品做了如下限制,请在使用时注意不要超过相应的限制值,以免出现异常。数据湖元数据 限制项 用户配额 单表QPS 500 单表分区数量 100万 数据湖入湖预处理作业 限制项 ...

配置流入任务延迟监控

您可以通过云监控查看数据湖构建(DLF)流任务延迟状况,以及为每一个流任务设置报警规则,帮助您监控流任务运行状态。重要 数据入湖功能已经停止更新,如果您有数据入湖需求请参考:数据入湖停止更新公告。查看流任务监控数据 您可以在...

用户管理

本文档主要为您说明如何管理数据湖构建中已添加的用户。查看用户列表 1.打开 数据湖构建控制台,并打开数据权限管理-用户菜单。2.打开用户列表信息页面。说明 此处管理的用户为添加到数据湖构建中的用户,目前仅支持添加RAM用户到数据湖...

应用场景

使用StarRocks统一管理数据湖和数据仓库,将高并发和实时性要求很高的业务放在StarRocks中进行分析,也可以使用External Catalog和外部表进行数据湖上的分析。典型场景的解决方案 OLAP通用场景解决方案 业务背景:该方案适用于多种业务场景...

MaxCompute仓一体概述

MaxCompute提供湖仓一体方案,该方案可以打破数据湖与数据仓库割裂的体系,并将数据湖的灵活性、生态丰富能力与数据仓库的企业级部署能力进行融合,助力构建数据湖和数据仓库相融合的数据管理平台。本文介绍如何通过MaxCompute和异构数据...

查询多个备份集

管理数据湖 若您在创建数据湖后仍想添加备份集,您可以通过 添加备份集 功能,按需往数据湖中添加备份集。由于每个备份计划仅支持同时创建一个数据湖,若您想创建新的数据湖,需要先关闭原有数据湖才可以重新建湖。登录 DBS控制台。单击...

DLF统一元数据

背景信息 阿里云数据湖构建是一款全托管的快速帮助用户构建云上数据湖的服务,产品为云原生数据湖提供了统一的元数据管理、统一的权限与安全管理、便捷的数据入湖能力以及一键式数据探索能力,详细信息请参见 数据湖构建产品简介。...

Kafka实时入

本文为您介绍如何在数据湖构建(Data Lake Formation,简称DLF)中使用Kafka实时入湖任务将数据同步到数据湖中。重要 数据入湖功能已经停止更新,如果您有数据入湖需求请参考:数据入湖停止更新公告。前提条件 已开通数据湖构建服务,尚未...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
云数据库 RDS 数据库备份 DBS 云服务器 ECS 云原生数据湖分析 (文档停止维护) 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用