最佳实践概览

Pack角色管理实现用户权限管控 配置Active Directory身份认证 日志全观测应用 通过Elastic实现Kubernetes容器全观测 基于Indexing Service实现数据流管理 通过OpenStore实现海量数据存储 数据管理可视化 基于Terraform管理阿里云...

常见问题

本文为您介绍数据构建的常见问题。如何申请数据构建产品的公测资格?数据构建如何收费?...目前DLF支持阿里云E-MapReduce产品组合实现Spark数据的读取,详细请参考:EMR+DLF数据解决方案,暂不支持自建Hadoop/Spark集群的集成。

搭建管理(基于Hadoop

通过MaxCompute与Hadoop构建湖仓一体方案旨在实现对海量数据的统一管理、存储和分析,提供了一个既能处理结构化、半结构化数据,又能满足高并发分析需求的一体化数据平台。本文为您介绍如何通过MaxCompute与Hadoop构建湖仓一体,以及管理湖...

概览

其适用场景主要包括:基础设施即代码(Infrastructure as Code,IaC):在需要以可编程和可重复的方式预置、管理和更新阿里云上的云基础设施时,CDK提供了一种强大的解决方案。通过编写代码定义你的资源栈(包含例如VPC、ECS实例、RDS数据...

全场景解决方案

平滑迁移异构治理 方案架构 双模微服务平台通过 SOFA 微服务和 Service Mesh 微服务,提供了既支持 SOFA 框架又支持 Service Mesh 架构的微服务管理和治理能力,解决用户在技术转型期间未改造的遗留系统相互之间的打通和过渡问题,帮助...

Iceberg概述

您可以借助Iceberg快速地在HDFS或者阿里云OSS上构建自己的数据湖存储服务,并借助开源数据生态的Spark、Flink、Hive和Presto等计算引擎来实现数据湖的分析。核心能力 Apache Iceberg设计初衷是为了解决Hive数仓上云的问题,经过多年迭代...

2023年

使用do-while节点实现复杂的数据分析 2023-09-20 新增通过跨项目数据访问实现不同地域MaxCompute项目数据迁移 新说明 本文为您介绍如何通过跨项目数据访问实现不同Region的MaxCompute项目数据迁移,包括两种使用场景:同云账号内不同Region...

2022年

基于MaxCompute的智能推荐解决方案 基于MaxCompute+开放搜索的电商、零售行业搜索开发实践 基于MaxCompute+PAI的用户增长方案实践 基于MaxCompute的实时数据处理实践 基于MaxCompute分布式Python能力的规模数据科学分析 基于MaxCompute+...

客户案例

解决方案 友盟+联合MaxCompute构建开发者数据银行,为企业提供面向分析的、实现友盟域数据与企业私域数据全面融合的自助分析服务“U-DOP数据开放”。该服务通过订阅数据包返还数据到MaxCompute,预置分析模板并结合可视化分析BI工具来快速...

客户案例

同时阿里云合作启动数据中台项目,可以帮助大润发降低TCO的同时,更好的依托云上生态,实现数据资产业务化闭环。客户需求 基于Hadoop开源生态打造,软硬件维护成本高昂,稳定性问题不断,严重影响业务经营分析。线上业务爆发,需求积压...

数据湖管理FAQ

本文汇总了数据湖管理相关的常见问题及解决方案。Lakehouse相关问题 什么是Lakehouse?Lakehouse数据入湖时,对线上RDS有压力吗?如何控制建仓的限流能力?Lakehouse工作负载为什么运行失败,又没有S park Log 日志可以看?元数据发现相关...

应用场景

该场景可实现:支持多数据源接入 支持数据库(RDS、PolarDB-X(原DRDS)、PolarDB、Oracle、SQL Server等),大数据(Flink、Hadoop、EMR、MaxCompute)、OSS、日志数据(Kafka、SLS等)以及本地数据导入。支持一键建仓 通过简单几步配置...

快速入门

背景信息 在阿里云Elastic Stack产品生态下,Elasticsearch作为实时分布式搜索和分析引擎,Logstash采集、转换、优化和输出数据,Beats从各个机器和系统采集数据高级监控报警服务提供Elasticsearch集群各类指标信息的监控,帮助您及时...

上海新能源汽车车辆基础数据

客户感言 2019年开始上海市新能源汽车大数据平台从自建Hadoop集群迁移至阿里云Lindorm+DLA Spark产品,有效解决了我们平台存储和计算的横向动态扩容瓶颈,同时借助其产品中间件LTS实现了我们平台数据的冷热分离,有效降低了数据存储成本,...

什么是MaxCompute

MaxCompute提供离线和实时的数据接入,支持规模数据计算及查询加速能力,为您提供面向多种计算场景的数据仓库解决方案及分析建模服务。MaxCompute还为您提供完善的数据导入方案以及多种经典的分布式计算模型,您可以不必关心分布式计算和...

应用场景

实时数据分析场景解决方案 步骤如下:实时摄入:通过直接读取Kafka数据实现。提供了Flink-Connector来支持Flink数据流的直接写入,并保证了exactly-once语义。此外,还支持Flink CDC来捕捉TP数据更新,并实时地将结果更新到StarRocks中。...

功能特性

数据库MongoDB版(ApsaraDB for MongoDB)完全兼容MongoDB协议,基于飞天分布式系统和高可靠存储引擎,提供多节点高可用架构、弹性扩容、容灾、备份回滚、性能优化等解决方案。本文介绍云数据库MongoDB版的功能特性。架构灵活 云数据库...

什么是云原生数据湖分析

云原生数据湖分析(简称DLA)是新一代大数据解决方案,采取计算存储完全分离的架构,支持数据库(RDS\PolarDB\NoSQL)消息实时归档建仓,提供弹性的SparkPresto,满足在线交互式查询、流处理、批处理、机器学习等诉求,也是传统...

2019年

概述 通过Tunnel迁移日志数据至MaxCompute 通过DataHub迁移日志数据至MaxCompute 通过DataWorks数据集成迁移日志数据至MaxCompute 通过日志服务迁移日志数据至MaxCompute 2019-12-25 新增开源地理空间UDF。新功能 您可以将开源地理空间UDF...

如何对JSON类型进行高效分析

针对海量半结构化数据计算分析,本文将以半结构化数据JSON为例,首先简述传统数据与数据仓库的解决方案,然后详细描述 PolarDB IMCI列式JSON、虚拟列、秒级加减列表列数扩展等技术点,最后给出 PolarDB IMCI列式JSON实时分析扩展流...

基本概念

M MaxCompute 大数据计算服务MaxCompute(原名ODPS)是一种快速、完全托管的TB、PB级数据仓库解决方案,提供了完善的数据导入方案以及多种经典的分布式计算模型,能够快速地解决海量数据计算问题。通过数据集成服务,可将Lindorm数据导入...

创建集群

通过阿里云E-MapReduce(简称EMR),您可以轻松构建和运行Hadoop、Spark、Hive、Presto等开源大数据框架,以进行规模数据处理和分析等操作。本文为您介绍在EMR on ECS上创建集群的操作步骤和相关配置,帮助您快速搭建和管理大数据集群。...

数据构建之MaxCompute湖仓一体最佳实践

MaxCompute+DLF湖仓一体方案打破数据与数据仓库割裂的体系,架构上将数据湖的灵活性、生态丰富与数据仓库的企业级能力进行融合,构建数据湖和数据仓库融合的数据管理平台。本文介绍湖仓一体的具体方案。背景信息 大数据计算服务...

概览

为了更好地指导您使用数据管理DMS(Data Management),DMS推出解决方案系列文档,旨在通过最佳实践(Step by Step)的形式向您介绍DMS研发流程、数据安全、数据开发的解决方案。研发流程解决方案 DMS为在线流程化系统,可统一管理企业内...

离线同步常见问题

MaxCompute如何实现列筛选、重排序和补空等 MaxCompute列配置错误的处理 MaxCompute分区配置注意事项 MaxCompute任务重跑和failover 报错信息及解决方案 报错信息及解决方案 数据同步报错:[TASK_MAX_SLOT_EXCEED]:Unable to find a ...

功能特性

计算 MaxCompute向用户提供了多种经典的分布式计算模型,提供TB、PB、EB级数据计算能力,能够更快速的解决用户海量数据计算问题,有效降低企业成本。功能集 功能 功能描述 参考文档 SQL开发 DDL语句 DDL语句 DDL DML操作 DML操作 DML操作 ...

JindoData版本说明

JindoData是阿里云开源大数据团队自研的数据湖存储加速套件,面向大数据和AI生态,为阿里云和业界主要数据湖存储系统提供全方位访问加速解决方案。本文为您介绍JindoData各版本支持的功能。背景信息 JindoData是原阿里云EMR SmartData组件...

产品简介

大数据专家服务 大数据专家服务(Bigdata Expert Service)是由阿里云大数据专家基于阿里云多年大数据架构、应用、运维、AI算法建模等最佳实践经验及方法论为用户提供全方位的大数据产品技术、...,帮助用户构建和持续优化的大数据体系架构...

注册EMR集群至DataWorks

背景信息 开源大数据开发平台 E-MapReduce(简称EMR),是运行在阿里云平台上的一种大数据处理的系统解决方案。EMR基于开源的Apache Hadoop和Apache Spark,让您可以方便地使用Hadoop和Spark生态系统中的其他周边系统分析和处理数据。EMR还...

常见术语

云原生数据湖分析(简称DLA)是新一代大数据解决方案,采取计算存储完全分离的架构,支持数据库(RDS\PolarDB)消息实时归档建仓,提供弹性的SparkPresto,满足在线交互式查询、流处理、批处理、机器学习等诉求,也是传统Hadoop方案...

应用上云方案设计

传输中数据保护:功能包括 TLS/SSL 层保护、数据丢失防护解决方案和安全数据传输;数据监控:通过操作中心(SOC)进行日志记录和监视功能;在云环境中,以数据为中心的保护需要在整个数据生命周期中进行。阿里云数据上云迁移最佳实践 数据库...

使用限制

单表QPS 500 单表分区数量 100万 数据湖入湖预处理作业 限制项 用户配额 用户入湖作业数量(每个region)1000个 每个入湖作业最大资源量 100CU 兼容使用限制说明 以下3种Hive特性不支持,建议采用最新Delta/Hudi/Iceberg方案替代:...

RDS术语

D DAS Database Autonomy Service,数据库自治服务,是一种基于机器学习和专家经验实现数据库自感知、自修复、自优化、自运维及自安全的云服务,帮助用户消除数据库管理的复杂性及人工操作引发的服务故障,有效保障数据库服务的稳定、安全...

DataWorks On CDP/CDH使用说明

环境准备 一、资源准备 类别 描述 相关文档 版本选择 DataWorks基础版服务可满足 CDP或CDH 基本的数据上云、数据开发调度生产、简单的数据治理工作,若需获取更专业的数据治理、数据安全解决方案,可选择相应的 标准版、专业版、企业版 ...

引擎类型

云原生多模数据库 Lindorm 内含宽表引擎、时序引擎、搜索引擎、文件引擎、计算引擎和流引擎,兼容HBase/Cassandra/S3、OpenTSDB、Solr、HDFS、Kafka等多种开源标准接口,同时提供SQL查询、时序处理、文本检索分析等能力。为应对动态变化的...

快速创建Milvus实例

通过创建阿里云向量检索Milvus实例,能够迅速搭建起具备高性能、弹性伸缩特性的AI向量检索数据库,并借助内置可视化管理工具Attu实现高效运维监控。本文为您介绍如何快速创建Milvus实例。前提条件 已拥有阿里云账号。如果您还没有阿里云...

产品架构

最后,数据通道服务(LTS)负责引擎之间的数据流转和数据变更的实时捕获,以实现数据迁移、实时订阅、数湖转存、数仓回流、单元化多活、备份恢复等能力。分布式文件系统 LDFS(Lindorm DFS,也称为Lindorm文件引擎)是面向云基础存储设施...

基于DLF、RDS或Flink、OSS支持Delta Lake或Hudi存储...

数据湖存储管理 对象存储OSS 数据构建DLF 将在线数据库中的源数据引入数据湖时,OSS会作为数据湖的统一存储,存储机制包含Delta Lake和Hudi两种。同时,DLF采用元数据管理功能管理元数据库和元数据表。数据湖探索分析 MaxCompute ...

概述

为了面向在线业务场景构建一套完整的数据库+缓存的解决方案实现对在线业务场景的数据访问、存储和加速,为客户提供一站式的解决方案,PolarDB MySQL版 推出了数据与缓存一站式的功能。技术原理 PolarDB MySQL版 数据与缓存一站式的功能中...

产品优势

云原生数据湖分析DLA(Data Lake Analytics)是新一代大数据解决方案,采取计算存储完全分离的架构,支持数据消息实时归档建仓。DLA提供弹性的SparkPresto,满足在线交互式查询、流处理、批处理、机器学习等诉求,也是传统Hadoop...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
数据传输服务 云原生大数据计算服务 MaxCompute 开源大数据平台 E-MapReduce 云服务器 ECS 商标服务 弹性公网IP
新人特惠 爆款特惠 最新活动 免费试用