应用场景

EMR Serverless Spark可以满足企业级用户的多种数据处理与分析需求。本文介绍EMR Serverless Spark的应用场景以及相应的解决方案。建立数据平台 得益于其开放式架构设计,EMR Serverless Spark极大地简化并提升了在数据湖环境中对结构化和...

数据开发概述

数据处理:通过编写代码的方式构建复杂的数据模型、构建同步任务和构建不同类型的代码任务。即席查询:即主题式查询,面向业务主题的数据查询。屏蔽了物理模型中技术特性带来的影响,基于逻辑模型从业务视角出发对外提供查询服务。双开发...

数据开发概述

数据处理:通过编写代码的方式构建复杂的数据模型、构建同步任务和构建不同类型的代码任务。即席查询:即主题式查询,面向业务主题的数据查询。屏蔽了物理模型中技术特性带来的影响,基于逻辑模型从业务视角出发对外提供查询服务。双开发...

外部表概述

该机制使得用户可以无需将数据导入到MaxCompute内部存储,直接对外部数据进行操作,从而提供了数据处理的灵活性和方便性。背景信息 MaxCompute SQL作为分布式数据处理的主要入口,可实现EB级别离线数据的快速处理和存储。随着大数据业务的...

概述

高性能版(推荐使用):基于基础版Spark全密态引擎提供的数据加密能力,高性能版的Spark全密态计算引擎结合Gluten和Velox,提供了向量化计算的能力,在保证数据传输与存储过程安全的同时,提升了数据处理效率。基础版和高性能版Spark全密态...

基本概念

任务实例说明 任务(Task):数据处理作业单元,任务定义了数据处理的操作以及其相关的配置,一个任务通常包含了需要执行的SQL、Python脚本或者应用包等,以及计算引擎的配置信息。任务依赖(Task Deps):当前任务可能需要有另外(1或者n...

Kafka实时入湖

本文为您介绍如何在数据湖构建(Data Lake Formation,简称DLF)中使用Kafka实时入湖任务将数据同步到数据湖中。重要 数据入湖功能已经停止更新,如果您有数据入湖需求请参考:数据入湖停止更新公告。前提条件 已开通数据湖构建服务,尚未...

影响查询性能的因素

节点数量 AnalyticDB MySQL版 使用了分布式数据处理架构,一条查询会被分解成多个Stage在不同的节点上并行执行。所以如果集群中的节点数量越多,AnalyticDB MySQL版 处理查询的能力也会越强。您可以根据实际的业务需求来决定集群节点的购买...

EMR Workbench

通过EMR Workbench,您可以轻松进行数据开发,以及交互式数据分析,并设计复杂的数据处理工作流。功能介绍 EMR Notebook 交互式编程环境:支持Jupyter笔记本,提供灵活的编程环境。多语言支持:允许使用Python、SQL等多种语言进行数据分析...

流式数据通道概述

MaxCompute流式数据通道服务提供了以流式的方式把数据写入MaxCompute的能力,使用与原批量数据通道服务不同的一套全新的API及后端服务。流式服务在API上极大简化了分布式服务的开发成本,同时解决了批量数据通道在高并发、高QPS(Queries-...

PolarDB PostgreSQL版间的迁移

是:配置ETL功能,并在文本框中填写数据处理语句,详情请参见 在DTS迁移或同步任务中配置ETL。否:不配置ETL功能。保存任务并进行预检查。若您需要查看调用API接口配置该实例时的参数信息,请将鼠标光标移动至 下一步保存任务并预检查 按钮...

PolarDB PostgreSQL版(兼容Oracle)间的迁移

2.0版本引入了新的查询优化算法和存储引擎,提高了查询速度和并发处理能力,能够更快地处理大量数据,提升数据库的响应能力和性能。此外,2.0版本还引入了许多新的功能和增强功能,提供更好的用户体验和开发者工具。例如,改进了对JSON数据...

版本发布记录

接入DataWorks任务调度 接入DataWorks任务调度,使得用户能够可视化轻松定制数据湖分析的数据处理流程,实现云上大数据WorkFlow。接入函数计算 接入函数计算,使得用户能够基于这两款Serverless化云产品,构建云原生Serverless工作流。接入...

DataWorks模块使用说明

使用流程与主要子模块 DataWorks为您提供从端到端的一站式数据开发治理平台,数据处理流程主要包括以下几个阶段。各个阶段DataWorks的主要子模块如下。数据集成 子模块:数据集成 功能说明:数据集成是稳定高效、弹性伸缩的数据同步平台,...

离线同步数据质量排查

如果写出数据和目标存储已有数据发生数据约束(主键冲突、唯一键约束、外键约束等),数据库则使用来源数据update更新目标表已有数据行,在目标表存在多个数据约束的情况下,数据替换可能会失败并产生脏数据 如果写出数据和目标存储已有...

数据下载

在DataWorks的数据开发(DataStudio)、数据分析、安全中心模块下载的CSV、XLSX格式文件数据将同步保存至数据下载功能。通过该功能,您可将所需历史下载文件重新下载至本地使用,也可追溯历史下载记录的操作详情。前提条件 已通过如下模块...

引擎类型

流引擎 兼容SQL、Kafka接口 IoT数据处理、应用日志处理、物流时效分析、出行数据处理、轨迹实时分析等场景。流引擎是面向流式数据处理的引擎,提供了流式数据的存储和轻计算功能,帮助您轻松实现将流式数据存储至 云原生多模数据库 Lindorm...

Iceberg概述

而Iceberg简化了工作流程,整个数据处理过程是一条完整的、可靠的实时流,其数据的清洗、转换和特征化等操作都是流上的节点动作,无需处理历史数据和实时数据。此外,Iceberg还支持原生的Python SDK,对于机器学习算法的开发者非常友好。

什么是云原生多模数据库Lindorm

本文介绍 云原生多模数据库 Lindorm 的...流引擎 云原生多模数据库 Lindorm 流引擎是 面向流式数据处理 的引擎,提供了流式数据的存储和轻计算功能,帮助您轻松实现流式数据存储至 云原生多模数据库 Lindorm,构建基于流式数据的处理和应用。

区块概述

更新样式 动作接口,用于在获取数据之后,通过 串行数据处理 逻辑节点处理数据后,最后调用了 垂直胶囊柱状图 组件的 更新组件配置 动作。下图是上述案例的区块在使用时对外展示的 数据源配置、交互配置 和 蓝图参数内容 的样式。数据源...

DataWorks On EMR使用说明

背景信息 开源大数据开发平台E-MapReduce(简称EMR),是运行在阿里云平台上的一种大数据处理的系统解决方案。EMR基于开源的Apache Hadoop和Apache Spark,让您可以方便地使用Hadoop和Spark生态系统中的其他周边系统分析和处理数据。阿里云...

产品架构

流引擎 LindormStream 是面向流式数据处理的引擎,提供了流式数据的存储和轻计算功能,兼容Kafka API和Flink SQL,帮助业务基于Lindorm快速构建基于流式数据的处理和应用。LindormStream内部包含流存储、流计算两大组件,通过两者的一体化...

系统函数分类

数据探索自身预置了诸多函数,用于常见的数据处理需求。这些预置的系统函数具有跨引擎的特点,在离线、实时、在线3种模型的不同引擎中具有相同的行为和使用方式。本文为您介绍数据探索提供的系统函数类型及函数使用相关说明。函数分类 数据...

减灾与应急时空解决方案与案例

方案背景 华宁环球(北京)减灾...特别在栅格数据处理上接口设计简单、功能丰富,并有效解决了困扰一般WebGIS用户的栅格数据处理性能问题。PolarDB云原生架构不仅可保证数据库的安全稳定运行,而且能通过节点的扩缩容实现整体系统的弹性能力。

基本概念

L 流引擎 面向流式数据处理的引擎,提供了流式数据的存储和轻计算功能,帮助您轻松实现流式数据存储至 云原生多模数据库 Lindorm,构建基于流式数据的处理和应用。更多信息,请参见 流引擎介绍。逻辑I/O 由应用程序发给文件系统的读写操作...

验证分析型查询请求能力

将 orders 表与自身聚合,生成 20,000*20,000 行数据的笛卡尔积,开启 8 个并行执行,对比执行时间,验证云数据库 OceanBase 的实时分析能力。概念介绍 OLAP(Online Analytical Processing)是一种面向分析的、多维数据分析技术。它适用于...

Delta Lake概述

而Delta简化了工作流程,整条数据处理过程是一条完整的、可靠的实时流,其数据的清洗、转换、特征化等操作都是流上的节点动作,无需对历史和实时数据分别处理。与开源Delta Lake对比 EMR-Delta Lake丰富了开源Delta Lake的特性,例如对SQL...

查看资源使用情况-半托管

资源统计项目 统计口径 描述 数据处理单元 同步&集成任务:每3个离线任务(数据同步任务+数据集成任务数)向上取整计算1个数据处理单元。计算任务:每1个离线计算任务计算1个数据处理单元。维度逻辑表:每1个维度逻辑表计算1个数据处理单元...

Tablestore外部表

关于脏数据处理示例,详情请参见 脏数据处理示例。tablestore.corrupt.column 否 指定脏数据写入列。仅当 tablestore.read.mode 参数取值 permissive 时,需要配置此参数。指定的列名称为MaxCompute外部表列名称,且只能是最后一列。不支持...

配置学区地图Tab列表交互

在 id=2:初中 的 串行数据处理 节点与 公办初中点 和 民办初中 的连线中分别添加两个 串行数据处理 节点,并分别命名为 schooltype=公办 和 schooltype=民办。串行数据处理 节点添加完成后,最终效果实现双重判断标准,部分截图如下所示。...

配置学区地图Tab列表交互

在 id=2:初中 的 串行数据处理 节点与 公办初中点 和 民办初中 的连线中分别添加两个 串行数据处理 节点,并分别命名为 schooltype=公办 和 schooltype=民办。串行数据处理 节点添加完成后,最终效果实现双重判断标准,部分截图如下所示。...

数据保护伞入门

数据保护伞 是一款数据安全管理产品,提供数据发现、数据脱敏、数据水印、访问控制、风险识别、数据溯源等功能,帮助您快速梳理敏感数据并进行安全管控,保障数据安全。本文示例使用内置规则对 xc_dpe_e2_dev 项目的 phone 数据脱敏,并...

查看资源使用情况-全托管

资源统计项目 统计口径 描述 数据处理单元 同步&集成任务:每3个离线任务(数据同步任务+数据集成任务数)向上取整计算1个数据处理单元;其中,前200个集成同步任务免费。计算任务:每1个离线计算任务或实时计算任务计算1个数据处理单元。...

创建Kudu数据

Kudu适用HTAP场景(例如物联网),对于数据处理系统的复杂性提出了更高的要求。从早期的OLTP、OLAP拆分,到后来的Lambda架构,都存在数据复制和同步的复杂性,而Kudu的单一数据架构,规避了传统架构数据复制和同步的复杂性。更多详情请参见...

亿海蓝-航运大数据的可视化案例

客户感言“阿里Ganos产品很好地提升了我们对异构时空数据处理能力。Lindorm高性能、低延迟、高吞吐、稳定性让我们节省了不少运维投入,更多精力投入到业务实现上。——亿海蓝CTO 客户简介 亿海蓝是中国的航运大数据公司,做为中国最大的...

2024年

修复数据处理场景中存储引擎处理特定数据时会触发 negative bitmapset member not allowed 报错信息,导致执行引擎异常崩溃的问题。修复数据处理过程中系统在尝试读取数据文件的特定块时发生错误,触发 beam could not read block in file ...

配置学区地图单选框交互

在连线中添加两个 串行数据处理 节点,分别命名为 小学 和 初中。具体操作方法请参见 配置蓝图编辑器。按照以下说明继续添加其他连线和 串行数据处理 节点。将 小学 的 串行数据处理 节点分别与 民办小学 的 显示 和 隐藏 动作连线。在每条...

配置学区地图单选框交互

在连线中添加两个 串行数据处理 节点,分别命名为 小学 和 初中。具体操作方法请参见 配置蓝图编辑器。按照以下说明继续添加其他连线和 串行数据处理 节点。将 小学 的 串行数据处理 节点分别与 民办小学 的 显示 和 隐藏 动作连线。在每条...

业务切换流程

为最大化地减少数据迁移对业务的影响,您可以参照本文的流程执行业务切换并建立回退方案。前提条件 已配置数据迁移任务,且数据迁移任务处于 迁移中 或 已完成 状态,配置案例请参见 迁移方案概览。注意事项 由于执行业务切换操作需要停止...

业务切换流程

为最大化地减少数据迁移对业务的影响,您可以参照本文的流程执行业务切换并建立回退方案。前提条件 已配置数据迁移任务,且数据迁移任务处于 迁移中 或 已完成 状态,配置案例请参见 迁移方案概览。注意事项 由于执行业务切换操作需要停止...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
云数据库 RDS 数据传输服务 数据库备份 DBS 云数据库 Redis 版 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用