查询流程和执行计划

Stage的数据来源可以是底层存储系统中的数据或者网络中传输的数据,一个Stage由分布在不同Executor节点上相同类型的Task组成,多个Task会并行处理数据。说明 AnalyticDB MySQL版 SQL诊断功能支持对Stage级别进行结果诊断。更多详情,请参见...

应用场景

EMR Serverless Spark可以满足企业级用户的多种数据处理与分析需求。本文介绍EMR Serverless Spark的应用场景以及相应的解决方案。建立数据平台 得益于其开放式架构设计,EMR Serverless Spark极大地简化并提升了在数据湖环境中对结构化和...

通用数据开发

通常数据开发的总体流程包括数据产生、数据收集存储、数据分析与处理数据提取和数据展现分享。说明 上图中,虚线框内的开发流程均可基于阿里云大数据平台完成。数据开发的流程如下所示:数据产生:业务系统每天会产生大量结构化的...

应用场景

例如,来自不同数据源的计量数据被收集到日志服务,函数计算 的定时器定时触发 云工作流 执行,云工作流 利用 函数计算 对多个Shard的计量数据并行处理,并将结果分别写回日志服务;然后可以将所有Shard产生的文件进行聚合,写入表格存储...

数据处理

不同处理方法可连接不同的上游节点,实现数据并行处理。参数 说明 处理方法 编写JavaScript函数体,返回结果可为任意类型。表格中仅提供 其他配置 中的参数说明,其他参数配置请参见 公共参数说明。输出结果:每个处理方法对相应上游节点的...

功能特性

支持数据质量检验和控制 可以设置数据质量规则和异常报警策略,及时发现和处理数据质量问题。支持实时监控任务运行状态和查看日志 用户可以实时了解任务的执行情况,并设置异常告警,保证任务的稳定运行。支持多种数据库产品组合 支持多种...

Kyuubi概述

Kyuubi可以在用户级别缓存后台引擎实例,以更好的实现计算资源共享和快速响应,并行处理大量数据的查询并快速返回结果。批数据处理:Kyuubi提供了SQL接口用于常见的批处理,通常是大型提取、转换、加载(ETL)过程。Kyuubi及其引擎都是存储...

什么是自动驾驶开发平台

能够解决的问题如下 海量非结构化数据快速预处理 利用数据管理并行计算框架,在阿里云上以云原生的方式分布式处理海量非结构化数据,采集到的感知数据处理效率提高10倍。感知数据多模态检索 无论是经过标注还是未经标注的传感器输出数据,...

技术架构

PolarDB PostgreSQL版(兼容Oracle)的计算节点,主要实现了SQL解析和优化、以及查询并行执行无锁高性能事务处理,计算节点之间通过高吞吐的物理复制协议同步内存状态。数据库节点最多可以扩容到16个,其中1个读写节点,其他均为只读节点...

MaxFrame概述

背景信息 基于Python语言的易读性、高效开发及开放生态等优势,Python已经成为科学计算、机器学习以及AI开发领域的事实标准和主流编程语言,其整合了数据分析、机器学习等各类第三方包,如Pandas(数据处理与分析)、NumPy(数值计算)、...

减灾应急时空解决方案案例

方案背景 华宁环球(北京)减灾应急科技有限公司专注于自然灾害风险、灾害应急预警领域全栈数据、模型及平台研发,面向保险等行业及各级政府提供技术服务,数据及模型研发及成果应用处于行业领先水平。公司主营OpenRIS灾害风险大数据平台...

什么是数据库备份DBS

常见问题和故障处理 使用DBS时遇到的各类问题,例如需要修改备份源数据库、数据库恢复失败、如何备份RDS只读实例等,您可以在 常见问题 或 常见报错 内查找,可以解决您的绝大部分问题。说明 若在文档中未找到您遇到的异常或报错,或按照...

概览

AnalyticDB PostgreSQL版 提供多种数据迁移方案,可满足不同的数据同步或迁移的业务需求,您可以在不影响业务的情况下,平滑地各种类型的数据库实例进行迁移或数据同步。迁移数据到AnalyticDB PostgreSQL版 迁移类型 文档 简介 是否支持...

深度解析PolarDB数据库并行查询技术

传统的优化器只能生成串行的执行计划,为了实现并行读取数据,同时并行处理数据,首先必须对现有的优化器进行改造,让优化器可以生成需要的并行计划。例如,选择哪个表或哪些表可以并行读取,并且通过并行读取会带来足够的收益;或者哪些...

使用OSS外表高速导入OSS数据

云原生数据仓库AnalyticDB PostgreSQL版 支持通过OSS外部表(gpossext功能),将数据并行从阿里云对象存储OSS导入到 AnalyticDB PostgreSQL。功能介绍 目前gpossext支持读写TEXT、CSV格式的文件以及GZIP压缩格式的TEXT、CSV文件。gpossext...

版本说明

V2.6.13 2021年4月30日 问题修复 修复IgnoreError模式下未捕获异常的逃逸引发的行为不一致 修复查询时指定过小startTime时查不到数据问题。V2.6.12 2021年4月9日 设计优化 添加数据写入的审计日志(由于会对写入性能有影响,只接受提交工...

配置学区地图单选框交互

将 公办 的 串行数据处理 节点分别 公办小学点 的 显示 动作和 民办小学 的 隐藏 动作连线。将 民办 的 串行数据处理 节点分别 公办小学点 的 隐藏 动作和 民办小学 的 显示 动作连线。最终的连线效果如下。使用同样的方式对 初中 节点...

通过脚本模式配置离线同步任务

当您需要实现更精细化的配置管理时,您可以使用脚本模式配置离线同步任务,通过编写数据同步的JSON脚本并结合DataWorks调度参数使用,将源端单表或分库分表的全量或增量数据周期性同步至目标数据表。本文为您介绍脚本模式配置离线同步任务...

配置学区地图单选框交互

将 公办 的 串行数据处理 节点分别 公办小学点 的 显示 动作和 民办小学 的 隐藏 动作连线。将 民办 的 串行数据处理 节点分别 公办小学点 的 隐藏 动作和 民办小学 的 显示 动作连线。最终的连线效果如下。使用同样的方式对 初中 节点...

2021年

本文介绍 PolarDB PostgreSQL版 的产品功能动态,分别为内核小版本、控制台、时空数据库和API的更新说明。说明 您可通过如下语句查看 PolarDB PostgreSQL版 的内核小版本的版本号:show polar_version;PolarDB PostgreSQL版 对应的原生...

2021年

本文介绍 PolarDB PostgreSQL版(兼容Oracle)的产品功能动态,分别为内核小版本、控制台、时空数据库和API的更新说明。说明 您可通过如下语句查看 PolarDB PostgreSQL版(兼容Oracle)的内核小版本的版本号:show polar_version;2021年12...

什么是数据管理DMS

AnalyticDB PostgreSQL版:云原生数据仓库AnalyticDB PostgreSQL版是一种大规模并行处理(MPP)数据仓库服务,可提供海量数据在线分析服务。OSS:对象存储服务OSS(Object Storage Service)是阿里云提供的海量、安全、低成本、高可靠的云...

并行查询性能

并行查询利用多核CPU的并行处理能力,以8核32 GB 独享规格 的集群为例,并行查询示意图如下所示。下文将介绍8.0.1和8.0.2版本并行查询参数取值分别设置为如下表所示时,PolarDB 集群负载 并行查询测试方法 执行结果。关于如何配置参数,...

使用OSS外表高速导出数据到OSS

云原生数据仓库AnalyticDB PostgreSQL版 支持通过OSS外部表(即gpossext功能),将数据并行导出到阿里云对象存储OSS,并支持通过GZIP进行OSS外部表文件压缩,大量节省存储空间及成本。功能介绍 目前gpossext支持读写TEXT、CSV格式的文件...

LLM on DLC-Megatron on DLC最佳实践

预训练大语言模型面对来自于模型规模和数据规模的多重挑战,为了解决这些问题,PAI提供了在 DLC 上使用Megatron-LM进行大语言模型预训练的最佳实践。该实践通过准备镜像环境训练数据、调整训练策略、提交管理任务等流程,帮助您在 DLC ...

PolarDB PostgreSQL版架构介绍

需要解决以下问题数据一致性:由原来的N份计算+N份存储,转变成了N份计算+1份存储。读写分离:如何基于新架构做到低延迟的复制。高可用:如何Recovery和Failover。IO模型:如何从Buffer-IO向Direct-IO优化。架构原理 基于Shared-Storage...

时空数据库版本发布记录

本文介绍PolarDB PostgreSQL版时空数据库(Ganos)的版本更新说明。6.X 6.3 类别 说明 新增特性 Trajectory SQL 新增 ST_InsertAttr 函数,支持为轨迹增加新的属性。GeomGrid SQL 新增 ST_Degeneralize 函数,支持将低层级网格分解成高层级...

时空数据库版本发布记录

本文介绍PolarDB PostgreSQL版(兼容Oracle)时空数据库(Ganos)的版本更新说明。6.X 6.3 类别 说明 新增特性 Trajectory SQL 新增 ST_InsertAttr 函数,支持为轨迹增加新的属性。GeomGrid SQL 新增 ST_Degeneralize 函数,支持将低层级...

PolarDB PostgreSQL版架构介绍

需要解决以下问题数据一致性:由原来的N份计算+N份存储,转变成了N份计算+1份存储。读写分离:如何基于新架构做到低延迟的复制。高可用:如何Recovery和Failover。IO模型:如何从Buffer-IO向Direct-IO优化。架构原理 基于Shared-Storage...

技术面临的挑战革新

分布式事务集中式事务的优劣 事务处理数据库保证ACID语义的核心功能,因为数据库系统需要处理大量的并发事务,为了保证并发事务能够尽可能高效的并发执行而又互不干扰,发展出若干种技术,比如多版本并发处理(MVCC),乐观并发处理(OCC)...

概述

PolarDB 集群备份和恢复功能均采用多线程并行处理,并通过其它技术创新,10分钟内即可完成从备份集(快照)恢复到一个新的集群。说明 一级备份默认开启,无法关闭。一级备份(快照)总大小如下图所示。说明 PolarDB 集群 一级备份(快照)...

备份数据库

数据库备份DBS 的 批量备份 功能支持备份单个数据库和多个数据库。本文以批量配置MySQL逻辑备份为例,向您介绍如何备份数据库。说明 关于各类数据库备份方案,请参见 备份方案概览。前提条件 已添加数据源。如何添加数据源,请参见 手动...

技术原理

针对这类在线数据库上复杂SQL的处理,PolarDB-X 1.0 额外扩展了单机并行处理器(Symmetric Multi-Processingy,简称SMP)和多机并行处理器(DAG)。前者完全集成在 PolarDB-X 1.0 内核中;而对于后者,PolarDB-X 1.0 构建了一个计算集群,...

PolarDB MySQL版8.0.2版本发布日志

修复在B-tree较高或B-tree数据倾斜的大表上执行并行查询操作时,可能存在的并行分片数目过少,或并发worker数据不均衡的问题。8.0.2.2.22 类别 说明 发布时间 新增功能和性能优化 支持为用户授予执行 SHOW_ROUTINE、FLUSH_USER_RESOURCES、...

时序引擎版本说明

修复PromQL无法处理NaN数据点的问题。修复previous插值少数据问题。3.4.18 发布日期 类型 说明 2022年07月06日 新特性 TSQL支持删除时间线功能。功能优化 修复TSQL条件中出现BOOLEAN数据类型的数据时可能出现异常的问题。3.4.17(稳定...

如何基于LSM-tree架构实现一写多读

最基础的DDL操作,例如Create或Drop操作,在一写多读架构下,要考虑数据与数据字典,数据与字典缓存一致性等问题。一写多读的基础是物理复制,物理复制日志只在引擎层流动,不涉及到Server层,因此需要新增日志来解决DDL操作导致的不一致...

弹性并行查询(Elastic Parallel Query)常见问题

并行查询的目的在于加速复杂查询的处理效率,并且无论是否使用分区表都可以使用并行查询,并行查询也支持在分区表上使用。关于分区表和并行查询的更多介绍请参见 分区表 和 弹性并行查询。连接PolarDB的读写分离地址能使用并行查询吗?可以...

概述

PolarDB 集群备份和恢复功能均采用多线程并行处理,并通过其他技术创新,10分钟内即可完成从备份集(快照)恢复到一个新的集群。说明 一级备份默认开启,无法关闭。一级备份保留时长最多可支持30天,如果您需要使用该功能,可以 联系我们 ...

PolarDB MySQL版8.0.1版本发布日志

修复使用事务断点续传功能时,因启用并行查询功能而无法查询到续传事务数据问题。修复执行库表恢复的新流程时,只读(RO)节点注册位点过低导致新增RO节点失败的问题。修复执行库表恢复的新流程时,因磁盘满载导致线程无法退出的问题。...

PolarDB并行查询

方案 随着互联网的发展,数据量的爆炸,一定的数据分析能力、异构数据处理能力开始成为事务型数据库的标配,MySQL社区在8.0版本中也对自身的查询处理能力做了加强,包括对子查询的transformation、hash join、window function支持等,...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
云数据库 RDS 数据传输服务 云数据库 Redis 版 数据库备份 DBS 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用