COALESCE PARTITION

本文档介绍了减少基于HASHKEY分区分区对应分区所有分区,并将数据合并到其他分区和分区中的方法。语法 ALTER TABLE…COALESCE PARTITION 命令用于减少基于HASHKEY分区分区对应分区所有分区,并将数据合并到其他...

分区表管理(auto_partition)

AnalyticDB PostgreSQL版 支持将大表定义为分区表,并支持通过auto_partition插件对分区表进行自动删除或新增,当您进行条件查询时,系统只会扫描满足条件的分区,避免全表扫描,从而提升查询性能。新增分区的粒度包括小时,天,星期,月,...

Linux实例中数据恢复

如果手动挂载时报分区表丢失,您可以尝试如下三种办法进行处理:通过fdisk恢复分区 通过testdisk恢复分区 通过testdisk直接恢复数据 通过fdisk恢复分区 对数据盘分区时,分区磁盘的起止扇区一般使用默认的值,所以可以先尝试直接使用 fdisk...

基于HBase Java API的应用开发

所有的数据将存储在同一个分区中,无法实现在多个分区间的并行处理和负载均衡。这可能导致性能瓶颈数据热点问题。admin.createTable(htd);如果需要创建多个分区的表/示例如下,预分区包含两个分区,分别为:[-∞,10),[10,∞),实际使用时请...

名词解释

新增索引 是 针对同一个索引的情况下,最新的变更执行前会终止所有旧的变更 自动触发全量 是 发现新的数据分区自动执行,最新的变更历史变更并存 手动触发全量 是 最新的变更历史变更并存 推送配置 是 最新的变更执行前会终止所有旧...

AUTO模式数据库与DRDS模式数据库

因此,该参数被调整后,实例中所有的AUTO模式数据库下新创建的表的自动分区数都将发生改变。需要注意的是,如果新创建的表的分区数与原来已创建的表的分区数不一致,将会导致它们之间的JOIN计算下推失效,影响执行效率,建议手动调整分区数...

Linux实例SWAP分区的配置常见问题处理

概述 本文介绍在Linux实例中,如何配置SWAP分区和常见问题处理。详细描述 SWAP分区介绍 在Linux系统中的SWAP(交换分区),类似于Windows系统的虚拟内存。系统会把一部分硬盘空间虚拟成内存使用,将系统内非活动内存换页到SWAP,以提高系统...

分区表索引

分区表索引类型 PolarDB PostgreSQL版 支持分区上的两种索引类型:本地索引 在分区表本地索引(Local Index)中,本地索引与分区表的分区一一对应,具有与其表相同的分区相同的分区范围。每个索引分区都与基础表的一个分区相关联,因此...

分区表索引

分区表索引类型 PolarDB PostgreSQL版(兼容Oracle)支持分区上的两种索引类型:本地索引 在分区表本地索引(Local Index)中,本地索引与分区表的分区一一对应,具有与其表相同的分区相同的分区范围。每个索引分区都与基础表的一个...

分区表索引

分区表索引类型 PolarDB PostgreSQL版(兼容Oracle)支持分区上的两种索引类型:本地索引 在分区表本地索引(Local Index)中,本地索引与分区表的分区一一对应,具有与其表相同的分区相同的分区范围。每个索引分区都与基础表的一个...

EMR控制台管理YARN分区

您可以直接在节点组上配置分区属性,扩容弹性伸缩后,EMR会自动为新增节点打上Node Label,无需重新配置新节点。本文为您介绍如何在EMR控制台上管理YARN分区。背景信息 适用以下场景:集群异构 实际的环境部署中,经常会出现不同的机器...

Hive数据迁移

即⼀次MMA任务迁移的所有分区的⼤⼩之的上限。hive job配置,用于mr,spark,tez等引擎 默认为MR任务的部分配置。说明 如果Hive使⽤的引擎不是MR,则需要通过指定“hive.execution.engine”值来指定Hive使⽤的引擎,并且⽤于不同引擎的任务...

分区表常见问题

分区个数取决于大租户的个数数据量。其他中小租户使用HASH分区,HASH分区的分区个数确定方法同HASH分区表。使用分区表时,如何选择索引?针对 PolarDB MySQL版 分区表,您可以选择以下几种索引:部分索引(Partial Index)您可以根据实际...

CREATE PARTITION TABLE

查看所有分区子表 您可以通过如下两种方法查看当前分区父表下所有分区子表:通过HoloWeb可视化查看,HoloWeb会展示分区父表下面的所有分区子表。通过执行如下命令语句,查看当前分区父表下所有分区子表。其中,您可以将 parent_table_...

常用SQL

本文主要介绍DLA中常用的SQL类型语法。DLA Presto基于开源Presto构建,DDL是兼容Hive的DDL语法标准,DML是支持ANSI SQL语法标准。DDL 常见DDL CREATE SCHEMA:创建SCHEMA/DATABASE。CREATE TABLE:创建表。DROP SCHEMA语法:删除SCHEMA/...

什么是TTL功能

随着时间的推移,新的分区会被创建,失效的分区会被删除,如下图所示:说明 PolarDB-X 默认会自动创建新分区和删除失效分区。您也可以在建表时禁用自动功能,通过DDL语句来手动创建或删除失效分区。一个周期后,创建的新分区和失效的分区,...

停用词过滤

停用词过滤算法组件是文本分析中的一个预处理方法,用于过滤分词结果中的噪声(例如的、是或啊)。停用词过滤算法组件的两个输入桩为输入表停用词表。输入表为需要过滤停用词的表。停用词表的格式为一列,每行对应一个停用词。Designer ...

分区热力图

分区热力图功能支持查看各分区的访问情况数据分布情况,可以帮助您快速发现数据过热的分区。注意事项 仅5.4.14及以上版本支持此功能。仅支持展示当前实例下所有AUTO模式数据库中的数据分布情况。当单个逻辑库下的总分区数超过8000时,则...

pg_depend

例如子分区索引有一个依赖于其关联的分区表的分区类型的依赖关系依赖于该表索引的每一列的自动依赖关系。此类情形表示多重依赖关系语义的并集,依赖对象的删除可以没有 CASCADE,如果其任一依赖关系满足自动删除的条件。相反地,关于哪些...

分区热力图

分区热力图功能支持查看各分区的访问情况数据分布情况,可以帮助您快速发现数据过热的分区。注意事项 仅5.4.14及以上版本支持此功能。仅支持展示当前实例下所有AUTO模式数据库中的数据分布情况。当单个逻辑库下的总分区数超过8000时,则...

Windows实例中数据恢复

处理磁盘相关问题时,您可能会碰到操作系统中数据盘分区丢失的情况。本文介绍了Windows系统下常见的数据盘分区丢失的问题以及对应的处理方法,同时提供了使用云盘的常见误区以及最佳实践,避免可能的数据丢失风险。前提条件 已注册阿里云...

COMMIT(提交事务)

由于当前分布式数据库仅使用了一阶段提交事务,因此提交时,若一部分分区成功,而另一部分分区失败或异常关闭连接,那么将造成分区数据不一致。HybridDB for MySQL的commit无论提交成功或失败,都将退出事务。commit成功,则所有更新将可见...

TTL表的定时任务

在TTL表中创建定时任务成功后,每隔一段时间定时任务会扫描表中的所有物理时间分区。如果需要创建新分区,会被自动创建。如果需要删除过期分区,会被自动删除。过期时间提前创建时间由建表时的local_partition_definition指定。创建定时...

存储空间分析

您可以在 AnalyticDB for MySQL 空间总览页面查看集群表的总数据量、冷数据量、热数据量、索引数据量、分区数量、节点的磁盘使用率等指标。查看集群级别的数据量 通过 空间总览 可以查看当前集群的 总数据量、热数据量、冷数据量、以及 ...

全局二级索引

例如,对于在线商城的订单表,假设按照买家用户维度拆分,那么对于卖家查询(例如,查询某个卖家的本月所有订单)就需要扫描所有分区。但是借助全局二级索引,可以仅仅扫描相应卖家所在的索引表分区,便可快速找到所需的订单信息。示例2:...

表的创建使用

分区名(partition_name)必须是引擎内部统一分区值,可以通过如下的SQL语句获取某个表的所有分区(此SQL暂时无法获取分区信息,有需要请钉钉联系DBA):select partition_name from information_schema.partitions where table_name='your...

生命周期

MaxCompute表的生命周期(Lifecycle),指表(分区)数据从最后一次更新的时间算起,在经过指定的时间后没有变动,则此表(分区)将被MaxCompute自动回收。这个指定的时间就是生命周期。通过设置生命周期可以实现自动数据清理或数据保留,...

转换MBR分区为GPT分区

sudo fdisk-lu/dev/vdb 如下图所示,Disklabel type 值为 gpt 时,表示已转换为GPT分区分区转换成功。说明 不同操作系统的显示略有不同。如果没有 Disklabel type 字段,可通过 System 字段判断。System 值为 GPT 表示GPT分区。转换...

一键导入MaxCompute数据

如果您需要导入MaxCompute的多级分区,则在Hologres中设置一级分区即可,其余分区自动映射为Hologres的普通字段。业务日期 如果MaxCompute表使用日期进行分区,则您可以选择具体的分区日期,系统将会导入指定日期的数据至MaxCompute表。...

重命名分区

场景 2:目标分区是含有二级分区的一级分区 当二级分区为非模板分区时,重命名一级分区对二级分区没有影响,语法规则与场景1一致。当二级分区为模板分区时,重命名一级分区会让该分区下的所有分区的名称都发生变化。表级用法 对于以下表tb1...

动态分区

本文介绍 云数据库 SelectDB 版 动态分区相关的概念示例,帮助您进行分区的动态管理,降低您的使用成本。概述 在某些场景下,可能会将数据库表按照天进行分区划分。如果需要手动管理分区,可能由于没有创建分区导致数据导入失败,这给...

动态分区管理

Hologres的动态分区功能无需预先设定所有分区信息,可依据创建分区表时配置的动态分区规则,自动创建并管理分区子表。同时,还支持将符合条件的分区数据迁移到低频存储设备,在保证查询性能的同时,有效降低存储费用。功能介绍 动态分区...

流式数据湖仓Paimon

背景信息 Apache Paimon是一种流统一的湖存储格式,支持高吞吐的写入低延迟的查询。目前阿里云开源大数据平台E-MapReduce常见的计算引擎(例如Flink、Spark、Hive或Trino)都与Paimon有着较为完善的集成度。您可以借助Apache Paimon...

宽表模型介绍

使用宽表模型可以实现元数据、大数据等多种场景的解决方案,例如 搭建海量智能元数据管理系统、亿量级订单管理方案、基于多元索引搭建亿量级店铺搜索系统、表格存储结合Spark流批处理实现一体化存储计算、表格存储结合实时计算Flink进行...

ANALYZE

此外,当 ANALYZE 通常处理指定分区表的所有分区时,如果分区表上有一个冲突的锁,这个选项将导致 ANALYZE 跳过所有分区表。boolean 规定所选的选项打开或关闭。您可以写 TRUE、ON 或 1 以启用该选项,或者是 FALSE、OFF 或 0 来禁用它。...

K近邻

所有分区 appendColNames 否 输出表中,附加预测表的列名。与 predictFeatureColNames 相同 outputTablePartition 否 输出表的分区。全表 k 否 最近邻的数量。取值范围为1~1000。100 enableSparse 否 输入表数据是否为稀疏格式。取值范围为...

INTERVAL RANGE简介

INTERVAL RANGE是RANGE分区的扩展,当新插入的数据超过现有分区的范围时,该分区允许数据库自动创建新分区。前提条件 集群版本需为 PolarDB MySQL版 8.0.2版本且Revision version为8.0.2.2.0及以上。您可以通过 查询版本号 确认集群版本。...

TRUNCATE

将指定表中的数据清空。清空非分区表里的数据 将指定的非分区表中的数据清空。如果您需要清空分区表中单个或多个分区的数据,请参见 清空分区数据。...SHOW:查看表的SQL DDL语句、列出项目下所有的表视图或列出一张表中的所有分区

同步 OceanBase 数据库的数据至 Kafka

背景信息 Kafka 是目前广泛应用的高性能分布式流计算平台,数据传输支持 OceanBase 数据库两种租户与自建 Kafka 数据源之间的数据实时同步,扩展消息处理能力,广泛应用于实时数据仓库搭建、数据查询报表分流等业务场景。前提条件 数据...

分区

分区表上的惟一约束(也就是主键)必须包括所有分区键列。存在此限制是因为本数据库只能每个分区中分别强制实施唯一性。BEFORE ROW 触发器无法更改哪个分区是新行的最终目标。不允许在同一个分区树中混杂临时关系持久关系。因此,如果...
共有100条 < 1 2 3 4 ... 100 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
弹性公网IP 短信服务 人工智能平台 PAI 金融分布式架构 对象存储 物联网平台
新人特惠 爆款特惠 最新活动 免费试用