数据倾斜调优

MapReduce 在了解数据倾斜之前首先需要了解什么是MapReduce,MapReduce是一种典型的分布式计算框架,它采用分治法的思想,将一些规模较大或者难以直接求解的问题分割成较小规模或容易处理的若干子问题,对这些子问题进行求解后将结果合并成...

CREATE TABLE

本文介绍 AnalyticDB for MySQL 的 CREATE TABLE 建表语法。您将了解到如何创建分区表和维表,以及如何定义表的分布键、分区键、索引、生命周期、冷热数据分层等。设置默认值、自增列 设置主键 设置...为什么要定义分区 分区可以加快数据过滤...

数据存储冷热分层

BEGIN fetch_overdue_partition_sql:='WITH targetpartitions AS(SELECT*FROM pg_partitions WHERE tablename=$1 AND schemaname=$2 AND partitionlevel=1 AND partitionisdefault=FALSE)SELECT partitiontablename FROM targetpartitions ...

错误码表(2.0版)

18054 CTAS_SELECT_SQL_ANALYZE_ERROR schema=xxx table=xxx message=xxx CTAS语句的SELECT子句语法分析失败,请检查语法,或进一步联系技术支持。18055 CTAS_INSERT_THREAD_ERROR message=xxx CTAS执行的INSERT阶段失败,请重试,或进一步...

内置的安全审计规则

数据库审计规则按照以下攻击场景进行分类:异常操作 应用账号风险操作 运维人员风险操作 数据库探测 数据泄露 拖库攻击 数据库外联 大流量返回 漏洞攻击 缓冲区溢出 存储过程滥用 拒绝服务漏洞 隐通道攻击 SQL注入 SQL注入尝试利用 疑似SQL...

Spark FAQ

DLA SQL支持多层嵌套目录 oss/db/table/partition1=a/partiion2=b/extral_folder/data.csv,但Spark SQL暂不支持。DLA SQL的语法和Spark SQL的语法略有区别,如何调试SQL,请参见 Spark SQL。为什么Spark作业提示错误日志oss object 403?...

SET PARTITION_HINT

PolarDB-X 支持通过SET PARTITION_HINT语句,指定SQL语句在某个DN分片上执行。语法 SET PARTITION_HINT=[PARTITION_NAME|GROUP_NAME|GROUP_NAME:TABLE_INDEX]说明 该语句支持在AUTO和DRDS模式数据库中使用。参数说明:PARTITION_NAME:AUTO...

CREATE TABLE

DEFAULTS|GENERATED|IDENTITY|INDEXES|STATISTICS|STORAGE|ALL } partition_bound_spec 是:IN(partition_bound_expr[,.])|FROM({ partition_bound_expr|MINVALUE|MAXVALUE }[,.])TO({ partition_bound_expr|MINVALUE|MAXVALUE }[,.])|WITH...

管理分区

表分区是指根据一定规则,将数据库中的一张表分解成多个更小的、容易管理的部分。从逻辑上看,只有一张表,但是底层却是由多个...如果SQL语句中未包含Partition部分,您可以单击 SQL选项,勾选 With PARTITION,即可包含分区信息的SQL语句。

自动优化

说明 详细内容可参考Databricks官网文章:自动优化 自动优化的工作原理 自动优化包含两个重要特性:优化Delta表的写入 在开源版Spark中,每个executor向partition中写入文件时,都会创建一个文件进行写入,最终会导致一个partition中包含...

使用Copilot生成SQL

本文为您介绍如何使用Copilot生成SQL,以提高工作效率。操作步骤 在SQLConsole或Notebook页面上方单击,在对话框中输入查询、分析的自然语言。Copilot会在当前引入的数据库表作用域中进行查找。提出问题后,Copilot会根据表的描述信息和...

DML操作常见问题

MaxCompute SQL中使用到新数据类型(TINYINT、SMALLINT、INT、FLOAT、VARCHAR、TIMESTAMP或BINARY)时,需要执行如下语句开启新数据类型开关:Session级别:如果使用新数据类型,您需要在SQL语句前加上 set odps.sql.type.system.odps2=...

向量检索

Partition partition Partition名称。默认为default,请根据需要选择不同的Partition。是 TopK topk 最大可返回的向量条数。TopK默认10,最大可支持1024。是 返回结果参数说明如下所示。参数 对应API参数名称 说明 距离 score 向量相似...

分区和列操作

alter table sale_detail add if not exists partition(sale_date='201910')partition(sale_date='201911')partition(sale_date='201912')partition(sale_date='202001')partition(sale_date='202002')partition(sale_date='202003')...

ALTER TABLE

alter table sale_detail add if not exists partition(sale_date='201910')partition(sale_date='201911')partition(sale_date='201912')partition(sale_date='202001')partition(sale_date='202002')partition(sale_date='202003')...

SQL查询

如果需要快速地对数据进行查询与分析,您可以使用SQL语句查询MaxCompute、EMR Hive、Hologres等数据源。本文为您介绍如何通过SQL语句查询数据源。支持查询的数据源 SQL查询支持的数据源包含MaxCompute、Hologres、EMR Hive、EMR Spark SQL...

分区表常见问题

什么添加分区的(ADD PARTITION)操作耗时长,如何避免?操作耗时长是因为在该分区表上有大事务正在进行。PolarDB MySQL版 8.0.2版本支持分区粒度的MDL锁只会阻塞正在添加分区的DML操作,不阻塞其他分区的DML操作,最大限度减少对业务的...

SQL性能问题

本文介绍有关SQL性能相关的常见问题。Flink全托管如何拆分SQL作业节点?Group Aggregate优化技巧有哪些?TopN优化技巧有哪些?有哪些高效去重方案?在使用内置函数时,需要注意什么?Flink全托管如何拆分SQL作业节点?在 作业运维 页面,...

创建EMR Impala节点

您可以创建EMR(E-MapReduce)Impala节点,对PB级大数据进行快速、实时的交互式SQL查询。前提条件 数据开发(DataStudio)中已创建业务流程。数据开发(DataStudio)基于业务流程对不同开发引擎进行具体开发操作,所以您创建节点前需要先...

DDL操作常见问题

您可以重新创建一张分区表,使用动态分区SQL将源表数据导入至新分区表,详情请参见 插入或覆写动态分区数据(DYNAMIC PARTITION)。如何查看指定的分区是否存在?可以使用函数PARTITION_EXISTS查看指定的分区是否存在,更多函数信息,请...

RDS MySQL同步至阿里云消息队列Kafka版

支持同步的SQL操作 操作类型 SQL操作语句 DML INSERT、UPDATE、DELETE DDL CREATE TABLE、ALTER TABLE、DROP TABLE、RENAME TABLE、TRUNCATE TABLE CREATE VIEW、ALTER VIEW、DROP VIEW CREATE PROCEDURE、ALTER PROCEDURE、DROP PROCEDURE...

Cassandra数据建模

Cassandra是一款分布式、去中心化、高可用的列存储(Wide Column Store)的No SQL数据库。分布式层面主要依靠一致性Hash算法把数据分布在整个集群中,单机主要实现了基于LSM-Tree的引擎。集群中的每个节点将整个Hash范围均匀地分担,每个...

PolarDB MySQL版同步至阿里云消息队列Kafka版

设置Partition Key 当您在步骤5中选择同步策略为 按主键的hash值投递到不同Partition 时,您可以配置本参数,指定单个或多个列作为Partition Key来计算Hash值,DTS将根据计算得到的Hash值将不同的行投递到目标Topic的各Partition中。...

RDS MySQL迁移至阿里云消息队列Kafka版

支持增量迁移的SQL操作 操作类型 SQL操作语句 DML INSERT、UPDATE、DELETE DDL CREATE TABLE、ALTER TABLE、DROP TABLE、RENAME TABLE、TRUNCATE TABLE CREATE VIEW、ALTER VIEW、DROP VIEW CREATE PROCEDURE、ALTER PROCEDURE、DROP ...

表结构设计

A:执行以下SQL,可以查看表的所有二级分区及分区的统计信息:SELECT partition_id,-分区名 row_count,-分区总行数 local_data_size,-分区本地存储所占用空间大小 index_size,-分区的索引大小 pk_size,-分区的主键索引大小 remote_data_...

INSERT

从Hologres V1.3版本起,支持符合FixedPlan的Insert语句直接写入分区表父表,详情请参见 Fixed Plan加速SQL执行。column table 表中的某个列的名称。您也可以使用子域名或者数组下标限定列名称。(指向一个组合列的某些列中插入会让其他域...

安全联合分析TrustDA/MPCSQL

一、什么是联合分析?功能介绍:在原始数据不可见的前提下,提供SQL模式对多方数据进行联合分析。二、哪些场景适合用联合分析?适用场景:适用于双方数据不共享,但有一些统计分析的需求。例如电商平台在媒体平台进行了营销广告投放,投放...

使用SQL管理外部项目

说明 目前无法对关联的External Project执行DDL类的SQL语句(add partition和drop partition除外)。DDL SQL语句,详情请参见 SQL概述。您可以在odps_config.ini文件中增加set配置 set.odps.sql.hive.compatible=true 和 set.odps.external...

查询拦截

本文介绍 云数据库 SelectDB 版 提供的SQL查询拦截相关功能,帮助您进行SQL管理。概述 在生产环境的部分场景下,需要对可执行的SQL语句做出限制,例如屏蔽删除或某些已知的高风险查询语句。为满足此类场景需求,SelectDB提供了SQL查询拦截...

SparkSQL自适应执行

spark.sql.adaptive.skewedPartitionFactor 10 当一个partition的size大于该值(所有parititon大小的中位数)且大于spark.sql.adaptive.skewedPartitionSizeThreshold,或者parition的条数大于该值(所有parititon条数的中位数)且大于 ...

表分区

``` 为了实现子分区,在创建分区的命令中指定`PARTITION BY`子句,例如:```sql CREATE TABLE measurement_y2006m02 PARTITION OF measurement FOR VALUES FROM('2006-02-01')TO('2006-03-01')PARTITION BY RANGE(peaktemp);``` 在创建了`...

SQL调优

本文为您介绍常见的SQL问题以及优化示例。并行度优化 并行度是衡量并行计算并行程度的一个指标,从执行计划上来看,例如ID为M1的任务,使用1000个Instance来执行,我们就说M1的并行度是 1000。需要注意的是:调整并行度不一定是越多越好,...

表分区定义

示例SQL如下:CREATE TABLE partition_with_name_list(a int,b int,c int)DISTRIBUTED BY(a)PARTITION BY LIST(a)(PARTITION p1 VALUES(1)WITH(tablename='partition_with_name_list_p1'),PARTITION p2 VALUES(2)WITH(tablename='partition...

INSERT OVERWRITE

如果SQL语句中含有单引号(''),需要通过$sql$改写 sql,以自动实现单引号转义。使用示例 场景一:使用存储过程将Hologres内部表数据导入Hologres非分区表-创建表A作为目标表 BEGIN;CREATE TABLE public.tablea(cid integer NOT NULL,...

分区分裂

definition:range_partition_list|list_partition_list subpartition_specs_definition:range_subpartition_list|list_subpartition_list range_partition_list:(range_partition[,range_partition,.])range_partition:PARTITION partition...

使用存储过程将数据导入Hologres内部表(Beta)

sql:标准的 select 语句,可用来查询MaxCompute或者Hologres的表,需确保 select 出来的分区字段的值必须完全等于 partition_value。如果SQL语句中含有单引号(' '),需要通过$sql$改写 sql,以自动实现单引号转义。命令示例:分区表写入...

Python SDK概述

SQL execute_sql()/run_sql()执行SQL语句。open_reader()读取执行结果。任务实例 list_instances()获取MaxCompute项目下的所有Instance。exist_instance()判断Instance是否存在。get_instance()获取Instance。stop_instance()停止Instance...

Dataphin的sql代码任务中的SQL语句数有什么限制

产品名称 Dataphin 产品模块 代码任务 概述 本文为您介绍在Dataphin中对sql代码任务的限制 问题描述 您的sql代码任务在开发环境可以执行,但在生产环境却执行失败是什么原因?Not Support:sql count>=100 in a script 问题原因 Dataphin对...

CREATE TABLE LIKE

如果SQL语句中有较多单引号,可以将$符号置于SQL语句前后,通过$query_sql$改写(推荐使用该用法,操作更简便)自动实现单引号转义,用法如下:CALL HG_CREATE_TABLE_LIKE('table_name',$query_sql$[,'partition_clause'])partition_clause...

SQL

PolarDB MySQL版 提供慢SQL分析功能,能够查看慢日志趋势和统计信息,并且提供SQL建议和诊断分析。操作步骤 登录 PolarDB控制台。在左侧导航栏单击 集群列表。在左上角,选择集群所在地域。找到目标集群,单击集群ID。在左侧导航栏中,选择...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
云原生数据仓库AnalyticDB MySQL版 云数据库HBase版 云备份 弹性公网IP 短信服务 人工智能平台 PAI
新人特惠 爆款特惠 最新活动 免费试用