DISTRIBUTED MAPJOIN

shard_count=<n>:设置小数据的片数,小数据片会分布至各个计算节点处理。n 即为片数,一般按奇数设置。说明 shard_count 值建议手动指定,shard_count 值可以根据小数据量来大致估算,预估一个片节点处理的数据量范围是[200...

概览

集群管理系统的概览页面提供了 云原生多模数据库 Lindorm 实例宽引擎中所有的详细信息,包括的大小、片情况、数据预览、结构、限流信息等。本文介绍如何通过集群管理系统管理宽。前提条件 已登录目标实例的集群管理系统,具体...

DISTRIBUTED MAPJOIN

shard_count=<n>:设置小数据的片数,小数据片会分布至各个计算节点处理。n 即为片数,一般按奇数设置。说明 shard_count 值建议手动指定,shard_count 值可以根据小数据量来大致估算,预估一个片节点处理的数据量范围是[200...

分箱

否 全 inputBinTableName 输入的。否 无 selectedBinColNames 选择的列。否 空 positiveLabel 输出正样本的分类。否 1 nDivide 箱的个数,取值为正整数。否 10 colsNDivide 自定义列的箱个数,例如 col0:3,col2:5。如果 ...

手动新建逻辑

通过手动新建逻辑,建立您期望的数据样式和字段,并支持将逻辑物理化至云计算资源中,为后续的加工和使用做基础。本文介绍如何手动新建逻辑。前提条件 已新建目录,具体操作,请参见 新建模型目录。操作步骤 登录 数据资源平台...

手动新建逻辑

通过手动新建逻辑,建立您期望的数据样式和字段,并支持将逻辑物理化至云计算资源中,为后续的加工和使用做基础。本文介绍如何手动新建逻辑。前提条件 已新建目录,具体操作,请参见 新建模型目录。操作步骤 登录企业数据智能...

Dataphin新建治理项展示字段含义

life_cycle Integer 生命周期 物理的生命周期 pangu_file_size Integer 存储大小 物理的物理存储大小 health_score Double 健康 本系统计算的物理健康 owner_name string 负责人 物理在dataphin资产目录中对应的负责人名称 biz...

扫描全部/部分库分表

语法#SCAN HINT#将SQL语句下发到所有库的所有分表上执行 SCAN()#将SQL语句下发到指定库的所有分表上执行 SCAN(NODE="node_list")#指定库#将SQL语句下发到指定库分表上执行,根据条件计算物理名称 SCAN([TABLE=]"table_name_list...

拆分函数概述

当一张逻辑库拆分方式与分表拆分方式不一致时,若SQL查询没有同时带上库条件与分表条件,则 PolarDB-X 1.0 在查询过程会进行全库扫描或全分表扫描操作。拆分函数对库、分表的支持情况 拆分函数 说明 是否支持用于库 是否支持...

MySQL库分表同步至MaxCompute

步骤三:库源设置 库分表解决方案同步的最小单位是逻辑,一个逻辑对应一套物理库规则、一个目标base。自动生成逻辑的功能,可以大大简化逻辑的配置步骤,一般情况下,我们都可以使用自动生成逻辑来扫描源端数据源,...

MySQL库分表同步至MaxCompute

步骤三:库源设置 库分表解决方案同步的最小单位是逻辑,一个逻辑对应一套物理库规则、一个目标base。自动生成逻辑的功能,可以大大简化逻辑的配置步骤,一般情况下,我们都可以使用自动生成逻辑来扫描源端数据源,...

扫描全部/部分库分表

语法#SCAN HINT#将SQL语句下发到所有库的所有分表上执行 SCAN()#将SQL语句下发到指定库的所有分表上执行 SCAN(NODE="node_list")#指定库#将SQL语句下发到指定库分表上执行,根据条件计算物理名称 SCAN([TABLE=]"table_name_list...

扩缩容

的数据存储方式 之间数据存储和查询共享数据节点资源(CPU、内存、磁盘):上图中展示的就是两张向量表,一个是4片,一个是1片,4片的会根据产出的索引进行均分数据到每个片中,而1片的向量表则会形成广播在每个数据节点中...

Colocation Join

基本原理 Colocation Join功能,是将一组拥有相同CGS的Table组成一个CG,并保证这些Table对应的数据片会落在同一个BE节点上,使得当CG内的进行桶列上的Join操作时,可以通过直接进行本地数据Join,减少数据在节点间的传输耗时。...

概述

查询优化器 支持Partial Partition Wise join 无 支持Partition动态剪枝 支持Partition Index Pruning 支持分区粒度的统计信息(Hyperloglog)分区支持区间的并行扫描 支持全局索引优化器选择和并行扫描 支持分区与MPP相结合 分区粒度...

深度解析PolarDB数据库并行查询技术

对于方案二,需要并行创建共享的HASH build,当build创建成功后,每个线程读取Probe的一个片,分别执行HASH JOIN,这里的片并不需要按照HASH key进行片,每个线程分别读取互不相交的片即可。分析统计的复杂算子的并行 对于...

SKEWJOIN HINT

当两张Join存在热点,导致出现长尾问题时,您可以通过取出热点key,将数据分为热点数据和非热点数据两部分处理,最后合并的方式,提高Join效率。SkewJoin Hint可以通过自动或手动方式获取两张热点key,分别计算热点数据和非热点数据...

Sharding 功能介绍

语法 CREATE[TEMPORARY]TABLE tbl_name[(create_definition,.)][table_options][dbshard by hash([id,str])shards N][tbshard by hash([id,str])shards N]使用限制 单库单:在单库单中执行 Sharding 语句创建库分表时,会被拦截。...

主键与唯一键(DRDS模式)

沿用示例3中的order_tbl,该使用city作为库拆分键,且只库不分表,因此每个库都只有1张分表。向order_tbl插入一条数据,执行成功。INSERT INTO order_tbl(order_id,city,name)VALUES(10001,"Beijing","phone");Query OK,1 row ...

SKEWJOIN HINT

当两张Join存在热点,导致出现长尾问题时,您可以通过取出热点key,将数据分为热点数据和非热点数据两部分处理,最后合并的方式,提高Join效率。SkewJoin Hint可以通过自动或手动方式获取两张热点key,分别计算热点数据和非热点数据...

评分卡训练

如果该指定,则先自动根据该箱规则对原始特征进行离散化,再进行训练。否 无 featureColNames 输入选择的特征列。否 选择全部,自动排除Label列。labelColName 目标列。是 无 outputTableName 输出模型。是 无 ...

分区常见问题

是的,分区把数据切分成小的片独立管理,从而使得拥有大数据量的仍然拥有高性能和高可用。分区的更多介绍请参见 分区概述。业务上估算单张的数据量为2 TB,选择使用 PolarDB MySQL版 还是PolarDB-X?PolarDB MySQL版 单最大...

数据集成侧同步任务能力说明

数据同步场景 全增量同步任务支持单表数据同步至目标端单库分表数据同步至目标端单表、整库(多表)数据同步至目标端多表。DataWorks为您提供多种类型的全增量同步任务。包括整库离线同步(一次性全量同步、周期性全量同步、离线全...

CREATE TABLE(DRDS模式)

使用哈希函数做拆分 建一张表,既分库又分表,每个库含有3张物理库拆分方式为按照ID列进行哈希,分表拆分方式为按照bid列进行哈希。您可以先根据ID列的值进行哈希运算,将表中数据分布在多个子库中,每个子库中的数据再根据bid列值的...

分区

为了帮助您深入理解 云数据库 SelectDB 版 的分区桶的概念和如何实施分区桶,本文档详细阐释了分区桶的原理和操作示例,以帮助您理解区分桶原理和如何实施分区桶。概述 为了能高效处理大数据量的存储和计算,云数据库 SelectDB ...

画像分析-BSI优化方案(Beta)

DDL语句如下:Roaring Bitmap表示的用户属性标签桶 CREATE TABLE rb_tag(tag_name text,tag_val text,bucket int,bitmap roaringbitmap)WITH(distribution_key='bucket'-将桶编号作为distribution_key);BSI表示的用户行为标签...

V5.1.x系列实例版本说明

新增拆分函数UNI_HASH能让库数一样的两张的JOIN保持为非跨库JOIN,不再受到分表数目的影响。增加支持ISNULL()函数。支持只读库因同步延迟过大自动切断流量并回流主库的功能。性能优化 优化权限相关的SQL错误提示,与MySQL保持一致。...

如何使用HINT(5.2及以下版本适用)

说明 使用该自定义HINT时,PolarDB-X 1.0 会将SQL直接下发到库上执行,所以在SQL语句中,名必须是该库中已经存在的名。TDDL:table_name.partition_key=value[and table_name1.partition_key=value1]*/在这个 PolarDB-X 1.0 自定义...

分区命令列表

ALTER TABLE…SPLIT SUBPARTITION 将一个子分区划分为两个子分区,并重新配子分区的内容。ALTER TABLE…MERGE PARTITION 将两个分区合并为一个新分区,新分区中包含原有两个分区的内容。ALTER TABLE.MERGE SUBPARTITION 将两个子分区合并...

DDL语句

目录 创建 修改属性-增加列 修改属性-删除列 修改属性-重命名 修改属性-手动合并碎 删除 删除-彻底删除 清空数据 创建单值分区 创建单值分区 删除单值分区 清空单值分区 创建 创建索引 添加索引 删除索引 重建...

创建并使用MaxCompute

您可通过MaxCompute的SQL语句及DataWorks提供的可视化方式,创建与管理MaxCompute。相比SQL方式,可视化方式操作更加便捷。本文为您介绍如何使用可视化方式创建及管理MaxCompute。前提条件 在 工作空间配置 页面绑定MaxCompute引擎后,...

创建并使用MaxCompute

您可通过MaxCompute的SQL语句及DataWorks提供的可视化方式,创建与管理MaxCompute。相比SQL方式,可视化方式操作更加便捷。本文为您介绍如何使用可视化方式创建及管理MaxCompute。前提条件 在 工作空间配置 页面绑定MaxCompute引擎后,...

常见问题

搜索索引是宽引擎与搜索引擎深度融合的特性,需要单独开通购买,核心功能为倒排索引和列存,适合较为复杂的多维查询场景,一个宽只能创建一个搜索索引,索引列个数最多1000个(默认)。二级索引是Lindorm宽内置的特性,无需开通...

将DRDS模式数据库转换为AUTO模式数据库

返回信息如下:+-+|RESULT|+-+|ALL SUCCESS|+-+1 row in set(8 min 12.05 sec)不做转换,仅查看源DRDS库db_drds的tb1,tb2的结构以及它们在AUTO模式下的结构。CREATE DATABASE db_auto like db_drds dry_run=true include=tb1,tb2;...

创建逻辑模型:维度

您可以通过 快捷模式 或 代码模式 为添加字段,其中 快捷模式 支持 从/视图导入,即从计算引擎已存在的物理或视图导入字段,即在 查找已有/视图 下拉列表搜索并选择已存在的物理或视图进行字段导入。说明 当前仅支持从MaxCompute...

数太多导致实例卡顿或异常

shard tag管理方式稍微复杂一些,需要一些额外的运维操作(sh.addShardTag 和 sh.addTagRange),但所有的依然由同一个MongoDB实例管理,业务上基本不需要改造,只需要将连接串替换为新的片集群实例的连接串即可。假如您的实例中有10万...

MaxCompute SQL中的关联操作

LEFT SEMI JOIN 对于左中的一条数据,如果右存在符合关联条件的行,则输出左。LEFT ANTI JOIN 对于左中的一条数据,如果右中不存在符合关联条件的数据,则输出左。SQL语句中,同时存在JOIN和WHERE子句时,如下所示。(SELECT*...

设计

这种情况下,单分区的写入能力就是整个的写入能力上限,更重要的是,一旦发生热点,无法通过片分裂来平衡负载,因为写入压力总是在写尾部。解决方法一:合理设置分区键 针对上面例子中的热点问题,可以把MachineIp放到主键列的第一列,...

topRegion分析

本文介绍如何通过集群管理系统查看热点分片分析结果。前提条件 已登录目标实例的集群管理系统,具体操作请参见 登录集群管理系统。背景信息 在实际使用数据库的过程中,会存在文件数过多导致请求时延变长的情况。同时,流量分布不均匀的...

导入与导出

无主键的主键选择可能会导致热点行更新,而热点行更新速度很慢,可以向 AnalyticDB MySQL 提工单解决该问题。当 AnalyticDB MySQL 集群的写入性能已达到瓶颈,需要升级 AnalyticDB MySQL 规格。DataWorks导入数据至AnalyticDB MySQL集群...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
云数据库Cassandra版 智能视觉 资源管理 弹性公网IP 短信服务 人工智能平台 PAI
新人特惠 爆款特惠 最新活动 免费试用