数据问答最佳实践

说明 使用宽表可以减少跨表查询:如A表格主要记录学生学习成绩信息,B表格主要记录学生兴趣爱好信息,通过将A表和B表结合为宽表C,通过C表既可以查询学生信息,也可以查询学生兴趣爱好。宽表并非“越宽越好”,当表格中的列过多,对应表格...

二级索引简介

当指定数据表的若干个预定义列作为索引表属性列时,读取索引表可以直接得到数据表中对应预定义列的值,无需反查数据表。存量索引 支持新建的索引表中包含数据表中的存量数据。稀疏索引 如果数据表的某个预定义列作为索引表的属性列,当数据...

CREATE TABLE

从技术方面而言,PRIMARY KEY 只是 UNIQUE 和 NOT NULL 的组合,不过将一组列标识为主键时还会提供有关 schema 设计的元数据,因为主键意味着其他表可以依赖于这一组列作为行的唯一标识符。无论作为列约束还是表约束,只能为表指定一个主键...

创建数据

设置预留读写吞吐量,容量型实例中的数据表只能设置为0,高性能实例中的数据表可以设置为非零值。client.createTable(request);} 创建数据表时 配置全局二级索引 以下示例用于同时创建数据表和全局二级索引。该表包含pk1(String类型)和pk...

管理MySQL Catalog

MySQL Catalog提供的表可以直接作为Flink SQL作业中的MySQL CDC源表、MySQL结果表和MySQL维表。支持RDS MySQL、PolarDB MySQL或自建MySQL。支持直接访问分库分表逻辑表。支持配合CDAS和CTAS语法完成基于MySQL数据源的整库同步、分库分表...

数据操作

设置预留读写吞吐量,容量型实例中的数据表只能设置为0,高性能实例中的数据表可以设置为非零值。client.createTable(request);} 创建表时配置全局二级索引 以下示例用于同时创建数据表和全局二级索引。该表包含pk1(String类型)和pk2...

行业算法版结构

只有 int 或 literal 字段类型可以做关联字段;主辅join时,join的字段必须类型相同,要是int都是int,要是literal都是literal;辅join主时,必须用辅的主键 join主的某个字段,不能用辅的非主键字段join主

维度

维度设置与列表」层级名称:可以填写具体的属性值,以及自定义的维度名称,如:比如关联属性选择的是「系统属性/品牌」,层级名称设置的是「型号」,层级3名称为「系统」维度值这边就可以做具体划分设置。新建维度值」分为手工新建和批量...

CREATE TABLE

表可以是普通表或者外部表。INHERITS 的使用在新的子表和它的父表之间创建一种持久的关系。对于父表的模式修改通常也会传播到子表,并且默认情况下子表的数据会被包括在对父表的扫描中。如果在多个父表中存在同名的列,除非父表中每一个...

配置匹配规则

同时,符合匹配规则的新增表可以通过增量 DDL 的方式自动同步至目标端。数据迁移增量 DDL 的详情请参见 同步 DDL 的支持范围和使用限制。数据传输支持的通配规则及其要求如下。说明 下方表格中的星号(*)表示通配规则。类别 支持的通配...

pg_hint_plan

视图的内部表可以通过其真实名称或别名指定目标对象。下面两个示例说明在每张表上执行查询的方式不同:方式一:指定表c1的并行度为3,表c2的并行度为5。EXPLAIN/*+Parallel(c1 3 hard)Parallel(c2 5 hard)*/SELECT c2.a FROM c1 JOIN c2 ON...

pg_hint_plan

视图的内部表可以通过其真实名称或别名指定目标对象。下面两个示例说明在每张表上执行查询的方式不同:方式一:指定表c1的并行度为3,表c2的并行度为5。EXPLAIN/*+Parallel(c1 3 hard)Parallel(c2 5 hard)*/SELECT c2.a FROM c1 JOIN c2 ON...

统计信息查看与分析

对于分区父,可以通过聚合函数统计 SELECT db_name,parent_schema_name AS schema_name,parent_table_name AS table_name,collect_time:date AS collect_date,sum(hot_file_count)AS hot_file_count,sum(cold_file_count)AS cold_file_...

Join优化

S和R需要Join,并且Join列是S的分桶列,那么S的数据其实可以不需要移动,通过移动分发表R的数据就可以完成Join的计算。它的网络开销是 T(R),相当于只ShuffleR的数据就可以完成Join。有关Bucket Shuffle Join使用的更多细节,...

表格产品说明书

一个工作表可以划分为若干个行和列,表格使用行号与列标来标记不同的行和列。列标:位于表格编辑窗口上方,用大写英文字母A、B、C……表示,表格的列即被称为A列、B列、C列……。行号:位于表格编辑窗口左侧,用阿拉伯数字1、2、3……表示...

如果您需要创建TINYINT和STRUCT等新数据类型字段的可以打开 options.sql.use_odps2_extension=True 开关,示例如下。from odps import options options.sql.use_odps2_extension=True table=o.create_table('my_new_table','cat ...

如需修改分布字段和分区字段,您可以尝试如下办法:先创建临时,并通过INSERT INTO SELECT命令把原数据导入到临时。删除原后,使用正确的分布字段或者分区字段建,再次使用INSERT INTO SELECT把临时数据导入到新建的。如何...

MySQL整库同步Kafka

背景信息 MySQL CDC数据主要用于获取MySQL数据,并可以实时同步数据中的修改,经常用在复杂的计算场景。例如,作为一张维和其他数据表做Join操作。在使用中,同一张MySQL可能被多个作业依赖,当多个任务使用同一张MySQL表做处理时...

外部概述

创建好的外部表可以像普通的MaxCompute表一样使用(大部分场景),充分利用MaxCompute SQL的强大计算功能。说明 使用外部表功能时,外部表的数据不会复制一份存在MaxCompute上并产生存储费用。外部表支持全量搜索。Tunnel功能及Tunnel SDK...

ALTER TABLE

ALTER TABLE语句用于修改,其中对分区父的修改会自动应用到分区子中。本文为您介绍ALTER TABLE的用法。使用限制 Hologres当前对修改的支持情况如下:目前支持对表进行重命名、增加列和修改数据生存时间的操作。支持修改字段的...

CREATE DATABASE AS(CDAS)语句

此时您可以使用connectionPoolName参数,让配置相同名称连接池的表可以共享连接池。说明 在将数据同步到Hologres时,如果您的上游源表包含了 Fixed Plan 不支持类型的数据,建议通过 INSERT INTO语句 的方式,在Flink内部类型转换后将...

通过控制台使用宽模型

步骤三:创建数据 创建数据后,您可以在数据中读写数据。创建数据时,您可以根据业务需求同时创建二级索引用于读取数据。在 概览 页面,单击实例名称或在 操作 列单击 实例管理。在 实例详情 页签,单击 创建数据。说明 单个实例...

实用程序命令

删除Delta不再引用的文件 您可以通过在上运行vacuum命令来删除Delta不再引用且早于保留阈值的文件。vacuum 不会自动触发。文件的默认保留阈值为7天。警告 vacuum仅删除数据文件,而不删除日志文件。检查点操作后,日志文件将自动异步...

术语

分区组(Partition Group)AUTO模式数据库中,当组中的为分区时,该组的所有的某个分区构成一个分区组,分区组是分区调度的基本单元,属于某个分区组的所有分区始终会位于同一个存储节点。Join Group AUTO模式数据库中,Join ...

Hologres整库周期性增全量同步至MaxCompute

目标端不存在的表可以单击 目标表名 列的 按钮编辑目标表结构,例如,为目标表添加字段,设置主键等。目标端已有表仅支持查看。还支持您全选 目标表映射 框中的表信息,单击 批量刷新表映射 按钮,进行批量表映射刷新。同步前清空目标表。...

AnalyticDB for MySQL3.0整库周期性增全量同步至...

目标端不存在的表可以单击 目标表名 列的 按钮编辑目标表结构,例如,为目标表添加字段,设置主键等。目标端已有表仅支持查看。还支持您全选 目标表映射 框中的表信息,单击 批量刷新表映射 按钮,进行批量表映射刷新。同步前清空目标表。...

继承

在本数据库中,一个表可以从 0 个或者多个其他表继承,而对一个表的查询则可以引用一个表的所有行或者该表的所有行加上它所有的后代表。默认情况是后一种行为。例如,下面的查询将查找所有高度高于 500 尺的城市的名称,包括州首府:SELECT...

统计信息收集

on_change:当CREATE TABLE AS SELECT、INSERT、UPDATE、DELETE或者COPY命令在上执行时,如果影响的行数超过了gp_autostats_on_change_threshold内核参数所设置的阈值时,会触发对这个表做一次统计信息收集。该模式完全自动化,不再需要...

一键实时同步至MaxCompute

单击 刷新源和MaxCompute映射 将根据您在步骤三配置的目标名映射规则来生成目标,若步骤三未配置映射规则,将默认写入与源同名的目标,若目标端不存在该同名,将默认新建。同时,您可以修改建立方式,为目标在源有表字段...

一键实时同步至MaxCompute

单击 刷新源和MaxCompute映射 将根据您在步骤三配置的目标名映射规则来生成目标,若步骤三未配置映射规则,将默认写入与源同名的目标,若目标端不存在该同名,将默认新建。同时,您可以修改建立方式,为目标在源有表字段...

通过文件管理优化性能

我们以一张Delta的x列为例,假设给定的文件x列的最小值为5,最大值为10,如果查询条件为 where x,则根据文件的统计信息,我们可以得出结论:该文件中一定不包含我们需要的数据,因此我们可以直接跳过该文件,减少扫描的数据量,...

MySQL分库分表实践

本文为您介绍如何通过DataWorker数据集成和Flink两种方式将MySQL分库分表的数据写入至Hologres同一个中,通过本实践您可以根据业务场景选择合适的方式将MySQL分库分表数据写入Hologres。背景信息 实际业务场景下数据同步通常不能通过一个...

撤回云企业中的路由

背景信息 下列举了可以从云企业中撤回的路由条目。说明 目前,控制台只支持撤回云企业中的VPC路由,VBR路由的撤回操作暂不支持,您可以通过调用WithdrawPublishedRouteEntries撤销VBR路由。详细信息,请参见 ...

无锁结构变更方案对比

另外,通过在备库上模拟操作变更,实际并不切换源表和目标可以对源表和目标校验来持续验证可靠性。代码复杂性 主要依赖触发器的同步和数据库内部操作,工具的作用相对较小。非触发器的设计基于Binlog,有很大的自由度,但是复杂度会...

数据集成侧同步任务配置

设置目标可以定义写入目标的相关属性,例如,写入模式、是否写入分区以及分区的字段名称、选择写入目标端已有还是新建、以及是否需要编辑字段并为目标字段赋值等。说明 此步骤中,单击 刷新源端与目标端映射 按钮后,将会...

实时数仓Hologres

类别 详情 支持类型 源、维和结果 运行模式 流模式和批模式 数据格式 暂不支持 特有监控指标 源:numRecordsIn numRecordsInPerSecond 结果:numRecordsOut numRecordsOutPerSecond currentSendTime 说明 指标含义详情,请参见 ...

ALTER TABLE

ALTER TABLE 用于更改一个现有的定义。简介 ALTER TABLE 更改一个现有的定义。下文描述了几种形式。注意每一种形式所要求的锁级别可能不同。如果没有明确说明,将会获得一个 ACCESS EXCLUSIVE 锁。当给出多个子命令时,获得的锁将是子...

什么是专有网络

可以使用下中标准的私网段及其子网作为VPC的私网段,也可以使用自定义地址段作为VPC的私网段。更多信息,请参见 网络规划。网段 说明 192.168.0.0/16 可用私IP数量(不包括系统保留地址):65,532 172.16.0.0/12 可用私IP...

DataStudio侧实时同步任务配置

示例:对上一步源名和目标名转换规则转换后的进一步字符串拼接处理,使用${db_table_name_src_transed}代表上一步的处理结果“my_table”,再为该内置变量增加前缀和后缀,例如,pre_${db_table_name_src_transed}_post,最终就...

MySQL分库分表同步至MaxCompute

手工添加逻辑 在 自动生成逻辑 与期望的匹配结果不符时,可以编辑逻辑匹配规则,也可以通过 手工添加逻辑 添加没有扫描到的逻辑。单击 手工添加逻辑,有几个逻辑需要同步,就在此处添加几个。同一逻辑的数据会同步到目标...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
云企业网 共享流量包 弹性公网IP 负载均衡 短信服务 人工智能平台 PAI
新人特惠 爆款特惠 最新活动 免费试用