数据倾斜诊断

您也可以添加过滤条件,查看指定Schema或指定表的数据倾斜情况,查询语句如下:查看指定Schema下所有表的数据倾斜情况:SELECT*FROM adbpg_toolkit.diag_skew_tables WHERE schema_name='名称>';查看指定表的数据倾斜情况:SELECT*FROM ...

登录临时实例

您可以创建临时实例(即将实例数据恢复到该临时实例),然后登录到临时实例中确认数据是否正确,最后再将临时实例的数据恢复到目标RDS实例。本文介绍如何登录临时实例。前提条件 RDS实例需满足以下条件:版本:RDS SQL Server 2008 R2 ...

常见问题

如果目标端的数据逐出策略(maxmemory-policy)配置为 noeviction 以外的值,可能导致目标端的数据与源端一致。关于数据逐出策略详情,请参见 Redis数据逐出策略介绍。增量数据迁移时Binlog相关的预检查项失败,如何处理?检查源库Binlog...

大数据安全治理的难点

如此多类型的用户,授权、管理难度加大,什么样的人员需要授予什么样的权限?如果他们离职、换部门了怎么办?这其中很有可能出现 权限蠕变、过度授权、离职撤权彻底 的情况,这些都为数据安全事件埋下了隐患。入口 由于大数据系统要服务...

DataWorks数据服务对接DataV最佳实践

DataV通过与DataWorks数据服务的对接,通过交互式分析Hologres连接DataWorks数据服务开发并生成API,快速在DataV中调用API并展现MaxCompute的数据分析结果。数据服务对接DataV产生背景 MaxCompute是阿里巴巴集团自主研究的快速、完全托管的...

Tunnel命令常见问题

当值为True时,会将符合表定义的数据全部忽略。详情请参见 Upload。使用Tunnel Upload命令上传数据时,报错You cannot complete the specified operation under the current upload or download status,如何解决?问题现象 使用Tunnel ...

常见问题

ClickHouse每次写入都会生成一个data part,如果每次写入一条或者少量的数据,那会造成ClickHouse内部有大量的data part(会给merge和查询造成很的负担)。为了防止出现大量的data part,ClickHouse内部做了很多限制,这就是too many ...

文档修订记录

QueryPublicModelEngine 2023.10.20 新增功能 上传与下载 DataWorks的上传与下载模块,提供了便捷的数据上传功能,支持将多种来源(例如,本地文件、OSS文件)的数据上传至MaxCompute数据引擎中进行分析处理及相关管理操作,致力于为您...

常见问题

mnt/disk1/starrocks/storage/trash/目录中存储的是删除的数据。如果您想减少该目录的磁盘占用,可以通过调小 be.conf 中的 trash_file_expire_time_sec 参数,控制trash目录保留时间。默认值是259200(72小时)。创建物化视图时报错,该...

新功能发布记录

2024年01月29日RDS MySQL IO加速公测活动开始 2023年 12月 类别 功能名称 功能描述 发布时间 相关文档 新增 Binlog Cache Free Flush RDS MySQL新增Binlog Cache Free Flush功能,有效解决事务提交时出现Binlog耗时过长、实例长时间可...

2020年

修复具有NaN数值的栅格数据在计算统计信息时会导致结果不正确的问题。2020年7月 内核小版本(V1.1.2)类别 名称 描述 相关文档 新增 Pivot语法 Pivot语法支持使用table或subquery作为别名。无 ROWID伪列 支持ROWID伪列和ROWIDTOCHAR/...

MaxCompute数据

如果您的表字段顺序调整、类型变更或者个数增减,您的任务会存在源头表列和目的表列不能对齐的风险,则直接导致您的任务运行结果不正确甚至运行失败。如果您想依次读取 name 和 id,则应该配置为"column":["name","id"]。如果您想在源头...

离线同步常见问题

读取kafka配置了endDateTime来指定所要同步的数据的截止范围,但是在目的数据源中发现了超过这个时间的数据 Kafka中数据量少,但是任务出现长时间读取数据也结束,一直运行中的现象是为什么?写入OSS出现随机字符串如何去除?MySQL分库...

Kafka数据

常见问题 读取kafka配置了endDateTime来指定所要同步的数据的截止范围,但是在目的数据源中发现了超过这个时间的数据 Kafka中数据量少,但是任务出现长时间读取数据也结束,一直运行中的现象是为什么?附录:脚本Demo与参数说明 附录:...

高效数据治理实施指南

数据治理是重要且繁琐的工作,在解决“如何制定客观的数据治理目标”、“如何高效推动团队达成治理目标”的过程中,通常包含以下挑战:问题难定位:传统数据治理方式难以快速、完整、精准地定位潜在问题,导致在长期执行治理工作时效率高...

数据治理

数据地图 为什么数据地图数据总览页存储量和存储趋势图相差较数据地图血缘展示延迟问题 数据地图新建表搜到 当前表业务逻辑变更如何通知下游?哪些类型的Hive表支持在数据地图中预览?数据保护伞 数据保护伞为什么有时候查询脱敏有...

创建MaxCompute数据

如果需要根据所处环境自动访问对应环境的数据源,请通过${数据源编码}.table 或${数据源编码}.schema.table 的变量格式访问。更多信息,请参见 Dataphin数据源表开发方式。重要 目前仅支持 MySQL、Hologres、MaxCompute 数据源。数据源编码...

创建MaxCompute数据

如果需要根据所处环境自动访问对应环境的数据源,请通过${数据源编码}.table 或${数据源编码}.schema.table 的变量格式访问。更多信息,请参见 Flink_SQL任务开发方式。重要 目前仅支持 MySQL、Hologres、MaxCompute 数据源。数据源编码...

数据格式描述文件

是 parser parser部分决定了您的数据如何被正确地解析,metricsSpec定义了数据如何被聚集计算,granularitySpec定义了数据分片的粒度、查询的粒度。对于parser,type有两个选项:string和hadoopString,后者用于Hadoop索引的 job。...

功能特性

数据迁移 数据迁移功能帮助您实现同构或异构数据源之间的数据迁移,适用于数据上云迁移、阿里云内部跨实例数据迁移、数据库拆分扩容等业务场景 功能集 功能 功能描述 参考文档 同构迁移 逻辑迁移 支持同构数据库间的数据迁移。自建MySQL...

常见问题

数据安全中心对于结构化数据源的扫描机制是什么样的数据安全中心扫描数据源中的字段名称、字段值综合判断该数据是否为敏感数据,只通过字段值无法判断数据是否敏感。例如:年龄数据。敏感数据识别是如何实现的?敏感数据识别是在完成数据...

创建Hologres数据

在引入Hologres的业务数据至Dataphin和将Dataphin的数据写入至Hologres的场景中,您需要先创建Hologres数据源。本文为您介绍如何新建Hologres数据源。背景信息 Hologres即阿里云交互式分析Hologres,是阿里巴巴自主研发的一款交互式分析...

常见问题

对于外部表,MaxCompute并真正持有数据,表格的数据可以存放在OSS或OTS中。MaxCompute仅会记录表格的Meta信息,您可以通过MaxCompute的外部表机制处理OSS或OTS上的非结构化数据,例如视频、音频、基因、气象、地理信息等。如果想使用...

存储过程

描述 删除实例中的数据库。删除时会将关联的对象移除掉,高可用系列会自动将镜像移除,并且KILL在该数据库上的连接。使用方法 USE db GO EXEC sp_rds_drop_database 'db' GO 参数是要被删除的数据库。设置更改跟踪 T-SQL命令 sp_rds_change...

前言

云数据库MongoDB版完全兼容MongoDB协议,提供稳定可靠、弹性伸缩的数据库服务。为您提供容灾、备份、恢复、监控、报警等方面的全套数据库解决方案。为什么选择云数据库MongoDB版 详情请参见 云数据库MongoDB与自建数据库对比优势 和 应用...

2023年

修复Hash join on char column结果不正确的问题。修复多个pg_dump命令在7.0版本上的Bug。修复auto_explain的内存泄漏问题。修复AOCO表在ADD Column时的内存异常问题。删除有安全隐患的gppkg包。2023年05月(V7.0.1.8)类别 功能 功能描述 ...

ListDoctorHiveTables-批量获取Hive表分析结果

温数据指的是 7 日内没有访问的数据,但是 30 日以内有访问的数据。coldDataSize:冷数据的数据量大小。冷数据指的是 30 日内没有访问的数据,但是 90 日以内有访问的数据。freezeDataSize:极冷数据数的据量大小。极冷数据指的是 90 日以内...

创建Hologres数据

在引入Hologres的业务数据至Dataphin和将Dataphin的数据写入至Hologres的场景中,您需要先创建Hologres数据源。本文为您介绍如何新建Hologres数据源。背景信息 Hologres即阿里云交互式分析Hologres,是阿里巴巴自主研发的一款交互式分析...

实时同步常见问题

实时同步支持的数据源请参考文档:实时同步支持的数据源。实时同步任务为什么不建议使用公网?实时同步任务使用公网时,会存在以下风险:网络可能稳定,丢包等时常发生,影响同步性能。安全性高。实时同步字段格式问题 数据集成实时...

创建OpenGauss数据

超过128字符。数据源配置 基于业务数据源是否区分生产数据源和开发数据源:如果业务数据源区分生产数据源和开发数据源,则选择 生产+开发数据源。如果业务数据源不区分生产数据源和开发数据源,则选择 生产数据源。标签 您可根据标签给...

创建OpenGauss数据

超过128字符。数据源配置 基于业务数据源是否区分生产数据源和开发数据源:如果业务数据源区分生产数据源和开发数据源,则选择 生产+开发数据源。如果业务数据源不区分生产数据源和开发数据源,则选择 生产数据源。标签 您可根据标签给...

历史版本常见问题

版本范围 5.4.1-*5.4.12-16444832(不包含)查询分片缺失及查询数据不正确问题 现象描述 在小于等于负整数的范围查询场景中,当分库分表列的类型是整数时,对于类似id的范围查询,分库分表路由结果会有概率出现个别分表缺失,导致数据扫描...

pg_statistic

因为不同类型的统计信息适用于不同类型的数据,pg_statistic 被设计成太在意自己存储的是什么类型的统计。只有极为常用的统计信息(比如 NULL 的含量)才在 pg_statistic 里给予专用的字段。其它所有东西都存储在“槽位”中,而槽位是一...

创建GBase 8a数据

超过128字符。数据源配置 基于业务数据源是否区分生产数据源和开发数据源:如果业务数据源区分生产数据源和开发数据源,则选择 生产+开发数据源。如果业务数据源不区分生产数据源和开发数据源,则选择 生产数据源。标签 您可根据标签给...

创建GBase 8a数据

超过128字符。数据源配置 基于业务数据源是否区分生产数据源和开发数据源:如果业务数据源区分生产数据源和开发数据源,则选择 生产+开发数据源。如果业务数据源不区分生产数据源和开发数据源,则选择 生产数据源。标签 您可根据标签给...

创建KingbaseES数据

超过128字符。数据源配置 基于业务数据源是否区分生产数据源和开发数据源:如果业务数据源区分生产数据源和开发数据源,则选择 生产+开发数据源。如果业务数据源不区分生产数据源和开发数据源,则选择 生产数据源。标签 您可根据标签给...

创建TiDB数据

超过128字符。实时研发 开启后该数据源可用于实时研发,但需填写实时研发相关配置项。数据源配置 基于业务数据源是否区分生产数据源和开发数据源:如果业务数据源区分生产数据源和开发数据源,则选择 生产+开发数据源。如果业务数据源不...

调试实时任务

上传本地数据前需要先下载例,例由Dataphin自动识别读写的表和表的schema信息生成的csv格式例模板,您可根据下载的例编辑需要上传的数据,单击 上传 后,数据自动填充至 元数据采样 区域。手动输入数据 适用于采集的数据比较少,...

创建KingbaseES数据

超过128字符。数据源配置 基于业务数据源是否区分生产数据源和开发数据源:如果业务数据源区分生产数据源和开发数据源,则选择 生产+开发数据源。如果业务数据源不区分生产数据源和开发数据源,则选择 生产数据源。标签 您可根据标签给...

创建Hudi数据

同步到Hive的数据库名称:填写同步到Hive的数据库名称。单击 确定,完成Hudi数据源的创建。重要 创建Hudi数据源时支持测试数据源是否可以和Dataphin进行正常的连通,因此需要您确保连接信息的正确性。您可根据 网络连通解决方案 自行排查...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
云数据库 Redis 版 数据库备份 DBS 云数据库 RDS 数据传输服务 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用