连接PostgreSQL实例

操作步骤 数据管理DMS连接 数据管理DMS是一种集数据管理、结构管理、用户授权、安全审计、数据趋势、数据追踪、BI图表、性能优化和服务器管理于一体的数据管理服务。数据库管理DMS的更多信息,请参见 什么是数据管理DMS。访问 RDS实例...

查看并管理治理工作台

您可以在治理工作台查看数据质量在校验过程中的出错情况及针对该质量校验问题发起整改、忽略、通知等治理操作,从而实现资产质量从制定计划到实现整改的PDCA完整流程,有效提升数据质量。本文为您介绍如何查看并管理治理工作台。权限说明 ...

查看并管理治理工作台

您可以在治理工作台查看数据质量在校验过程中的出错情况及针对该质量校验问题发起整改、忽略、通知等治理操作,从而实现资产质量从制定计划到实现整改的PDCA完整流程,有效提升数据质量。本文为您介绍如何查看并管理治理工作台。权限说明 ...

新功能发布记录

批量导出导入 单表导出导入 导出导入任务列表 导出任务 2023 年 2 月 27 日 功能名称 功能描述 相关文档 新增功能 备份恢复 支持通过异地备份文件将集群恢复到异地备份所在地域;支持集群用所在地域的其他集群的异地备份文件进行恢复,...

外部表常见问题

问题类别 常见问题 OSS外部表 自定义Extractor在读取非结构化数据时,如果数据字段存在DATETIME类型,报错ODPS-0123131,如何解决?在MaxCompute上访问OSS外部表,编写UDF本地测试通过,上传后报错内存溢出,如何解决?通过外部表处理OSS...

产品优势

多场景支持:支持实时数仓、多表实时拼接查询、实时数据处理与上传、实时报表、业务与计算分离、实时业务问题定位等。高效低延时:通过DTS获取和写入数据,支持分布式并发读写,效率高于Flink,数据准确性更高。可视化数据开发,更多信息,...

管理问题数据

支持保留问题数据的规则列表与问题数据口径 目前支持保留问题数据的监控规则,及各规则问题数据的定义,详情请参见:附录:支持保留问题数据的规则列表与问题数据口径。注意事项 目前仅MaxCompute表支持配置保留问题数据功能。目前仅部分...

数据仓库研发规范概述

数据仓库研发规范旨在为广大数据研发者、管理者提供规范化的研发流程指导方法,目的是简化、规范日常工作流程,提高工作效率,减少无效冗余工作,赋能企业、政府更强大的数据掌控力来应对海量增长的业务数据,从而释放更多人力财力专注...

EMR Kafka磁盘故障运维

磁盘故障及其运维通常伴随着磁盘上的数据销毁。在进行磁盘运维时,您应考虑数据是否需要迁移备份。对于Kafka集群,您还需要考虑Topic分区副本数据是否可以从其他Broker节点分区副本同步恢复。本文以EMR Kafka 2.4.1版本为例,介绍Kafka磁盘...

数据标准概述

通过规范约束标准代码、度量单位、字段标准、命名词典,来保障后续建模应用过程中数据处理的一致性,从源头上保障数据的标准化生产,节约后续数据应用和处理的成本。应用场景 DataWorks的数据标准包含 字段标准、标准代码、度量单位、...

内容分割

本文介绍如何使用数据清洗功能中的内容分割模板处理消息数据。背景信息 数据清洗功能提供常见的消息处理模板,包括内容分割、动态路由、内容富化和内容映射等。您可以直接利用模板处理消息,也可以根据业务情况在模板基础上修改代码。消息...

内容映射

本文介绍如何使用数据清洗功能中的内容映射模板处理消息数据。背景信息 数据清洗功能提供常见的消息处理模板,包括内容分割、动态路由、内容富化和内容映射等。您可以直接利用模板处理消息,也可以根据业务情况在模板基础上修改代码。消息...

数据集成概述

数据集成是基于Dataphin构建的简单高效的数据同步平台,致力于提供具有强大的数据处理能力、丰富的异构数据源之间数据高速稳定的同步能力。背景信息 面对各行各业对大数据的应用,数据集成会有很多的诉求,包括能够简单高效的配置大量...

C100售前支持相关问题

本文介绍了您在使用C100系列数据库审计服务前可能遇到的问题和解答,帮助您更好地理解和使用产品。咨询类问题 如何通过数据库审计实现数据库的安全监控及合规?数据库审计C100实例通过对数据库全量行为的审计溯源、危险攻击的实时告警、...

ActionTrail日志清洗

系统默认的数据清洗时间是00:30,您可以根据业务规律,将数据清洗时间设置在业务低峰期,以免清洗过程中可能对业务造成的影响。完成上述参数配置后单击 创建,创建Schema。Schema创建成功后,DLA自动在您设定的同步时间将ActionTrail投递到...

内容富化

本文介绍如何使用数据清洗功能中的内容富化模板处理消息数据。背景信息 数据清洗功能提供常见的消息处理模板,包括内容分割、动态路由、内容富化和内容映射等。您可以直接利用模板处理消息,也可以根据业务情况在模板基础上修改代码。消息...

背景信息以及准备工作

在使用DLA对OSS中的历史数据按天进行清洗时,由于数据清洗的SQL是固定的,只是每次执行的时候需要传入不同的日期,因此我们可以通过DataWorks来循环调度DLA数据清洗任务。针对上述场景,我们需要在DataWorks中完成以下工作:部署一个赋值...

动态路由

本文介绍如何使用数据清洗功能中的动态路由模板处理消息数据。背景信息 数据清洗功能提供常见的消息处理模板,包括内容分割、动态路由、内容富化和内容映射等。您可以直接利用模板处理消息,也可以根据业务情况在模板基础上修改代码。消息...

常见问题

本文为您介绍数据集成任务常见问题。资源组操作及网络连通 在做离线同步时,我们需要先了解哪些DataWorks及其网络能力?同步ECS自建的数据库的数据时,如何保障数据库DataWorks的网络连通?...收费常见问题 数据集成是怎么收费的?

敏感数据保护概览

数据自动化扫描。自定义数据扫描触发周期。自动识别企业敏感数据和对敏感数据进行分类分级,解决企业资产中的敏感数据及时发现、有效管理的问题。内置和自定义分类分级模板,完善业务精细化分类管理模型,可以使用最小授权原则管理敏感数据...

作业开发入门概述

DWD:数据明细层,对ODS层数据进行清洗、过滤等处理。本教程以过滤为例。ADS:数据应用层,面向业务进行数据分析、生产报表等使用的数据。您可以选择Spark SQL和XIHE BSP SQL任意一种方式进行作业开发。选择不同方式进行作业开发时,需要...

租户设置

资源使用说明 总的处理单元规格数和总的质量规则数客户购买的数据处理单元和规则配额有关。详情请参见 查看资源使用情况。新建租户 使用超级管理员或系统管理员账号,登录元仓租户。在Dataphin首页,单击顶部菜单栏的 管理中心。在 管理...

常见问题

本文汇总了 云数据库ClickHouse 的常见问题及解决方案。选型购买 云数据库ClickHouse和官方版本对比多了哪些功能和特性?购买实例时,推荐选择哪一个版本?单双副本实例各有什么特点?购买链路资源时显示“当前区域资源不足”,应该如何...

ODPS-0123091

解决方案 检查输入数据,必要时先对输入数据进行清洗处理。假如想忽略错误,可以将当前处理模式修改为非严格模式。Query示例-准备数据 odps>create table mc_test(a string);odps>insert overwrite table mc_test values('100'),('-');设置...

集成开发概览

DMS的数据集成开发功能模块,针对数据全生命周期的集成、开发、服务三个阶段提供界面化的功能支持。功能简介 数据集成开发功能模块支持多种计算、存储引擎,支持结构化、半结构化、非结构化数据的实时集成、离线集成、开发、服务,能够...

实时同步常见问题

实时同步字段格式问题 数据集成实时同步在同步MySQL、Oracle、Loghub和PolarDB类型的数据至DataHub或Kafka时,会在同步的目标端添加5个附加列,以进行元数据管理、排序去重等操作。详情请参见 实时同步字段格式。为什么实时同步任务延迟较...

服务支持

DataV-Board 数据看板 DataV-TwinFabric 孪生仿真 DataV-Atlas 可视分析地图 DataV-Card 可视分析创作间 常见问题 DataV-Board 数据看板 配置项常见问题 组件使用常见问题 账号配置常见问题 视频流接入常见问题 数据源配置常见问题 ...

如何处理Tair集群数据倾斜

为什么会产生数据倾斜 Tair 集群架构作为一个分布式系统,整个数据库空间会被分为16384个槽(Slot),每个数据分片节点将存储与处理指定Slot的数据(Key),例如3分片集群实例,3个分片分别负责的Slot为:[0,5460]、[5461,10922]、[10923,...

如何处理Redis集群数据倾斜

为什么会产生数据倾斜 Redis 集群架构作为一个分布式系统,整个数据库空间会被分为16384个槽(Slot),每个数据分片节点将存储与处理指定Slot的数据(Key),例如3分片集群实例,3个分片分别负责的Slot为:[0,5460]、[5461,10922]、[10923,...

处理治理项问题

使用治理方案模板并配置治理项后,数据治理中心会根据配置的治理项检测目标租户下存在的治理项问题。...后续步骤 治理项问题处理完成后,您可以进入 治理评估 页面,通过治理报告或治理排行榜查看治理成效,详情请参见 查看治理结果。

添加处理数据数据管理

数据处理后,需要将处理后的数据添加到数据管理中,以便被用于数仓建设、标签管理等数据中台任务。本文以倾斜数据处理后为例,介绍如何添加处理数据数据管理。前提条件 已新建数据处理任务,具体操作,请参见 新建数据处理任务。操作...

Stage级别诊断结果

较大的数据量被广播 Stage输入数据倾斜 Stage输出数据倾斜 较大的数据量被广播 问题 广播(Broadcast)是在两个相邻的Stage间,上游向下游Stage传输数据时所用的一种方法(更多详情,请参见 数据输出类型)。如果某个Stage广播了较多数据,...

数据

本文将解答与数据源相关的问题。Q:Databricks数据洞察的支持哪些数据源?目前支持读写阿里云对象存储(OSS)的数据。Q:是否支持当前的DDI集群访问其他集群的HDFS数据?支持访问同账号下的EMR Hadoop集群上的HDFS数据

常见问题概览

连接访问网络 热点问题 其他常见问题 排查Mongo Shell登录问题 如何通过DMS登录MongoDB数据库 登录时提示Authentication failed错误如何处理?云数据库MongoDB支持哪些语言的客户端进行连接?如何查询及限制连接数 排查因连接数耗尽导致...

查看数据处理任务运维信息

您可以通过查看数据处理任务运维信息,快速定位任务失败的原因。本文以倾斜数据处理后为例,介绍如何查看数据处理任务运维信息。操作步骤 登录 数据资源平台控制台。在页面左上角,单击 图标,选择 协同。在顶部菜单栏,单击 图标,选择...

常见问题

查看当前Reduce Task中Reduce Input bytes和Reduce shuffle bytes的信息,如果比其他的Task处理数据量大很多,则说明出现了倾斜问题。如何预估Hive作业并发量的上限值?Hive作业并发量HiveServer2的内存以及master实例个数有关系。您...

外部表概述

该机制使得用户可以无需将数据导入到MaxCompute内部存储,直接对外部数据进行操作,从而提供了数据处理的灵活性和方便性。背景信息 MaxCompute SQL作为分布式数据处理的主要入口,可实现EB级别离线数据的快速处理和存储。随着大数据业务的...

全景视角

详情请参见 处理治理项问题数据使用视角 在数据分析、发布或使用数据服务等数据使用场景下,建议您使用数据使用视角,关注查看数据使用过程中,浏览、访问过的表列表、拥有权限的数据服务等方面的情况。为您提供个人视角下的各维度管理把...

数据处理

数据处理类节点包括串行数据处理节点。本文介绍在蓝图编辑器中,配置数据处理类节点的方法。串行数据处理节点 串行数据处理 节点,是使用串行方式来处理一个事件。使用场景:例如,小数0.835要转换成整数百分比83%,可经过:单位转换(83.5...

MaxFrame概述

背景信息 基于Python语言的易读性、高效开发及开放生态等优势,Python已经成为科学计算、机器学习以及AI开发领域的事实标准和主流编程语言,其整合了数据分析、机器学习等各类第三方包,如Pandas(数据处理与分析)、NumPy(数值计算)、...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
云数据库 RDS 数据传输服务 云数据库 Redis 版 数据库备份 DBS 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用