数据治理专业认证CDMP学习笔记(思维导图与知识点)- 第八章数据集成和互操作篇

数据治理专业认证CDMP学习笔记(思维导图与知识点)- 第八章数据集成和互操作篇

大家好,我是独孤风,一位曾经的港口煤炭工人,目前在某国企任大数据负责人,公众号大数据流动主理人。在最近的两年的时间里,因为公司的需求,还有大数据的发展趋势所在,我开始学习数据治理的相关知识。数据治理需要进行系统的学习才能真正掌握,也需要进行专业的考试认证才能证明自己在数据治理方面的学习...

《全链路数据治理-全域数据集成》—— 一、数据同步场景下的技术选型——1. 数据集成简介

《全链路数据治理-全域数据集成》—— 一、数据同步场景下的技术选型——1. 数据集成简介

1元开通与体验DataWorks、MaxCompute、Hologres 三款云原生一体化数仓产品卷首语云原生一体化数仓是阿里云整合自研大数据产品 MaxCompute、DataWorks、Hologres 和实时计算 Flink 版推出的一站式大数据处理平台,具备流批一体、实时离线一体、湖仓一体、...

《全链路数据治理-全域数据集成》—— 一、数据同步场景下的技术选型——2. 同步业务场景和技术方案选择对照表

《全链路数据治理-全域数据集成》—— 一、数据同步场景下的技术选型——2. 同步业务场景和技术方案选择对照表

2. 同步业务场景和技术方案选择对照表每类同步场景支持的方案不同,您可参考此表根据业务需要进行选择。 【注】l DataStudio 是 DataWorks 中的数据开发模块,数据集成主站是指DataWorks 中的数据集成模块,目前部分的数据集成任务由于历史原因,操作入口还在数据开发(DataSt...

《全链路数据治理-全域数据集成》—— 一、数据同步场景下的技术选型——3.数据同步增值能力

《全链路数据治理-全域数据集成》—— 一、数据同步场景下的技术选型——3.数据同步增值能力

3. 数据同步增值能力除了实现不同数据源之间的同步,DataWorks 数据集成还与 DataWorks 强大的全链路数据开发治理能力融合,支持数据源开发与生产环境隔离、任务运维、数据质量监控、数据源审批策略管控、独享资源组等多项能力。 1) 支持数据源开发和生产隔离数据同步基于数据源进行配置,配置...

《全链路数据治理-全域数据集成》——二、实时与离线同步能力介绍——1. 实时同步功能概述

《全链路数据治理-全域数据集成》——二、实时与离线同步能力介绍——1. 实时同步功能概述

二、实时与离线同步能力介绍1. 实时同步功能概述DataWorks 数据集成为您提供的实时数据同步功能,方便您使用单表同步或整库同步方式,将源端数据库中部分或全部表的数据变化实时同步至目标数据库中。 支持复杂网络环境下的数据同步,云数据库,本地或 ecs 自建数据库或非阿里云数据库等环境下的数据同步...

《全链路数据治理-全域数据集成》——二、实时与离线同步能力介绍——2. 使用权限

2. 使用权限l 实时同步仅支持使用独享数据集成资源组。 l 对于数据库类数据源需要预先开通数据库的实时日志能力。

《全链路数据治理-全域数据集成》——二、实时与离线同步能力介绍——3. 实时同步场景与配置

3. 实时同步场景与配置1) 单表 ETL 实时同步l 将单个表或者 topic 内的数据同步到另外一个表中,整个流程支持图形化开发无需编写代码,单表实时同步至单表时,支持使用托拽的方式实现任务开发,业务新手也能够轻松上手。 l 单表增量数据实时同步场景下,您可以根据业务需求,对输入数据源进行数据过...

《全链路数据治理-全域数据集成》——二、实时与离线同步能力介绍——4. 实时同步附加能力

4. 实时同步附加能力1) 监控报警配置l 支持对业务延迟、Failover、DDL 策略、心跳检查设置监控报警。 l 支持通过邮件、短信、电话和钉钉等方式将报警信息发送给报警接收人,方便您及时发现并处理任务异常。 l 支持报警疲劳度控制。为了避免短时间内产生大量报警,DataWorks 支持您设置...

《全链路数据治理-全域数据集成》——二、实时与离线同步能力介绍——6. 离线同步功能概述

《全链路数据治理-全域数据集成》——二、实时与离线同步能力介绍——6. 离线同步功能概述

6. 离线同步功能概述离线(批量)的数据通道通过定义数据来源和去向的数据源和数据集,提供一套抽象化的数据抽取插件(Reader)、数据写入插件(Writer),并基于此框架设计一套简化版的中间数据传输格式,实现任意结构化、半结构化数据源之间数据传输;支持单表...

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

社区圈子

DataWorks
DataWorks
DataWorks基于MaxCompute/Hologres/EMR/CDP等大数据引擎,为数据仓库/数据湖/湖仓一体等解决方案提供统一的全链路大数据开发治理平台。作为阿里巴巴数据中台的建设者,DataWorks从2009年起不断沉淀阿里巴巴大数据建设方法论,同时与数万名政务/金融/零售/互联网/能源/制造等客户携手,助力产业数字化升级。
2700+人已加入
加入
相关电子书
更多
基于 Flink CDC 打造 企业级实时数据集成方案
全链路数据治理-全域数据集成
Flink CDC:新一代数据集成框架
立即下载 立即下载 立即下载