DataWorks数据集成

准备工作 数据集成任务准备 开通DataWorks服务 开通MaxCompute,自动产生一个默认的MaxCompute数据源,并使用主账号登录 DataWorks 创建工作空间。您可在工作空间中协作完成工作流,共同维护数据和任务等,因此使用DataWorks前需要先创建...

什么是数据库审计

工作原理 数据库审计服务通过旁路监听模式,支持完全独立于数据库的部署。在不影响数据库日常运行效能的前提下,实现灵活的审计与监控。基于数据库操作语句进行审计,监视数据库登录、访问行为,有效地实施审计策略。数据库审计服务还具备...

数据迁移与同步FAQ

DTS的数据迁移与数据同步工作原理是什么?DTS的数据迁移与数据同步有什么区别?使用DTS遇到预检查报错,如何解决?什么是数据迁移、数据同步?数据迁移:将Redis数据库中的数据(即键值对)迁移至另一个Redis数据库中。通常迁移完成后即可...

产品架构

数据迁移工作原理 数据迁移过程包括三个阶段,即结构迁移、全量数据迁移和增量数据迁移。如果需要在迁移期间保持源数据库的正常运行,当您在配置迁移任务时,必须将结构迁移、全量数据迁移和增量数据迁移都选为所需的迁移类型。结构迁移:...

离线同步数据质量排查

背景信息 讲述数据集成数据同步的原理机制,理解数据同步的过程,进而对数据同步的执行效果有判断能力,判断数据同步效果具体包括:数据同步的数据量、目标端数据实际数量等。同步原理 DataWorks数据集成的同步任务在执行时称之为一个Job,...

RDS实例间的数据迁移

更多迁移功能原理,请参见 数据迁移工作原理。DTS在执行全量数据迁移时将占用源库和目标库一定的读写资源,可能会导致数据库的负载上升,在数据库性能较差、规格较低或业务量较大的情况下(例如源库有大量慢SQL、存在无主键表或目标库存在...

RDS实例间数据迁移

更多迁移功能原理,请参见 数据迁移工作原理。DTS在执行全量数据迁移时将占用源库和目标库一定的读写资源,可能会导致数据库的负载上升,在数据库性能较差、规格较低或业务量较大的情况下(例如源库有大量慢SQL、存在无主键表或目标库存在...

功能特性

SQL窗口介绍 SQL Console初体验 SQL Console新交互模式下变更表数据和结构 数据工作数据集成 离线集成是一种低代码开发数据加工任务的工具,可以组合各类任务节点形成数据流,通过周期调度运行达到数据加工、数据同步的目的。...

备份集查询功能概览

工作原理 DBS与数据湖Data Lake Analytics深度集成,提供备份集在线查询能力,通过DLA直接对OSS上的备份数据文件进行查询。备份集查询功能的整体架构如下图所示。DBS也支持在单个备份计划下查询多个备份集。您需要选择目标备份集并创建数据...

离线同步读取MongoDB数据

DataWorks的数据集成为您提供MongoDB Reader插件,可从MongoDB中读取数据,并将数据同步至其他数据源。本文以一个具体的示例,为您演示如何通过数据集成将MongoDB的数据离线同步至MaxCompute。背景信息 本实践的来源数据源为MongoDB,去向...

配置并管理实时同步任务

您需要在数据集成同步任务配置前,配置好您需要同步的源端和目标端数据库,以便在同步任务配置过程中,可通过选择数据源名称来控制同步任务的读取和写入数据库。实时同步支持的数据源及其配置详情请参见 实时同步支持的数据源。说明 数据源...

UpdateDIProjectConfig

调用UpdateDIProjectConfig修改当前工作空间中数据集成同步解决方案任务默认的全局配置。当前DataWorks仅支持为同步解决方案任务中的实时同步DDL消息处理策略设置默认的全局配置。如果您的同步解决方案任务包含实时同步任务,则配置 DDL...

ListDIProjectConfig

调用ListDIProjectConfig查看当前工作空间中数据集成同步解决方案任务默认的全局配置。当前DataWorks仅支持为同步解决方案任务中的实时同步DDL消息处理策略设置默认的全局配置。如果您的同步解决方案任务包含实时同步任务,则配置 DDL消息...

工作原理

工作原理 本地安装一个数据库网关代理(database gateway agent)。数据库网关代理负责与数据库网关云端服务(database gateway cloud service)建立安全的、可信任的通道。不同账号、不同网关所建立的通道彼此隔离。通道建立后,当您...

DataWorks OpenAPI概述

DataWorks为您提供了涵盖租户、元数据、数据开发、运维中心、数据集成等多个功能模块的OpenAPI接口,不同API的QPS限制、每日调用次数上限和支持使用的DataWorks服务版本存在差异。您可参考本文了解各OpenAPI支持的DataWorks版本及地域、...

2023年

JSON_SET 2023-10-09 新增Sugar BI连接MaxCompute 新说明 Sugar BI是百度智能云推出的敏捷 BI 和数据可视化平台,MaxCompute支持您将MaxCompute项目数据接入Sugar BI,帮助您轻松完成数据分析和数据可视化工作。本文为您介绍如何使用Sugar ...

管理控制台功能概览

功能模块 您可通过控制台了解DataWorks各模块的功能及使用流程,并快速进入指定工作空间的 数据集成、智能数据建模、数据开发、运维中心、数据质量、数据分析、数据地图、安全中心、数据治理中心、数据服务、管理中心 模块执行相关操作。...

功能概览

订阅方案概览 数据集成 数据同步 帮助您实现数据源之间的数据实时同步,适用于数据异地多活、数据异地灾备、本地数据灾备、跨境数据同步、查询与报表分流、云BI及实时数据仓库等多种业务场景。数据同步方案概览 离线集成 离线集成是一种低...

管理数据集成任务

完成数据集成任务的配置后,您可以停止、恢复或删除该数据集成任务。前提条件 已创建数据集成任务,相关案例请参见 配置RDS MySQL间的数据集成任务。背景信息 数据集成任务支持的管理操作及对应的影响请参见下表。操作 影响 停止数据集成...

附录:预设角色权限列表(空间级)

不同预设角色对DataWorks各空间级功能的操作权限详情请参见下文的:数据管理 发布管理 按钮控制 代码开发 函数开发 节点类型控制 资源管理 工作流开发 数据集成 数据建模 数据分析 此外,空间级预设角色对MaxCompute引擎数据也具有一定的...

Kafka增量数据同步至MaxCompute

创建数据源 准备用于运行数据同步任务的工作空间与数据集成资源组,操作详情请参见 新增和使用独享数据集成资源组。本实践下文以一个标准模式的工作空间使用独享数据集成资源组为例,为您示例操作详情。新建Kafka数据源,并完成Kafka数据源...

Kafka增量数据同步至MaxCompute

创建数据源 准备用于运行数据同步任务的工作空间与数据集成资源组,操作详情请参见 新增和使用独享数据集成资源组。本实践下文以一个标准模式的工作空间使用独享数据集成资源组为例,为您示例操作详情。新建Kafka数据源,并完成Kafka数据源...

公共数据集成(调试)资源组

本文为您介绍公共数据集成(调试)资源组相关问题。公共数据集成(调试)资源组怎么收费?公共数据集成(调试)资源组支持哪些类型的任务?公共数据集成(调试)资源组支持哪些网络类型?公共数据集成(调试)资源组的性能限制 公共数据...

数据集成:全领域数据汇聚

DataWorks的数据集成功能模块是稳定高效、弹性伸缩的数据同步平台,致力于提供复杂网络环境下、丰富的异构数据源之间高速稳定的数据移动及同步能力。功能概述 DataWorks数据集成支持离线同步、实时同步,以及离线和实时一体化的全增量同步...

通过操作审计查询行为事件日志

DIBatchDeleteAlarmRule 运维中心数据集成批量删除告警规则 DIUpdateAlarmRule 运维中心数据集成修改告警规则 DISaveSolution 数据集成主站新建或修改保存解决方案 DIDeleteSolution 数据集成主站删除解决方案 DIStartSolution 数据集成主...

收费常见问题

本文为您介绍数据集成收费相关问题及解决方案。数据集成是怎么收费的?数据集成收费包含三种途径,详情请参见 独享数据集成资源组计费说明:包年包月、公共数据集成(调试)资源组:按量计费、公网流量计费说明。

DataWorks的审计事件

DIBatchOfflineStreamxJob 运维中心数据集成功能下批量下线实时任务。DIBatchRunStreamxJob 运维中心数据集成功能下批量启动实时任务。DIBatchStartAlarmRule 运维中心数据集成功能下批量启动告警规则。DIBatchStopAlarmRule 运维中心数据...

查看历史任务

数据集成任务会在每个调度时间点生成一个数据迁移任务,通过DTS控制台您可以查看所有已经运行完成的数据迁移任务,了解该任务的执行情况。前提条件 已创建数据集成任务,相关案例请参见 配置RDS MySQL间的数据集成任务。操作步骤 登录 数据...

DataWorks公共数据集成(调试)资源组下线公告

已经配置了DataWorks公共数据集成资源组的任务可继续正常运行,但不能对这些任务进行修改,若您需修改这些任务,请于 2024年4月1日 前切换为 DataWorks独享数据集成资源组。2024年9月1日 起,DataWorks公共数据集成资源组不再提供服务,...

数据引入概述

Dataphin支持通过数据集成和数据同步的方式,将业务数据源的数据引入Dataphin平台。背景信息 如果您是在 2020年4月之后 购买的Dataphin,则数据同步能力通过数据集成功能实现(即系统 不再提供数据同步的功能入口)。数据集成为您提供简单...

配置监控报警

数据集成任务提供了监控报警功能,您可以通过控制台对重要的监控指标设置报警规则,让您第一时间了解该任务的运行状态。前提条件 已创建数据集成任务,相关案例请参见 配置RDS MySQL间的数据集成任务。背景信息 DTS目前支持的监控项为 延迟...

独享资源组模式

数据集成任务的编辑页面,通过调度运行及界面测试,选择运行时执行数据集成离线同步任务的资源组:单击左上角的 图标,选择 全部产品>数据开发与运维>DataStudio(数据开发),并切换至修改的归属工作空间。在 数据开发 面板,双击打开...

数据集成概述

数据集成是基于Dataphin构建的简单高效的数据同步平台,致力于提供具有强大的数据预处理能力、丰富的异构数据源之间数据高速稳定的同步能力。背景信息 面对各行各业对大数据的应用,数据集成会有很多的诉求,包括能够简单高效的配置大量...

数据传输作业:数据集成

MaxCompute支持通过DataWorks数据集成功能将其他数据源数据同步至MaxCompute,数据集成作业主要有三种类型:离线同步、实时同步、同步解决方案。本文为您介绍MaxCompute数据集成的实现方案。离线同步 离线(批量)的数据通道通过定义数据...

附录:ECS自建数据库的安全组配置

添加安全组 进行ECS自建数据源的数据同步时,如果同步任务运行在:独享数据集成资源组上 需要将独享数据集成资源组的EIP地址段或独享数据集成资源组绑定的交换机网段添加至ECS安全组上。通过外网同步数据时,需获取并添加独享资源组本身的...

修改调度策略

对于已经配置完成的数据集成任务,如果由于业务需求变更需要重新调整调度策略,您可以参照本文的方法修改调度策略。前提条件 已创建数据集成任务,相关案例请参见 配置RDS MySQL间的数据集成任务。操作步骤 登录 数据传输控制台。在左侧...

计费方式

运行数据集成任务会产生DataWorks相关费用,此外还可能其他产品费用,具体如下:DataWorks相关收费 数据集成资源组(独享数据集成资源组计费说明:包年包月,如果使用 公共数据集成(调试)资源组:按量计费,则还包括公共数据集成资源组...

通过数据集成导入导出MongoDB数据

数据集成DataWorks是稳定高效、弹性伸缩的数据同步平台,为阿里云大数据计算引擎(MaxCompute、AnalyticDB和OSS等)提供离线、批量数据的进出通道。本文介绍如何通过数据集成导入导出MongoDB数据。关于通过数据集成导入导出MongoDB数据的...

使用数据集成迁移数据到AnalyticDB MySQL 2.0

数据集成是阿里集团对外提供的稳定高效、弹性伸缩的数据同步平台,致力于提供复杂网络环境下、丰富的异构数据源之间数据高速稳定的数据移动及同步能力。支持的数据源类型 数据集成提供丰富的数据源支持,如下所示:文本存储(FTP/SFTP/OSS/...

通过DataWorks导入数据

前提条件 已购买合适规格的独享数据集成资源组。详情请参见:新增和使用独享数据集成资源组。已完成数据集成资源组与数据源的网络连通。详情请参见:配置资源组与网络连通。已完成数据源环境准备。您可以基于您需要进行的同步配置,在同步...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
云数据库 RDS 数据库备份 云数据库 Redis 版 弹性公网IP 短信服务 人工智能平台 PAI
新人特惠 爆款特惠 最新活动 免费试用