空间管理

TOP 5 DB空间 以横向柱形图形式展示用户RDS实例空间使用率TOP 5的数据库空间详情,包括:总空间(单位:MB)数据空间(单位:MB)日志空间(单位:MB)空间变化趋势:以折线图形式展示用户RDS实例空间变化情况,可以查看近一天、近一周、近...

数据风险点监控

在线数据风险点监控 在线业务系统的数据生成过程中必须确保数据质量,根据业务规则对数据进行监控。说明 MaxCompute本身未提供相应的监控工具,您可以借助DataWorks进行监控。详情请参见 概述。您可以对数据库表的记录进行规则校验,制定...

数据引入概述

Dataphin支持通过数据集成和数据同步的方式,将业务数据源的数据引入Dataphin平台。背景信息 如果您是在 2020年4月之后 购买的Dataphin,则数据同步能力通过数据集成功能实现(即系统 不再提供数据同步的功能入口)。数据集成为您提供简单...

数据引入概述

Dataphin支持通过数据集成和数据同步的方式,将业务数据源的数据引入Dataphin平台。背景信息 如果您是在 2020年4月之后 购买的Dataphin,则数据同步能力通过数据集成功能实现(即系统 不再提供数据同步的功能入口)。数据集成为您提供简单...

数据开发

步骤一:购买并配置独享数据集成资源组 本教程需将存储在MySQL中的数据同步至MaxCompute,同步任务需使用DataWorks的独享数据集成资源组,因此您需要先准备独享数据集成资源组,并完成前期的准备工作。说明 DataWorks为您提供了独享数据...

离线同步任务调优

离线同步任务使用的调度资源组 离线同步任务将有调度资源下发至数据集成任务执行资源上执行,调度资源使用情况同样会影响整体数据集成同步效率。关于离线任务下发机制,详情请参见:任务下发机制。离线同步任务配置 传输速度:是否设置任务...

离线数据集成(DataWorks+MaxCompute)

背景信息 DataWorks的数据集成是稳定高效、弹性伸缩的数据同步平台,致力于提供复杂网络环境下、丰富的异构数据源之间高速稳定的数据移动及同步能力。详细说明,请参见 数据集成概述。使用DataWorks中数据集成的IoT Reader插件可以读取物...

常见问题

本文为您介绍数据集成任务常见问题。资源组操作及网络连通 在做离线同步时,我们需要先了解哪些DataWorks及其网络能力?同步ECS自建的数据的数据时,如何保障数据库与DataWorks的网络连通?数据库和DataWorks不在同一个地域(Region)下...

离线同步常见问题

您可以在 DataStudio 修改数据集成任务调试所用的资源组,同时,也支持您在 运维中心 修改任务调度时所使用的数据集成任务执行资源组。配置详情请参见:新增和使用独享数据集成资源组。脏数据如何排查和定位?脏数据定义:单条数据写入目标...

离线同步数据质量排查

写端数据一致性排查 数据集成的Writer插件用来将源头读取到的数据写出至数据目标端,每一个目标存储类型都会有对应的Writer插件,Writer插件会根据用户配置的数据写出模式(包括冲突替换策略),使用JDBC或者对应数据源SDK最终将数据提交给...

我是系统集成

工业应用数据平台监控数据源的数据变化进行主动式的数据集成,是否支持增量同步 选择为 是:如果数据库是Sqlserver监控增量需要开通Sqlserver CDC服务,首先确保SQL Server Agent(代理服务)已启动;然后激活数据库CDC支持,执行以下SQL:...

数据集成

数据集成是阿里对外提供的可跨异构数据存储系统的、可靠、安全、低成本、可弹性扩展的数据同步平台,为20多种数据源提供不同网络环境下的离线(全量/增量)数据进出通道。您可以通过 数据集成(Data Integration)向云数据库RDS进行数据的...

数据集成

数据集成是阿里对外提供的可跨异构数据存储系统的、可靠、安全、低成本、可弹性扩展的数据同步平台,为20多种数据源提供不同网络环境下的离线(全量/增量)数据进出通道。您可以通过 数据集成(Data Integration)向云数据库RDS进行数据的...

更多数据同步方案

数据集成是阿里对外提供的可跨异构数据存储系统的、可靠、安全、低成本、可弹性扩展的数据同步平台,为20多种数据源提供不同网络环境下的离线(全量/增量)数据进出通道。您可以通过 数据集成(Data Integration)向云数据库RDS进行数据的...

使用公共资源组

开通DataWorks时,DataWorks自动为您提供公共资源组(包括公共调度资源组、公共数据集成(调试)资源组、公共数据服务资源组),可用于数据开发、运行测试等操作。公共资源组被多个租户共享,高峰期租户间可能会存在抢占资源的情况。本文为...

Stream Load

max_filter_ratio 最大容忍可过滤(例如,因为数据不规范等原因而过滤)的数据比例。默认零容忍。说明 此处数据不规范的数据不包括通过WHERE条件过滤的数据。partitions 用于指定该导入所涉及的Partition。如果您能够确定数据对应的...

功能更新动态(2022年)

2022年10月25日 华北2(北京)设置Dataphin实例的计算引擎 2022年10月27日 华东1(杭州)2022年11月01日 华南1(深圳)2022年11月03日 华东2(上海)数据集成:输入组件、数据源优化,提升体验感,数据源表存在性、表结构变动功能点优化,...

Stream Load

max_filter_ratio 最大容忍可过滤(例如,因为数据不规范等原因而过滤)的数据比例。默认为0,取值范围是0~1。说明 此处数据不规范的数据不包括通过WHERE条件过滤的数据。partitions 用于指定该导入所涉及的Partition。如果您能够确定数据...

数据集成

DataWorks数据集成支持复杂网络环境下的数据同步,您可在数据开发(DataStudio)界面直接 创建离线同步节点,用于离线(批量)数据周期性同步;实时同步任务运维,用于单表或整库增量数据实时同步。本文为您介绍数据同步的相关内容。背景...

常见问题

迁移与同步 为什么OSS外表导入ORC、PARQUET等格式的数据,出现内存报错或OOM挂掉?如何处理导入数据报错:too many parts?为什么DataX导入速度慢?为什么Hive导入后其数据行数跟ClickHouse对不上?为什么Kafka导入后其数据行数跟...

告警事件

来源系统 包括:数据质量 实时计算 实时集成 数据服务 离线计算 告警原因 告警事件发生的原因,详情请参见 查看告警事件。推送方式 告警事件推送给您方式。推送方式 包括:电话 短信 邮件 钉钉 告警频率 告警推送给您的频率。首次告警时间 ...

QueryDISyncTaskConfigProcessResult

writer","category":"writer"}],"version":"2.0","order":{"hops":[{"from":"reader","to":"writer"}]}} 异步线程生成的数据集成同步任务所需参数。该参数将作为 CreateDISyncTask 或 UpdateDISyncTask 接口的输入参数,用于后续创建或...

产品概述

数据集成服务支持与信息系统通过数据库、消息队列、Web API或者FTP文件的方式进行数据集成,能够自定义集成任务的数据源、数据结构和集成频度(定时触发还是数据变化自动触发);数据应用服务提供数据的可视化组态以及数据分析报表的开发,...

技术架构选型

其中,Dataphin的数据集成及同步负责完成源业务系统数据引入。MaxCompute作为整个大数据开发过程中的离线计算引擎。Dataphin则基于OneData方法论——OneModel、OneID、OneService,囊括了数据建模研发、运维中心、监控报警、数据资产等在内...

文档更新动态(2022年)

更新说明 什么是Dataphin 添加派生指标和衍生指标 新建注册上标签 2022年07月19日 增加回收站功能 可以将删除的数据处理任务还原。新增说明 管理回收站的资源对象 2022年07月19日 实时研发新增支持Ververcia Flink引擎 支持Flink SQL流批...

数据同步概述

背景说明 如果您是在 2020年4月之后 购买的Dataphin,则数据同步能力通过数据集成功能实现(即系统 不再提供数据同步的功能入口)。数据集成为您提供简单高效、安全可靠的数据同步平台。更多信息,请参见 数据集成概述。重要 因数据同步...

数据同步概述

背景说明 如果您是在 2020年4月之后 购买的Dataphin,则数据同步能力通过数据集成功能实现(即系统 不再提供数据同步的功能入口)。数据集成为您提供简单高效、安全可靠的数据同步平台。更多信息,请参见 数据集成概述。重要 因数据同步...

IoT数据自动化同步至云端解决方案

登录 DataWorks控制台,单击左侧导航栏 数据集成,在下拉框中选择对应工作空间后单击 进入数据集成。新增OSS数据源和MaxCompute数据源,详情请参见 配置OSS数据源 和 配置MaxCompute数据源。单击当前页面左上角的 图标,选择 全部产品>...

DeleteDISyncTask

删除数据集成同步任务失败后的原因描述。如果删除数据集成同步任务成功,则该参数的返回值为空。示例 请求示例 http(s):/[Endpoint]/?Action=DeleteDISyncTask&ProjectId=10000&TaskType=DI_REALTIME&FileId=100&公共请求参数 正常返回示例...

规划工作空间

数据清洗层(ODS):按部门划分,不同部门内数据统一口径,清洗不宜公开的数据,例如“ods_人力资源部”、“ods_生产部”等。任务节点:只有单一输入、单一产出的SQL任务。数据表:ODS层表。空间成员:各部门委派的数据清洗人员。资源...

DataWorks数据集成服务关联角色

数据集成支持RAM角色授权模式。本文为您介绍如何获取DataWorks数据集成相关的RAM角色列表、删除服务关联角色,以及子账号如何创建服务关联角色所需要的权限。应用场景 当您通过RAM角色授权模式创建DataWorks数据源时,请选择相关的自定义...

GenerateDISyncTaskConfigForUpdating

DataWorks目前仅支持直接使用 UpdateDISyncTask 接口更新数据集成离线同步任务,而数据集成实时同步任务和解决方案同步任务则需要先调用GenerateDISyncTaskConfigForUpdating和 QueryDISyncTaskConfigProcessResult 接口,异步生成更新数据...

CreateDISyncTask

Message String 不合法的目录路径:业务流程/xxxx/数据集成 创建数据集成同步任务失败的原因描述,如果成功,该字段为空,如果不成功,实例如下"不合法的目录路径:业务流程/xxxx/数据集成",FileId Long 1000001 成功创建的数据集成同步...

DeployDISyncTask

TaskType String 是 DI_REALTIME 目标数据源所关联的数据集成同步任务的任务类型。取值如下:DI_REALTIME:表示数据集成实时同步任务。DI_SOLUTION:表示数据集成同步解决方案。RegionId String 是 cn-zhangjiakou 地域信息,通常为服务...

UpdateDISyncTask

TaskType String 是 DI_OFFLINE 修改的数据集成同步任务的任务类型。目前仅支持使用UpdateDISyncTask接口修改数据集成离线同步任务(DI_OFFLINE)。TaskContent String 否 {"type":"job","version":"2.0","steps":[{"stepType":"mysql",...

数据集成概述

数据集成是稳定高效、弹性伸缩的数据同步平台,致力于提供复杂网络环境下、丰富的异构数据源之间高速稳定的数据移动及同步能力。使用限制 数据同步:支持且仅支持结构化(例如RDS、DRDS等)、半结构化、无结构化(OSS、TXT等,要求具体同步...

数据集成侧同步任务配置

登录 DataWorks控制台,单击左侧导航栏 数据集成,在下拉框中选择对应工作空间后单击 进入数据集成。操作流程 步骤一:创建同步任务 步骤二:选择同步方案 步骤三:网络与资源配置 步骤四:同步任务配置 步骤五:启动同步任务 步骤一:...

采集数据

user_info_d)表及OSS中的网站访问日志数据(user_log.txt)文件,通过数据集成离线同步任务分别同步至MaxCompute的ods_user_info_d、ods_raw_log_d表为例,为您介绍如何通过DataWorks数据集成实现异构数据源间的数据同步,完成数仓数据...

等待资源

在 运维中心 页面左侧导航栏,单击 运维大屏,在 运维大屏 页面 数据集成 页签,查看 同步任务执行详情。说明 任务并发配置需要结合 机器支持的最大并发数、同时执行的任务数据、以及每个任务设置的并发和来分配单个任务并发数配置。一个...

离线同步日志分析

调度系统会将任务下发至数据集成资源组上执行,您可在区域①查看当前任务运行使用的数据集成资源组。不同类型资源组日志打印不同:任务运行在默认的资源组上,日志中会出现如下信息。running in Pipeline[basecommon_group_xxxxxxxxx]任务...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
数据库备份 DBS 数据传输服务 云数据库 RDS 云数据库 Redis 版 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用