常见问题

如果目标端的数据逐出策略(maxmemory-policy)配置为 noeviction 以外的值,可能导致目标端的数据与源端不一致。关于数据逐出策略详情,请参见 Redis数据逐出策略介绍。增量数据迁移时Binlog相关的预检查项失败,如何处理?检查源库Binlog...

数据

数据库备份场景下,有4个概念:数据库磁盘空间、数据文件空间、备份数据量、存储数据量。数据量 说明 数据库磁盘空间 由数据库的数据文件空间、数据库的日志文件空间、操作系统文件空间和空闲空间组成。说明 RDS中为:购买时选择的存储...

什么是备份数据

本文介绍数据库备份DBS中备份数据量的概念。名词解释 备份数据量,是指通过DBS备份链路的数据量。常见概念 在数据库备份DBS业务场景下,含有常见以下几个概念:数据库磁盘空间、数据文件空间、备份数据量、存储数据量等。概念 说明 数据库...

数据迁移同步FAQ

本文为您列出数据迁移与数据同步的常见问题和相关解答。什么是数据迁移、数据同步?DTS的数据迁移与数据同步工作原理是什么?DTS的数据迁移与数据同步有什么区别?使用DTS遇到预检查报错,如何解决?什么是数据迁移、数据同步?数据迁移:...

数据传输迁移概述

类型 典型场景 OSS数据与MaxCompute数据上传 LOAD命令。外部表,湖仓一体。Hologres数据写入MaxCompute MaxCompute直读Hologres数据。OTS/RDS(MySQL)/HBase/Lindorm/Hudi/HDFS/Hive等其它数据源写入MaxCompute 无。实时数据写入(数据...

数据库迁移

一致性校验 迁移完成后,对迁移前后的数据进行对比,以确定迁移后的数据与源数据相同。不校验:不校验迁移后的数据是否与源数据相同。迁移完成,自动校验:迁移完成后,自动开始校验迁移后的数据是否与源数据相同。选中 迁移完成,自动校验...

数据集市

数据集市是基于业务分类,面向特定应用场景或者产品的数据组织。通常位于数据应用层,依赖于公共层的整合数据。本文为您介绍如何创建数据集市并管理主题域。前提条件 已创建业务分类,用于对指定业务进行特定场景化的细分。详情请参见 业务...

使用场景

包含但不限于如下场景:数据迁移同步 使用DMS任务编排配置和管理数据迁移或数据同步任务,将数据从一个数据源迁移到另一个数据源,或实现同数据源、不同数据源之间的数据实时同步。数据清洗加工 DMS任务编排可以用于数据清洗和加工任务...

MySQL节点

您可以通过创建MySQL节点,直接使用SQL语句对目标MySQL数据源进行数据开发。本文为您介绍如何创建并使用MySQL节点。前提条件 MySQL节点仅支持使用独享调度资源组,独享调度资源组的使用请参考文档:新增和使用独享调度资源组。已通过连接串...

数据类型版本说明

MaxCompute目前提供了三种不同类型的数据类型版本,包括1.0数据类型、2.0数据类型以及Hive兼容数据类型,您可以根据业务需求选择合适的数据类型版本。本文为您介绍三种数据类型版本、选择数据类型版本以及查看和修改项目的数据类型版本。...

数据追踪

DMS 可追踪到的数据与目标数据库实例的Binlog保留时长有关,若该数据的保存时间超过Binlog的保留时长,则获取不到该部分数据。若数据库的Binlog未开启或数据库登录状态异常,系统将无法获取日志文件。数据追踪功能仅支持追踪DML数据变更的...

开发前准备:绑定数据源或集群

若您要在DataWorks中进行数据建模、数据开发或使用运维中心周期性调度任务,需先将已创建的数据源或集群绑定至数据开发(DataStudio)模块。绑定后,才可读取数据源或集群中的数据,并进行相关开发操作。前提条件 您需根据后续要开发和调度...

应用场景

数据库网关(DatabaseGateway,简称DG)具有广泛的应用场景,用户可以使用云服务访问并管理本地IDC或其他云厂商的数据库,同时也可以其他阿里云服务集成提供丰富的解决方案。多云数据库统一管理 数据管理 DMS 是一种集数据管理、结构管理...

应用场景

数据库网关(DatabaseGateway,简称DG)具有广泛的应用场景,用户可以使用云服务访问并管理本地IDC或其他云厂商的数据库,同时也可以其他阿里云服务集成提供丰富的解决方案。多云数据库统一管理 数据管理 DMS 是一种集数据管理、结构管理...

独享数据集成资源组

数据集成任务高并发执行且无法错峰运行的情况下,需要专有的计算资源组来保障数据快速、稳定的传输时,建议您选择使用DataWorks的独享数据集成资源组。本文为您概要介绍独享数据集成资源组。功能介绍 独享数据集成资源组的功能亮点如下:...

数据归档至DBS内置OSS

本文介绍如何将大表数据归档至DBS内置OSS中。前提条件 支持如下类型的源数据库:MySQL类型:RDS MySQL、PolarDB MySQL版。PolarDB PostgreSQL版。PolarDB分布式版。说明 MySQL数据库账号必须具有REPLICATION CLIENT权限。您的系统角色需要...

DataWorks on EMR Serverless StarRocks最佳实践

DataWorks支持StarRocks数据源,通过数据源对接EMR Serverless StarRocks,可实现EMR Serverless StarRocks的数据集成、开发、分析、数据服务等功能。本文为您介绍EMR Serverless StarRocks在DataWorks上的操作流程。背景信息 了解EMR ...

配置资源组网络连通

数据同步任务配置前,您需要确保用于执行同步任务的独享数据集成资源组您将要同步的数据来源端目的端数据库的网络连通性,您可以根据数据库所在网络环境,选择合适的网络解决方案来实现网络连通。本文为您介绍数据库在不同网络环境中...

采集数据

新建两个离线同步节点 ods_raw_log_d、ods_user_info_d,用于后续同步MySQL用户数据与OSS网站访问日志数据,再新建虚拟节点 WorkShop_Start 统一管理该业务流程。本阶段仅涉及数据采集业务流程,不涉及具体同步任务配置。1、新建业务流程 ...

数据查询分析管控

背景信息 数据查询分析管控支持对数据源查询和查询结果可执行的展示、复制、下载、分享等操作进行权限管控,具体如下:数据源查询权限管控 用于对数据源的查询权限进行管控。DataWorks的数据源分为绑定引擎时默认创建的引擎数据源,及在...

采集数据

新建两个离线同步节点 ods_raw_log_d、ods_user_info_d,用于后续同步MySQL用户数据与OSS网站访问日志数据,再新建虚拟节点 WorkShop_Start 统一管理该业务流程。本阶段仅涉及数据采集业务流程,不涉及具体同步任务配置。1、新建业务流程 ...

应用场景

敏感数据识别与打标 DSC 能从海量数据中发现和锁定保护对象,精准区分敏感数据与非敏感数据。通过内置算法规则和自定义敏感数据识别规则,对其存储的数据库类型数据以及非数据库类型文件进行整体扫描、分类、分级,并根据结果做进一步的...

实验介绍

数据采集 数据加工 配置数据质量监控 数据可视化展现 目标人群 开发工程师、数据分析师、产品运营等存在数仓数据获取与数据分析洞察人员。涉及产品 本案例涉及以下产品:一站式大数据开发治理DataWorks 本案例通过DataWorks实现数据采集,...

使用DataWorks

MaxCompute支持通过DataWorks的数据集成功能将MaxCompute中的数据以离线方式导出至其他数据源。当您需要将MaxCompute中的数据导出至其他数据源执行后续数据处理操作时,您可以使用数据集成功能导出数据。本文为您介绍如何将MaxCompute的...

功能特性

计算 MaxCompute向用户提供了多种经典的分布式计算模型,提供TB、PB、EB级数据计算能力,能够更快速的解决用户海量数据计算问题,有效降低企业成本。功能集 功能 功能描述 参考文档 SQL开发 DDL语句 DDL语句 DDL DML操作 DML操作 DML操作 ...

敏感数据保护概览

如果您有对敏感数据进行管控和脱敏的需求,可以使用 数据管理DMS 的敏感数据保护功能对数据库进行扫描,识别、脱敏和管理敏感数据。背景信息 通过敏感数据保护功能,可帮助企业及时有效地发现识别敏感数据资产,避免敏感数据滥用,有效...

概述

系统按照您设定的数据同步时间自动、无缝的帮您把数据源中的数据同步到目标数据仓库OSS中,同时在数据仓库和DLA中创建与数据源表相同的表结构,基于目标数据仓库进行数据分析,不影响数据源端的线上业务运行。方案优势 T+1全量同步一键建仓...

应用场景

数据体系复杂、数据不统一,数据分析速度和数据准确一致性难保障,战略决策与数据化运营受阻。解决方案:数据融合:通过数据引入功能,将业务系统数据集成、融合一体,统一基础数据数据建模:通过规范建模功能,结合业务发展需求,自顶...

快速体验

DataWorks为您提供智能建模、数据清洗、周期调度运维、数据治理等一站式大数据开发管理能力,本文以一个零售电商行业的数仓搭建实验为例,为您介绍DataWorks在数仓搭建过程中的技术选型、技术流程以及流程实现,帮助您深入了解阿里云...

功能特性

OSS数据源 一键入湖 通过DLA控制台配置数据源(RDS数据源、ECS自建数据数据)和目标OSS数据仓库,系统按照您设定的数据同步时间自动、无缝的帮您把数据源中的数据同步到目标数据仓库OSS中,同时在数据仓库和DLA中创建与数据源表相同的表...

通过向导模式配置离线同步任务

数据集成提供向导式的开发引导,您无需编写任何代码,通过在界面勾选数据来源去向,并结合DataWorks调度参数,实现将源端单表或分库分表的全量或增量数据周期性同步至目标数据表。本文为您介绍向导模式配置离线同步任务的常规配置,各...

迁移 PolarDB-X 1.0 数据库的数据至 OceanBase 数据库...

目标端表对象存在数据时,如果原数据与写入数据冲突,数据传输采用将冲突数据记录日志,保留原数据不变的策略进行数据写入。重要 全量校验将使用 IN 模式拉取数据,无法校验目标端多数据的场景,并且校验性能存在一定程度降级。单击 预检查...

通过脚本模式配置离线同步任务

部分数据与支持分布式模式执行任务,详情请参见具体插件配置文档。concurrent(任务期望最大并发数)用于定义当前任务从源端并行读取或并行写入目标端的最大线程数。说明 由于资源规格等原因,实际执行时并发数可能小于等于此处配置的并发...

数据模型架构规范

数据层次的划分 ODS:Operational Data Store,操作数据层,在结构上其源系统的增量或者全量数据基本保持一致。它相当于一个数据准备区,同时又承担着基础数据的记录以及历史变化。其主要作用是把基础数据引入到MaxCompute。CDM:Common ...

矢量散点层(v2.x版本)

数据源 单击 配置数据源,可在 设置数据源 面板中修改数据源类型和数据查询代码、预览数据源返回结果以及查看数据响应结果,详情请参见 配置资产数据数据过滤器 数据过滤器提供数据结构转换、筛选和一些简单的计算功能。单击 添加过滤器...

新建Doris数据

数据源配置 基于业务数据源是否区分生产数据源和开发数据源:如果业务数据源区分生产数据源和开发数据源,则选择 生产+开发数据源。如果业务数据源不区分生产数据源和开发数据源,则选择 生产数据源。标签 您可根据标签给数据源进行分类...

数据分析整体趋势

数据与数据库一体化:早期大数据技术以牺牲一定程度一致性为基础提供分布式能力,解决了传统单机数据库的扩展性不足问题,在MapReduce基础上提供了标准SQL接口,架构上也逐步采用了部分MPP数据库技术;另一方面,分布式数据库也快速发展...

配置MySQL输入

DataWorks的数据集成实时同步MySQL数据是基于实时订阅MySQL实现的,实时同步MySQL数据目前仅支持配置MySQL数据源为RDS的 5.x 或 8.x 版本的MySQL,如果需要同步DRDS的MySQL,请不要将DRDS的MySQL配置为MySQL数据源,您可以参考 配置DRDS...

使用数据传输迁移数据

目标端表对象存在记录时处理策略 处理策略包括 忽略 和 停止迁移:选择 忽略:当目标端表对象存在数据时,如果原数据与写入数据冲突,数据传输采用将冲突数据记录日志,保留原数据不变的策略进行数据写入。重要 选择 忽略,全量校验将使用 ...

DataWorks On MaxCompute使用说明

一、数据集成 DataWorks的数据集成模块为您提供读取和写入数据至MaxCompute的能力,您可将其他数据源的数据同步至MaxCompute数据源,或将MaxCompute数据源的数据同步至其他数据源。同时,可根据需要选择离线同步、实时同步、全增量同步任务...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
数据库备份 DBS 数据传输服务 云数据库 RDS 云数据库 Redis 版 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用