数据治理中心概述

数据治理中心可自动发现平台使用过程中数据存储、任务计算、代码开发、数据质量及安全等维度存在的问题,并通过健康分量化评估,从全局、工作空间、个人等多个视角,以治理报告及排行榜呈现治理成果,帮助您高效达成治理目标。同时,提供...

全景视角

背景信息 为提高不同使用场景下的数据治理效率和质量,DataWorks为您提供以下视角:数据管理视角:在数据资产管理、数据安全加固、数据权限管理等数据管理场景下,建议您使用数据管理视角,关注查看数据管理过程中,表的统计数据、安全权限...

数据清理

背景信息 ODC 支持在源数据库中的数据归档到目标数据库后,删除源数据库中的数据,以提高数据库查询性能,降低在线存储成本。本文档旨在介绍如何通过提交数据清理工单实现归档数据原理介绍 前提条件 清理的表中必须包含主键。注意事项 ...

独享数据集成资源组

数据集成任务高并发执行且无法错峰运行的情况下,需要专有的计算资源组来保障数据快速、稳定的传输时,建议您选择使用DataWorks的独享数据集成资源组。本文为您概要介绍独享数据集成资源组。功能介绍 独享数据集成资源组的功能亮点如下:...

功能发布记录(2023年)

2023-12 功能名称 功能描述 发布时间 发布地域 使用客户 相关文档 数据开发(DataStudio)绑定数据源 若您要在DataWorks中进行数据建模、数据开发或使用运维中心周期性调度任务,需先将已创建的数据源或集群绑定至数据开发(DataStudio)...

数据归档

背景信息 ODC 支持定时将源数据库中的表数据归档至其它目标数据库中,以解决因线上数据增多影响查询性能与业务运作的问题。本文档旨在介绍如何通过提交数据归档工单实现归档数据原理介绍 前提条件 归档的表中必须包含主键。注意事项 前置...

公共规范

中间层CDM需要积极了解应用层数据的建设需求,将公用数据沉淀到公共层,为其他层提供数据服务。应用层需要积极配合中间层CDM持续改造公共层。必须避免出现过度的引用ODS层、不合理的数据复制以及子集合冗余。ODS层数据不能被应用层任务...

入门实践

本文以实现构建数据标准来设计数据模型,并通过规范化的流程,下发模型至计算引擎为例,为您介绍DataWorks数据建模的流程。前提条件 如果您使用的是阿里云主账号,请下载建模工具。如果您使用的是RAM用户,请完成授权并下载建模工具。详情...

网络连通解决方案

添加数据源时需要根据数据源所在网络环境,通过对应的网络解决方案,实现Dataphin与数据源的网络连通。本文为您介绍数据源在不同网络环境中与Dataphin的网络连通方案。网络连通方案 根据数据源所在的网络环境,在下图中选择对应的网络连通...

权限管理与规范化数据开发

进入 数据建模 阿里云DataWorks联合建模工具DDM(Datablau Data Modeler)为您提供一体化的数据建模解决方案,我们将数据模型设计管控、引标落标等能力融入DataWorks规范化开发流程,助力用户实现数据资产价值化输出,在数据全生命周期上...

系统管理

所选资源组需绑定至待接收数据的表所在的DataWorks工作空间,且需确保数据上传任务使用的数据源与所选资源组网络连通。说明 购买独享资源组并配置资源组绑定的归属工作空间,请参见 新增和使用独享调度资源组、新增和使用独享数据集成资源...

数据服务入门

步骤一:创建数据源并配置网络连通性 使用数据服务创建API前,您需将数据库或数据仓库添加为DataWorks的数据源,并保障数据服务资源组与您的目标数据源网络连通,以便调用API时DataWorks可成功访问数据源。说明 DataWorks工作空间将集群或...

创建Oracle数据订阅通道

通过数据订阅功能,您可以实时订阅源库的增量数据,轻松帮助业务实现轻量级缓存更新、业务异步解耦、含ETL逻辑的数据实时同步等场景。本文为您介绍如何创建Oracle数据订阅通道。前提条件 自建Oracle数据库的版本为9i、10g、11g版本,且不...

技术原理

扩展性原理 扩展性本质在于分而治之,PolarDB-X 1.0 计算资源通过水平拆分(分库分表)和垂直拆分,将数据分散到多个存储资源MySQL以实现获取数据读写并发和存储容量分散的效果。水平拆分(分库分表)PolarDB-X 1.0 具备数据水平拆分的能力...

数据传输作业:数据集成

离线同步 离线(批量)的数据通道通过定义数据来源和去向的数据源和数据集,提供一套抽象化的数据抽取插件(Reader)、数据写入插件(Writer),并基于此框架设计一套简化版的中间数据传输格式,从而实现任意结构化、半结构化数据源之间...

创建GreenPlum数据

通过创建GreenPlum数据源能够实现Dataphin读取GreenPlum的业务数据或向GreenPlum写入数据。本文为您介绍如何创建GreenPlum数据源。背景信息 Greenplum是一款大数据分析引擎,作用于分析、机器学习和AI等领域。其架构主要针对管理大规模分析...

创建GreenPlum数据

通过创建GreenPlum数据源能够实现Dataphin读取GreenPlum的业务数据或向GreenPlum写入数据。本文为您介绍如何创建GreenPlum数据源。背景信息 Greenplum是一款大数据分析引擎,作用于分析、机器学习和AI等领域。其架构主要针对管理大规模分析...

数据保护伞入门

数据保护伞 是一款数据安全管理产品,提供数据发现、数据脱敏、数据水印、访问控制、风险识别、数据溯源等功能,帮助您快速梳理敏感数据并进行安全管控,保障数据安全。本文示例使用内置规则对 xc_dpe_e2_dev 项目的 phone 数据脱敏,并...

数据同步流程

数据传输提供数据同步功能,帮助您实现数据源之间的数据实时同步。适用于数据异地多活、数据异地灾备、数据聚合和实时数据仓库等多种业务场景。您可以参考以下流程进行同步前的准备工作、以及购买、配置和管理数据同步项目。完成准备工作。...

数据集成概述

离线(批量)的数据通道通过定义数据来源和去向的数据源和数据集,提供一套抽象化的数据抽取插件(Reader)、数据写入插件(Writer),并基于此框架设计一套简化版的中间数据传输格式,从而实现任意结构化、半结构化数据源之间数据传输。...

数据迁移流程

数据传输提供数据迁移功能,帮助您实现同构或异构数据源之间的数据迁移。适用于数据库升级、跨实例数据迁移、数据库拆分、扩容等业务场景。您可以参考以下流程进行迁移前的准备工作、以及购买、配置和管理数据迁移项目。完成准备工作数据...

资源组操作及网络连通

如果您需要使用独享数据集成资源组通过内网同步ECS自建的数据库,您需要为独享数据集成资源组做相关的网络配置,详情可参见 新增和使用独享数据集成资源组,连通方案核心点为:独享数据集成资源组绑定ECS所在VPC,会自动添加一个路由指向...

查询数据代码说明

您可以在数据板块页面,查看数据板块公用英文名。说明 若为开发环境查询数据,须在 板块英文名 后加_DEV。即 板块英文名_DEV。逻辑表名:需要查询的逻辑表名。ds='${bizdate}':定义查询的分区日期,${bizdate} 为Dataphin内置的日期时间...

查询数据代码说明

您可以在数据板块页面,查看数据板块公用英文名。说明 若为开发环境查询数据,须在 板块英文名 后加_DEV。即 板块英文名_DEV。逻辑表名:需要查询的逻辑表名。ds='${bizdate}':定义查询的分区日期,${bizdate} 为Dataphin内置的日期时间...

目标数据库连接性检查

为保障数据迁移任务的顺利执行,在预检查阶段检查DTS服务器是否能够连通要迁移的目标数据库。本文将介绍目标数据库连接性检查失败可能的原因及修复方法。当目标数据库连接性预检查失败时,可能是以下几种原因。数据库账号或数据库密码不...

添加RDS for MySQL数据

本文为您介绍在DataV中添加RDS for MySQL数据源的方法。前提条件 已准备好待添加的RDS for MySQL数据源。通过内网添加数据源操作步骤 登录 DataV控制台。在 我的数据 页签中选择 数据源管理,单击 添加数据。从 类型 列表中,选择 RDS for ...

添加RDS for PostgreSQL数据

本文为您介绍在DataV中添加RDS for PostgreSQL数据源的方法。前提条件 已准备好待添加的RDS for PostgreSQL数据源。通过内网添加数据源操作步骤 登录 DataV控制台。在 我的数据 页签中选择 数据源管理,单击 添加数据。从 类型 列表中,...

添加RDS for SQLServer数据

本文为您介绍在DataV中通过内网和外添加RDS for SQLServer数据源的方法。前提条件 已准备好待添加的RDS for SQLServer数据源。通过内网添加数据源操作步骤 登录 DataV控制台。在 我的数据 页签中选择 数据源管理,单击 添加数据。从 类型...

场景:工作空间模式升级(简单模式升级标准模式)

若您当前使用的是简单模式工作空间,但希望将开发与生产环境隔离,可将简单模式工作空间升级为标准模式工作空间。本文为您介绍如何升级工作空间模式。操作须知 升级工作空间模式前,您需先了解以下内容:了解简单模式与标准模式工作空间的...

MMA概述

数据迁移原理 Hive数据迁移原理 Hive数据迁移包含通过Hive UDTF迁移数据到MaxCompute、通过OSS迁移Hive数据到MaxCompute,本文为您介绍两种数据迁移方式的原理。通过Hive UDTF迁移数据到MaxCompute。该场景通过Hive的分布式能⼒,实现Hive...

添加PolarDB for MySQL数据

本文为您介绍在DataV中添加PolarDB for MySQL数据源的方法,以及相关参数配置说明。云原生关系型数据库PolarDB是阿里巴巴自主研发的下一代云原生关系型数据库,100%兼容MySQL语法。通过外添加数据源操作步骤 登录 DataV控制台。在 我的...

添加PolarDB for Oracle数据

本文为您介绍在DataV中添加PolarDB for Oracle数据源的方法,以及相关参数配置说明。云原生关系型数据库PolarDB是阿里巴巴自主研发的下一代云原生关系型数据库,100%兼容Oracle语法。通过外添加数据源操作步骤 登录 DataV控制台。在 我的...

添加PolarDB PostgreSQL数据库

本文为你介绍如何添加PolarDB PostgreSQL数据库。前提条件 添加数据库之前请先安装Ganos插件,详情请参见 GanosBase时空数据库。添加数据库前请先参见 创建PolarDB PostgreSQL实例,开通对应数据库服务并添加白名单。外连接数据库 登录 ...

添加PolarDB for PostgreSQL数据

本文为您介绍在DataV中添加PolarDB for PostgreSQL数据源的方法,以及相关参数配置说明。云原生关系型数据库PolarDB是阿里巴巴自主研发的下一代云原生关系型数据库,100%兼容PostgreSQL语法。通过外添加数据源操作步骤 登录 DataV控制台...

添加OceanBase for MySQL数据

本文为您介绍在DataV中添加OceanBase for MySQL数据源的方法,以及相关参数配置说明。OceanBase具有数据强一致、高可用、高性能、在线扩展、高度兼容SQL标准和主流关系型数据库、低成本等特点。通过外添加数据源操作步骤 登录 DataV控制...

数据上传

DataWorks的数据上传功能支持将本地文件、数据分析的电子表格、OSS文件等数据上传至MaxCompute、EMR Hive、Hologres等引擎进行分析及管理,为您提供便捷的数据传输服务,助力您快速实现数据驱动业务。本文为您介绍如何使用数据上传功能上传...

数据集成概述

数据集成是基于Dataphin构建的简单高效的数据同步平台,致力于提供具有强大的数据预处理能力、丰富的异构数据源之间数据高速稳定的同步能力。背景信息 面对各行各业对大数据的应用,数据集成会有很多的诉求,包括能够简单高效的配置大量...

设计阶段

完成需求阶段的工作后,数据产品经理会产出最终版本的产品需求文档,以供设计人员进行设计工作。设计工作包含数据探查和系分设计两部分:数据探查旨在了解来源数据数据形态,例如数据质量、数据分布等。结合业务场景,帮助分析和判断需求...

使用限制

在使用云数据库MongoDB前,您需要了解不同类型云数据库MongoDB实例本身存在的约束信息,使您初步了解不同类型云数据库MongoDB实例的使用限制,以帮助您选择更适合业务场景的实例。单节点实例 功能 约束 实例部署 目前不是所有地域和可用区...

购买流程

数据传输服务DTS(Data Transmission Service)支持先配置再购买和先购买再配置两种创建任务方式。若您需要随用随配,建议您选择先配置再购买的方式;若您需要先锁定财务预算而不需要配置任务,建议您选择先购买再配置的方式。本文介绍数据...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
云数据库 RDS 云数据库 Redis 版 数据库备份 DBS 弹性公网IP 短信服务 人工智能平台 PAI
新人特惠 爆款特惠 最新活动 免费试用