DataWorks数据集成

数据集成(Data Integration)是阿里巴巴集团提供的数据同步平台。该平台具备可跨异构数据存储系统、可靠、安全、低成本、可弹性扩展等特点,可为20多种数据源提供不同网络环境下的离线(全量/增量)数据进出通道。关于数据集成的更多信息...

创建同步任务

本文为您介绍如何通过创建同步任务,导出MaxCompute中的数据至MySQL数据源中。前提条件 已通过RDS创建MySQL实例,获取RDS实例ID,并在RDS控制台添加白名单。详情请参见 快速创建RDS MySQL实例 和 添加白名单。说明 如果是通过自定义资源组...

访问外部数据

背景信息 Databricks数据洞察为了满足您在计算任务里访问您在阿里云上已有的数据,支持通过添加外部数据源的方式,打通集群到您自己VPC下的网络环境。绑定数据源 绑定数据源的本质是打通不同VPC之间的网络,即将数据源集群所在VPC与目标...

概述

若集群中某些库表的数据几乎没有更新、插入和修改操作,且读取频率非常低,如果您有降本需求,可以使用 PolarDB MySQL版 提供的冷数据归档功能,将这部分数据转存至低成本的OSS上存储,以降低数据存储成本。本章节介绍了冷数据归档方法、...

Delta Lake概述

Delta Lake以数据为中心,围绕数据流走向(数据从流入数据湖、数据组织管理和数据查询到流出数据湖)推出了一系列功能特性,协助您搭配第三方上下游工具,搭建快捷、易用和安全的数据湖。背景信息 通常的数据湖方案是选取大数据存储引擎...

导入概述

为了更好地满足各种不同的业务场景,StarRocks支持多种数据模型,StarRocks中存储的数据需要按照特定的模型进行组织。本文为您介绍数据导入的基本概念、原理、系统配置、不同导入方式的适用场景,以及一些最佳实践案例和常见问题。背景信息...

RDS术语

A AliPG 阿里云支持一系列兼容PostgreSQL的云数据库服务产品,这些云数据库服务采用统一的数据库内核(简称AliPG),AliPG兼容PostgreSQL开源数据库,于2015年正式商用,支持PostgreSQL主流大版本,已稳定运行多年,支撑了大量阿里巴巴集团...

RDS术语

DMS Data Management,数据管理,是一种阿里云提供的图形化的数据管理工具,集数据管理、结构管理、访问安全、BI图表、数据趋势、数据轨迹、性能与优化和服务器管理于一体的数据管理服务。支持MySQL、SQL Server、PostgreSQL、MongoDB、...

什么是数据传输服务DTS

数据传输服务DTS(Data Transmission Service)是阿里云提供的实时数据流服务,支持关系型数据库(RDBMS)、非关系型的数据库(NoSQL)、数据多维分析(OLAP)等数据源间的数据交互,集数据同步、迁移、订阅、集成、加工于一体,助您构建...

数据保护机制

注意事项 设置Exception Policy可能存在TOCTOU(Time-of-Check to Time-of-Use)数据泄露问题(即Race Condition问题):问题描述 假设,用户的数据流出流程如下:(TOC阶段)用户A向项目所有者申请导出表t1的数据。项目所有者对t1的数据...

一键创建OSS数据仓库

系统默认的数据同步时间是00:30,您可以根据业务规律,将数据同步时间设置在业务低峰期,以免同步过程中可能对业务造成的影响。高级选项 自定义设置项,例如过滤字段等。完成上述参数配置后,单击 创建,创建OSS数据仓库。说明 数仓创建...

确定需求

需求分析 在未考虑数据分析师和业务运营人员的数据需求的情况下,单纯根据业务调研结果构建的数据仓库可用性差。完成业务调研后,您需要进一步收集数据使用者的需求,进而对需求进行深度的思考和分析。需求分析的途径有两种:根据与分析师...

从这里开始

区块:区块是基于基础组件封装的一个黑盒工具,可以定义内部外部的数据传输,对内可以封装业务相关的组件样式、组件布局、默认数据(不包含除静态数据和API外的数据源)和蓝图逻辑,对外可定义业务相关的区块数据接口。资源管理 设计资源:...

确定需求

需求分析 在未考虑数据分析师和业务运营人员的数据需求的情况下,单纯根据业务调研结果构建的数据仓库可用性差。完成业务调研后,您需要进一步收集数据使用者的需求,进而对需求进行深度的思考和分析。需求分析的途径有两种:根据与分析师...

配置同步任务

配置同步任务是将数据源的数据同步到目标表的过程。本文为您介绍如何配置同步任务。配置流程说明 同步任务的配置流程如下图。来源表和目标表均支持多种数据源。数据库类型 数据源 关系型数据库 MySQL、Oracle、Microsoft SQL Server、...

统一服务

在数据中台建设过程中,搭建核心处理平台,并根据相关标准要求,将源数据或治理后的数据,按照“全面、高效、统筹”的共享原则,“低延时”、“精准化”的传递给用户,方便更多应用消费数据,实现数据价值。协同管控各种组织机构,为智慧化...

功能简介

在数据中台建设过程中,搭建核心处理平台,并根据相关标准要求,将源数据或治理后的数据,按照“全面、高效、统筹”的共享原则,“低延时”、“精准化”地传递给用户,方便更多应用消费数据,实现数据价值。协同管控各种组织机构,为智慧化...

离线同步能力说明

开发和生产隔离:同一个名称的数据源存在开发环境和生产环境两套配置,配置数据同步任务时会使用开发环境的数据源,提交生产运行时会使用生产环境的数据源。您可以通过数据源隔离使其在不同环境隔离使用。离线同步任务配置相关能力 支持的...

创建并管理数据

若您想在DataWorks操作您的数据库或数据仓库(例如,MaxCompute项目数据),需先在DataWorks的数据源管理页面,将数据库或数据仓库创建为DataWorks的数据源,并将该数据源绑定至DataWorks相应的功能模块使用。例如,同步MaxCompute数据前,...

独享资源组

独享调度资源组使用场景 如果非数据集成任务需要访问VPC环境下的数据库、有白名单访问控制的数据库时,需要使用独享调度资源组,独享调度资源组的使用详情请参见 新增和使用独享调度资源组。独享数据集成资源组使用场景 如果您需要同步VPC...

数据源管理常见问题

您可以在DataV控制台单击 我的数据>数据源管理,选择+添加数据,进入 添加数据 对话框,选择 CSV文件 类型,输入 自定义数据源名称 并上传一个本地电脑中的CSV文件。上传完成后,您可以在画布编辑器中添加组件,在右侧 数据 面板中的 设置...

数据源管理常见问题

您可以在DataV控制台单击 我的数据>数据源管理,选择+添加数据,进入 添加数据 对话框,选择 CSV文件 类型,输入 自定义数据源名称 并上传一个本地电脑中的CSV文件。上传完成后,您可以在画布编辑器中添加组件,在右侧 数据 面板中的 设置...

功能简介

在数据中台建设过程中,搭建核心处理平台,并根据相关标准要求,将源数据或治理后的数据,按照“全面、高效、统筹”的共享原则,“低延时”、“精准化”地传递给用户,方便更多应用消费数据,实现数据价值。协同管控各种组织机构,为智慧化...

数据连接管理

可能是您录入的数据库实例已从 数据连接管理 页面删除,或者 选择已有的数据库连接 所属的区域与已录入的数据库实例的 类型 不符。如何在DMS中录入数据库实例?请参见 云数据库录入 和 他云/自建数据库录入。说明 DMS不支持以源库或目标库...

配置同步任务

配置同步任务是将数据源的数据同步到目标表的过程。本文为您介绍如何配置同步任务。配置流程说明 同步任务的配置流程如下图。来源表和目标表均支持多种数据源。数据库类型 数据源 关系型数据库 MySQL、Oracle、Microsoft SQL Server、...

创建OceanBase数据

数据源配置 选择需要配置的数据源:如果业务数据源区分生产数据源和开发数据源,则选择 生产+开发数据源。如果业务数据源不区分生产数据源和开发数据源,则选择 生产数据源 标签 您可根据标签给数据源进行分类打标,如何创建标签,请参见 ...

通过向导模式配置离线同步任务

离线同步支持的数据源及其配置详情请参见 支持的数据源与读写插件。说明 数据源相关能力介绍详情请参见:数据源概述。已购买合适规格的独享数据集成资源组。详情请参见:新增和使用独享数据集成资源组。独享数据集成资源组与数据源网络已...

创建OceanBase数据

数据源配置 选择需要配置的数据源:如果业务数据源区分生产数据源和开发数据源,则选择 生产+开发数据源。如果业务数据源不区分生产数据源和开发数据源,则选择 生产数据源 标签 您可根据标签给数据源进行分类打标,如何创建标签,请参见 ...

通过脚本模式配置离线同步任务

离线同步支持的数据源及其配置详情请参见 支持的数据源与读写插件。说明 数据源相关能力介绍详情请参见:数据源概述。已购买合适规格的独享数据集成资源组。详情请参见:新增和使用独享数据集成资源组。独享数据集成资源组与数据源网络已...

BI分析模式数据面板功能介绍

使用BI分析模式配置组件数据是一个全新的数据配置功能,需要与您准备的数据集内容相结合,您可以使用BI分析模式,为组件自由分配所需数据集的字段内容,合理配置图表数据映射和其他数据筛选等功能。本文介绍BI分析模式下组件数据配置面板...

从这里开始

我的区块:区块是基于基础组件封装的一个黑盒工具,可以定义内部外部的数据传输,对内可以封装业务相关的组件样式、组件布局、默认数据(不包含除静态数据和API外的数据源)和蓝图逻辑,对外可定义业务相关的区块数据接口。设计资产:设计...

存储空间分析

查看集群级别的数据量 通过 空间总览 可以查看当前集群的 总数据量、热数据量、冷数据量、以及 最近24小时 和 近一周日均 数据增长量。登录 云原生数据仓库AnalyticDB MySQL控制台,在左上角选择集群所在地域。在左侧导航栏,单击 集群...

功能特性

多可用区部署 备份恢复 Lindorm宽表引擎支持数据备份恢复功能,基于数据生态服务中的数据迁移将数据存储至OSS中,定期全量备份数据,实时增量同步数据,来满足对数据备份和数据恢复的需求。备份恢复 产品生态 功能集 功能 功能描述 参考...

概述

以下是常见的应用场景:数据存储与计算安全场景:在不可信环境中(如第三方平台),Spark全密态计算引擎 可以为关键的数据分析应用(如投资和财务分析)提供数据保护,保证用户数据在存储与计算过程中的安全,降低明文数据泄露风险。...

数据归档常见问题

归档为CSV格式的数据的数据量可能会比归档为ORC格式的数据的数据量更大。为什么归档后的冷数据及文件在主账号下面的OSS上看不到?PolarDB 的冷数据存储在系统默认的OSS上,不在客户的OSS里,所以客户无法看到。目前只支持在PolarDB控制台上...

产品计费

查询冷存储的数据时,查询速度比查询热存储的数据慢。数据查询费用 0.2元/GB 0.3元/GB 查询冷存储的数据时,按量收取数据查询费用。企业版 V1 和V0 重要 仅企业版 V1收取包年包月的费用。公共云 计费项 计费方式 定价 说明 包年包月的费用 ...

表设计规范

表设计主要目标 降低存储成本 合理的表设计可以降低数据分层设计上的冗余存储,减少中间表的数据量大小。对表数据的生命周期进行正确的管理,也能够直接降低存储的数据量及存储成本。降低计算成本 规范化的表设计可以帮助您优化数据的读取...

2020年

Kafka集群的数据存储格式 PolarDB O引擎迁移至阿里云消息队列Kafka版、自建Kafka的任务,支持选择使用DTS Avro或shareplex json格式进行投递。Kafka集群的数据存储格式 支持自建Oracle迁移至阿里云消息队列Kafka版、自建Kafka。从自建...

同步方案概览

数据同步功能帮助您实现数据源之间的数据实时同步,适用于数据异地多活、数据异地灾备、本地数据灾备、跨境数据同步、云BI及实时数据仓库等多种业务场景。本文将介绍数据同步功能支持的数据库、同步类型和同步拓扑。说明 数据同步在某些...

迁移方案概览

数据迁移功能帮助您实现同构或异构数据源之间的数据迁移,适用于数据上云迁移、阿里云内部跨实例数据迁移、数据库拆分扩容等业务场景。本文将介绍数据迁移功能支持的数据库、版本和迁移类型,以及具体的配置文档。说明 数据迁移在某些场景...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
数据传输服务 数据库备份 云数据库 RDS 云数据库 Redis 版 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用