数据服务概述

数据服务作为统一的数据服务出口,实现了数据的统一市场化管理,有效降低数据开放门槛的同时,保障了数据开放的安全。前提条件 已购买 数据服务 增值服务,开通Dataphin 常见数据应用问题 一般从需求提出到需求交付分为:需求提出-需求...

数据分析整体趋势

近些年来,随着业务数据量的增多,企业需要能够对数据进行分析,助力商业决策,更好发挥数据价值,而传统开源及商业关系型数据库通常为单机版,在海量数据分析场景下扩展能力有限,性能无法满足需求。以Teradata,Oracle Exadata为代表的...

表设计规范

这使得数据结构变得灵活、易于扩展,数据一致性得到了增强,数据加工者可以更加方便管理数据。此方式仅可应用于数据基础层。数据导入通道与表设计 通道类型有以下几种:DataHub 规划写入的分区与写入流量之间的关系。数据达到64 MB会执行...

什么是数据资源平台

阿里云数据资源平台是数据资产定义、加工、管理、服务的全流程平台,提供数据同步、数据查询、数据标准、数据建模、数据加工、质量评估、业务模型构建、资产管理、数据服务等功能,为智能数据应用持续稳定供给全量、标准、干净、智能的数据...

功能发布记录(2024年)

2024.2.21 所有地域 所有DataWorks用户 DataWorks On CDP/CDH使用说明 数据服务支持实例模式的StarRocks数据源 开通E-MapReduce Serverless StarRocks集群后,您可在DataWorks中通过实例模式新增StarRocks数据源,DataWorks数据服务支持...

功能特性

配置管理 数据保护 敏感数据管理 DMS的敏感数据保护能力能根据所选的敏感数据扫描模板、敏感数据识别模型以及脱敏算法对数据进行脱敏处理,以避免敏感数据滥用,有效保护企业的敏感数据资产,防止数据泄露造成企业经营资金损失或罚款。...

数据库代理常见问题

数据库代理是位于数据库服务端和应用服务端之间的网络代理服务,用于转发应用服务端访问数据库时的所有请求,提供自动读写分离、事务拆分、连接池、连接保持等高级功能,具有高可用、高性能、可运维、简单易用等特点。通用型代理和独享型...

DLA Presto CU版本快速入门

配置数据网络 说明 如果需要连接您VPC内的数据源(如VPC内的RDS、AnalyticDB等),您需要配置数据网络,如不需要连接,忽略此步骤即可。在配置数据网络前,您需要授予DLA账户访问您VPC相关API的权限,详细操作步骤请参见 配置数据源...

通过向导模式配置离线同步任务

数据集成提供向导式的开发引导,您无需编写任何代码,通过在界面勾选数据来源与去向,并结合DataWorks调度参数,实现将源端单表或分库分表的全量或增量数据周期性同步至目标数据表。本文为您介绍向导模式配置离线同步任务的常规配置,各...

数据归档至专属存储

本文为您介绍如何将数据归档至专属存储中(存储在 DMS)、将专属存储的数据转存至OSS,以及删除归档至专属存储的数据等操作。前提条件 源数据库类型为:MySQL:RDS MySQL、PolarDB MySQL版、AnalyticDB MySQL 3.0。说明 MySQL数据库账号...

Dataphin支持的数据

背景信息 Dataphin支持对接的数据源包括大数据存储型数据源、文件数据源、消息队列数据源、关系型数据源和NoSQL数据源,各模块支持对接的数据源类型说明如下:如果您需要在Dataphin中连接某数据源,则需要先在数据源管理中创建该数据源。...

通过Reindex API迁移自建Elasticsearch数据

增量数据迁移 如果您自建的ES索引存在数据更新或是写入了新数据,且没有数据被删除,则可以通过增量数据迁移的方式完成数据迁移任务。您可以根据ES索引的 mappings,选择不同的方案进行数据迁移。如果您的数据包含数据更新时间字段,则可以...

常见问题

PolarDB数据网络联通性测试失败怎么办?Oracle数据网络联通性测试失败怎么办?MySQL数据网络联通性测试失败怎么办?实时任务,运行报错:...

通过脚本模式配置离线同步任务

当您需要实现更精细化的配置管理时,您可以使用脚本模式配置离线同步任务,通过编写数据同步的JSON脚本并结合DataWorks调度参数使用,将源端单表或分库分表的全量或增量数据周期性同步至目标数据表。本文为您介绍脚本模式配置离线同步任务...

新功能发布记录

开启安全访问代理 接入达梦数据库 新增 全面直接接入达梦数据库(DM),包括数据导入、数据查询、数据变更、数据导出、数据服务与数据可视化等功能。支持的数据库类型与功能 数据类目 新增 对表进行分类,便于管理人员、开发人员及运维人员...

逻辑数仓

数据管理DMS提供的逻辑数仓具有强大的数据源管理能力,可以实现将企业的异构数据源进行逻辑聚合,形成物理分散、逻辑统一的虚拟数仓,然后快速提供数据分析和访问服务,满足业务人员、BI分析师、运营人员等各种角色的需求。背景信息 企业...

使用DataWorks

MaxCompute支持通过DataWorks的数据集成功能将MaxCompute中的数据以离线方式导出至其他数据源。当您需要将MaxCompute中的数据导出至其他数据源执行后续数据处理操作时,您可以使用数据集成功能导出数据。本文为您介绍如何将MaxCompute的...

术语

全球数据网络(Global Database Network)全球数据网络(GDN)是由分布在全球不同地域的多个 PolarDB 数据库集群组成的一张网络网络中所有集群的数据保持同步,完全一致。更多详情,请参见 创建与删除全球数据网络。主集群...

Oracle同步至Tablestore

本实践以Oracle作为来源数据源,以Tablestore作为去向数据源,因此您需要在DataWorks的工作空间的 数据源管理 页面新增Oracle数据源和Tablestore数据源,两个数据源支持的数据同步能力请参见 Oracle数据源、Tablestore数据源。已购买独享...

功能特性

计算 MaxCompute向用户提供了多种经典的分布式计算模型,提供TB、PB、EB级数据计算能力,能够更快速的解决用户海量数据计算问题,有效降低企业成本。功能集 功能 功能描述 参考文档 SQL开发 DDL语句 DDL语句 DDL DML操作 DML操作 DML操作 ...

文档更新动态(2022年)

更新说明 数据服务概述 2022年02月18日 新增Dataphin出网IP地址 在连通业务数据库与Dataphin间的网络时,您需要将不同网络环境下Dataphin的出网IP地址添加至业务数据库的白名单中。新增说明 Dataphin出网IP地址 2022年02月18日 新增数据源...

雷达图

图表样式 雷达图是移动端组件中的一种,支持使用角度轴和极坐标轴分别展示类目和数值,支持自定义文本、图形、动画样式,支持多系列数据配置,能够使用雷达图直观展示多维度的类目数据对比情况。配置面板 搜索配置:单击 配置 面板右上角...

雷达图

图表样式 雷达图是移动端组件中的一种,支持使用角度轴和极坐标轴分别展示类目和数值,支持自定义文本、图形、动画样式,支持多系列数据配置,能够使用雷达图直观展示多维度的类目数据对比情况。配置面板 搜索配置:单击 配置 面板右上角...

连接全球数据库网络

全球数据网络(Global Database Network,简称GDN)是由分布在同一个国家不同地域的多个 PolarDB 集群组成的网络,在本文介绍如何查看GDN的集群地址并连接GDN。GDN连接地址 GDN不提供统一的连接地址,但GDN中每个子集群(主集群和从集群...

数据传输作业:数据集成

离线同步 离线(批量)的数据通道通过定义数据来源和去向的数据源和数据集,提供一套抽象化的数据抽取插件(Reader)、数据写入插件(Writer),并基于此框架设计一套简化版的中间数据传输格式,从而实现任意结构化、半结构化数据源之间...

全增量同步任务常见问题

PolarDB数据网络联通性测试失败怎么办?OceanBase数据网络联通性测试失败怎么办?MySQL数据网络联通性测试失败怎么办?全增量实时至MaxCompute时,数据源被置灰了没法选择怎么办?实时任务,运行报错:...

常见问题

PolarDB数据网络联通性测试失败怎么办?MySQL数据网络联通性测试失败怎么办?实时任务,运行报错:com.alibaba.otter.canal.parse.exception.PositionNotFoundException: can't find start position for XXX 实时任务,运行报错:...

约束和限制

目录下面采样最新和最老的文件,每个文件读取前1000行 元数据发现SLS数据源发现历史投递数据 如果投递中途修改了分区格式,不会发现修改前的数据 一键建仓/多库合并支持的数据网络类型 VPC 一键建仓/多库合并支持的数据源 PolarDB MySQL ...

跨阿里云主账号访问

您在跨账号进行数据同步任务之前,需要设置并确保执行任务的独享数据集成资源组,与源端及目标端数据库之间的网络连通性。本文将为您介绍在使用跨阿里云账号时,数据库与DataWorks工作空间之间的网络连通操作。背景信息 网络连通方案选择取...

通过DataWorks导入数据

DataWorks提供了可视化的数据导入方式,相对于通过外表导入,DataWorks导入的方式更为轻量化,适合数据量相对较小的数据导入场景。本文介绍如何通过DataWorks将 PolarDB分布式版(原DRDS)的数据导入至 AnalyticDB MySQL版 湖仓版(3.0)或...

通过DataWorks导入

HDFS是一个分布式文件系统,为您提供读取和写入HDFS双向通道的功能,本文为您介绍如何通过DataWorks将HDFS数据导入至 AnalyticDB MySQL版 湖仓版(3.0)或 数仓版(3.0)。前提条件 已完成数据源配置。您需要在数据集成同步任务配置前,...

目标数据库连接性检查

为保障数据迁移任务的顺利执行,在预检查阶段检查DTS服务器是否能够连通要迁移的目标数据库。本文将介绍目标数据库连接性检查...网络互通问题 经过上述排查后仍然无法通过目标数据库连接性检查,可能是DTS服务器与目标数据网络互通问题。

源库连接性检查

网络互通问题 经过上述排查后仍然无法通过源库连接性检查,可能是DTS服务器与源数据网络互通问题。您可以 通过钉钉(钉钉通讯客户端下载地址)进入到DTS客户交流钉钉群(群号:68325004196或68640008972),进行咨询。

离线同步任务运维

数据质量监控 数据集成部分目标端数据源支持配置产出表的数据质量监控,您可以进入数据质量规则页面,对数据同步写入的目标表配置数据质量校验规则。对于配置了数据质量监控规则的表,当表关联的调度节点运行(执行节点代码逻辑)完成后...

网络类型

网络类型和访问方式 分析型数据库MySQL版支持的网络类型有两种:经典网络和 专有网络(Virtual Private Cloud 以下简称VPC)。经典网络:IP地址由阿里云统一分配,配置简便,使用方便,适用于对操作易用性要求比较高的场景。所有经典网络...

实施步骤

通过DTS实时同步PolarDB for MySQL数据到分析型数据库MySQL版需要以下几个步骤:步骤一:创建DTS同步作业 步骤二:配置同步链路 步骤三:查看同步数据 步骤一:创建DTS同步作业 创建DTS同步作业需要用户支付一定的费用,DTS支持两种付费...

在EMR上使用Sqoop与数据库同步数据时的网络配置

如果您的E-MapReduce(EMR)集群需要和集群之外的数据库同步数据,确保网络是联通的。本文以RDS、ECS自建和云下私有数据库三种情况为例,分别介绍如何配置网络。云数据库RDS Sqoop是用map任务同步数据,可以在任意节点上运行,而Sqoop任务...

交叉透视表

图表样式 交叉透视表是表格组件的一种,支持数据内容的自定义展示,能够将数据信息以表格的形式清晰展示在可视化应用上。配置面板 搜索配置:单击 配置 面板右上角的 搜索配置,可在 搜索配置 面板中输入您需要搜索的配置项名称,快速...

分组聚合查询优化

本文介绍如何在 AnalyticDB for MySQL 中对分组聚合查询进行优化。...说明 该优化不一定能起到优化内存使用的目的,因为在聚合度较低的情况下,数据还是会大量积攒在内存中进行去重和聚合以确保某个分组值的数据全部处理完成。

Oracle数据

由于主备数据同步存在一定的时间差,在网络延迟等特定情况下,会导致备库同步恢复的数据与主库有较大差别,从备库同步的数据不是一份当前时间的完整镜像。一致性约束 Oracle在数据存储划分中属于RDBMS系统,对外可以提供强一致性数据查询...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
云数据库 RDS 云数据库 Redis 版 数据库备份 DBS 弹性公网IP 短信服务 人工智能平台 PAI
新人特惠 爆款特惠 最新活动 免费试用