Delta Lake概述

说明 ACID指数据库事务正确执行的四个基本要素的缩写。包含:原子性(Atomicity)、一致性(Consistency)、隔离性(Isolation)和持久性(Durability)。图 1.数据仓库与数据湖 Data Warehouse、Data Lake和Delta Lake对比如下所示。对比...

数据传输服务概述

数据传输服务是MaxCompute数据进出的最重要通道,其中包括适用于批量操作的普通Tunnel和适用于流式写入的Stream Tunnel,同时在所有Region提供免费限量使用的数据传输服务共享资源组,也提供数据传输服务(包年包月)独享资源组,供您采购...

测试数据构建

性能数据参考(进行了流量控制,避免瞬时生成过多数据造成数据库负载的影响):4个字段生成100万条数据约60s。40个字段生成100万条数据约120s-180s之间。操作步骤 登录 数据管理DMS 5.0。在顶部菜单栏中,选择 数据库开发>环境构建>测试...

数据质量教程概述

数据质量的评估 数据质量可以从完整性、准确性、一致性和及时性共四个角度进行评估,详情请参见 数据质量评估标准。在本教程中,您将学会通过数据质量风险监控,保证数据的完整性、准确性、一致性;通过数据及时性监控,保证数据的及时性。...

数据质量教程概述

数据质量的评估 数据质量可以从完整性、准确性、一致性和及时性共四个角度进行评估,详情请参见 数据质量评估标准。在本教程中,您将学会通过数据质量风险监控,保证数据的完整性、准确性、一致性;通过数据及时性监控,保证数据的及时性。...

概述

本教程将以集群实例为例,带您体验云数据库 OceanBase 的低存储成本和实时分析能力。更多特性,详情参见 OceanBase 数据库概述。特性介绍 低存储成本 数据压缩是降低海量数据存储空间的关键手段。OceanBase 通过 LSM-Tree 的存储架构和自...

概述

DataHub数据同步功能 DataHub提供数据Sink/Source功能,即数据同步功能,DataHub支持将对应Topic中的数据 实时/准实时 的同步到第三方阿里云产品中,打通阿里云产品间的数据流通。目前支持MaxCompute(原ODPS)、分析型数据库MySQL(ADS)、...

通过Mongo Shell连接MongoDB单节点实例

Mongo Shell是MongoDB自带的数据库管理工具,您可以将Mongo Shell工具下载并安装至客户端(本地服务器或ECS服务器),用于连接云数据库MongoDB单节点实例。本文介绍通过Mongo Shell连接云数据库MongoDB单节点实例的方法。前提条件 已创建云...

术语

全球数据网络(Global Database Network)全球数据网络(GDN)是由分布在全球不同地域的多 PolarDB 数据库集群组成的一张网络网络中所有集群的数据保持同步,完全一致。更多详情,请参见 创建与删除全球数据网络。主集群...

自定义RDBMS数据库及同步数据

为了满足不同业务场景数据集成的诉求,Dataphin支持用户自定义当前系统不支持的RDBMS数据库(关系型数据库)类型的组件,并进行数据同步。您只需要准备关系型数据库的驱动,即可自定义RDBMS数据库类型的组件。本教程以MySQL为例,为您介绍...

自定义RDBMS数据库及同步数据

为了满足不同业务场景数据集成的诉求,Dataphin支持用户自定义当前系统不支持的RDBMS数据库(关系型数据库)类型的组件,并进行数据同步。您只需要准备关系型数据库的驱动,即可自定义RDBMS数据库类型的组件。本教程以MySQL为例,为您介绍...

产品架构

EMR Serverless StarRocks架构 EMR Serverless StarRocks的产品架构主要由以下三个层次构成:存储层:存算一体版:StarRocks内表使用云盘或本地盘作为数据存储的介质,使用StarRocks Table Format存储格式。存算分离版:StarRocks内表使用...

图扑案例

为适应日趋复杂化多样化的终端设备、边缘设备、传感器以及第三方系统数据源采集、上报的异构数据,如图3所示,阿里 云原生多模数据库 Lindorm 在云端单实例融合了宽表、索引、时序等多种数据引擎能力,通过阿里云DTS/DMS或第三方开源数据...

支持的数据库

数据同步 数据同步功能帮助您实现数据源之间的数据实时同步,适用于数据异地多活、数据异地灾备、本地数据灾备、跨境数据同步、查询与报表分流、云BI及实时数据仓库等多种业务场景。同步支持的数据库、版本和同步类型以及配置文档,请参见...

迁移方案概览

数据迁移功能帮助您实现同构或异构数据源之间的数据迁移,适用于数据上云迁移、阿里云内部跨实例数据迁移、数据库拆分扩容等业务场景。本文将介绍数据迁移功能支持的数据库、版本和迁移类型,以及具体的配置文档。说明 数据迁移在某些场景...

数据集成侧同步任务配置

完成数据源、网络、资源的准备配置后,您可以根据同步场景选择同步解决方案,创建并执行同步任务,将源端数据同步至目标端。本文为您介绍同步任务的通用配置流程,不同的同步方案配置流程可能存在差异,对应方案配置详情请以界面为准。前提...

迁移 PolarDB-X 1.0 数据库的数据至 OceanBase 数据库...

项目启动成功后,PolarDB-X 1.0 数据库至 OceanBase 数据库 MySQL 租户的数据迁移项目会自动删除,数据传输会保存 PolarDB-X 1.0 数据库下挂载的数据库至 OceanBase 数据库 MySQL 租户的数据迁移项目,并自动创建相应的数据源。您可以在弹...

创建Impala数据

版本支持:CDH5:2.11.0 CDH6:3.2.0 CDP7.1.3:3.4.0 E-MapReduce 3.x:3.4.0 E-MapReduce 5.x:3.4.0 E-MapReduce 5.x:4.2.0 数据源描述 对数据源的简单描述。不得超过128字符。数据源配置 选择需要配置的数据源:如果业务数据源区分生产...

查看报表

支持的报表类型 报表名称 说明 综合分析报告 从资产管理和安全保障分析、异常和审计时间分析、敏感数据访问和规则命中情况分析、SQL语句执行情况分析四个维度对数据库进行综合分析。等保参考分析报告 根据当前信息安全技术网络安全等级保护...

确定需求

A公司的电商业务板块分为招商、供应链、营销和服务四个模块,每个板块的需求和数据应用都不同。您在构建数据仓库之前,首先需要明确构建数据仓库的业务板块和需要具体满足的业务需求。此外,您还需要进一步了解各业务板块中已有的数据功能...

确定需求

A公司的电商业务板块分为招商、供应链、营销和服务四个模块,每个板块的需求和数据应用都不同。您在构建数据仓库之前,首先需要明确构建数据仓库的业务板块和需要具体满足的业务需求。此外,您还需要进一步了解各业务板块中已有的数据功能...

跨账号授权配置

前提条件 已配置 云企业网 等网络连通方案,完成两账号中数据源实例与DataWorks资源组的VPC网络互通,更多信息,请参见 配置资源组与网络连通。跨账号授权操作流程 数据源为 MaxCompute、Hologres、AnalyticDB for PostgreSQL或...

专业术语

例如,每秒写入10次包含5,000个点的batch,每个点有4个field,那么values per second=每个点有4个field,每个batch有5,000个点,每秒写入10次=每秒写入200,000个值。相关术语:batch,field,point,points per second。wal(Write Ahead ...

配置资源组与网络连通

数据同步任务配置前,您需要确保用于执行同步任务的独享数据集成资源组与您将要同步的数据来源端与目的端数据库的网络连通性,您可以根据数据库所在网络环境,选择合适的网络解决方案来实现网络连通。本文为您介绍数据库在不同网络环境中...

网络连通解决方案

添加数据源时需要根据数据源所在网络环境,通过对应的网络解决方案,实现Dataphin与数据源的网络连通。本文为您介绍数据源在不同网络环境中与Dataphin的网络连通方案。网络连通方案 根据数据源所在的网络环境,在下图中选择对应的网络连通...

简介

该场景下核心的四个功能如下:安全托管:DMS在阿里集团数据库权限访问控制最佳实践,为企业提供一系列数据库权限管控的集合,可帮助企业实现多云数据库统一权限管理,确保用户安全地用数。更多信息,请参见 安全托管。DMS Data Copilot:是...

气泡图

图表 自定义边距:气泡图区域与组件上下左右四个边界之间的距离,单位默认px,单击 图标控制自定义边距的显隐。气泡大小:气泡的最小半径和最大半径,单位默认px。说明 设置的气泡大小并用于映射数据中的r字段,即最小的r值将被绘制成最小...

创建数据

数据管理DMS离线集成中,可以组合各类任务节点,形成数据流,通过周期调度运行达到数据加工、数据同步的目的。本文介绍创建数据流和配置的方法。前提条件 支持的数据库类型:MySQL:RDS MySQL、PolarDB MySQL版、MyBase MySQL、PolarDB...

创建元数据

在基于HBase、Elasticsearch或MongoDB数据源创建服务单元之前,需要先创建对应数据源中数据表的元数据,以实现通过元数据确定数据源中数据表的结构。后续您可以通过该元数据读取到对应数据源的数据。本文为您介绍如何创建HBase、...

数据资产等级定义

本文为您介绍数据资产等级的定义,以及如何定义生产链路上的相关数据的资产等级。数据资产等级定义 根据数据质量不满足完整性、准确性、一致性、及时性时,对业务的影响程度划分数据的资产等级。通常,划分为5性质的等级:毁灭性质:数据...

01创建数据字典并物理化

数据字典帮助平台管理者和数据管理者管控治理后数据的一致性和数据质量,创建并维护逻辑表中使用的数据字典,方便数据元引用数据字典来规范数据元的值域范围,保证关联了字段标准的表及字段可以自动设置数据质量规则,规范数据质量,本章节...

FineReport

这张报表的数据来源于两不同的数据集ds1和ds2,商品种类、合同种类字段是这两个数据集共有的字段,使用这字段建立起他们之间的联系。选中并双击D4单元格,弹出数据列对话框,选择过滤。给单元格添加一个普通条件,将ds2与ds1的商品种类...

步骤二:规划数仓

数仓规划是基于Dataphin建设数据中台的第一步,同时也是数据体系的顶层设计中至关重要的一步。在开始数据开发前,需要完成数据仓库的规划,包括定义数据板块、项目、数据源、计算源和统计周期。本文将指导您完成本教程的规划数仓。背景信息...

步骤二:规划数仓

数仓规划是基于Dataphin建设数据中台的第一步,同时也是数据体系的顶层设计中至关重要的一步。在开始数据开发前,需要完成数据仓库的规划,包括定义数据板块、项目、数据源、计算源和统计周期。本文将指导您完成本教程的规划数仓。背景信息...

无感集成(Zero-ETL)

云原生数据仓库 AnalyticDB PostgreSQL 版 提供无感集成(Zero-ETL)功能,可以帮助您一站式完成数据同步和管理,实现事务处理和数据分析一体化,专注于数据分析业务。公测时间 2024年4月1日至6月30日。公测地域 华北2(北京)、华东1...

设置数据库代理连接地址

开通数据库代理 时会默认创建1代理连接地址(原代理终端),新增代理连接地址(原代理终端)时会默认申请1内网地址(专有网络),后续您可以申请外网地址。说明 单个RDS MySQL实例支持1~7代理连接地址,每代理连接地址支持申请1...

Bucket Shuffle Join

Shuffle Join:Shuffle Join会根据哈希计算,将A、B两张表的数据分散到集群的节点之中,所以这次操作的网络开销为 A表数据量+B表数据量,内存开销为B表数据量。FE中保存了SelectDB每表的数据分布信息。如果Join语句命中了表的数据分布列...

应用场景

根据数据量和网络条件,迁移过程可能需要几小时甚至几天的时间。这漫长的过程可能会对您的业务产生很大的影响。DTS则可以帮助您以最小化的停机时间迁移您的数据。在数据迁移期间,您的应用程序仍可以保持运行状态。唯一的停机时间是当...

资源组说明

数据同步资源占用2c4g,支持4个任务并发,数据同步速率参考值3M/秒,日均任务数量参考值50个。说明 实际任务执行数量取决于网络速率、数据库读写速度、数据量大小、任务调度周期等。通用任务执行资源占比1c2g,支持10个SQL任务并发,日均...

资源组说明

数据同步资源占用2c4g,支持4个任务并发,数据同步速率参考值3M/秒,日均任务数量参考值50个。说明 实际任务执行数量取决于网络速率、数据库读写速度、数据量大小、任务调度周期等。通用任务执行资源占比1c2g,支持10个SQL任务并发,日均...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
数据库备份 数据传输服务 云数据库 RDS 云数据库 Redis 版 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用