restful 大数据量-restful 大数据量文档介绍内容-阿里云

实时同步常见问题

若业务延迟较大，其可能原因如下：报错现象直接原因解决方案读端延迟大源端数据量变更过多。延迟突然增大，说明某一时间点源端数据量增加。若源端数据更新快，数据量多，但同步延迟大，您可以：修改任务配置：您可以在源端数据库最大...

查询概述

湖仓一体 SelectDB提供多源数据目录功能（Multi-Catalog或Catalog），支持对接数据湖（如Hive、Iceberg、Hudi）、数据库（如MySQL、ES）等大量外部数据源，进行简单快速的数据分析。通过使用Catalog，您可以快速访问和分析存储在外部数据源...

创建Impala数据源

背景信息 Impala是用于处理存储在Hadoop集群中大量数据的SQL查询引擎。如果您使用的是Impala，在导出Dataphin数据至Impala，您需要先完成Impala数据源的创建。更多Impala信息，请参见 Impala官网。权限说明 Dataphin仅支持超级管理员、...

JindoFS实战演示

分层更高效，对Hive数仓进行热度/冷度统计分层更高效，对Hive数仓进行热度/冷度统计 2021-07-27 传统的Hadoop集群中，没有对数据进行分层，导致数据量不断增加的同时，存储成本也在大幅增加，计算速度在不断下降。此时，您可以对集群中的...

功能特性

通过DataX导入数据 OSS Load 云数据库 SelectDB 版结合OSS对象存储提供了内网高速导入功能，且单次导入数据量可达百GB级别。本文介绍如何通过OSS Load导入数据至云数据库 SelectDB 版实例中。OSS Load Stream Load 本文介绍如何通过Stream ...

创建HBase数据源

背景信息 HBase是用于处理存储在Hadoop集群中大量数据的SQL查询引擎。如果您使用的是HBase，在导出Dataphin数据至HBase，您需要先完成HBase数据源的创建。更多HBase信息，请参见 HBase官网。使用限制 Dataphin仅支持超级管理员、数据源管理...

什么是RDS PostgreSQL

为了实现读取能力的弹性扩展，分担数据库压力，您可以创建一个或多个只读实例，利用只读实例满足大量的数据库读取需求，增加应用的吞吐量。数据库代理（读写分离）：数据库代理是位于数据库服务端和应用服务端之间的网络代理服务，用于代理...

创建Impala数据源

背景信息 Impala是用于处理存储在Hadoop集群中大量数据的SQL查询引擎。如果您使用的是Impala，在导出Dataphin数据至Impala，您需要先完成Impala数据源的创建。更多Impala信息，请参见 Impala官网。权限说明 Dataphin仅支持超级管理员、...

应用场景

根据数据量和网络条件，迁移过程可能需要几个小时甚至几天的时间。这个漫长的过程可能会对您的业务产生很大的影响。DTS则可以帮助您以最小化的停机时间迁移您的数据。在数据迁移期间，您的应用程序仍可以保持运行状态。唯一的停机时间是当...

整库离线同步至Elasticsearch

您可以根据实际网络情况及数据量大小进行合理配置，减少不必要的网络开销。增量同步仅当方案选择配置为只增量一次性同步、周期性增量同步或全量一次性同步后周期增量时，需要配置该参数。说明您可以使用调度参数来指定同步源表及...

功能特性

配置管理数据保护敏感数据管理 DMS的敏感数据保护能力能根据所选的敏感数据扫描模板、敏感数据识别模型以及脱敏算法对数据进行脱敏处理，以避免敏感数据滥用，有效保护企业的敏感数据资产，防止数据泄露造成企业经营资金损失或罚款。...

数据集成概述

说明以业务数据库数据同步到MaxCompute数据仓库为例，当有大量的数据存储在数据库系统里，需要将数据库中的全量及增量数据同步到MaxCompute进行数仓分析时，数据集成传统方式是通过全量同步或者依赖数据库表中的 modify_time 等字段进行...

新功能发布记录

当存储即将出现溢出时，集群的存储空间可自动进行扩容，保障线上业务的稳定性，主要适用于业务数据量比较大，或者业务量波动较大且频繁的场景。设置存储自动扩容访问地址优化支持多机房部署方案添加两个访问地址。当访问地址为 2 个时，...

MongoDB 4.0

升级数据库大版本所用时间与数据库的数据量有关，请根据业务情况提前安排升级时间。升级数据库大版本后不支持降级数据库大版本。升级数据库大版本后，低版本的备份数据不能恢复至云数据库MongoDB实例。您可以下载备份文件，将低版本的备份...

RDS SQL Server I/O高问题

实例I/O过高时，容易影响查询性能。本文介绍查看I/O吞吐情况的方式以及如何排查I/O高...如果调整备份时间无法避免全量备份操作和业务的冲突，建议升级实例的磁盘性能等级，或者拆分数据，减少单个实例上的数据量，缩短全量备份所需的时间。

离线同步日志分析

半结构化存储：按照文件数或文件数据量进行切分。例如，OSS任务并发上限不超过文件数。同步数据此阶段将按照切分逻辑将切分出来的task，基于您配置的并发数进行分批同步。关系型数据库将按照上述切分键，切分为多个取数SQL，分别向数据库...

PolarDB PostgreSQL版（兼容Oracle）间的迁移

2.0版本引入了新的查询优化算法和存储引擎，提高了查询速度和并发处理能力，能够更快地处理大量数据，提升数据库的响应能力和性能。此外，2.0版本还引入了许多新的功能和增强功能，提供更好的用户体验和开发者工具。例如，改进了对JSON数据...

恢复SQL Server数据

为了获得更准确的备份和恢复性能，请参考最近一次全量备份的数据量和备份时间。在目标实例恢复全量备份必须 200 GB/小时无在源实例进行增量事务日志备份必须 200 GB/小时进行增量日志备份前后，可能存在2分钟的额外损耗（例如备份准备...

数据集成侧同步任务能力说明

说明以业务数据库数据同步到MaxCompute数据仓库为例，当有大量的数据存储在数据库系统里，需要将数据库中的全量及增量数据同步到MaxCompute进行数仓分析时，数据集成传统方式是通过全量同步或者依赖数据库表中的 modify_time 等字段进行...

基本概念

数据资产：数据资源平台中存在大量的数据表、标签、API等各类数据资产，数据管理者通过数据汇聚、数据治理、数据分析后，需要对整个平台数据进行统一管控，了解平台的核心数据资产，提供对应的数据资产管理规范。统一服务应用：是调用API...