ListDoctorHiveTables-批量获取Hive表分析结果

数据指的是 7 日内没有访问的数据,但是 30 日以内有访问的数据。coldDataSize:冷数据的数据量大小。冷数据指的是 30 日内没有访问的数据,但是 90 日以内有访问的数据。freezeDataSize:极冷数据数的据量大小。极冷数据指的是 90 日以内...

ListDoctorHDFSDirectories-批量获取HDFS目录分析结果

数据指的是 7 日内没有访问的数据,但是 30 日以内有访问的数据。coldDataSize:冷数据的数据量大小。冷数据指的是 30 日内没有访问的数据,但是 90 日以内有访问的数据。freezeDataSize:极冷数据的数据量大小。极冷数据指的是 90 日以内...

GetDoctorHDFSCluster-获取HDFS分析结果

数据指的是 7 日内没有访问的数据,但是 30 日以内有访问的数据。Name string 指标名称。warmDataSize Value long 指标值。4062349775577 Unit string 指标单位。MB Description string 指标描述。Size of the warm data size ...

GetDoctorHiveTable-获取Hive表分析结果

数据指的是 30 日内没有访问的数据,但是 90 日以内有访问的数据。Name string 指标名称。coldDataSize Value long 指标值。217715 Unit string 指标单位。MB Description string 指标描述。Size of the cold data size FreezeDataSize ...

GetDoctorHiveDatabase-获取Hive库信息

数据指的是 30 日内没有访问的数据,但是 90 日以内有访问的数据。Name string 指标名称。coldDataSize Value long 指标值。1000 Unit string 指标单位。MB Description string 指标描述。Ratio of cold files FreezeDataSize object 极...

GetDoctorHDFSDirectory-获取HDFS特定目录分析结果

数据指的是 7 日内没有访问的数据,但是 30 日以内有访问的数据。Name string 指标名称。warmDataSize Value long 指标值。4062349775577 Unit string 指标单位。MB Description string 指标描述。Size of the warm data size ...

ListDoctorHiveDatabases-批量获取 Hive 库信息

数据指的是 30 日内没有访问的数据,但是 90 日以内有访问的数据。Name string 指标名称。coldDataSize Value long 指标值。1000 Unit string 指标单位。MB Description string 指标描述。Ratio of cold files FreezeDataSize object 极...

GetDoctorHiveCluster-获取 Hive 集群信息

数据指的是 30 日内没有访问的数据,但是 90 日以内有访问的数据。Name string 指标名称。coldDataSize Value long 指标值。1000 Unit string 指标单位。MB Description string 指标描述。Ratio of cold files FreezeDataSize object 极...

应用场景

实时数据通道 1.1 接入多种异构数据并投递到下游多种大数据系统 通过数据总线,您可以实时接入APP、WEB、IoT和数据库等产生的异构数据,统一管理,并投递到下游的分析、归档等系统,构建清晰的数据流,让您更好的释放数据的价值。...

数据质量教程概述

准确性 准确性是指数据记录中信息和数据是否准确、不存在错误或异常。例如,在本教程中,如果UV、PV数值小于0,则明显是错误数据。一致性 对于不同的业务流程和节点,同一份数据必须保持一致性。例如表 province 字段中如果有 浙江、ZJ 两...

数据质量教程概述

准确性 准确性是指数据记录中信息和数据是否准确、不存在错误或异常。例如,在本教程中,如果UV、PV数值小于0,则明显是错误数据。一致性 对于不同的业务流程和节点,同一份数据必须保持一致性。例如表 province 字段中如果有 浙江、ZJ 两...

技术原理

分析型查询的是涉及数据量较、计算比较复杂的查询,例如对一定时间区间内的数据进行聚合。相比于业务中常见的简单查询,这类查询往往要执行数秒甚至数分钟,需要消耗较多的计算资源。为了加速复杂分析型查询,PolarDB-X将计算任务切分...

质量评估

质量评估通过用户自定义质量检查计划,根据用户设置的数据质量规则执行面向不同计算资源的质量检查任务,通过数据质量监控报告展现系统整体数据质量概览及多维度细分数据的质量情况。质量评估通过完整性、准确性、一致性、唯一性、时效性、...

功能简介

一致性:数据一致性是指确保两个数据集之间或一个数据集内部不同字段间数值或信息的一致。唯一性:数据唯一性是指在一个数据集中,没有重复的记录或信息。时效性:数据时效性是指数据集按时、按量的更新程度。规范性:数据规范性是指数据集...

功能简介

一致性:数据一致性是指确保两个数据集之间或一个数据集内部不同字段间数值或信息的一致。唯一性:数据唯一性是指在一个数据集中,没有重复的记录或信息。时效性:数据时效性是指数据集按时、按量的更新程度。规范性:数据规范性是指数据集...

备份大小

图中的 归档备份 是指已保留超过2年(730天)的数据备份,数据 是指非归档的数据备份。备份大小说明 与存储空间使用量的关系 数据备份和日志备份存放在备份空间,都不占用存储空间。日志分为本地日志和日志备份。日志 说明 费用 作用 本地...

概述

PolarDB 是阿里巴巴自研的新一代 云原生数据库,在存储计算分离架构下,利用了软硬件结合的优势,为用户提供具备极致弹性、高性能、海量存储、安全可靠的数据库服务。100%兼容MySQL 5.6/5.7/8.0,PostgreSQL 11,高度兼容Oracle。PolarDB ...

概述

PolarDB 是阿里巴巴自研的新一代 云原生数据库,在存储计算分离架构下,利用了软硬件结合的优势,为用户提供具备极致弹性、高性能、海量存储、安全可靠的数据库服务。100%兼容MySQL 5.6/5.7/8.0,PostgreSQL 11,PostgreSQL 14,高度兼容...

数据校验计费方式

本文介绍DTS数据校验任务的计费方式和计费标准。计费方式 全量数据校验任务当前仅支持按量付费(后付费)的计费方式。说明 按表行数进行校验 的校验模式不收费,按抽样比例进行HASH校验 的校验...校验的数据是指源库中待校验数据的大小。

管理健康报告

Tablet数据大小变异系数 是指同一个分区内的tablet数据大小变异系数,代表了一个表的数据的tablet分布均衡程度。计算方式为:同一个分区内tablet数据大小的标准差除以平均值。一般来说,变异系数越,这个分区越有可能存在数据倾斜的情况...

RDS SQL Server空间不足问题

数据空间的回收通常有如下几种方式:归档数据 删除数据库中不常用的数据(例如早期的历史数据),或者根据需要迁移到其他数据库实例中,或者以其他形式归档保存,通过直接减少数据量来降低已使用数据空间大小。这种方式是控制数据空间增长...

数据节点管理

Locality,的是将数据库中的对象(如数据库、表或分区等)通过Locality属性关联到不同的资源池。对于每个DN节点,由于数据分布的不同,实际对资源的需求也有区别。PolarDB-X 支持针对每个DN节点单独升降配,提升整体的资源利用率。注意...

概述

数据备份物理空间大小如下图所示:说明 PolarDB 集群 数据备份物理空间大小(上图中①所示):指数据备份的收费对象,物理空间大小是指所有数据备份(快照)独占的物理空间大小之和,PolarDB集群的数据与多个数据备份(快照)会复用相同的...

概述

数据备份物理空间大小如下图所示:说明 PolarDB 集群 数据备份物理空间大小(上图中①所示):指数据备份的收费对象,物理空间大小是指所有数据备份(快照)独占的物理空间大小之和,PolarDB集群的数据与多个数据备份(快照)会复用相同的...

监控

AnalyticDB for MySQL 集群中包含多个存储节点,磁盘数据使用量是指单个读写节点的最大磁盘使用量,热数据使用量是指所有读写节点的磁盘数据使用量之和。预留模式跨规格变配为弹性模式后,监控界面看到 CPU平均使用率增大,是什么原因?...

实时同步常见问题

实时同步MySQL数据常见问题 实时同步MySQL数据源的数据时,一开始读到数据,一段时间后无法读到数据,怎么处理?实时同步Oracle、PolarDB、MySQL常见问题 实时同步Oracle、PolarDB、MySQL任务重复报错 报错信息与解决方案 报错信息与解决...

数据迁移与同步FAQ

本文为您列出数据迁移与数据同步的常见问题和相关解答。什么数据迁移、数据同步?DTS的数据迁移与数据同步工作原理是什么?DTS的数据迁移与数据同步有什么区别?使用DTS遇到预检查报错,如何解决?什么数据迁移、数据同步?数据迁移:...

数据源权限管理

本文为您汇总数据源权限管理相关的问题。哪些角色可以管理数据源的权限?是否支持再次分享已被分享的数据源?数据源的创建者是否有权控制该数据源?什么是私有模式的数据源?哪些用户能够收回数据源的分享权限?如何检查数据源分享关系的...

数据归档

RDS MySQL实例数据量较时,存储成本会随之增高。业务数据通常分为冷数据和热数据,将对象存储(OSS)作为归档冷数据的存储介质,能够大幅降低用户的存储成本。功能简介 在开启RDS MySQL通用云盘的数据归档OSS功能后,用户可通过执行下面...

创建Hudi数据

背景信息 Hudi即Apache Hudi,Hudi是一个通用的大数据存储系统,将核心仓库和数据库功能直接引入到数据库中,并支持记录级别的插入更新和删除数据的能力。权限说明 仅支持 超级管理员、数据源管理员、板块架构师、项目管理员 角色创建数据...

JindoFS实战演示

使用Checksum迁移HDFS数据到OSS 使用Checksum迁移HDFS数据到OSS 2021-05-11 通过Checksum算法,你可以在大数据迁移场景中校验数据的完整性、对比数据差异并实现增量迁移。本视频为您介绍如何使用Jindo Distcp迁移HDFS数据到OSS,以及在迁移...

创建Hudi数据

背景信息 Hudi即Apache Hudi,Hudi是一个通用的大数据存储系统,将核心仓库和数据库功能直接引入到数据库中,并支持记录级别的插入更新和删除数据的能力。更多信息,请参见 Apache Hudi官网。权限说明 仅支持 超级管理员、数据源管理员、...

什么数据传输服务DTS

数据传输服务DTS(Data Transmission Service)是阿里云提供的实时数据流服务,支持关系型数据库(RDBMS)、非关系型的数据库(NoSQL)、数据多维分析(OLAP)等数据源间的数据交互,集数据同步、迁移、订阅、集成、加工于一体,助您构建...

文档修订记录

Check节点 2024.1.12 新增功能 最佳实践 新增DataWorks大数据安全治理实践新增指南,为您介绍数据安全治理的常见思路、DataWorks产品的安全能力,以及在DataWorks上基于“基础防护建设”、“数据安全防护措施”、“数据安全持续运营”三个...

新功能发布记录

开启安全访问代理 接入达梦数据库 新增 全面直接接入达梦数据库(DM),包括数据导入、数据查询、数据变更、数据导出、数据服务与数据可视化等功能。支持的数据库类型与功能 数据类目 新增 对表进行分类,便于管理人员、开发人员及运维人员...

数据服务入门

DataWorks数据服务的主要目标是为个人、团队和企业构建统一的数据服务总线,帮助用户统一管理面向内外部的API服务。例如,您可以将查询数据表功能快速的生成对应的API,或将已有的API注册至数据服务平台进行统一发布和管理。本文以MySQL...

入仓解决方案

支持的数据库部署位置 有公网IP的自建数据库 无公网IP:Port的数据库(通过数据库网关DG接入)通过云企业网CEN接入的自建数据库 ECS上的自建数据库 通过专线/VPN网关/智能接入网关接入的自建数据库 ECS上的自建数据库 通过专线/VPN网关/智能...

离线同步并发和限流之间的关系

数据限制能力用来控制任务在遇到脏数据时的行为,所谓脏数据是指数据条目在写入目标数据源过程中发生了异常,则此条数据被视为脏数据。由于各类异构系统对数据处理的复杂和差异性,目前策略是写入失败的数据均被归类于脏数据。在一些数据...

概述

AnalyticDB PostgreSQL版 向量分析可以通过AI算法提取非结构化数据的特征,并利用特征向量作为非结构化数据的唯一标识,帮您快速且低成本地实现对非结构化数据检索和对结构化数据关联分析。向量数据库简介 在现实世界中,绝多数的数据都...

概述

数据传输是 OceanBase 数据库提供的一种支持同构或异构数据源与 OceanBase 数据库之间进行数据交互的服务,具备在线迁移存量数据和实时同步增量数据的能力。产品功能 数据传输提供可视化的集中管控平台,您只需要进行简单的配置即可实时...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
云数据库 RDS 数据传输服务 数据库备份 DBS 云数据库 Redis 版 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用