应用场景

实时数据通道 1.1 接入多种异构数据并投递到下游多种大数据系统 通过数据总线,您可以实时接入APP、WEB、IoT和数据库等产生的异构数据,统一管理,并投递到下游的分析、归档等系统,构建清晰的数据流,让您更好的释放数据的价值。...

数据质量教程概述

数据质量是数据分析结论有效性和准确性的基础。本文为您介绍数据质量保障教程的业务场景以及如何衡量数据质量的高低。前提条件 在开始本教程前,请您首先完成 搭建互联网在线运行分析平台 教程,详情请参见 业务场景与开发流程。业务场景 ...

数据质量教程概述

数据质量是数据分析结论有效性和准确性的基础。本文为您介绍数据质量保障教程的业务场景以及如何衡量数据质量的高低。前提条件 在开始本教程前,请您首先完成 搭建互联网在线运行分析平台 教程,详情请参见 业务场景与开发流程。业务场景 ...

基本概念

同步延迟 同步延迟是指同步到目标数据库的最新数据时间戳,与源数据库的当前时间戳之间的差值。如果同步延迟为0,则源数据库与目标数据库的数据完全同步。数据更新 数据更新是指仅修改数据,未修改结构定义的操作,例如INSERT、DELETE和...

ListDoctorHiveTables-批量获取Hive表分析结果

数据指的是 7 日内没有访问的数据,但是 30 日以内有访问的数据。coldDataSize:冷数据的数据量大小。冷数据指的是 30 日内没有访问的数据,但是 90 日以内有访问的数据。freezeDataSize:极冷数据数的据量大小。极冷数据指的是 90 日以内...

ListDoctorHDFSDirectories-批量获取HDFS目录分析结果

数据指的是 7 日内没有访问的数据,但是 30 日以内有访问的数据。coldDataSize:冷数据的数据量大小。冷数据指的是 30 日内没有访问的数据,但是 90 日以内有访问的数据。freezeDataSize:极冷数据的数据量大小。极冷数据指的是 90 日以内...

GetDoctorHDFSCluster-获取HDFS分析结果

数据指的是 7 日内没有访问的数据,但是 30 日以内有访问的数据。Name string 指标名称。warmDataSize Value long 指标值。4062349775577 Unit string 指标单位。MB Description string 指标描述。Size of the warm data size ...

GetDoctorHiveTable-获取Hive表分析结果

数据指的是 30 日内没有访问的数据,但是 90 日以内有访问的数据。Name string 指标名称。coldDataSize Value long 指标值。217715 Unit string 指标单位。MB Description string 指标描述。Size of the cold data size FreezeDataSize ...

GetDoctorHiveDatabase-获取Hive库信息

数据指的是 7 日内没有访问的数据,但是 30 日以内有访问的数据。Name string 指标名称。warmDataSize Value long 指标值。1000 Unit string 指标单位。MB Description string 指标描述。Ratio of warm files ColdDataSize object 冷数据...

GetDoctorHDFSDirectory-获取HDFS特定目录分析结果

数据指的是 7 日内没有访问的数据,但是 30 日以内有访问的数据。Name string 指标名称。warmDataSize Value long 指标值。4062349775577 Unit string 指标单位。MB Description string 指标描述。Size of the warm data size ...

ListDoctorHiveDatabases-批量获取 Hive 库信息

数据指的是 7 日内没有访问的数据,但是 30 日以内有访问的数据。Name string 指标名称。warmDataSize Value long 指标值。1000 Unit string 指标单位。MB Description string 指标描述。Ratio of warm files ColdDataSize object 冷数据...

GetDoctorHiveCluster-获取 Hive 集群信息

数据指的是 30 日内没有访问的数据,但是 90 日以内有访问的数据。Name string 指标名称。coldDataSize Value long 指标值。1000 Unit string 指标单位。MB Description string 指标描述。Ratio of cold files FreezeDataSize object 极...

质量评估

质量评估通过用户自定义质量检查计划,根据用户设置的数据质量规则执行面向不同计算资源的质量检查任务,通过数据质量监控报告展现系统整体数据质量概览及多维度细分数据的质量情况。质量评估通过完整性、准确性、一致性、唯一性、时效性、...

功能简介

一致性:数据一致性是指确保两个数据集之间或一个数据集内部不同字段间数值或信息的一致。唯一性:数据唯一性是指在一个数据集中,没有重复的记录或信息。时效性:数据时效性是指数据集按时、按量的更新程度。规范性:数据规范性是指数据集...

功能简介

一致性:数据一致性是指确保两个数据集之间或一个数据集内部不同字段间数值或信息的一致。唯一性:数据唯一性是指在一个数据集中,没有重复的记录或信息。时效性:数据时效性是指数据集按时、按量的更新程度。规范性:数据规范性是指数据集...

概述

PolarDB 是阿里巴巴自研的新一代 云原生数据库,在存储计算分离架构下,利用了软硬件结合的优势,为用户提供具备极致弹性、高性能、海量存储、安全可靠的数据库服务。100%兼容MySQL 5.6/5.7/8.0,PostgreSQL 11,PostgreSQL 14,高度兼容...

概述

PolarDB 是阿里巴巴自研的新一代 云原生数据库,在存储计算分离架构下,利用了软硬件结合的优势,为用户提供具备极致弹性、高性能、海量存储、安全可靠的数据库服务。100%兼容MySQL 5.6/5.7/8.0,PostgreSQL 11,高度兼容Oracle。PolarDB ...

数据节点管理

背景介绍 PolarDB-X 的数据节点管理功能支持存储资源池和数据节点单独升降配,实现数据节点的精细化管理与资源隔离,以适应多样化业务场景需求,进而有效提升整体资源使用率。存储资源池,即将DN存储节点划分为互不交叉的池,支持在单个...

技术原理

分析型查询的是涉及数据量较、计算比较复杂的查询,例如对一定时间区间内的数据进行聚合。相比于业务中常见的简单查询,这类查询往往要执行数秒甚至数分钟,需要消耗较多的计算资源。为了加速复杂分析型查询,PolarDB-X将计算任务切分...

数据迁移与同步FAQ

本文为您列出数据迁移与数据同步的常见问题和相关解答。什么数据迁移、数据同步?DTS的数据迁移与数据同步工作原理是什么?DTS的数据迁移与数据同步有什么区别?使用DTS遇到预检查报错,如何解决?什么数据迁移、数据同步?数据迁移:...

JindoFS实战演示

数据迁移 文档链接 视频链接 视频发布时间 描述 高效迁移HDFS海量文件到OSS 高效迁移HDFS海量文件到OSS 2021-05-11 通过Hadoop DistCp将HDFS海量文件同步到OSS存在很多问题,例如文件数量太造成内存溢出、同步效率慢、无法保证数据一致性...

创建Hudi数据

背景信息 Hudi即Apache Hudi,Hudi是一个通用的大数据存储系统,将核心仓库和数据库功能直接引入到数据库中,并支持记录级别的插入更新和删除数据的能力。权限说明 仅支持 超级管理员、数据源管理员、板块架构师、项目管理员 角色创建数据...

创建Hudi数据

背景信息 Hudi即Apache Hudi,Hudi是一个通用的大数据存储系统,将核心仓库和数据库功能直接引入到数据库中,并支持记录级别的插入更新和删除数据的能力。更多信息,请参见 Apache Hudi官网。权限说明 仅支持 超级管理员、数据源管理员、...

什么数据传输服务DTS

数据传输服务DTS(Data Transmission Service)是阿里云提供的实时数据流服务,支持关系型数据库(RDBMS)、非关系型的数据库(NoSQL)、数据多维分析(OLAP)等数据源间的数据交互,集数据同步、迁移、订阅、集成、加工于一体,助您构建...

概述

AnalyticDB PostgreSQL版 向量分析可以通过AI算法提取非结构化数据的特征,并利用特征向量作为非结构化数据的唯一标识,帮您快速且低成本地实现对非结构化数据检索和对结构化数据关联分析。向量数据库简介 在现实世界中,绝多数的数据都...

备份大小

图中的 归档备份 是指已保留超过2年(730天)的数据备份,数据 是指非归档的数据备份。备份大小说明 与存储空间使用量的关系 数据备份和日志备份存放在备份空间,都不占用存储空间。日志分为本地日志和日志备份。日志 说明 费用 作用 本地...

概述

数据传输是 OceanBase 数据库提供的一种支持同构或异构数据源与 OceanBase 数据库之间进行数据交互的服务,具备在线迁移存量数据和实时同步增量数据的能力。产品功能 数据传输提供可视化的集中管控平台,您只需要进行简单的配置即可实时...

独享资源组

独享资源组使用场景 独享调度资源组使用场景 独享数据集成资源组使用场景 独享资源组网络配置 独享资源组访问VPC环境下数据的前提条件是什么?如何查看数据源的网络环境?添加独享资源组白名单 独享资源组商业化行为 如何对资源组进行续费...

管理缓存

释放数据是指从Alluxio缓存中删除数据,而不是从底层UFS中删除数据。释放操作后,数据仍然可供用户使用,但对Alluxio释放文件后尝试访问该文件的客户端来讲性能可能会降低。语法 alluxio fs free示例:将 tmp 目录中的所有数据从缓存中释放...

管理健康报告

Tablet数据大小变异系数 是指同一个分区内的tablet数据大小变异系数,代表了一个表的数据的tablet分布均衡程度。计算方式为:同一个分区内tablet数据大小的标准差除以平均值。一般来说,变异系数越,这个分区越有可能存在数据倾斜的情况...

支持的数据库

数据同步 数据同步功能帮助您实现数据源之间的数据实时同步,适用于数据异地多活、数据异地灾备、本地数据灾备、跨境数据同步、查询与报表分流、云BI及实时数据仓库等多种业务场景。同步支持的数据库、版本和同步类型以及配置文档,请参见...

RDS SQL Server空间不足问题

数据空间的回收通常有如下几种方式:归档数据 删除数据库中不常用的数据(例如早期的历史数据),或者根据需要迁移到其他数据库实例中,或者以其他形式归档保存,通过直接减少数据量来降低已使用数据空间大小。这种方式是控制数据空间增长...

自媒体:易撰

所属行业:自媒体 网站地址:易撰 客户介绍 长沙营智信息技术有限公司是专业的新媒体大数据服务商,其旗下知名品牌易撰,基于新媒体大数据挖掘技术及NLP算法分析,为各内容创客、广告主提供全面、科学、精准的大数据分析服务以及大数据架构...

一键创建OSS数据仓库

本文介绍如何通过向导将RDS、PolarDB for MySQL、MongoDB数据库或者ECS自建数据数据同步到OSS中,即创建OSS数据仓库(创建Schema)。操作步骤 登录 Data Lake Analytics管理控制台。在页面左上角,选择DLA所在地域。在左侧导航栏单击 ...

概述

数据备份物理空间大小如下图所示:说明 PolarDB 集群 数据备份物理空间大小(上图中①所示):指数据备份的收费对象,物理空间大小是指所有数据备份(快照)独占的物理空间大小之和,PolarDB集群的数据与多个数据备份(快照)会复用相同的...

配置数据质量监控

本文为您介绍如何通过数据质量实现表数据监控。前提条件 在进行本实验前,请确保已完成 采集数据 和 加工数据。已通过数据集成将存储于RDS MySQL的用户基本信息(ods_user_info_d)同步至MaxCompute的ods_user_info_d表。已通过数据集成将...

概述

数据备份物理空间大小如下图所示:说明 PolarDB 集群 数据备份物理空间大小(上图中①所示):指数据备份的收费对象,物理空间大小是指所有数据备份(快照)独占的物理空间大小之和,PolarDB集群的数据与多个数据备份(快照)会复用相同的...

受众与核心能力

产品受众 从事数据开发、算法开发等岗位的技术人员 从事销售运营、商业智能分析等岗位的业务人员 从事数据安全与合规工作的管理人员 从事数据应用开发的开发人员 把控公司核心数据资产的管理人员 核心能力 基于DataWorks,您可以获得如下...

基于Delta lake的一站式数据湖构建与分析实战

数据湖作为一个集中化的数据存储仓库,支持的数据类型具有多样性,包括结构化、半结构化以及非结构化的数据数据来源上包含数据数据、binglog 增量数据、日志数据以及已有数仓上的存量数据等。数据湖能够将这些不同来源、不同格式的数据...

数据建模:智能数据建模

智能数据建模是阿里云DataWorks自主研发的智能数据建模产品,沉淀了阿里巴巴十多年来数仓建模方法论的最佳实践,包含数仓规划、数据标准、维度建模及数据指标四大模块,帮助企业在搭建数据中台、数据集市建设过程中提升建模及逆向建模的...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
云数据库 RDS 云原生大数据计算服务 MaxCompute 数据库备份 DBS 数据传输服务 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用