质量规则参数配置

统计值(重复行数/重复率)重复行数用于检查数据中重复了的行数的多少,仅计算多出来的行数,算法为总行数-去重行数。重复率=重复行数/总行数。如果需要重复数据的全部行数/重复率计算,可以使用唯一值校验模板的异常行数/异常率指标。及时...

质量规则参数配置

统计值(重复行数/重复率)重复行数用于检查数据中重复了的行数的多少,仅计算多出来的行数,算法为总行数-去重行数。重复率=重复行数/总行数。如果需要重复数据的全部行数/重复率计算,可以使用唯一值校验模板的异常行数/异常率指标。及时...

数据库画像

数据库画像是数据库评估的基础数据,可以帮助您更好地了解自己的源数据库,在数据库迁移、改造等阶段,可以快速查找源数据库信息,指导迁移与改造。新建画像 登录 数据管理DMS 5.0。在顶部菜单栏中,选择 集成与开发(DTS)>异构数据库迁移...

pg_profile

pg_profile 是 PolarDB PostgreSQL版 支持的一款第三方插件,能够统计目标数据库中资源密集型活动,来分析和优化数据库。此扩展基于PostgreSQL的统计视图和部分社区插件,完全由PL/pgSQL编写,无需任何外部库或软件。配合 pg_cron 插件可以...

pg_profile

pg_profile 是 PolarDB PostgreSQL版(兼容Oracle)支持的一款第三方插件,能够统计目标数据库中资源密集型活动,来分析和优化数据库。此扩展基于PostgreSQL的统计视图和部分社区插件,完全由PL/pgSQL编写,无需任何外部库或软件。配合 pg_...

功能简介

数据开发为用户提供一站式计算节点开发能力,通过对数据加工流程的开发和运行调试等环节的一体化管理,数据开发实现数据加工工作流编排、加工逻辑的复用,大幅提高数据开发效率。数据开发帮助用户优化智能系统的架构,提高系统的工程化水平...

数据开发

数据开发为用户提供一站式计算节点开发能力,通过对数据加工流程的开发、部署、调试等环节的一体化管理,数据开发实现数据加工工作流编排、加工逻辑的复用,大幅提高数据开发效率。数据开发帮助用户优化智能系统的架构,提高系统的工程化...

购买指引

产品版本 入门版 标准版 高级版 版本选择建议 小型数据团队 中小型数据团队 中型数据团队 功能规格 数据同步 离线数据同步 离线数据同步 实时数据同步 配置化数据同步 离线数据同步 实时数据同步 配置化数据同步 多引擎数据计算任务编排 ...

资源密集活动统计(pg_profile)

RDS PostgreSQL支持使用pg_profile插件来统计数据库中资源密集型活动,用于分析优化数据库。插件简介 此扩展基于PostgreSQL的统计视图(pg_stat_statements)和社区插件(pg_stat_kcache),完全使用PL/pgSQL编写,无需任何外部库或软件,...

授权系统API

在OpenAPI场景,当外部应用需要对接 数据资源平台 组件的OpenAPI时,需要联系租户管理员,对外部应用调用 数据资源平台 组件的OpenAPI进行授权。本文介绍如何授权API。前提条件 已完成应用创建,具体操作,请参见 新建应用。如需进行API...

常见问题概览

本文汇总了云数据库MongoDB的常见问题。说明 如果您遇到其他问题,也可查阅 MongoDB错误码汇总 匹配错误信息。兼容性与变配 热点问题 其他常见问题 云数据库MongoDB版和MongoDB有什么关系?云数据库MongoDB版支持哪些数据库版本?云数据库...

如何选取统计信息自动采集策略

数据发生剧烈变化的场景,常见数据导入过长,会触发实时的统计信息采集。建议 如果不希望在凌晨执行采集,可以在控制台 参数设置 页面,将 ENABLE_BACKGROUND_STATISTIC_COLLECTION 和 ENABLE_STATISTIC_FEEDBACK 参数的值设置为False,...

统计功能介绍

一、功能效果 网站管理者通过统计功能查看了解网站使用期间的数据,更好的进行针对性优化或推广。二、使用教程 统计功能包括:网站概况、渠道统计、栏目统计、产品统计、文章统计。1.网站概况 1.1 点击网站概况可以查看该网站在选择的时间...

减灾与应急时空解决方案与案例

公司主营OpenRIS灾害风险大数据平台提供了海量灾害数据的快速地图展示、统计查询、切割下载、上传数据定制化在线分析等功能,实现了灾害数据与模型一体化云服务。在数据与系统上云过程前,遇到了如下挑战:长期积累的时空数据类型多、数据...

API概览

本产品(大数据开发治理平台 DataWorks/2020-05-18)的OpenAPI采用 RPC 签名风格,签名细节参见 签名机制说明。我们已经为开发者封装了常见编程语言的SDK,开发者可通过 下载SDK 直接调用本产品OpenAPI而无需关心技术细节。如果现有SDK不能...

数据资源平台服务关联角色

本文为您介绍数据资源平台服务关联角色(AliyunServiceRoleForDataQ)的应用场景以及如何删除服务关联角色。背景信息 数据资源平台服务关联角色(AliyunServiceRoleForDataQ)是在某些情况下,为了完成数据资源平台自身的某个功能,需要...

新建工作组

工作组是 数据资源平台 进行数据研发的基本单元,用于数据隔离的命名空间,通常为一个用户组、一个项目或一个应用。在使用 数据资源平台 时,可以通过创建工作组来隔离数据,对数据进行分域管理,以达到各工作组之间空间隔离的效果。本文...

数据服务入门

步骤一:创建数据源并配置网络连通性 使用数据服务创建API前,您需将数据库或数据仓库添加为DataWorks的数据源,并保障数据服务资源组与您的目标数据源网络连通,以便调用API时DataWorks可成功访问数据源。说明 DataWorks工作空间将集群或...

数据资源平台

阿里云数据资源平台是构建数据智能的全流程平台,提供数据汇聚、规范设计、指标与标签体系构建、数据质量管控、数据资产管理、数据资产服务与共享、智能分析等核心功能,支持行业知识内容沉淀,帮助金融、政府及企业客户快速构建智能数据中...

数据服务概述

数据服务价值 为了解决常见的数据应用问题,在数据服务体系下,开发人员开发数据服务时,提供简易向导和灵活脚本两种模式,从而降低开发门槛、提高开发效率、统一代码质量,方便管理变更;业务人员应用数据服务时,提供安全、稳定的数据...

发现

通过统一的数据资产目录,沉淀数据供给方生产的各类型数据,帮助资产运营管理者进行高价值、可共享的数据资源的注册、编目分类和公开运营,帮助数据使用者快速了解和获取业务需要的高质量数据资产,促进数据资产发挥更大的业务价值。...

功能更新动态(2024年)

创建数据表质量规则 创建全域数据表质量规则 创建数据源质量规则 创建实时元表规则 创建指标质量规则 批量上传质量规则 数据安全 识别规则新增基于血缘关系自动继承上游分类分级功能,同时结合默认脱敏策略,保障自动继承结果的数据可以...

产品概述

阿里云流数据处理平台数据总线DataHub是流式数据(Streaming Data)的处理平台,提供对流式数据的发布(Publish),订阅(Subscribe)和分发功能,让您可以轻松构建基于流式数据的分析和应用。数据总线 DataHub服务可以对各种移动设备,应用...

功能简介

概览 对数据资产的全局及增量指标进行统计和展示,帮助用户快速了解平台管理数据资产的总体情况。支持数据表、API和指标资产类型,同时,支持精确或模糊搜索数据资产。支持数据资产总量、今日新增等全局指标展示,并以趋势图的形式展示增量...

功能简介

概览 对数据资产的全局及增量指标进行统计和展示,帮助用户快速了解平台管理数据资产的总体情况。支持数据表、API和指标资产类型,同时,支持精确或模糊搜索数据资产。支持数据资产总量、今日新增等全局指标展示,并以趋势图的形式展示增量...

什么是备份数据

常见概念 在数据库备份场景下,有4个概念:数据库磁盘空间、数据文件空间、备份数据量、存储数据量。数据量 说明 数据库磁盘空间 由数据库的数据文件空间、数据库的日志文件空间、操作系统文件空间和空闲空间组成。说明 RDS中为:购买时...

什么是数据资源平台

阿里云数据资源平台数据资产定义、加工、管理、服务的全流程平台,提供数据同步、数据查询、数据标准、数据建模、数据加工、质量评估、业务模型构建、资产管理、数据服务等功能,为智能数据应用持续稳定供给全量、标准、干净、智能的数据...

新建数据字典

数据字典管理支持创建并维护数据模型中使用的数据字典,制定并管理平台遵循的统一数据标准,为数据元、指标、维度的值域设置中引用数据字典提供数据基础,帮助平台管理者和数据管理者管控治理后数据的一致性和数据质量。本文为您介绍如何...

数据同步

数据同步提供批量、实时多源异构数据的便捷同步或接入能力,系统提供完善的数据接入配置、任务运行监控等功能,有效保障数据接入的稳定性和可控性,满足各类平台数据源及应用系统间的数据汇聚需求。同时支持对存储在基于ArcGIS、超图等...

功能简介

数据同步为用户提供批量、实时多源异构数据的便捷同步或接入能力,系统提供完善的数据接入配置、任务运行监控等功能,有效保障数据接入的稳定性和可控性,满足各类平台数据源及应用系统间的数据汇聚需求。同时支持对存储在基于ArcGIS、...

新建数据字典

数据字典管理支持创建并维护数据模型中使用的数据字典,制定并管理平台遵循的统一数据标准,为数据元、指标、维度的值域设置中引用数据字典提供数据基础,帮助平台管理者和数据管理者管控治理后数据的一致性和数据质量。本文为您介绍如何...

管理预置指标表

预置指标是物联网数据服务平台默认描述设备情况的维度,预置指标表是一组预置指标的集合,指标数据默认是关闭统计的。您可开启预置指标表统计预置指标数据,并将预置指标表实例化为数据API,用于获取统计的指标数据。本文介绍如何查看预置...

JindoFS实战演示

云上计算云下数据:HDFS缓存加速 云上计算云下数据:HDFS缓存加速 2021-06-29 随着云计算越来越成熟,带来弹性扩容、运维方便、节省成本等优点,越来越多企业开始将大数据平台搬到云上。云下的HDFS集群存在历史数据,其中可能包含敏感数据...

功能简介

数据同步为用户提供批量、实时多源异构数据的便捷同步或接入能力,系统提供完善的数据接入配置、任务运行监控等功能,有效保障数据接入的稳定性和可控性,满足各类平台数据源及应用系统间的数据汇聚需求。通过数据同步的自定义同步任务...

数据归档概述

当线上数据库中的历史数据(访问率很低的数据)越来越多,占用的存储越来越大,以至于会影响数据库的查询性能与业务运转,此时您可以使用 数据管理DMS 的数据归档功能,周期性地将指定表的数据归档至其他数据库或存储服务中。同时,该功能...

数仓规划概述

数据集市与主题域 数据集市与主题域通常位于应用层,面向用户的实际业务需求,对指定的某类业务进行场景或产品的细粒度划分,制定不同分析视角,基于公共层的整合数据进行业务个性化的数据统计。数据集市 数据集市是对某个业务分类制定细化...

数据质量概述

数据质量帮助您第一时间感知源端数据的变更与ETL(Extract Transformation Load)中产生的脏数据,自动拦截问题任务,有效阻断脏数据向下游蔓延。避免任务产出不符合预期的问题数据,影响正常使用和业务决策。同时也能显著降低问题处理的...

数据质量概述

数据质量帮助您第一时间感知源端数据的变更与ETL(Extract Transformation Load)中产生的脏数据,自动拦截问题任务,有效阻断脏数据向下游蔓延。避免任务产出不符合预期的问题数据,影响正常使用和业务决策。同时也能显著降低问题处理的...

离线同步任务运维

查看离线数据大屏 您还可以在 运维大屏>离线同步 页面查看离线同步任务的运行状态分布、数据同步进度、同步数据统计、同步任务执行详情(可基于来源端与目标端数据源,以及任务是否产生公网等条件过滤目标任务)等运行指标信息。...

高效数据治理实施指南

存储资源优化治理实施指南 存储资源优化是进行成本相关数据治理时,最常见的切入点。通过数据存储资源优化,可以有效地降低数据存储成本,提高数据存储的效率,控制数仓团队的数据成本。此外,存储资源优化还可以帮助企业更好地管理数据,...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
云数据库 RDS 云数据库 Redis 版 数据库备份 数据传输服务 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用