文档修订记录

DataWorks数据安全治理路线 2023年12月更新记录 时间 特性 类别 描述 产品文档 2023.12.29 新增功能 数据开发 若您要在DataWorks中进行数据建模、数据开发或使用运维中心周期性调度任务,需先将已创建的数据源或集群绑定至数据开发...

统计功能介绍

Q、为什么网站自带的统计数据与百度统计、站长统计数据不一致?A:本站统计是对您已有的多个域名访问的合并统计(管理模式的访问不再纳入统计),而第三方统计则根据绑定的域名进行统计,因此可能会导致本站统计结果与第三方统计不一致。Q...

探查数据

在列表上方的统计数据部分,查看每个字段的 唯一值个数。单击 或,查看 高价值数据 和 统计数据。可选,单击复选框,选择不同的字段。可选,单击,选择当前字段的排序方式。可选,单击,在当前字段中筛选出需要探查的具体数据。可以选择多...

质量规则模板类型

单表字段统计值一致性比较 用于对同一表两个字段进行统计数据的对比,如求和值、最大值等。单字段业务逻辑一致性比较 用于对同一表多个字段的复杂业务逻辑是否正确进行校验。两表字段值一致性比较 用于对不同表两个字段原值进行数据的对比...

质量规则模板类型

单表字段统计值一致性比较 用于对同一表两个字段进行统计数据的对比,如求和值、最大值等。单字段业务逻辑一致性比较 用于对同一表多个字段的复杂业务逻辑是否正确进行校验。两表字段值一致性比较 用于对不同表两个字段原值进行数据的对比...

pg_statistic

目录 pg_statistic 存储有关数据库内容的统计数据。其中的项由ANALYZE创建,查询规划器会使用这些数据来进行查询规划。所有的统计数据天然就是近似的,即使它刚刚被更新。通常对于数据表中一个已经被 ANALYZE 过的列,在本目录中会存在一个...

创建逻辑模型:应用表

应用表是面向具体业务场景时,用于组织相同时间周期、相同维度的多个原子指标、派生指标或统计粒度的统计数据,为后续的业务查询,OLAP分析,数据分发等提供基础。本文为您介绍如何创建应用表。前提条件 已创建数据分层。数据分层是将相同...

修饰词

修饰词是基于选择的数据域创建的,是对数据域中的数据不同维度的修饰,用来限定统计数据的业务范围。例如,统计上海区域生鲜门店的销售金额,上海区域和生鲜门店就是对业务范围的限定修饰。前提条件 已创建数据域,用于确定修饰词所属的...

创建逻辑模型:汇总表

汇总表用于组织一个数据域下相同时间周期、相同维度的多个派生指标的统计数据,为后续的业务查询,OLAP分析,数据分发等提供基础。本文为您介绍如何创建汇总表。前提条件 已创建数据分层。数据分层是将相同功能作用的表挂载至统一的数据层...

维度建模概述

汇总表 汇总表用于组织一个数据域下相同时间周期、相同维度的多个派生指标的统计数据,是对业务高度抽象后的梳理结果,为后续的业务查询,OLAP分析,数据分发等提供基础。更多汇总表的设计创建详情可参见 创建逻辑模型:汇总表。应用表 ...

统计信息

执行逻辑 在每次导入事务提交后,SelectDB 将记录本次导入事务更新的表行数用以估算当前已有表的统计数据的健康度(对于没有收集过统计数据的表,其健康度为0)。当表的健康度低于60(可通过参数 table_stats_health_threshold 调节)时,...

API概览

GetInstanceSqlOptimizeStatistic 获取自动SQL优化事件的统计数据 调用GetInstanceSqlOptimizeStatistic接口,获取指定时间段内自动SQL优化任务的统计数据,包括任务总数和最大收益等。自动空间优化 API 标题 API概述 ...

新建统计周期

统计周期即统计数据的时间范围,例如最近7天、最近30天等。本文为您介绍如何新建统计周期。前提条件 仅支持 智能研发版。若需使用,请升级当前版本。升级版本,请参见 升级。完成计算引擎类型设置,详情请参见 设置Dataphin实例的计算引擎...

新建统计周期

统计周期即统计数据的时间范围,例如最近7天、最近30天等。本文为您介绍如何新建统计周期。前提条件 仅支持 智能研发版。若需使用,当前租户还需开通智能研发模块。完成计算引擎类型设置,详情请参见 设置计算引擎为Hadoop 设置Dataphin...

事件中心

在 事件中心 页,单击 事件和建议 页签,查看选定时间范围内各类事件的统计数据和趋势图。说明 选择时间范围时,查询结束时间需晚于查询开始时间,且查询开始时间和查询结束时间的间隔不能超过7天。在 异常事件 页签,查看异常事件的统计...

全景视角

背景信息 为提高不同使用场景下的数据治理效率和质量,DataWorks为您提供以下视角:数据管理视角:在数据资产管理、数据安全加固、数据权限管理等数据管理场景下,建议您使用数据管理视角,关注查看数据管理过程中,表的统计数据、安全权限...

通过 HyperLoglog 实现高性能多维数据透视

按天统计数据 历史统计数据无更新,只有增量。需要定时将统计结果写入并合并至 t_result 结果表中。insert into t_result select t1.day,t2.brand,t1.groupid,t3.tag1,t3.tag2,t3.tag3,.count(1)as cnt,array_agg(uid)as uids,hll_add_agg...

关系图

逻辑模型-汇总表:用于组织一个数据域下相同时间周期、相同维度的多个派生指标的统计数据,是对业务高度抽象后的梳理结果,为后续的业务查询,OLAP分析,数据分发等提供基础。逻辑模型-应用表:面向具体业务场景,用于组织相同时间周期、...

数据总览

登录 DataWorks控制台,切换至目标地域后,单击左侧导航栏的 数据治理>数据地图,在右侧页面中单击 进入数据地图。在数据地图 首页,单击 元数据采集 后的 数据总览。在数据总览页,查看当前地域阿里云主账号下所有的引擎资源。以...

快速实现数据分类分级

在表详情面板,查看敏感信息的统计数据和表列表。相关文档 如果您需要接入RDS外其他类型的数据库,具体操作,请参见 接入数据库。如果您需要为DMS实现数据分类分级功能,具体操作,请参见 通过DSC实现DMS数据分类分级。

功能特性

识别任务说明 敏感数据检索 支持通过实例、所属区域、表名以及具体的字段类别进行筛选和统计数据分类分级、敏感数据识别结果;同时支持依据管理员划分的数据域来进行敏感数据的统计和展示,支持统计敏感实例数、库、表数量,支持查看敏感...

获取自动SQL优化事件的统计数据

调用GetInstanceSqlOptimizeStatistic接口,获取指定时间段内自动SQL优化任务的统计数据,包括任务总数和最大收益等。接口说明 使用该接口需满足以下前提条件:使用阿里云或 DAS 的 SDK 时,建议使用最新版本。使用 SDK 调用 DAS 服务时,...

2022年

2022-12-05 实例画像 2022年11月 引擎 功能名称 功能描述 发布时间 相关文档 RDS MySQL、PolarDB MySQL版 自动SQL优化 新增自动SQL优化的API接口,用于获取指定时间段内自动SQL优化任务的统计数据,包括任务总数和最大收益等。2022-11-29 ...

请求分析

数据库自治服务DAS(Database Autonomy Service)提供请求分析功能,包括查看全局慢日志和SQL全量请求分析。前提条件 数据库实例需要满足以下条件:全局慢日志功能,目前仅支持如下数据库实例:RDS MySQL MyBase MySQL PolarDB MySQL版 ...

数仓规划概述

数据集市 数据集市是对某个业务分类制定细化的业务主题,并通过主题域,基于不同分析视角对目标集市中的数据进行主题划分,最终面向业务应用统计分析数据。例如,运营平台数据集市。详情请参见 数据集市。主题域 主题域用于将数据集市按照...

核心概念

统计粒度 统计分析的对象或视角,用于圈定数据的统计范围,您也可以理解为聚合运算时的分组条件(类似于SQL中Group By的对象)。统计粒度也被称为粒度,是维度或维度的组合,是派生指标构建的核心元素,同时也可以唯一标识汇总逻辑表。例如...

逻辑结构说明

统计粒度 统计分析的对象或视角,用于圈定数据的统计范围,您也可以理解为聚合运算时的分组条件(类似于SQL中Group By的对象)。统计时效 派生指标的计算频次,即派生指标产出的时间间隔。派生指标 即基于原子指标、时间周期和维度,圈定...

数据表-数据概况

功能说明 在数据表详情的数据概况标签页,基于对元数据及存储数据的统计,为您提供了数据表更加详细的指标信息,比如表存储大小、表文件总数、DDL最后更新时间、数据最后更新时间、访问次数、分区存储大小,分区文件数,分区最后更新时间等...

原子指标

数据单位 基于原子指标的统计数据类型,选择合适的度量单位。例如,统计支付金额,则可选择 货币单位。说明 如果已创建的单位类型中没有适合业务使用的,则可进入度量单位页面创建,详情请参见 度量单位。是否去重 根据业务需求判断统计时...

库表结构优化

要做好库表结构设计和优化,用户通常需要关注以下信息:数据库引擎架构 用户需要了解数据库引擎的存储和计算架构特点,才能结合业务的数据分布特征与业务场景特征,进行数据建模,从而设计出符合引擎架构特点的数据表结构。SQL特征差异 ...

查看调度资源大盘

功能说明 调度资源大盘从 资源分配 和 资源消耗 两个视角为您提供Dataphin集群调度资源的统计分析,核心关注CPU和内存两个指标。此外,针对资源利用率较低可能造成资源浪费、或利用率过高可能产生内存溢出等风险的任务,通过待优化任务列表...

进入数据质量概览(新版)

数据质量概览为您展示当前工作空间下,需要重点关注的数据质量总览指标、实例运行后触发的质量规则校验状态的趋势及分布情况、TOP质量问题表及质量问题责任人、质量规则覆盖保障情况等,帮助质量负责人快速了解工作空间数据质量整体情况,...

日志报表

1小时(相对)大批量修改SQL的列表,包括:最早执行时间 最近执行时间 PolarDB-X 实例ID 数据库 表格 执行次数 平均更新行数 平均时长(秒)SQL 修改数据统计时间 日志报表页面的所有图表都是基于不同时间段(默认为过去1小时内的)的数据...

时间周期

时间周期是用来明确数据统计的时间范围或者时间窗口,例如近1天,近1自然周。用于在统计派生指标时,限定业务统计的时间范围。本文为您介绍如何创建时间周期。背景信息 时间周期与原子指标、修饰词,共同构成一个派生指标,用于体现企业某...

案例介绍

本案例以某公司的零售事业群为例,为您介绍在构建数据中台时,如何规划业务模型中的业务板块、项目、数据域和指标等,帮助您更好的理解Dataphin的核心概念。案例场景简介 某公司是一家横跨多个行业领域的大型企业,以零售商超起家,逐步...

主备方案介绍

A:存储的是数据D1和数据D2中时间戳更大的数据数据在LTS同步过程中不会改变数据原有的时间戳,一般情况下存储的是数据D2,但是由于主备实例不同可能存在时间戳毫秒级的时间差异造成数据D2的时间戳比数据D1的时间戳小,在这种情况下存储的...

应用场景

云原生数据仓库AnalyticDB MySQL版 为千万家企业级客户提供了数据处理ETL、实时在线分析、核心报表、大屏和监控能力,为广大商家和消费者提供稳定的离线和在线数据服务。本文介绍 云原生数据仓库AnalyticDB MySQL版 的五个使用场景:实时数...

OSS Foreign Table使用技巧

收集统计信息 OSS Foreign Table的数据实际存储在OSS上,AnalyticDB PostgreSQL版 默认不会自动收集数据的统计信息。在复杂场景下的查询SQL(例如多张表关联操作),如果不存在统计信息或统计信息过时,优化器可能会生成低效的查询计划。...

维度层(DIM)

例如,电商公司的商品维度可能有近百个维度属性,为下游的数据统计、分析、探查提供了良好的基础。尽可能多的给出包含一些富有意义的文字性描述。属性不应该是编码,而应该是真正的文字。在阿里巴巴维度建模中,通常是编码和文字同时存在,...

公共汇总粒度事实层(DWS)

区分统计周期:在表的命名上要能说明数据的统计周期,如_1d 表示最近1天,td 表示截至当天,nd 表示最近N天。公共汇总事实表规范 公共汇总事实表命名规范:dws_{业务板块缩写/pub}_{数据域缩写}_{数据粒度缩写}[_{自定义表命名标签缩写}]_{...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
数据传输服务 云数据库 RDS 云数据库 Redis 版 数据库备份 DBS 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用