什么是EMR Serverless Spark

一站式的开发体验 提供作业开发、调试、发布、调度等一站式数据开发体验。内置版本管理、开发与生产隔离,满足企业级开发与发布标准。Serverless的资源平台 开箱即用,无需手动管理和运维云基础设施。弹性伸缩,秒级资源弹性与供给。按量...

应用场景

该方案优势如下:全托管免运维 弹性扩展能力 开放数据湖架构 一站式的数据开发平台 数据查询与分析场景 在传统数据平台下,数据仓库工程师和数据分析师通常面临两个不同的环境,甚至使用不同的引擎和语法,导致数据指标和算子行为存在差异...

典型场景

基于湖构建数据平台,支持BI、挖掘等业务 对象存储OSS可以作为湖存储,DLA基于OSS构建一站式的数据平台。具体包括构建数据湖、数据ETL、交互式查询、机器学习等功能。构建数据湖 实时数据湖:支持DB的CDC与消息数据(如Kafka)入湖,构建...

MaxCompute表数据

查看数据统计信息和分布情况 查看表基本信息 您可以在表详情页左侧的 表基础信息 区域查看表的 浏览次数、读取次数、收藏次数 等信息。图标表示当前表为DataWorks智能数据建模生成的模型表。如果您需要使用智能建模功能,请参考 概述。浏览...

查看资源用量大盘

资源用量大盘为您展示当前租户下已使用的数据处理单元总量和按任务类型分别统计的消耗趋势以及按项目粒度统计的消耗增量排行,帮助您了解数据处理单元的消耗情况以及时调整资源规格配置。本文为您介绍如何查看资源用量大盘。前提条件 需...

添加数据

DataV数据集支持多种数据源的接入,如数据库、excel表格文件等,通过对数据的结构化存储和元数据的汇集整理,提供高效实用的数据建模能力,可用的算子包括常见的数据聚合函数、按不同时间粒度划分、地理信息处理等。本文为您介绍如何在...

DataV6.0数据集介绍

介绍 DataV数据集支持多种数据源的接入,如数据库、Excel表格文件等,通过对数据的结构化存储和元数据的汇集整理,提供高效实用的数据建模能力,可用的算子包括常见的数据聚合函数、按不同时间粒度划分和地理信息处理等。创建 登录 DataV...

通过Quick BI连接StarRocks实例

背景信息 Quick BI是由阿里云提供的一款全场景数据消费式的BI平台,无缝对接各类云上数据库和自建数据库,大幅提升数据分析和报表开发效率。您只需在Quick BI中添加StarRocks数据源并成功连接,然后可以在Quick BI上进行数据的分析和展示。...

升级数据统计

系统(应用)升级数据统计模块展示了以版本为维度的升级过程中各项数据的统计图表。导航:系统(应用)升级数据统计 升级结果查询 该图表显示了指定版本的升级安装成功和失败的设备数量随时间变化的曲线。图表分为“累计”和“增量”两张图...

播放数据统计常见问题

视频的播放数据统计存在无法避免的合理范围误差,其误差主要来自两个方面:阿里云官方播放器的日志采集间隔是30s,对于用户在视频播放页(而非播放器内)意外中断播放的行为,目前难以合理捕获,因此视频播放的时长统计会存在最大不超过30s...

自定义监控概览

自定义监控提供数据统计的监控功能类型,用于配置个性化的监控项。进入实时监控产品控制台后,在左侧导航栏中点击 自定义监控>+<新建>>新建监控产品 按钮。在 新建监控产品 窗口中,根据业务需要从 常用 或 高级 标签页中选择监控项并开始...

数据集成概述

数据集成是基于Dataphin构建的简单高效的数据同步平台,致力于提供具有强大的数据预处理能力、丰富的异构数据源之间数据高速稳定的同步能力。背景信息 面对各行各业对大数据的应用,数据集成会有很多的诉求,包括能够简单高效的配置大量...

什么是DataWorks

产品架构 DataWorks十多年沉淀数百项核心能力,通过 智能数据建模、全域数据集成、高效数据生产、主动数据治理、全面数据安全、数据分析服务六大全链路数据治理的能力,帮助企业治理内部不断上涨的“数据悬河”,释放企业的数据生产力。...

什么是数据库网关

数据管理DMS 数据管理DMS(Data Management Service)是一款支撑数据全生命周期的一站式数据管理平台。DMS提供全域数据资产管理、数据治理、数据库设计开发、数据集成、数据开发和数据消费等功能,致力于帮助企业高效、安全地挖掘数据价值...

维度建模概述

应用层:基于实际应用需求,获取公共层加工整合后的数据,面向具体应用场景或指定产品进行的个性化数据统计。该层级仅支持使用 业务分类 视角管理模型表。未分层:如果已创建的模型表未划分层级归属(即 公共层 或 应用层),则该表会被...

查看异常统计

如果您需要查看租户粒度下的全局异常数据统计概况,则单击 图标进行切换查看。实时实例页面展示当前时间的异常统计信息排行。离线实例页面默认展示运行日期为当天的统计数据。同时,您可以选择查看最近7天内的统计数据。鼠标悬停至 图标,...

查看异常统计

如果您需要查看租户粒度下的全局异常数据统计概况,则单击 图标进行切换查看。实时实例页面展示当前时间的异常统计信息排行。离线实例页面默认展示运行日期为当天的统计数据。同时,您可以选择查看最近7天内的统计数据。鼠标悬停至 图标,...

数据表-数据概况

功能说明 在数据表详情的数据概况标签页,基于对元数据及存储数据统计,为您提供了数据表更加详细的指标信息,比如表存储大小、表文件总数、DDL最后更新时间、数据最后更新时间、访问次数、分区存储大小,分区文件数,分区最后更新时间等...

什么是数据库网关

数据管理DMS 数据管理DMS(Data Management Service)是一款支撑数据全生命周期的一站式数据管理平台。DMS提供全域数据资产管理、数据治理、数据库设计开发、数据集成、数据开发和数据消费等功能,致力于帮助企业高效、安全地挖掘数据价值...

时间周期

时间周期是用来明确数据统计的时间范围或者时间窗口,例如近1天,近1自然周。用于在统计派生指标时,限定业务统计的时间范围。本文为您介绍如何创建时间周期。背景信息 时间周期与原子指标、修饰词,共同构成一个派生指标,用于体现企业某...

数据总览

登录 DataWorks控制台,切换至目标地域后,单击左侧导航栏的 数据治理>数据地图,在右侧页面中单击 进入数据地图。在数据地图 首页,单击 元数据采集 后的 数据总览。在数据总览页,查看当前地域阿里云主账号下所有的引擎资源。以...

产品优势

数据管理DMS是一款支撑数据全生命周期的一站式数据管理平台,本文介绍数据管理DMS的产品优势。实现全域数据资产管理 支持全域数据资产:关系型数据库:MySQL、SQL Server、PostgreSQL、PolarDB MySQL版、PolarDB PostgreSQL版(兼容Oracle...

数据集成概述

数据集成是基于Dataphin构建的简单高效的数据同步平台,致力于提供具有强大的数据预处理能力、丰富的异构数据源之间数据高速稳定的同步能力。背景信息 面对各行各业对大数据的应用,数据集成会有很多的诉求,包括能够简单高效的配置大量...

Paimon概述

目前阿里云开源大数据平台E-MapReduce常见的计算引擎(例如Flink、Spark、Hive或Trino)都与Paimon有着较为完善的集成度。您可以借助Apache Paimon快速地在HDFS或者云端OSS上构建自己的数据湖存储服务,并接入上述计算引擎实现数据湖的分析...

探查数据

本文为您介绍可视分析创作间中数据集的探查过程。前提条件 已通过上传或者连接数据库完成数据集的创建。操作步骤 输入账户和密码,登录 可视分析创作间。在左侧导航栏,单击分析图标,进入 分析 页面。选择需要探查的数据集,单击 探索,...

多值数据写入

时序多值模型 多值的模型是针对数据源建模,我们每一行数据针对的是一个数据源,它的被测量的多个指标在同一行上,所以每一个数据源,数据的来源在每一个时间点上都有一行,这就是多值的模型。比如某个机器的cpu,mem和load指标。每次是...

逻辑结构说明

统计粒度 统计分析的对象或视角,用于圈定数据统计范围,您也可以理解为聚合运算时的分组条件(类似于SQL中Group By的对象)。统计时效 派生指标的计算频次,即派生指标产出的时间间隔。派生指标 即基于原子指标、时间周期和维度,圈定...

全景视角

背景信息 为提高不同使用场景下的数据治理效率和质量,DataWorks为您提供以下视角:数据管理视角:在数据资产管理、数据安全加固、数据权限管理等数据管理场景下,建议您使用数据管理视角,关注查看数据管理过程中,表的统计数据、安全权限...

DataWorks模块使用说明

使用流程与主要子模块 DataWorks为您提供从端到端的一站式数据开发治理平台,数据处理流程主要包括以下几个阶段。各个阶段DataWorks的主要子模块如下。数据集成 子模块:数据集成 功能说明:数据集成是稳定高效、弹性伸缩的数据同步平台,...

产品简介

服务内容 服务大类 服务类型 服务内容 大数据专家咨询服务 大数据技术架构方案咨询 为客户提供构建和优化大数据体系的技术架构方案咨询服务,覆盖离线/实时数仓体系建设管理、数仓建模管理,数据开发管理,数据安全管理、数据质量管理、...

系统函数分类

数据探索自身预置了诸多函数,用于常见的数据处理需求。这些预置的系统函数具有跨引擎的特点,在离线、实时、在线3种模型的不同引擎中具有相同的行为和使用方式。本文为您介绍数据探索提供的系统函数类型及函数使用相关说明。函数分类 数据...

基于Delta lake的一站式数据湖构建与分析实战

数据湖作为一个集中化的数据存储仓库,支持的数据类型具有多样性,包括结构化、半结构化以及非结构化的数据数据来源上包含数据数据、binglog 增量数据、日志数据以及已有数仓上的存量数据等。数据湖能够将这些不同来源、不同格式的数据...

配置数据质量监控

1、配置分区表达 数据质量通过分区表达式来确定数据质量校验的表分区数据。此步骤中,您需要监控ods_raw_log_d表的 dt=$[yyyymmdd-1]表达式所匹配的分区数据是否符合预期,即在ods_raw_log_d表每次监控规则执行时,监控其业务时间对应...

事件中心

数据库日常运维中,您可以通过查看数据库实例中计划执行、正在执行和已执行完成的性能事件(例如异常事件、优化事件、弹性伸缩事件等),及时且全面地了解数据库的性能问题及相关的运维操作。本文介绍如何通过数据库自治服务DAS的性能...

DataWorks V2.0

数据服务(新增)数据服务 提供了快速将数据表生成数据API的能力,支持您将现有的API快速注册到数据服务平台以统一管理和发布。同时,数据服务已与API网关(API Gateway)打通,支持将API服务一键发布至API网关。数据服务与API网关一道为您...

创建逻辑模型:汇总表

汇总表用于组织一个数据域下相同时间周期、相同维度的多个派生指标的统计数据,为后续的业务查询,OLAP分析,数据分发等提供基础。本文为您介绍如何创建汇总表。前提条件 已创建数据分层。数据分层是将相同功能作用的表挂载至统一的数据层...

概述

数据内容安全管理 安全中心提供的数据分级分类、敏感数据识别、数据访问审计、数据源可追溯等功能,在处理业务流程的过程中,能够快速及时识别存在安全隐患的数据,保障了数据内容的安全可靠,详情请参见 数据保护伞。安全诊断的最佳实践 ...

创建逻辑模型:应用表

应用表是面向具体业务场景时,用于组织相同时间周期、相同维度的多个原子指标、派生指标或统计粒度的统计数据,为后续的业务查询,OLAP分析,数据分发等提供基础。本文为您介绍如何创建应用表。前提条件 已创建数据分层。数据分层是将相同...

通过 HyperLoglog 实现高性能多维数据透视

本文通过电商类数据透视示例,介绍了使用 AnalyticDB PostgreSQL 通过HLL预计算,实现毫秒级多维数据透视的方法。关于HyperLogLog的用法,请参考 使用HLL。实践总结 本文介绍的操作方法,涉及以下最佳实践。如您已了解操作方法,可以直接...

公共汇总粒度事实层(DWS)

公共汇总事实表规范 公共汇总事实表命名规范:dws_{业务板块缩写/pub}_{数据域缩写}_{数据粒度缩写}[_{自定义表命名标签缩写}]_{统计时间周期范围缩写}。关于统计实际周期范围缩写,缺省情况下,离线计算应该包括最近一天(_1d),最近N天...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
云数据库 Redis 版 云数据库 RDS 数据库备份 DBS 弹性公网IP 短信服务 人工智能平台 PAI
新人特惠 爆款特惠 最新活动 免费试用