确定需求

举例:数据分析师需要了解A公司电商业务中最近1厨具类目的成交金额。当获知这个需求后,您需要分析:根据什么(维度)汇总、汇总什么(原子指标)、汇总的范围有多大(业务范围即业务限定,时间范围即统计周期)。例如,类目是统计粒度...

资产安全概述

在电商领域中,某些特殊场景下需要显示真实销售额用于宣传,您可以开启将某个用户设置在脱敏白名单中及设定有效的时间段,这样就可以看到某的销售额数据。功能优势 内置资源多:Dataphin内置了对数据的分级分类、敏感数据识别规则及脱敏...

资产安全概述

在电商领域中,某些特殊场景下需要显示真实销售额用于宣传,您可以开启将某个用户设置在脱敏白名单中及设定有效的时间段,这样就可以看到某的销售额数据。功能优势 内置资源多:Dataphin内置了对数据的分级分类、敏感数据识别规则及脱敏...

Dataphin免费试用申请

说明 试用到期之后,试用实例的数据会继续为您保留14,14后实例释放并清空相关数据。若您希望保留部分试用数据,可以在实例释放前选择 立即购买。免费试用申请说明 当前仅支持使用主账号登录申请,或使用其下属子账号登录代替主账号...

Dataphin智能数据建设与治理试用服务协议

协议版本生效日期:2022年11月22日 本协议是 Dataphin智能数据建设与治理(简称“Dataphin”)与您就 Dataphin 提供的免费试用服务的相关事项所订立的有效合约。1.免费试用内容说明 1.1 免费试用次数:每个 UID 仅可开通 1 次免费试用。1.2...

规范定义最佳实践

当数据的业务含义存在较大差异时,您可以创建不同的数据板块,让各成员独立管理不同的业务,后续数据仓库的建设将按照数据板块进行划分。在Dataphin中,项目可以归属至数据板块以实现规范建模功能,同一个数据板块中可能包含多个不同的项目...

规范定义最佳实践

当数据的业务含义存在较大差异时,您可以创建不同的数据板块,让各成员独立管理不同的业务,后续数据仓库的建设将按照数据板块进行划分。在Dataphin中,项目可以归属至数据板块以实现规范建模功能,同一个数据板块中可能包含多个不同的项目...

使用限制

计算引擎类型 选择设置 计算引擎设置需要提前采购计算引擎MaxCompute资源,系统以此来支持相关数据的建设工作。需要选择计算引擎类型(目前仅开放MaxCompute计算类型),配置计算引擎所在的集群,例如Endpoint等信息。系统以此来支持该计算...

明确统计指标

例如,如果支付金额为原子指标,则最近7买家支付金额(统计粒度为买家、时间周期为最近7)和最近7买家支付宝支付金额(统计粒度为买家、业务限定为支付宝支付、时间周期为最近7)都可以作为派生指标。派生指标唯一归属于一个原子...

开通Dataphin

Dataphin实例到期停机且在14的保留期内时,仅支持续费操作。购买Dataphin实例 Dataphin提供了多种版本和功能的组合,以适配不同场景、不同数据体量客户的诉求,支持选择 智能研发版(离线&实时)、基础研发版(离线&实时)和 敏捷研发版...

数仓构建流程

本文为您介绍如何基于阿里巴巴OneData方法论最佳实践,使用Dataphin助力企业数据中台的建设与管理,快速构建标准、规范的数据仓库。数仓构建流程 下图为使用Dataphin构建数据仓库的基本流程。基本概念 在正式学习本教程之前,您需要了解...

租户设置

数据建设与治理 开启后,可勾选目标租户所负责的功能模块。数据处理单元:设置数据处理单元配置数。数据处理单元配额需大于0,但不能超过剩余处理单元。规则配额:包括域内质量规则和全域质量规则,统计已开启监控的质量规则数。说明 租户...

创建衍生原子指标

例如,最近7支付金额,是否需要基于最近1支付金额进行累加计算。同时需要基于已提交的原子指标定义计算表达式,例如 crt_amt/usr_cnt 其中crt_amt为下单金额对应的已提交原子指标,usr_cnt 为用户数对应的已提交原子指标,以计算人均下...

创建衍生原子指标

例如,最近7支付金额,是否需要基于最近1支付金额进行累加计算。同时需要基于已提交的原子指标定义计算表达式,例如 crt_amt/usr_cnt 其中crt_amt为下单金额对应的已提交原子指标,usr_cnt 为用户数对应的已提交原子指标,以计算人均下...

查看并管理分析平台表

如果您需要重新筛选,则可单击 重置,即可快速清空所有筛选条件,恢复系统默认。② 分析平台表列表 分析平台表列表为您展示当前已创建的分析平台表,包括表名称、创建时间、最近更新时间及支持的操作。支持的操作包括复制select语句、查询...

查看并管理分析平台表

如果您需要重新筛选,则可单击 重置,即可快速清空所有筛选条件,恢复系统默认。② 分析平台表列表 分析平台表列表为您展示当前已创建的分析平台表,包括表名称、创建时间、最近更新时间及支持的操作。支持的操作包括复制select语句、查询...

准备数据源和计算源

在使用Dataphin前,您需要选择符合业务场景需求的数据库或数据仓库作为数据源,用于读取原始数据和写入数据建设过程中的数据;同时您需要准备MaxCompute项目、Flink项目作为Dataphin的计算源,为数据的研发提供计算资源。准备数据源 ...

准备数据源和计算源

在使用Dataphin前,您需要选择符合业务场景需求的数据库或数据仓库作为数据源,用于读取原始数据和写入数据建设过程中的数据;同时您需要准备MaxCompute项目、Flink项目作为Dataphin的计算源,为数据的研发提供计算资源。准备数据源 ...

离线数仓构建流程概述

步骤一:准备工作 规划数仓 数仓规划是数据建设中的蓝图,在您开始数据开发前,需要完成数据仓库的规划,数仓规划配置包括:创建数据板块和主题域、计算源、数据源、项目及项目中的成员。步骤二:规划数仓 数据集成 将创建好的数据源集成至...

离线数仓构建流程概述

步骤一:准备工作 规划数仓 数仓规划是数据建设中的蓝图,在您开始数据开发前,需要完成数据仓库的规划,数仓规划配置包括:创建数据板块和主题域、计算源、数据源、项目及项目中的成员。步骤二:规划数仓 数据集成 将创建好的数据源集成至...

配置离线管道调度依赖

添加本节点上周期 即该节点任务的调度需要依赖于本节点上一周期(前1或前n小时)运行成功。添加依赖 若 自动解析 无法解析出调度依赖关系或 自动解析 生成的上游依赖配置与实际应用不符时,您可手动单击+添加依赖 添加节点的 上游依赖。...

创建指标映射标签

动态标签:需要随时间变化动态更新来保证标签有效性,如最近7下单金额等标签。技术属性 参数 描述 标签更新方式 支持 周期更新 和 手动更新 方式。周期更新:在一定时间的间隔内自动更新标签。手动更新:通过手动操作方式更新标签。具体...

创建行为统计标签

动态标签:需要随时间变化动态更新来保证标签有效性,如最近7下单金额等标签。标签描述 填写标签的简单描述信息,1000字符以内。技术属性 参数 描述 标签code 标签code是全局的唯一标识。例如,创建的服务中存在相同名称的标签时,可帮助...

创建行为偏好标签

动态标签:需要随时间变化动态更新来保证标签有效性,如最近7下单金额等标签。标签描述 填写标签的简单描述信息,1000字符以内。技术属性 参数 描述 标签code 标签code是全局的唯一标识。例如,创建的服务中存在相同名称的标签时,可帮助...

定义维度与构建总线矩阵

根据阿里巴巴OneData方法论,明确每个主题域中有哪些业务过程后,您需要开始定义维度,并基于维度构建总线矩阵。定义维度 在划分主题域、构建总线矩阵时,需要结合对业务过程的分析定义维度。本教程中,以A电商公司的营销业务板块为例,在...

申请、交还应用权限

如果您需要消费他人生成的API,则需要申请该API所在的应用权限。前提条件 已购买数据服务增值服务,详情请参见 开通Dataphin。申请应用权限 在Dataphin首页,单击顶部菜单栏的 管理中心。按照下图指引,进入 申请应用权限 页面。在 应用...

维度和事实逻辑表物化配置

如果您当前访问的是 Dev 或 Basic(非 Data_distill)项目,且项目空间为您的数据开发空间,则不需要选择项目空间。在 物化配置 面板,配置参数。区域 描述 分区与生命周期 派生指标分区:仅周期快照事实表、累积快照事实表和普通维度逻辑...

数仓规划概述

数仓规划是基于Dataphin建设数据中台的第一步,同时也是数据体系的顶层设计中至关重要的一步。在您开始数据开发前,需要完成数据仓库的规划,包括定义数据板块、项目、数据源、计算源和统计周期。功能介绍 数仓规划包括逻辑空间与物理空间...

维度和事实逻辑表物化配置

如果您当前访问的是 Dev 或 Basic(非 Data_distill)项目,且项目空间为您的数据开发空间,则不需要选择项目空间。在 物化配置 面板,配置参数。区域 描述 分区与生命周期 派生指标分区:仅周期快照事实表、累积快照事实表和普通维度逻辑...

数仓规划概述

数仓规划是基于Dataphin建设数据中台的第一步,同时也是数据体系的顶层设计中至关重要的一步。在您开始数据开发前,需要完成数据仓库的规划,包括定义数据板块、项目、数据源、计算源和统计周期。功能介绍 数仓规划包括逻辑空间与物理空间...

管理API权限

有效期 系统支持选择30,90,180和长期,您也可以选中自定义后,选择截至日期。申请原因 填写申请原因。完成参数配置后,单击 提交。交还API权限 在 API权限 页签,单击 操作 列下的 交还。在 是否进行交还该权限 对话框中,单击 ...

治理分析

待治理项 项目中需要治理但还未治理的事项数量。操作 操作 下为您提供查看数据趋势和健康分排行榜的入口:单击 操作 列下的 图标,查看 近7 或 近30 数据趋势。将鼠标悬浮在数据趋势曲线上,可以查看某日的健康分和存储消耗。单击 操作...

治理分析

待治理项 项目中需要治理但还未治理的事项数量。操作 操作 下为您提供查看数据趋势和健康分排行榜的入口:单击 操作 列下的 图标,查看 近7 或 近30 数据趋势。将鼠标悬浮在数据趋势曲线上,可以查看某日的健康分和存储消耗。单击 操作...

数据源管理概述

在使用Dataphin前,您可将需要引入Dataphin的数据源接入到Dataphin中,已接入的数据源可用于读取原始数据和写入数据建设过程中的数据。Dataphin具备丰富的数据源类型接入,支持对接如MaxCompute、Hive等数据仓库,也支持对接企业传统数据库...

数据源管理概述

在使用Dataphin前,您可将需要引入Dataphin的数据源接入到Dataphin中,已接入的数据源可用于读取原始数据和写入数据建设过程中的数据。Dataphin具备丰富的数据源类型接入,支持对接如MaxCompute、Hive等数据仓库,也支持对接企业传统数据库...

新建基线监控

基线一旦建立后,会按照调度依赖关系自动识别圈定需要被纳入监控范围的任务,并按照设定的预警时间和承诺时间,在被保障对象数据可能延迟产出的情况下发送基线告警。基线范围内的任务可设置更高优先级以优先分配资源。本文为您介绍如何进行...

新建基线监控

基线一旦建立后,会按照调度依赖关系自动识别圈定需要被纳入监控范围的任务,并按照设定的预警时间和承诺时间,在被保障对象数据可能延迟产出的情况下发送基线告警。基线范围内的任务可设置更高优先级以优先分配资源。本文为您介绍如何进行...

查询数据代码说明

ds='${bizdate}':定义查询的分区日期,${bizdate} 为Dataphin内置的日期时间全局变量,默认格式为yyyyMMdd,即当前日期的前一。Dataphin也支持输入具体的日期,例如 ds='20210223'。重要 如果关闭了使用 select*语法查询汇总逻辑表的...

创建业务限定

数据时效 您可以根据业务情况为业务限定选择数据时效,数据时效包括 、小时 和 分钟。配置完成后,单击 保存并提交,提交业务限定。后续步骤 如果项目的模式为Dev-Prod,则您需要发布业务限定至生产环境。更多信息,请参见 管理发布任务...

查询数据代码说明

ds='${bizdate}':定义查询的分区日期,${bizdate} 为Dataphin内置的日期时间全局变量,默认格式为yyyyMMdd,即当前日期的前一。Dataphin也支持输入具体的日期,例如 ds='20210223'。重要 如果关闭了使用 select*语法查询汇总逻辑表的...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
商标服务 数字证书管理服务(原SSL证书) 云虚拟主机 域名 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用