举例:数据分析师需要了解A公司电商业务中最近1天厨具类目的成交金额。当获知这个需求后,您需要分析:根据什么(维度)汇总、汇总什么(原子指标)、汇总的范围有多大(业务范围即业务限定,时间范围即统计周期)。例如,类目是统计粒度...
在电商领域中,某些特殊场景下需要显示真实销售额用于宣传,您可以开启将某个用户设置在脱敏白名单中及设定有效的时间段,这样就可以看到某天的销售额数据。功能优势 内置资源多:Dataphin内置了对数据的分级分类、敏感数据识别规则及脱敏...
在电商领域中,某些特殊场景下需要显示真实销售额用于宣传,您可以开启将某个用户设置在脱敏白名单中及设定有效的时间段,这样就可以看到某天的销售额数据。功能优势 内置资源多:Dataphin内置了对数据的分级分类、敏感数据识别规则及脱敏...
说明 试用到期之后,试用实例的数据会继续为您保留14天,14天后实例释放并清空相关数据。若您希望保留部分试用数据,可以在实例释放前选择 立即购买。免费试用申请说明 当前仅支持使用主账号登录申请,或使用其下属子账号登录代替主账号...
协议版本生效日期:2022年11月22日 本协议是 Dataphin智能数据建设与治理(简称“Dataphin”)与您就 Dataphin 提供的免费试用服务的相关事项所订立的有效合约。1.免费试用内容说明 1.1 免费试用次数:每个 UID 仅可开通 1 次免费试用。1.2...
当数据的业务含义存在较大差异时,您可以创建不同的数据板块,让各成员独立管理不同的业务,后续数据仓库的建设将按照数据板块进行划分。在Dataphin中,项目可以归属至数据板块以实现规范建模功能,同一个数据板块中可能包含多个不同的项目...
当数据的业务含义存在较大差异时,您可以创建不同的数据板块,让各成员独立管理不同的业务,后续数据仓库的建设将按照数据板块进行划分。在Dataphin中,项目可以归属至数据板块以实现规范建模功能,同一个数据板块中可能包含多个不同的项目...
计算引擎类型 选择设置 计算引擎设置需要提前采购计算引擎MaxCompute资源,系统以此来支持相关数据的建设工作。需要选择计算引擎类型(目前仅开放MaxCompute计算类型),配置计算引擎所在的集群,例如Endpoint等信息。系统以此来支持该计算...
例如,如果支付金额为原子指标,则最近7天买家支付金额(统计粒度为买家、时间周期为最近7天)和最近7天买家支付宝支付金额(统计粒度为买家、业务限定为支付宝支付、时间周期为最近7天)都可以作为派生指标。派生指标唯一归属于一个原子...
Dataphin实例到期停机且在14天的保留期内时,仅支持续费操作。购买Dataphin实例 Dataphin提供了多种版本和功能的组合,以适配不同场景、不同数据体量客户的诉求,支持选择 智能研发版(离线&实时)、基础研发版(离线&实时)和 敏捷研发版...
本文为您介绍如何基于阿里巴巴OneData方法论最佳实践,使用Dataphin助力企业数据中台的建设与管理,快速构建标准、规范的数据仓库。数仓构建流程 下图为使用Dataphin构建数据仓库的基本流程。基本概念 在正式学习本教程之前,您需要了解...
数据建设与治理 开启后,可勾选目标租户所负责的功能模块。数据处理单元:设置数据处理单元配置数。数据处理单元配额需大于0,但不能超过剩余处理单元。规则配额:包括域内质量规则和全域质量规则,统计已开启监控的质量规则数。说明 租户...
例如,最近7天支付金额,是否需要基于最近1天支付金额进行累加计算。同时需要基于已提交的原子指标定义计算表达式,例如 crt_amt/usr_cnt 其中crt_amt为下单金额对应的已提交原子指标,usr_cnt 为用户数对应的已提交原子指标,以计算人均下...
例如,最近7天支付金额,是否需要基于最近1天支付金额进行累加计算。同时需要基于已提交的原子指标定义计算表达式,例如 crt_amt/usr_cnt 其中crt_amt为下单金额对应的已提交原子指标,usr_cnt 为用户数对应的已提交原子指标,以计算人均下...
如果您需要重新筛选,则可单击 重置,即可快速清空所有筛选条件,恢复系统默认。② 分析平台表列表 分析平台表列表为您展示当前已创建的分析平台表,包括表名称、创建时间、最近更新时间及支持的操作。支持的操作包括复制select语句、查询...
如果您需要重新筛选,则可单击 重置,即可快速清空所有筛选条件,恢复系统默认。② 分析平台表列表 分析平台表列表为您展示当前已创建的分析平台表,包括表名称、创建时间、最近更新时间及支持的操作。支持的操作包括复制select语句、查询...
在使用Dataphin前,您需要选择符合业务场景需求的数据库或数据仓库作为数据源,用于读取原始数据和写入数据建设过程中的数据;同时您需要准备MaxCompute项目、Flink项目作为Dataphin的计算源,为数据的研发提供计算资源。准备数据源 ...
在使用Dataphin前,您需要选择符合业务场景需求的数据库或数据仓库作为数据源,用于读取原始数据和写入数据建设过程中的数据;同时您需要准备MaxCompute项目、Flink项目作为Dataphin的计算源,为数据的研发提供计算资源。准备数据源 ...
步骤一:准备工作 规划数仓 数仓规划是数据建设中的蓝图,在您开始数据开发前,需要完成数据仓库的规划,数仓规划配置包括:创建数据板块和主题域、计算源、数据源、项目及项目中的成员。步骤二:规划数仓 数据集成 将创建好的数据源集成至...
步骤一:准备工作 规划数仓 数仓规划是数据建设中的蓝图,在您开始数据开发前,需要完成数据仓库的规划,数仓规划配置包括:创建数据板块和主题域、计算源、数据源、项目及项目中的成员。步骤二:规划数仓 数据集成 将创建好的数据源集成至...
添加本节点上周期 即该节点任务的调度需要依赖于本节点上一周期(前1天或前n小时)运行成功。添加依赖 若 自动解析 无法解析出调度依赖关系或 自动解析 生成的上游依赖配置与实际应用不符时,您可手动单击+添加依赖 添加节点的 上游依赖。...
动态标签:需要随时间变化动态更新来保证标签有效性,如最近7天下单金额等标签。技术属性 参数 描述 标签更新方式 支持 周期更新 和 手动更新 方式。周期更新:在一定时间的间隔内自动更新标签。手动更新:通过手动操作方式更新标签。具体...
动态标签:需要随时间变化动态更新来保证标签有效性,如最近7天下单金额等标签。标签描述 填写标签的简单描述信息,1000字符以内。技术属性 参数 描述 标签code 标签code是全局的唯一标识。例如,创建的服务中存在相同名称的标签时,可帮助...
动态标签:需要随时间变化动态更新来保证标签有效性,如最近7天下单金额等标签。标签描述 填写标签的简单描述信息,1000字符以内。技术属性 参数 描述 标签code 标签code是全局的唯一标识。例如,创建的服务中存在相同名称的标签时,可帮助...
根据阿里巴巴OneData方法论,明确每个主题域中有哪些业务过程后,您需要开始定义维度,并基于维度构建总线矩阵。定义维度 在划分主题域、构建总线矩阵时,需要结合对业务过程的分析定义维度。本教程中,以A电商公司的营销业务板块为例,在...
如果您需要消费他人生成的API,则需要申请该API所在的应用权限。前提条件 已购买数据服务增值服务,详情请参见 开通Dataphin。申请应用权限 在Dataphin首页,单击顶部菜单栏的 管理中心。按照下图指引,进入 申请应用权限 页面。在 应用...
如果您当前访问的是 Dev 或 Basic(非 Data_distill)项目,且项目空间为您的数据开发空间,则不需要选择项目空间。在 物化配置 面板,配置参数。区域 描述 分区与生命周期 派生指标分区:仅周期快照事实表、累积快照事实表和普通维度逻辑...
数仓规划是基于Dataphin建设数据中台的第一步,同时也是数据体系的顶层设计中至关重要的一步。在您开始数据开发前,需要完成数据仓库的规划,包括定义数据板块、项目、数据源、计算源和统计周期。功能介绍 数仓规划包括逻辑空间与物理空间...
如果您当前访问的是 Dev 或 Basic(非 Data_distill)项目,且项目空间为您的数据开发空间,则不需要选择项目空间。在 物化配置 面板,配置参数。区域 描述 分区与生命周期 派生指标分区:仅周期快照事实表、累积快照事实表和普通维度逻辑...
数仓规划是基于Dataphin建设数据中台的第一步,同时也是数据体系的顶层设计中至关重要的一步。在您开始数据开发前,需要完成数据仓库的规划,包括定义数据板块、项目、数据源、计算源和统计周期。功能介绍 数仓规划包括逻辑空间与物理空间...
有效期 系统支持选择30天,90天,180天和长期,您也可以选中自定义后,选择截至日期。申请原因 填写申请原因。完成参数配置后,单击 提交。交还API权限 在 API权限 页签,单击 操作 列下的 交还。在 是否进行交还该权限 对话框中,单击 ...
待治理项 项目中需要治理但还未治理的事项数量。操作 操作 下为您提供查看数据趋势和健康分排行榜的入口:单击 操作 列下的 图标,查看 近7天 或 近30天 数据趋势。将鼠标悬浮在数据趋势曲线上,可以查看某日的健康分和存储消耗。单击 操作...
待治理项 项目中需要治理但还未治理的事项数量。操作 操作 下为您提供查看数据趋势和健康分排行榜的入口:单击 操作 列下的 图标,查看 近7天 或 近30天 数据趋势。将鼠标悬浮在数据趋势曲线上,可以查看某日的健康分和存储消耗。单击 操作...
在使用Dataphin前,您可将需要引入Dataphin的数据源接入到Dataphin中,已接入的数据源可用于读取原始数据和写入数据建设过程中的数据。Dataphin具备丰富的数据源类型接入,支持对接如MaxCompute、Hive等数据仓库,也支持对接企业传统数据库...
在使用Dataphin前,您可将需要引入Dataphin的数据源接入到Dataphin中,已接入的数据源可用于读取原始数据和写入数据建设过程中的数据。Dataphin具备丰富的数据源类型接入,支持对接如MaxCompute、Hive等数据仓库,也支持对接企业传统数据库...
基线一旦建立后,会按照调度依赖关系自动识别圈定需要被纳入监控范围的任务,并按照设定的预警时间和承诺时间,在被保障对象数据可能延迟产出的情况下发送基线告警。基线范围内的任务可设置更高优先级以优先分配资源。本文为您介绍如何进行...
基线一旦建立后,会按照调度依赖关系自动识别圈定需要被纳入监控范围的任务,并按照设定的预警时间和承诺时间,在被保障对象数据可能延迟产出的情况下发送基线告警。基线范围内的任务可设置更高优先级以优先分配资源。本文为您介绍如何进行...
ds='${bizdate}':定义查询的分区日期,${bizdate} 为Dataphin内置的日期时间全局变量,默认格式为yyyyMMdd,即当前日期的前一天。Dataphin也支持输入具体的日期,例如 ds='20210223'。重要 如果关闭了使用 select*语法查询汇总逻辑表的...
数据时效 您可以根据业务情况为业务限定选择数据时效,数据时效包括 天、小时 和 分钟。配置完成后,单击 保存并提交,提交业务限定。后续步骤 如果项目的模式为Dev-Prod,则您需要发布业务限定至生产环境。更多信息,请参见 管理发布任务...
ds='${bizdate}':定义查询的分区日期,${bizdate} 为Dataphin内置的日期时间全局变量,默认格式为yyyyMMdd,即当前日期的前一天。Dataphin也支持输入具体的日期,例如 ds='20210223'。重要 如果关闭了使用 select*语法查询汇总逻辑表的...