离线数仓构建流程概述

步骤一:准备工作 规划数仓 数仓规划是数据建设中的蓝图,在您开始数据开发前,需要完成数据仓库的规划,数仓规划配置包括:创建数据板块和主题域、计算源、数据源、项目及项目中的成员。步骤二:规划数仓 数据集成 将创建好的数据源集成至...

离线数仓构建流程概述

步骤一:准备工作 规划数仓 数仓规划是数据建设中的蓝图,在您开始数据开发前,需要完成数据仓库的规划,数仓规划配置包括:创建数据板块和主题域、计算源、数据源、项目及项目中的成员。步骤二:规划数仓 数据集成 将创建好的数据源集成至...

准备数据源和计算源

在使用Dataphin前,您需要选择符合业务场景需求的数据库或数据仓库作为数据源,用于读取原始数据和写入数据建设过程中的数据;同时您需要准备MaxCompute项目、Flink项目作为Dataphin的计算源,为数据的研发提供计算资源。准备数据源 ...

准备数据源和计算源

在使用Dataphin前,您需要选择符合业务场景需求的数据库或数据仓库作为数据源,用于读取原始数据和写入数据建设过程中的数据;同时您需要准备MaxCompute项目、Flink项目作为Dataphin的计算源,为数据的研发提供计算资源。准备数据源 ...

数据源管理概述

在使用Dataphin前,您可将需要引入Dataphin的数据源接入到Dataphin中,已接入的数据源可用于读取原始数据和写入数据建设过程中的数据。Dataphin具备丰富的数据源类型接入,支持对接如MaxCompute、Hive等数据仓库,也支持对接企业传统数据库...

数据源管理概述

在使用Dataphin前,您可将需要引入Dataphin的数据源接入到Dataphin中,已接入的数据源可用于读取原始数据和写入数据建设过程中的数据。Dataphin具备丰富的数据源类型接入,支持对接如MaxCompute、Hive等数据仓库,也支持对接企业传统数据库...

数仓构建流程

本文为您介绍如何基于阿里巴巴OneData方法论最佳实践,使用Dataphin助力企业数据台的建设与管理,快速构建标准、规范的数据仓库。数仓构建流程 下图为使用Dataphin构建数据仓库的基本流程。基本概念 在正式学习本教程之前,您需要了解...

元数据仓库共享模型概述

业务租户:统称为 开发租户,进行数据建设的租户,即进行数据开发和治理的核心使用租户。一个Dataphin实例可以创建多个开发租户,由元仓租户在租户设置页面创建并分配可用资源(数据处理单元数、质量规则数等)。元仓共享模型数据说明 ...

数仓分层

在汇总数据层同样可以关联复用统计粒度中的维度,采取更多的宽表化手段构建公共指标数据层,提升公共指标的复用性,减少重复加工。维度层(DIM,Dimension):以维度作为建模驱动,基于每个维度的业务含义,通过添加维度属性、关联维度等...

维度层(DIM)

在阿里巴巴维度建模中,通常是编码和文字同时存在,例如商品维度中的商品ID和商品标题、类目ID和类目名称等。ID通常用于不同表之间的关联,而名称通常用于报表标签。区分数值型属性和事实。数值型字段是作为事实还是维度属性,可以根据字段...

概念建模概述

将现实中的业务进行抽象,通过图形化等方式真实的反映业务情况。功能概述 多级主题域:支持多级主题域,且支持树形图展示多级主题域。实体关系定义:定义业务实体时,同时定义实体关系。并且支持配置多种实体关系,包括关联、继承、层级、...

概念建模概述

将现实中的业务进行抽象,通过图形化等方式真实的反映业务情况。功能概述 多级主题域:支持多级主题域,且支持树形图展示多级主题域。实体关系定义:定义业务实体时,同时定义实体关系。并且支持配置多种实体关系,包括关联、继承、层级、...

逻辑结构说明

Dataphin业务模型的核心概念具有一定的逻辑结构,您可以通过了解其结构,为后期项目规划、建模等提供思路。本文为您介绍Dataphin中核心概念的逻辑结构及...物理表 计算引擎中的表,即通过DDL创建的表。物化表 存储逻辑表真实数据的物理表。

步骤二:规划数仓

数仓规划是基于Dataphin建设数据台的第一步,同时也是数据体系的顶层设计至关重要的一步。在开始数据开发前,需要完成数据仓库的规划,包括定义数据板块、项目、数据源、计算源和统计周期。本文将指导您完成本教程的规划数仓。背景信息...

步骤二:规划数仓

数仓规划是基于Dataphin建设数据台的第一步,同时也是数据体系的顶层设计至关重要的一步。在开始数据开发前,需要完成数据仓库的规划,包括定义数据板块、项目、数据源、计算源和统计周期。本文将指导您完成本教程的规划数仓。背景信息...

规范定义最佳实践

创建业务过程,即从顶层视角,规范业务中的事务内容的类型及唯一性。例如电商订单是一个业务过程,业务过程由下单、支付、发货和确认收货等不可拆分的事件组成,每个事件就是一个业务过程。统计周期 统计的时间范围,也可以称为时间周期。...

规范定义最佳实践

创建业务过程,即从顶层视角,规范业务中的事务内容的类型及唯一性。例如电商订单是一个业务过程,业务过程由下单、支付、发货和确认收货等不可拆分的事件组成,每个事件就是一个业务过程。统计周期 统计的时间范围,也可以称为时间周期。...

确定需求

在需求分析阶段,您需要沉淀出业务分析或报表中的指标,以及指标的定义和粒度。粒度可以作为维度的输入。建议您思考下列问题,对后续的数据建模将有巨大的帮助:业务数据是根据什么(维度、统计粒度,简称“粒度”,是维度或维度组合)汇总...

引入预制模型

模型市场为您提供开箱即可试用的模型示例,降低您的学习成本以及理解Dataphin的成本,帮助您快速建立企业模型。本文为您介绍如何导入模型示例。视频介绍 权限说明 仅支持超级管理员、系统管理员导入模型。计算引擎说明 仅当计算设置中的...

资产质量概述

质量治理 帮助您查看数据质量在校验过程中的出错情况及针对该质量校验问题发起整改、忽略、通知等治理操作,从而实现资产质量从制定计划到实现整改的PDCA完整流程,有效提升数据质量。资产质量功能入口 在Dataphin首页,单击顶部菜单栏 ...

资产质量概述

质量治理 帮助您查看数据质量在校验过程中的出错情况及针对该质量校验问题发起整改、忽略、通知等治理操作,从而实现资产质量从制定计划到实现整改的PDCA完整流程,有效提升数据质量。资产质量功能入口 在Dataphin首页,单击顶部菜单栏 ...

核心概念

例如零售业务中的买家,商品、类目和地域等可以具象化的业务对象,买家的性别,商品的价格为业务对象的属性。从技术层,类似于SQL中group by后的字段。关于group by如何使用,请参见 GROUP BY分组查询(col_list)。维度逻辑表 丰富维度的...

调用API

调用API即应用调用生产环境中的API。在为企业建立API生态场景中,您需要调用API进行二次开发或开放API给合作伙伴等,帮助企业实现数据的资产化和价值化。本文为您介绍如何调用API。前提条件 API已发布至数据服务市场。具体操作,请参见 ...

使用限制

本文为您介绍使用Dataphin过程中的操作限制。浏览器限制 您需要使用Google Chrome浏览器90.x及以上版本或者奇安信可信浏览器登录Dataphin。使用限制 为保障软件系统稳定,Dataphin有部分使用上的限制或建议,详情如下表所示。功能项 操作项...

创建FTP数据源

表名称 的格式引用数据源中的表;如果需要根据所处环境自动访问对应环境的数据源,请通过${数据源编码}.table 或${数据源编码}.schema.table 的变量格式访问。更多信息,请参见 Dataphin数据源表开发方式。重要 目前仅支持 MySQL、Hologres...

创建FTP数据源

表名称 的格式引用数据源中的表;如果需要根据所处环境自动访问对应环境的数据源,请通过${数据源编码}.table 或${数据源编码}.schema.table 的变量格式访问。更多信息,请参见 Flink_SQL任务开发方式。重要 目前仅支持 MySQL、Hologres、...

数仓规划概述

数仓规划是基于Dataphin建设数据台的第一步,同时也是数据体系的顶层设计至关重要的一步。在您开始数据开发前,需要完成数据仓库的规划,包括定义数据板块、项目、数据源、计算源和统计周期。功能介绍 数仓规划包括逻辑空间与物理空间...

数仓规划概述

数仓规划是基于Dataphin建设数据台的第一步,同时也是数据体系的顶层设计至关重要的一步。在您开始数据开发前,需要完成数据仓库的规划,包括定义数据板块、项目、数据源、计算源和统计周期。功能介绍 数仓规划包括逻辑空间与物理空间...

数据服务概述

数据服务(OneService)是基于Dataphin建设数据台的最后一步。数据服务作为统一的数据服务出口,实现了数据的统一市场化管理,有效地降低数据开放门槛的同时,保障了数据开放的安全。前提条件 已购买 数据服务 增值服务,开通Dataphin ...

什么是Dataphin

Dataphin是阿里巴巴集团OneData数据治理方法论内部实践的云化输出,一站式提供数据采、建、管、用全生命周期的大数据能力,以助力企业显著提升数据治理水平,构建质量可靠、消费便捷、生产安全经济的企业级数据台。Dataphin兼容多种计算...

答疑支持

若您在使用智能数据建设与治理Dataphin的过程有任何疑问,您可通过答疑支持联系我们,为您答疑解惑。操作步骤 在Dataphin页面,按照以下操作指引或单击蓝色小机器人选择 答疑支持,进入答疑支持页面后,输入您需解答的问题。依次单击 ...

答疑支持

若您在使用智能数据建设与治理Dataphin的过程有任何疑问,您可通过答疑支持联系我们,为您答疑解惑。使用说明 需保证网络连通、Dataphin已升级至3.14.1及以上版本且已经对接工单系统(如需对接可联系运维部署团队)方可使用工单功能。...

基本概念

本文将为您介绍告警中心中的告警事件、推送记录、值班表和推送渠道等基本概念。概念 描述 告警事件 基于告警对象和告警规则构成的事件。推送记录 告警中心将告警消息推送给订阅用户的记录。值班表 为接收并处理告警事件的人员提供了排班...

基本概念

本文将为您介绍告警中心中的告警事件、推送记录、值班表和推送渠道等基本概念。概念 描述 告警事件 基于告警对象和告警规则构成的事件。推送记录 告警中心将告警消息推送给订阅用户的记录。值班表 为接收并处理告警事件的人员提供了排班...

基本概念

本文为您介绍资产质量中的数据对象、质量规则、强规则和弱规则等基本概念。概念 描述 质量规则 数据对象进行质量校验时的规则,质量规则可以覆盖到字段。例如,如果您需要关注某个表中的行数变化及主键是否重复,则您可以将行数变化和主键...

基本概念

本文为您介绍资产质量中的数据对象、质量规则、强规则和弱规则等基本概念。概念 描述 质量规则 数据对象进行质量校验时的规则,质量规则可以覆盖到字段。例如,如果您需要关注某个表中的行数变化及主键是否重复,则您可以将行数变化和主键...

新建资产市场

可以定义一个公共资产市场以及多个私有资产市场,项目中的标签仅可上架到关联的市场中,且不支持上架到多个市场。本文将指导您如何创建资产市场。操作步骤 在Dataphin首页,单击顶部菜单栏的 规划。默认进入 数据架构 页面。按照以下操作...

申请资产权限

申请至项目中的标签可以选择规则组合方式加工新标签;申请至应用的标签可以创建标签离线服务、实时查询服务,进行标签应用。本文将指导您如何申请标签权限。申请标签权限 请参见 标签资产市场入口,进入资产市场页面。进入资产市场页面后,...

技术架构选型

MaxCompute作为整个大数据开发过程中的离线计算引擎。Dataphin则基于OneData方法论——OneModel、OneID、OneService,囊括了数据建模研发、运维中心、监控报警、数据资产等在内的一系列功能。icmsDocProps={'productMethod':'created','...

操作功能权限

在 资产 页面,单击顶部菜单栏中的 权限。在 权限管理 页面,单击左侧导航栏中 我管理的 下的 功能权限。在 功能权限 页面,单击需要授权功能权限所在行 操作 列下的 图标。根据功能权限授权对话框提示,配置参数。参数 描述 授权用户 选择...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
商标服务 云虚拟主机 云数据库 RDS 域名 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用