数仓规划概述

数仓规划是基于Dataphin建设数据中台的第一步,同时也是数据体系的顶层设计中至关重要的一步。在您开始数据开发前,需要完成数据仓库的规划,包括定义数据板块、项目、数据源、计算源和统计周期。功能介绍 数仓规划包括逻辑空间与物理空间...

产品概述

产品描述 Dataphin是集产品、技术、方法论于一体的智能大数据平台建设引擎,为您提供数据引入、规范定义、建模研发、资产管理、数据服务等全链路智能数据建设及治理服务。功能 描述 Dataphin全托管 全托管又称公共云多租户模式,只需购买...

确定需求

业务调研 充分的业务调研和需求分析是数据仓库建设的基石,直接决定数据仓库能否建设成功。在数仓建设项目启动前,您需要请相关的业务人员介绍具体的业务,以便明确各个团队的分析员、运营人员的需求,沉淀出相关文档。您可以通过调查表、...

准备数据源和计算源

在使用Dataphin前,您需要选择符合业务场景需求的数据库或数据仓库作为数据源,用于读取原始数据和写入数据建设过程中的数据;同时您需要准备MaxCompute项目、Flink项目作为Dataphin的计算源,为数据的研发提供计算资源。准备数据源 ...

准备数据源和计算源

在使用Dataphin前,您需要选择符合业务场景需求的数据库或数据仓库作为数据源,用于读取原始数据和写入数据建设过程中的数据;同时您需要准备MaxCompute项目、Flink项目作为Dataphin的计算源,为数据的研发提供计算资源。准备数据源 ...

升级

请您仔细核对购买信息并阅读 智能数据建设与治理服务协议,确认无误后选中 智能数据建设与治理服务协议。单击 去支付,支付成功后即可开始升级开通增值功能包。正在通过升级开通增值功能包的Dataphin实例,在Dataphin管理控制台页面,显示 ...

数仓构建流程

本文为您介绍如何基于阿里巴巴OneData方法论最佳实践,使用Dataphin助力企业数据中台的建设与管理,快速构建标准、规范的数据仓库。数仓构建流程 下图为使用Dataphin构建数据仓库的基本流程。基本概念 在正式学习本教程之前,您需要了解...

创建企业关系

建立企业关联关系。建立企业关联后,可以实现跨企业进行账号管理、财资管理、合同管理、主体共享等业务。当前支持企业之间建立运营管理关系、主体共享关系。具体关系类型和权益说明请见:关联类型说明。运营管理关系 运营管理关系建立流程...

逻辑结构说明

当数据的业务含义存在较大差异时,您可以创建不同的数据板块,让各成员独立管理不同的业务,后续数据仓库的建设将按照数据板块进行划分。主题域 数据域即主题域,是对某个主题分析后确定的主题边界。例如,商品域、交易域、会员域等。项目 ...

创建FTP数据源

connectPattern:连接模式,包括以下两种:PORT(主动模式):客户端打开一个端口等服务器建立数据连接。PASV(被动模式):服务器打开一个端口等客户端建立数据连接。单击 测试连接,测试数据源是否可以和Dataphin进行正常的连通。测试...

设置Dataphin实例的计算引擎

校验成功后,单击 确认并开始数据建设,即可开始数据建设。后续步骤 完成设置Dataphin实例的计算引擎后,您就可以准备后续数据研发过程中用于读取和写入数据的数据源、用于提供计算资源的计算源。具体操作,请参见 准备数据源和计算源。

概念建模概述

背景信息 在建设数据中台的流程中,一般的首要任务是对整个业务进行前置调研,如先盘点出参与业务的人员、事物和基本规则定义,并理清人、事、物之间的关系和发生的各种交互行为。在全面了解业务的架构和运行情况后,产出业务的概念模型。...

使用限制

计算引擎类型 选择设置 计算引擎设置需要提前采购计算引擎MaxCompute资源,系统以此来支持相关数据的建设工作。需要选择计算引擎类型(目前仅开放MaxCompute计算类型),配置计算引擎所在的集群,例如Endpoint等信息。系统以此来支持该计算...

创建FTP数据源

connectPattern:连接模式,包括以下两种:PORT(主动模式):客户端打开一个端口等服务器建立数据连接。PASV(被动模式):服务器打开一个端口等客户端建立数据连接。单击 测试连接,测试数据源是否可以和Dataphin进行正常的连通。重要 ...

概念建模概述

背景信息 在建设数据中台的流程中,一般的首要任务是对整个业务进行前置调研,如先盘点出参与业务的人员、事物和基本规则定义,并理清人、事、物之间的关系和发生的各种交互行为。在全面了解业务的架构和运行情况后,产出业务的概念模型。...

引入预制模型

模型市场为您提供开箱即可试用的模型示例,降低您的学习成本以及理解Dataphin的成本,帮助您快速建立企业模型。本文为您介绍如何导入模型示例。视频介绍 权限说明 仅支持超级管理员、系统管理员导入模型。计算引擎说明 仅当计算设置中的...

调用API

在为企业建立API生态场景中,您需要调用API进行二次开发或开放API给合作伙伴等,帮助企业实现数据的资产化和价值化。本文为您介绍如何调用API。前提条件 API已发布至数据服务市场。具体操作,请参见 测试与发布API。需先创建应用。具体操作...

资产质量概述

背景信息 面对各行各业日趋强烈的大数据建设、管理及应用的诉求,Dataphin应用场景的多样性及复杂性随之增加。因业务系统的原始数据的规范性无法得以保障,所以Dataphin需要定义数据分析的质量,以满足资产质量的时效性、准确性、完整性、...

资产质量概述

背景信息 面对各行各业日趋强烈的大数据建设、管理及应用的诉求,Dataphin应用场景的多样性及复杂性随之增加。因业务系统的原始数据的规范性无法得以保障,所以Dataphin需要定义数据分析的质量,以满足资产质量的时效性、准确性、完整性、...

工作原理

数据库网关提供私网数据库远程...通道建立后,当您在云端使用某数据库产品(如DMS、DBS)需要访问该网络内的本地数据库时,数据库产品会通过已建立好的通道,访问至您的本地网络。相关操作 准备工作 新建数据库网关 添加数据库 查看网关状态

基本概念

用户建立会话连接后,若会话因为用户主动断开或因为其他因素意外断开,系统将立即启动以用户自定义的会话断连保留时长为长度的倒计时。如果在该倒计时结束之前,用户始终未重新建立与该会话的连接,则该会话将会注销,未保存的数据都将销毁...

如何与其它模块建立关联?

问题描述 如何与其它模块建立关联?问题原因 同模块实体建立关联直接连线即可;跨模块关联需在面板中拖入其他模块实体。

步骤一:准备工作

进行离线数仓建设前您需完成相关云资源的准备。云资源准备包括阿里云账号资源准备、Dataphin开通与AccessKey配置、MaxCompute计算源的开通与配置、以及数据源的准备。本文将指导您完成本教程的云资源准备工作。步骤一:阿里云账号资源准备 ...

步骤一:准备工作

进行离线数仓建设前您需完成相关云资源的准备。云资源准备包括阿里云账号资源准备、Dataphin开通与AccessKey配置、MaxCompute计算源的开通与配置、以及数据源的准备。本文将指导您完成本教程的云资源准备工作。步骤一:阿里云账号资源准备 ...

元数据仓库共享模型概述

业务租户:统称为 开发租户,进行数据中台建设的租户,即进行数据开发和治理的核心使用租户。一个Dataphin实例可以创建多个开发租户,由元仓租户在租户设置页面创建并分配可用资源(数据处理单元数、质量规则数等)。元仓共享模型数据说明 ...

错误码

WSS_LINK 0:信令通道建立或重连成功。1:信令通道连接失败。会话相关 CREATE_ROOM 0:创建房间成功。其他:创建房间失败。JOIN_ROOM 0:加入房间成功。其他:加入房间失败。PUBLISH 0:发布成功。其他:发布失败。SUBSCRIBE 0:订阅成功。...

新建基线监控

基线一旦建立后,会按照调度依赖关系自动识别圈定需要被纳入监控范围的任务,并按照设定的预警时间和承诺时间,在被保障对象数据可能延迟产出的情况下发送基线告警。基线范围内的任务可设置更高优先级以优先分配资源。本文为您介绍如何进行...

新建基线监控

基线一旦建立后,会按照调度依赖关系自动识别圈定需要被纳入监控范围的任务,并按照设定的预警时间和承诺时间,在被保障对象数据可能延迟产出的情况下发送基线告警。基线范围内的任务可设置更高优先级以优先分配资源。本文为您介绍如何进行...

规范定义最佳实践

当数据的业务含义存在较大差异时,您可以创建不同的数据板块,让各成员独立管理不同的业务,后续数据仓库的建设将按照数据板块进行划分。在Dataphin中,项目可以归属至数据板块以实现规范建模功能,同一个数据板块中可能包含多个不同的项目...

概述

安全管理的目的是风险管理,企业选择将业务迁移到云上,并不意味着安全风险的降低,也并不表示企业的安全要由云供应商来承担。...所以更应该在上云之初就规划安全体系的建设和设计,不要等到业务已经运行起来后再考虑安全建设

规范定义最佳实践

当数据的业务含义存在较大差异时,您可以创建不同的数据板块,让各成员独立管理不同的业务,后续数据仓库的建设将按照数据板块进行划分。在Dataphin中,项目可以归属至数据板块以实现规范建模功能,同一个数据板块中可能包含多个不同的项目...

数据源管理概述

在使用Dataphin前,您可将需要引入Dataphin的数据源接入到Dataphin中,已接入的数据源可用于读取原始数据和写入数据建设过程中的数据。Dataphin具备丰富的数据源类型接入,支持对接如MaxCompute、Hive等数据仓库,也支持对接企业传统数据库...

数据源管理概述

在使用Dataphin前,您可将需要引入Dataphin的数据源接入到Dataphin中,已接入的数据源可用于读取原始数据和写入数据建设过程中的数据。Dataphin具备丰富的数据源类型接入,支持对接如MaxCompute、Hive等数据仓库,也支持对接企业传统数据库...

配置限速流程组件

本文为您介绍如何配置限速流程...速度上限 选择数据传输的速度上限:如果您选择 基于数据量限制,则需选择 1M/s、2M/s、5M/s、10M/s。如果您选择 基于数据条数限制,则需填写限制的条数,例如30条/s。单击确定,完成限速流程组件的属性配置。

研发平台设置

默认为 30分钟,最低为 5分钟,最高不超过 120分钟。关闭对象时自动释放 关闭对象编辑选项(tab)时自动释放锁定。提交成功时自动释放 提交成功时自动释放锁定,提交失败不释放。单击 确定,完成 研发平台设置。若需将研发平台设置恢复为...

研发平台设置

默认为 30分钟,最低为 5分钟,最高不超过 120分钟。关闭对象时自动释放 关闭对象编辑选项(tab)时自动释放锁定。提交成功时自动释放 提交成功时自动释放锁定,提交失败不释放。单击 确定,完成 研发平台设置。若需将研发平台设置恢复为...

配置限速流程组件

速度上限 选择数据传输的速度上限:如果您选择 基于数据量限制,则需选择 1M/s、2M/s、5M/s、10M/s。如果您选择 基于数据条数限制,则需填写限制的条数,例如30条/s。单击 确认,完成 限速 流程组件的属性配置。后续步骤 完成流程组件的...

附录:数据探查典型场景说明

E-MapReduce3.x、E-MapReduce5.x、CDH5.x、CDH6.x、FusionInsight 8.x、Cloudera Data Platform 7.x、亚信DP5.3 运行速度慢 设置的Job并发执行数量不足。set hive.exec.parallel=true;set hive.exec.parallel.thread.number=16;

附录:数据探查典型场景说明

E-MapReduce3.x、E-MapReduce5.x、CDH5.x、CDH6.x、FusionInsight 8.x、Cloudera Data Platform 7.x、亚信DP5.3 运行速度慢 设置的Job并发执行数量不足。set hive.exec.parallel=true;set hive.exec.parallel.thread.number=16;

到期提醒与停机策略

本文将为您介绍Dataphin的到期提醒与停机策略。到期提醒 Dataphin实例到期前的168小时(7天)、72小时、24小时,系统将会给您...系统会在实例到期的2小时、5小时、24小时、48小时、72小时、168小时后,以短信方式提醒您续费,保证数据不丢失。
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
智能数据建设与治理 Dataphin 城市视觉智能引擎 弹性公网IP 短信服务 人工智能平台 PAI 金融分布式架构
新人特惠 爆款特惠 最新活动 免费试用