数仓规划概述

在您开始数据开发前,需要完成数据仓库的规划,包括定义数据板块、项目、数据源、计算源和统计周期。功能介绍 数仓规划包括逻辑空间与物理空间的全局架构,以实现业务划分、资源管控、项目管理等目的:逻辑空间:基于业务特征划分命名空间...

数据保护伞概述

数据保护伞是一款数据安全管理产品,为您提供数据发现、数据脱敏、数据水印、访问控制、风险识别、数据溯源等多种功能,帮助您快速梳理敏感数据并进行安全管控,保障数据安全。本文为您介绍数据保护伞的使用流程、使用限制等内容。使用流程...

DataWorks On EMR使用说明

数据地图概述 安全中心 数据保护伞 审批中心 安全中心是集数据资产分级分类、敏感数据识别、数据授权管理、敏感数据脱敏、敏感数据访问审计、风险识别与响应于一体的一站式数据安全治理界面,帮助用户落地数据安全治理事项。安全中心概述 ...

数据保护伞入门

数据保护伞 是一款数据安全管理产品,提供数据发现、数据脱敏、数据水印、访问控制、风险识别、数据溯源等功能,帮助您快速梳理敏感数据并进行安全管控,保障数据安全。本文示例使用内置规则对 xc_dpe_e2_dev 项目的 phone 数据脱敏,并...

通用数据查询与管理

您可在页面中查看表的基础信息和业务信息,了解当前表所属的项目、表owner、所属的环境是生产环境还是开发环境等信息,并可以在右侧通过各详细信息的页签页面,快速查看表的字段明细、血缘关系数据预览等详细信息,帮助您快速了解表结构...

新建注册上挂指标

您可以将物理表中的指标字段上挂至汇总逻辑表进行数据分析。本文为您介绍如何为汇总逻辑表新建注册上挂标签。前提条件 完成派生指标的创建,详情请参见 创建派生指标。操作步骤 在Dataphin首页,单击顶部菜单栏的 研发。默认进入数据 开发 ...

新建注册上挂指标

您可以将物理表中的指标字段上挂至汇总逻辑表进行数据分析。本文为您介绍如何为汇总逻辑表新建注册上挂标签。前提条件 完成派生指标的创建,详情请参见 创建派生指标。操作步骤 登录 Dataphin控制台。在Dataphin控制台页面,选择工作区地域...

MaxCompute数据离线同步至ClickHouse

说明 此处会展示ClickHouse数据开发环境的表列表和表结构,如果您的ClickHouse数据开发和生产环境的表定义不同,则可能出现任务在开发环境配置正常但提交生产运行后报错表不存在、列不存在的问题。导入前准备语句、导入后完成语句 您...

任务调度属性配置概述

登录 DataWorks控制台,单击左侧导航栏的 数据建模与开发>数据开发,在下拉框中选择对应工作空间后单击 进入数据开发。进入调度配置页面。在数据开发(DataStudio)界面,您需找到目标节点,进入该节点的编辑页面。单击节点编辑页面右侧...

DataWorks on EMR集群配置最佳实践

DataWorks支持绑定EMR(E-MapReduce)的DataLake(新版数据湖)集群为EMR计算引擎,创建Hive、MR、Presto和Spark SQL等节点,实现EMR任务工作流的配置、定时调度和元数据管理等功能,帮助EMR用户更好产出数据。本文为您介绍在DataWorks上...

功能发布记录(2022年)

美国(硅谷),美国(弗吉尼亚),阿联酋(迪拜)所有DataWorks用户 数据集成概述 DataWorks支持EMR新版数据湖DataLake DataWorks支持基于EMR计算引擎新版数据湖DataLake,实现基于EMR引擎的数据集成、数据建模、数据开发调度、数据质量、...

DataWorks V2.0

DataWorks V2.0版本操作差异 您可参见DataWorks V2.0系列详解视频,对DataWorks V2.0各功能模块的特性进行深入学习:DataWorks V2.0数据开发功能与用法解析 DataWorks V2.0数据集成简介与最佳实践 DataWorks V2.0智能监控简介与最佳实践 ...

DataWorks各版本详解

专业版 基于DataWorks标准版,增加更专业的数据安全功能,同时增强数据治理、数据服务的功能,完善的数据开发与运维功能,提供产品化的数据治理、数据安全解决方案。此版本适合中小型企业使用。企业版 基于DataWorks专业版,在该版本上您...

使用指南

本文将为您介绍如何使用跨链服务控制台,包括注册区块链、跨链授权(包括账本数据访问、合约消息推送)的相关操作流程,以及如何进行权限查看、合约消息查看等。注册区块链 注册您的区块链是开始跨链连接的第一步。注册区块链后,跨链数据...

全景查看表

当前仅华北2(北京)、华东2(上海)、华东1(杭州)和华南1(深圳)地域的数据治理中心支持Hologres数据源。进入表360页面 登录 DataWorks控制台,切换至目标地域后,单击左侧导航栏的 数据治理>数据治理中心,在下拉框中选择对应工作空间...

业务分类

登录 DataWorks控制台,单击左侧导航栏的 数据建模与开发>数据建模,在下拉框中选择对应工作空间后单击 进入数据建模。在 数据建模 页面的顶部菜单栏,单击 数仓规划,进入 数仓规划 页面。在 数仓规划 页面的左侧导航栏,单击 业务分类,...

概述

配置DTS数据迁移节点 离线数据集成 用于数据迁移、数据传输等场景,实现数据源之间的数据同步。配置离线数据集成节点 数据加工 单实例SQL 将SQL语句发放到指定的关系数据库上并执行。说明 如果目标实例已开启无锁结构变更,单实例SQL任务...

数据源管理概述

功能介绍 多数据源类型接入:Dataphin内置丰富的数据源类型,支持对接的数据源包括大数据存储型数据源、文件型数据源、消息队列型数据源、关系数据源和NoSQL数据源。更多信息,请参见 Dataphin支持的数据源。自定义数据源类型:在内置的...

数据源管理概述

功能介绍 多数据源类型接入:Dataphin内置丰富的数据源类型,支持对接的数据源包括大数据存储型数据源、文件型数据源、消息队列型数据源、关系数据源和NoSQL数据源。更多信息,请参见 Dataphin支持的数据源。自定义数据源类型:在内置的...

配置同周期调度依赖

依赖某节点同周期指本节点本周期运行,依赖上游节点当前周期的数据产出情况(即任务执行情况),待上游当前周期实例执行成功后,本节点才会运行。通常,若当前任务需依赖上游任务同周期产出的表数据时,可为当前任务设置依赖该上游任务的同...

DataWorks OpenAPI概述

DataWorks为您提供了涵盖租户、元数据、数据开发、运维中心、数据集成等多个功能模块的OpenAPI接口,不同API的QPS限制、每日调用次数上限和支持使用的DataWorks服务版本存在差异。您可参考本文了解各OpenAPI支持的DataWorks版本及地域、...

步骤二:规划数仓

在开始数据开发前,需要完成数据仓库的规划,包括定义数据板块、项目、数据源、计算源和统计周期。本文将指导您完成本教程的规划数仓。背景信息 数据板块:数据板块是逻辑空间的重要组成部分,是基于业务特征划分的命名空间。本教程以 ...

步骤二:规划数仓

在开始数据开发前,需要完成数据仓库的规划,包括定义数据板块、项目、数据源、计算源和统计周期。本文将指导您完成本教程的规划数仓。背景信息 数据板块:数据板块是逻辑空间的重要组成部分,是基于业务特征划分的命名空间。本教程以 ...

下线节点

报错:请先在发布中心把文件${filename}发布到生产环境或在发布中心取消发布 报错:节点存在子节点,导致任务删除或下线失败 如何下线节点 如果您使用的是标准模式工作空间,则开发环境和生产环境隔离,在DataWorks的数据开发(DataStudio...

功能发布记录 2022年之前

数据治理中心概述 2021-08 功能名称 功能描述 发布时间 发布地域 相关文档 独享数据服务资源组上线杭州、上海地域。在调用数据服务API需要高QPS和SLA保障的情况下,企业需要使用独享的数据服务资源来保障调用成功。同时,独享数据服务资源...

数据源权限管理

本文为您汇总数据源权限管理相关的问题。哪些角色可以管理数据源的权限?是否支持再次分享已被分享的数据源?数据源的创建者是否有权控制该数据源?什么是私有模式的数据源?哪些用户能够收回数据源的分享权限?如何检查数据源分享关系的...

注册CDH或CDP集群至DataWorks

以下简称CDH)和CDP(Cloudera Data Platform,以下简称CDP)集群对接的能力,您可在DataWorks中注册CDH及CDP集群,进行任务开发、调度、数据地图(元数据管理)和数据质量等一系列的数据开发和治理操作。背景信息 CDH是Cloudera的开源平台...

安全设置与其他

DataWorks支持丰富的数据开发配置,您可以在安全设置与其他页面控制是否脱敏展示返回结果中的敏感信息;是否安全隔离代码与日志;是否进行代码强制评审,把控开发任务的代码质量;是否强制执行冒烟测试,保障任务的正确性;批量删除无用的...

新建层级维度逻辑表

层级维度逻辑表是具有层级结构关系的维度表。例如时间层级维度逻辑表,包含日、周、月、季、年等日期数据。本文为您介绍如何新建并配置层级维度逻辑表。前提条件 已完成层级业务对象的创建,具体操作请参见 创建并管理业务实体。步骤一:...

离线同步能力说明

数据集成的离线同步功能为您提供数据读取(Reader)和写入插件(Writer),方便您通过定义来源与去向数据源,并结合DataWorks调度参数使用,将源端数据库中全量或增量数据的同步至目标数据库中。本文为您介绍离线同步的相关能力。使用限制 ...

DataWorks On MaxCompute使用说明

数据地图概述 安全中心 数据保护伞 审批中心 安全中心是集数据资产分级分类、敏感数据识别、数据授权管理、敏感数据脱敏、敏感数据访问审计、风险识别与响应于一体的一站式数据安全治理界面,帮助用户落地数据安全治理事项。安全中心概述 ...

管理控制台介绍

数据服务为您提供高效便捷的主题式查询功能及有效的全链路企业内API生命周期托管,真正实现零门槛API开发,帮助您更好进行数据资产应用并实现数据的价值化。如果您选择了 数据标准,下方展示 数据标准 增值功能。更多信息请参见 数据标准...

管理控制台介绍

数据服务为您提供高效便捷的主题式查询功能及有效的全链路企业内API生命周期托管,真正实现零门槛API开发,帮助您更好进行数据资产应用并实现数据的价值化。如果您选择了 数据标准,下方展示 数据标准 增值功能。更多信息请参见 数据标准...

自定义RDBMS数据库及同步数据

为了满足不同业务场景数据集成的诉求,Dataphin支持用户自定义当前系统不支持的RDBMS数据库(关系数据库)类型的组件,并进行数据同步。您只需要准备关系数据库的驱动,即可自定义RDBMS数据库类型的组件。本教程以MySQL为例,为您介绍...

自定义RDBMS数据库及同步数据

为了满足不同业务场景数据集成的诉求,Dataphin支持用户自定义当前系统不支持的RDBMS数据库(关系数据库)类型的组件,并进行数据同步。您只需要准备关系数据库的驱动,即可自定义RDBMS数据库类型的组件。本教程以MySQL为例,为您介绍...

采集数据

本教程以MySQL中的用户基本信息(ods_user_info_d)表及OSS中的网站访问日志数据(user_log.txt)文件,通过数据集成离线同步任务分别同步至MaxCompute的ods_user_info_d、ods_raw_log_d表为例,为您介绍如何通过DataWorks数据集成实现异构...

引擎与数据权限管控概述

引擎与数据权限控制 DataWorks空间成员获取不同引擎资源权限的方式不同,各引擎权限的详细说明如下表所示:引擎类型 权限说明 相关参考 MaxCompute引擎 预设角色 DataWorks空间级角色与MaxCompute引擎Role存在映射关系,使得授予空间预设...

加工数据

本文为您介绍如何将同步至MaxCompute的用户信息表ods_user_info_d及访问日志数据ods_raw_log_d,通过DataWorks的ODPS SQL节点加工得到目标用户画像数据,阅读本文后您可了解到如何通过DataWorks+MaxCompute产品组合来计算和分析已采集的...

购买指引-全托管

版本适用场景 Dataphin提供了多种版本和功能的组合,以适配不同场景、不同数据体量客户的诉求:智能研发版(离线&实时):支持离线研发和实时研发场景,可创建生产开发隔离的双环境项目,提供智能建模、逻辑运维等特色功能,适用于数据量...

数据集市

数据集市是基于业务分类,面向特定应用场景或者产品的数据组织。通常位于数据应用层,依赖于公共层的整合数据。本文为您介绍如何创建数据集市并管理主题域。前提条件 已创建业务分类,用于对指定业务进行特定场景化的细分。详情请参见 业务...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
云数据库 Redis 版 云数据库 RDS 数据库备份 DBS 数据传输服务 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用