数据开发与运维中心:数据加工

DataWorks的 数据开发(DataStudio)是数据加工的开发平台,运维中心 是智能运维平台,基于这两个功能模块,您可以在DataWorks上规范、高效构建和运维数据开发工作流。功能概述 DataWorks的数据开发的亮点功能如下。DataStudio支持...

配置基础属性

责任 数据开发节点的责任。默认为当前登录用户,您也可以根据实际需求修改责任。说明 空间管理员可修改,且仅支持选择当前DataWorks工作空间中的成员为责任。描述 调度节点的描述。通常用于呈现节点业务、用途等信息。

数据开发概述

与运维中心配合使用,面向各引擎(MaxCompute、Hologres、EMR等)提供可视化开发主界面,支持智能代码开发、多引擎混编工作流、规范化任务发布等能力,帮助您轻松构建离线数仓、实时数仓与即席分析系统,保证数据生产的高效稳定。...

操作指南

新手引导 准备工作 数据埋点指南 数据规范 推荐全链路深度定制开发平台 PAIRec 推荐系统搭建 AB实验平台 实验指标管理 数据诊断 智能召回引擎BE 实例管理 访问控制 数据管理 服务管理 个性化算法开发平台TPP 实例基础配置 创建方案 创建...

DataWorks On Hologres使用说明

节点代码定义:Hologres开发指南 Hologres SQL节点 一键MaxCompute表结构同步节点 一键MaxCompute数据同步节点 您可结合DataWorks的通用类型节点和引擎计算节点进行复杂的逻辑处理。主要节点如下:用于管控业务流程的虚拟节点。用于外部...

阶段一:基础防护建设

在该阶段,DataWorks为您提供了数据分类分级、规范数据开发流程、企业级身份认证、开源身份隔离等多个场景的最佳实践,帮助企业做好数据安全治理的相关基础防护工作。场景一:数据分级分类 无论在任何行业,数据分级分类都是监管首要检查的...

概述

本节为不熟悉关系数据库管理系统的介绍 SQL 语言。将讨论创建、填充、查询和更新表等基本操作以及示例。还将讨论视图、外键和事务等更高级的概念。PolarDB PostgreSQL版(兼容Oracle)是关系数据库管理系统(RDBMS)。这意味着它是用于...

创建解决方案

背景信息 DataWorks对数据开发模式进行全面升级,按照业务种类组织相关的不同类型的节点,让您能够更好以业务为单元、连接多个业务流程进行开发。DataWorks通过 工作空间>解决方案>业务流程 三级结构,全新定义开发流程,提升开发体验:...

简介

DMS Data Copilot:是DMS基于阿里云大模型构建的数据智能助手。其结合了DMS熟练的数据管理、数据使用能力,可帮助开发、运维、产品等人员,更高效、规范使用和管理数据。更多信息,请参见 Data Copilot智能助手。Notebook:一个交互式的...

数据仓库研发规范概述

在大数据时代,规范进行数据资产管理已成为推动互联网、大数据、人工智能和实体经济深度融合的必要条件。贴近业务属性、兼顾研发各阶段要点的研发规范,可以切实提高研发效率,保障数据研发工作有条不紊运作。而不完善的研发流程,会...

必读:简单模式和标准模式的区别

绑定后不同工作空间模式下,DataWorks模块对应操作的数据源如下表所示:DataWorks模块 标准模式 简单模式 数据开发 操作开发环境数据源(实例,项目、数据库)操作生产环境数据源(实例,项目、数据库)运维中心 开发环境运维中心:操作...

权限管理与规范化数据开发

本实践将基于DataWorks标准模式空间完成从“数据建模”到“数据生产”的基本流程,帮助您快速掌握规范化的数据体系建设流程,提升在数据开发过程中的规范性、安全性、稳定性。背景信息 DataWorks采取RBAC权限模型供用户管理DataWorks所有...

通过脚本模式创建集成任务

创建离线脚本模式后,可以通过直接编写数据同步的JSON脚本来完成数据同步开发,为数据同步开发提供了更灵活的能力和更精细化的配置管理。本文为您介绍如何创建离线脚本模式。前提条件 已完成数据源配置。您需要在配置集成任务前,配置好您...

数据开发功能索引

本文为您介绍DataWorks数据开发(DataStudio)界面的整体布局,以及进行开发操作的主界面(业务流程和节点)中各组件、按钮的功能作用,方便您快速了解及使用数据开发模块。进入数据开发 登录 DataWorks控制台,单击左侧导航栏的 数据建模...

通过脚本模式创建集成任务

创建离线脚本模式后,可以通过直接编写数据同步的JSON脚本来完成数据同步开发,为数据同步开发提供了更灵活的能力和更精细化的配置管理。本文为您介绍如何创建离线脚本模式。前提条件 已完成数据源配置。您需要在配置集成任务前,配置好您...

工作空间概述

后续:开始数据开发 创建工作空间并分配空间成员角色权限后,您可根据各角色定义的权限前往数据开发DataStudio模块开始数据开发工作,数据开发模块的入门教程详情请参见:数据开发开发者。相关文档 在阅读工作空间的概述后,若您想创建...

新功能发布记录

2020年6月 新功能/特性 简要概述 类别 文档 支持同步数据到Hologres 支持同步数据到Hologres 数据同步 创建同步Hologres 兼容Kafka 可以使用原生Kafka客户端将数据写入DataHub 开发指南 兼容Kafka Canal插件 使用canal将MySql的增量数据...

创建业务流程

DataWorks的 业务流程 开发结构满足根据业务视角来组织数据开发任务的需求,也提供了 周期业务流程 和 手动业务流程 两种,以满足需要周期性调度和无需周期性调度手动触发运行的场景。本文为您介绍如何创建、设计、提交和查看业务流程,...

文档修订记录

DataWorks数据安全治理路线 2023年12月更新记录 时间 特性 类别 描述 产品文档 2023.12.29 新增功能 数据开发 若您要在DataWorks中进行数据建模、数据开发或使用运维中心周期性调度任务,需先将已创建的数据源或集群绑定至数据开发...

数据服务概述

数据服务作为统一的数据服务出口,实现了数据的统一市场化管理,有效降低数据开放门槛的同时,保障了数据开放的安全。前提条件 已购买 数据服务 增值服务,开通Dataphin 常见数据应用问题 一般从需求提出到需求交付分为:需求提出-需求...

审批中心概述

功能介绍 在DataWorks上进行数据开发管理的过程中,您可以便捷对表数据数据服务API等进行权限管控,进行权限管控时,DataWorks的 安全中心 为您提供默认的权限申请审批流程,同时也支持您在 审批中心 自定义审批流程。自定义审批流程后...

高效数据治理实施指南

DataWorks数据治理中心可协助数据治理团队建立数据治理框架、优化治理过程、提升治理效率,从而实现治理目标的高效突破。本文通过治理负责的实操过程,为您介绍如何通过数据治理计划能力,高效设定和达成数据治理目标。背景信息 在多人...

功能简介

数据开发为用户提供一站式计算节点开发能力,通过对数据加工流程的开发和运行调试等环节的一体化管理,数据开发实现数据加工工作流编排、加工逻辑的复用,大幅提高数据开发效率。数据开发帮助用户优化智能系统的架构,提高系统的工程化水平...

数据开发:开发者

本文以使用MaxCompute数据源,在DataWorks上运行MaxCompute作业任务为例,为您介绍开发人员如何使用数据开发(DataStudio)创建一个周期调度任务,帮助您快速了解数据开发(DataStudio)模块的基本使用。前提条件 已完成开发前的环境准备,...

功能简介

数据开发为用户提供一站式计算节点开发能力,通过对数据加工流程的开发和运行调试等环节的一体化管理,数据开发实现数据加工工作流编排、加工逻辑的复用,大幅提高数据开发效率。数据开发帮助用户优化智能系统的架构,提高系统的工程化水平...

数据开发

数据开发为用户提供一站式计算节点开发能力,通过对数据加工流程的开发、部署、调试等环节的一体化管理,数据开发实现数据加工工作流编排、加工逻辑的复用,大幅提高数据开发效率。数据开发帮助用户优化智能系统的架构,提高系统的工程化...

采集数据

本文为您介绍如何新建OSS和RDS数据源来访问本教程所提供的用户信息与网站日志数据,配置数据同步链路至私有OSS数据源,并通过EMR Hive节点建表去查询同步后的数据,完成数据同步的操作过程。前提条件 开始本文的操作前,请准备好需要使用的...

同步节点

同步节点即数据传输节点。本文介绍同步节点的各属性配置参数说明。节点属性 节点属性用于设置同步节点的基本信息,关键参数说明如下:参数 说明 节点名称 节点的名称,支持用户自定义。节点标识 节点的唯一标识,支持用户自定义,同一个...

操作权限控制

任务执行环境 实时场景 数据开发执行任务(开发环境执行任务)场景一:select col1 from tablename 用个人账号访问开发环境下该表。即用个人账号访问:projectname_dev.tablename。场景二:select col1 from projectname.tablename 用个人...

同步节点

同步节点即数据传输节点。本文介绍同步节点的各属性配置参数说明。节点属性 节点属性用于设置同步节点的基本信息,关键参数说明如下:参数 说明 节点名称 节点的名称,支持用户自定义。节点标识 节点的唯一标识,支持用户自定义,同一个...

下线任务

下线任务即将该任务从开发环境删除,并将删除操作发布至生产调度系统,下线后任务将无法再调度。本文以标准模式工作空间为例,为您介绍周期调度任务的下线流程、恢复流程、任务下线后对于已生成实例及正在运行实例平台侧的处理方案。使用...

什么是Dataphin

Dataphin是阿里巴巴集团OneData数据治理方法论内部实践的云化输出,一站式提供数据采、建、管、用全生命周期的大数据能力,以助力企业显著提升数据治理水平,构建质量可靠、消费便捷、生产安全经济的企业级数据中台。Dataphin兼容多种计算...

创建数据板块

数据板块是逻辑空间的重要组成部分,是基于业务特征划分的命名空间。在使用规范建模前,您需要完成数据板块的创建。本文为您介绍如何新建数据板块。前提条件 仅支持 智能研发版。若需使用,当前租户还需开通智能研发模块。在开始执行操作前...

创建并使用MaxCompute表

进入数据开发(DataStudio)登录 DataWorks控制台,单击左侧导航栏的 数据建模与开发>数据开发,在下拉框中选择对应工作空间后单击 进入数据开发。新建MaxCompute表 您可在DataWorks表管理目录中新建,也可在具体业务流程下,针对该业务...

Dataphin支持的数据

背景信息 Dataphin支持对接的数据源包括大数据存储型数据源、文件数据源、消息队列数据源、关系数据源和NoSQL数据源,各模块支持对接的数据源类型说明如下:如果您需要在Dataphin中连接某数据源,则需要先在数据源管理中创建该数据源。...

创建数据板块

数据板块是逻辑空间的重要组成部分,是基于业务特征划分的命名空间。在使用规范建模前,您需要完成数据板块的创建。本文为您介绍如何新建数据板块。前提条件 仅支持 智能研发版。若需使用,请升级当前版本。升级版本,请参见 升级。在开始...

DataWorks On EMR使用说明

数据地图概述 安全中心 数据保护伞 审批中心 安全中心是集数据资产分级分类、敏感数据识别、数据授权管理、敏感数据脱敏、敏感数据访问审计、风险识别与响应于一体的一站式数据安全治理界面,帮助用户落地数据安全治理事项。安全中心概述 ...

数据保护伞入门

数据保护伞 是一款数据安全管理产品,提供数据发现、数据脱敏、数据水印、访问控制、风险识别、数据溯源等功能,帮助您快速梳理敏感数据并进行安全管控,保障数据安全。本文示例使用内置规则对 xc_dpe_e2_dev 项目的 phone 数据脱敏,并...

通用数据查询与管理

您可在页面中查看表的基础信息和业务信息,了解当前表所属的项目、表owner、所属的环境是生产环境还是开发环境等信息,并可以在右侧通过各详细信息的页签页面,快速查看表的字段明细、血缘关系数据预览等详细信息,帮助您快速了解表结构...

新建注册上挂指标

您可以将物理表中的指标字段上挂至汇总逻辑表进行数据分析。本文为您介绍如何为汇总逻辑表新建注册上挂标签。前提条件 完成派生指标的创建,详情请参见 创建派生指标。操作步骤 在Dataphin首页,单击顶部菜单栏的 研发。默认进入数据 开发 ...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
云数据库 Redis 版 云数据库 RDS 数据库备份 DBS 数据传输服务 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用