GetFile

该参数与 DataWorks控制 ,EMR Spark Streaming和EMR Streaming SQL数据开发任务,编辑页面右侧导航栏的“配置>时间属性>启动方式“对应。InputParameters Array of InputContextParameter 节点上下文输入参数。该参数与 DataWorks控制...

UpdateFile

该参数与 DataWorks控制 数据开发任务的“调度配置>时间属性>出错自动重跑”的”重跑间隔“配置对应。控制台中“重跑间隔”的时间单位为分钟,请在调用时注意转换时间。RerunMode String 否 ALL_ALLOWED 重跑属性。取值如下:ALL_...

CreateFile

调用CreateFile,在数据开发中创建一个文件。目前不支持调用该接口创建数据集成节点任务。调试 您可以在OpenAPI Explorer中直接运行该接口,免去您计算签名的困扰。运行成功后,OpenAPI Explorer可以自动生成SDK代码示例。请求参数 名称 ...

通过OpenAPI创建、修改、删除离线同步任务

该参数与 DataWorks控制 数据开发任务的“调度配置>调度依赖”的“从代码解析输入输出”对应。SchedulerType String 否 NORMAL 调度的类型,取值如下:NORMAL:正常调度任务。MANUAL:手动任务,不会被日常调度,对应手动业务流程...

通过OpenAPI创建、修改、删除离线同步任务

该参数与 DataWorks控制 ,EMR Spark Streaming和EMR Streaming SQL数据开发任务,编辑页面右侧导航栏的“配置>时间属性>启动方式“对应。InputParameters String 否[{"ValueSource":"project_001.first_node:bizdate_param",...

GetIDEEventDetail

该参数与 DataWorks控制 数据开发任务的“调度配置>调度依赖”配置为“上一周期”后,依赖项选择”其他节点“时配置的内容对应。ResourceGroupId Long 375827434852437 文件发布成任务后,任务执行时使用的资源组。您可以调用 ...

必读:简单模式和标准模式的区别

附录:不同工作空间模式下,DataWorks模块对应操作的数据源 您可以在 数据开发>数据源 界面下查看数据开发中已绑定的数据源信息。绑定后不同工作空间模式下,DataWorks模块对应操作的数据源如下表所示:DataWorks模块 标准模式 简单模式 ...

API概览

查询数据开发中可用的集群列表 调用ListFlowClusterAll接口,查询数据开发可用的集群列表。查询工作流列表 调用ListFlow接口,查询工作流列表。查询项目用户信息 调用ListFlowProjectUser接口,查询项目用户列表。删除项目用户 调用...

应用示例:数据开发过程触发事件检查

支持的扩展点事件 DataWorks数据开发中,目前支持对以下的扩展点事件进行消息通知,通过扩展程序实现校验并响应。DataStudio-运行文件 DataStudio-提交文件 DataStudio-发布文件 DataStudio-删除文件 DataStudio-提交表 DataStudio-发布表 ...

数据地图概述

说明 如果需要在 数据开发 表管理 进行可视化建表操作,请先在数据地图进行元数据采集,可视化建表操作仅支持绑定为引擎类型的数据源。详情请参见 表管理。网络连通 如果您需要将数据源中的元数据导入数据地图进行统一的元数据管理,...

基本概念

其中,在数据开发中绑定MaxCompute、Hologres、AnalyticDB for PostgreSQL、AnalyticDB for MySQL 3.0、ClickHouse、E-MapReduce和CDH/DCP数据源后,即可在工作空间开发和调度引擎任务。业务流程 针对业务实体,抽象出 业务流程 的概念,...

开发ODPS Spark任务

说明 由于数据开发中的ODPS Spark节点没有运行入口,因此您需要在开发环境的运维中心执行Spark任务。查看返回结果。待补数据实例运行成功后,进入其运行日志的 tracking URL 中查看运行结果,如下:False True True True True 编辑代码:...

运维中心概述

已到达任务节点设置的定时运行时间 数据开发中定义节点的调度属性时,需要为节点设置调度环境下节点运行的“理想时间”。当当前节点依赖的所有父节点都在当前节点设置的定时运行时间点前执行成功,那么当父节点全都执行成功后,当前节点将...

功能简介

面向数据资产管理者提供服务的统计分析、服务用量统计分析、热门数据统计分析能力,实现数据中台建设后半场“数据应用”的有效落地,支撑数据智能应用的高效开发。通用资源 提供了自定义函数和函数资源的能力,帮助用户在数据开发等过程中...

操作指南

您可以在Dataphin工作进行数据开发数据治理等操作。功能 文档 Dataphin全托管 数仓规划概述 数据引入概述 数据开发概述 发布中心概述 运维中心概述 分析平台概述 标签工厂概述 资产全景及目录概述 数据标准概述 资产质量概述 资源治理...

快速体验

DataWorks为您提供智能建模、数据清洗、周期调度运维、数据治理等一站式大数据开发管理能力,本文以一个零售电商行业的数仓搭建实验为例,为您介绍DataWorks在数仓搭建过程的技术选型、技术流程以及流程实现,帮助您深入了解阿里云...

概述

数据开发 的核心功能如下:文件夹 用于存放并管理数据数据开发节点。详情请参见 文件夹。Hologres开发 用于周期性调度作业。详情请参见 Hologres开发:周期性调度。一键MaxCompute表结构同步 支持使用可视化方式批量创建外部表,加速...

数据服务

背景信息 数据服务提供了数据中台建设过程中的数据服务化能力,面向数据开发者提供覆盖各个加工阶段统一体验的、便捷的数据查询转服务、服务管理、服务运维能力;面向数据资产管理者提供服务的统计分析、服务用量统计分析,实现数据中台...

连接方式概述

可以在 OceanBase 控制台中访问使用。ODC 支持连接 OceanBase 数据库的 MySQL 租户和 Oracle 租户,同时为数据开发者提供了数据库日常开发操作、WebSQL、SQL 诊断、会话管理和数据导入导出等功能。使用 OceanBase 开发者中心连接 ...

技术架构选型

数据模型设计之前,您需要首先完成技术架构的选型。本教程使用阿里云大数据产品MaxCompute配合...MaxCompute作为整个大数据开发过程的离线计算引擎。DataWorks则包括数据开发数据质量、数据安全、数据管理等在内的一系列功能。

资产安全概述

应用场景 基于Dataphin实现数据安全保护的一些典型的场景:场景1:业务数据中敏感数据保护 您可以使用资产安全的敏感数据识别和保护功能,脱敏明文敏感数据,保证业务数据安全。例如,姓名张三脱敏后*三。场景2:开发环境数仓建设 敏感数据...

资产安全概述

应用场景 基于Dataphin实现数据安全保护的一些典型的场景:场景1:业务数据中敏感数据保护 您可以使用资产安全的敏感数据识别和保护功能,脱敏明文敏感数据,保证业务数据安全。例如,姓名张三脱敏后*三。场景2:开发环境数仓建设 敏感数据...

流程管控

DataWorks提供了全链路的数据开发治理能力,为您提供了统一的数据开发治理流程,同时也支持您在DataWorks的默认流程上基于自己的业务需求在关键的流程节点进行流程管控。本文为您介绍DataWorks在数据开发过程支持的流程管控能力。背景...

什么是EMR Notebook

EMR Notebook是一个Serverless化的交互式数据分析和探索平台,满足大数据和AI融合下的数据处理需求,为数据工程师、数据分析师和数据科学家提供了可视化的应用程序开发环境。通过EMR Notebook可以完成对SQL、Python、Markdown等多种语言...

功能简介

数据中台建设过程中,搭建核心处理平台,并根据相关标准要求,将源数据或治理后的数据,按照“全面、高效、统筹”的共享原则,“低延时”、“精准化”地传递给用户,方便更多应用消费数据,实现数据价值。协同管控各种组织机构,为智慧化...

通用参考:切换资源组

数据开发页面 重要 数据开发中修改的资源组不会同步到生产环境中,您需要通过 发布流程 将任务发布后,才能在生产环境中生效。进入数据开发页面。登录 DataWorks控制,切换至目标地域后,单击左侧导航栏的 数据建模与开发>数据开发,在...

统一服务

数据中台建设过程中,搭建核心处理平台,并根据相关标准要求,将源数据或治理后的数据,按照“全面、高效、统筹”的共享原则,“低延时”、“精准化”的传递给用户,方便更多应用消费数据,实现数据价值。协同管控各种组织机构,为智慧化...

项目分配与安全

在为企业级大数据平台创建项目时,建议您对ODS层、DWD及DWS层的数据按照业务板块的粒度建立项目,对于ADS层的数据...同时要为在数据开发过程的资源使用赋权,并做好数据安全隔离。关于MaxCompute数仓安全和权限配置详情,请参见 安全模型。

功能简介

数据中台建设过程中,搭建核心处理平台,并根据相关标准要求,将源数据或治理后的数据,按照“全面、高效、统筹”的共享原则,“低延时”、“精准化”地传递给用户,方便更多应用消费数据,实现数据价值。协同管控各种组织机构,为智慧化...

什么是DataWorks

从2009年起,DataWorks不断沉淀阿里巴巴大数据建设方法论,支撑数据中台建设,同时与数万名政务、央国企、金融、零售、互联网、能源、制造、工业等行业的客户携手,不断提升数据应用效率,助力产业数字化升级。产品架构 DataWorks十多年...

连接方式概述

ODC 支持连接 OceanBase 数据库的 MySQL 租户和 Oracle 租户,同时为数据开发者提供了数据库日常开发操作、WebSQL、SQL 诊断、会话管理和数据导入导出等功能。使用 OceanBase 开发者中心连接 OceanBase 租户的具体操作示例请参见 通过 ...

连接方式概述

ODC 支持连接 OceanBase 数据库的 MySQL 租户和 Oracle 租户,同时为数据开发者提供了数据库日常开发操作、WebSQL、SQL 诊断、会话管理和数据导入导出等功能。使用 OceanBase 开发者中心连接 OceanBase 租户的具体操作示例请参见 通过 ...

客户案例

基于飞天大数据平台产品DataWorks+MaxCompute大大提高了数据业务的开发效率,构建大润发的数据中台体系。新金融行业:某互联网金融公司湖仓一体案例 客户架构如下。客户简介 公司的第一代数据湖是基于Hadoop+OSS搭建的,同时引入的数据中台...

手动添加数据

您可以通过 数据库备份DBS 的手动添加数据源功能,将不同环境的数据库添加至 数据库备份DBS ,便于后续对数据源进行管理与备份。费用说明 添加数据源操作不会产生费用,只有在添加数据源后开启备份才会产生费用。如何开启备份,请参见 ...

开发ODPS SQL任务

数据开发DataStudio运行:将合并当前任务代码内所有的关键字(set、use)语句,作为所有SQL的前置语句。在调度环境运行:将按照实际编写顺序执行。假设在节点定义的代码如下。set a=b;create table name1(id string);set c=d;create ...

建表并上传数据

数据开发中绑定MaxCompute数据源,请在数据开发控制左侧导航栏单击 数据源,根据提示进行操作。背景信息 表bank_data用于存储业务数据,表result_table用于存储数据分析后产生的结果。创建表bank_data 进入 数据开发 页面。登录 ...

MaxCompute函数管理

通过MaxCompute客户端、MaxCompute Studio等非DataWorks方式上传的函数,您可以在MaxCompute函数面板进行查看,但不会显示在 数据开发 。删除函数 如果您需要删除函数,请切换至 数据开发 面板,右键单击相应业务流程下的函数名称,单击 ...

什么是数据资源平台

统一服务:是一款数据中台建设过程中的数据服务化组件,面向数据开发者提供覆盖各个加工阶段统一体验的、便捷的数据查询转服务、服务管理、服务运维能力;面向数据资产管理者提供服务的统计分析、服务用量统计分析能力,实现数据中台建设后...

DataWorks交流钉钉群

说明 从2009年飞天大数据平台写下第一行代码开始,DataWorks历经10年发展,形成一套成熟的产品功能体系,满足企业数据中台搭建需求。在阿里巴巴内部,每天有数万数据、算法开发工程师正在使用DataWorks。您需要先单击 申请链接 加入“阿里...

集成与开发概览

DMS的数据集成与开发功能模块,针对数据全生命周期的集成、开发、服务三个阶段提供界面化的功能支持。功能简介 数据集成与开发功能模块支持多种计算、存储引擎,支持结构化、半结构化、非结构化数据的实时集成、离线集成、开发、服务,能够...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
云数据库 RDS 数据库备份 DBS 阿里邮箱 弹性公网IP 短信服务 人工智能平台 PAI
新人特惠 爆款特惠 最新活动 免费试用