创建CDH Hive节点

开发SQL代码:使用调度参数 DataWorks提供 调度参数,可实现调度场景下代码动态入参,您可在节点中通过${变量名} 的方式定义代码中的变量,并在 调度配置>参数 处,为该变量赋值。调度参数支持的格式,详情请参见 调度参数支持的格式。...

什么是阿里云CDN

链路质量系统 链路质量探测系统会实时监测缓存系统中的所有节点和链路的实时负载以及健康状况,并将结果反馈给调度系统调度系统根据用户请求中携带的IP地址解析用户的运营商和区域归属,然后综合链路质量信息为用户分配一个最佳接入节点...

创建CDH Presto节点

开发SQL代码:使用调度参数 DataWorks提供 调度参数,可实现调度场景下代码动态入参,您可在节点中通过${变量名} 的方式定义代码中的变量,并在 调度配置>参数 处,为该变量赋值。调度参数支持的格式,详情请参见 调度参数支持的格式。...

通过脚本模式配置离线同步任务

当您需要实现更精细化的配置管理时,您可以使用脚本模式配置离线同步任务,通过编写数据同步的JSON脚本并结合DataWorks调度参数使用,将源端单表或分库分表的全量或增量数据周期性同步至目标数据表。本文为您介绍脚本模式配置离线同步任务...

离线同步任务运维

任务调度与管理 离线同步依托DataWorks强大的调度能力,为您实现离线任务的周期性自动调度执行,同时,可以结合DataWorks调度参数,实现增量数据和全量数据写入到目标表对应分区,离线同步任务的运维操作与其他离线调度任务操作一致,支持...

创建数据源质量规则

调度配置:可在弹框中筛选调度类型或用调度名称快捷搜索调度。也支持编辑调度。关联知识库文档:规则关联知识库后,可在质量规则和治理工作台中查看关联知识。支持选择未被关联的知识库。如需创建,请参见 新建及管理知识库。删除:删除此...

创建数据源质量规则

调度配置:可在弹框中筛选调度类型或用调度名称快捷搜索调度。也支持编辑调度。关联知识库文档:规则关联知识库后,可在质量规则和治理工作台中查看关联知识。支持选择未被关联的知识库。如需创建,请参见 新建及管理知识库。删除:删除此...

通过向导模式配置离线同步任务

配置资源属性:用于定义调度场景下,将当前任务下发至数据集成任务执行资源时所使用调度资源组,您可以在调度配置的资源属性区域,选择任务调度运行时需要使用的资源组。说明 数据集成离线任务通过调度资源组下发至对应的数据集成任务...

创建实时元表规则

调度配置:支持在对话框中筛选调度类型或用调度名称快捷搜索调度。也支持编辑调度,为质量规则批量配置调度。开启:支持批量开启质量规则的对象的生效状态,开启生效状态后,所选规则会按照配置的调度自动执行。关闭:支持批量关闭质量规则...

创建实时元表规则

调度配置:支持在对话框中筛选调度类型或用调度名称快捷搜索调度。也支持编辑调度,为质量规则批量配置调度。开启:支持批量开启质量规则的对象的生效状态,开启生效状态后,所选规则会按照配置的调度自动执行。关闭:支持批量关闭质量规则...

创建CDH Impala节点

开发SQL代码:使用调度参数 DataWorks提供 调度参数,可实现调度场景下代码动态入参,您可在节点中通过${变量名} 的方式定义代码中的变量,并在 调度配置>参数 处,为该变量赋值。调度参数支持的格式,详情请参见 调度参数支持的格式。...

数据开发

由于任务每天需要更新写入日期格式的分区,所以这里数据去向的分区信息使用调度参数代替,每天周期性执行任务的时候,调度参数会替换对应的日期值。数据来源 参数 值 数据源 MySQL:retail_e_commerce_read 表 mbr_user_info 数据过滤-切分...

工作流编辑

配置工作流调度 您可以打开工作流调度配置面板,配置工作流调度参数,调度系统会按照参数定时运行相关工作流,并将作业下发到指定集群上执行。以下介绍如何配置工作流的基本属性、调度属性和告警设置。进入数据开发的项目列表页面。通过...

场景:调度参数在数据集成的典型应用场景

背景信息 DataWorks数据集成结合调度参数使用,可实现以下场景:场景 说明 相关文档 增量数据同步 部分Reader插件可通过调度参数实现每次调度只同步指定时间范围内的数据至目标端。同时,您可以结合 补数据 功能,实现将对应时间内的数据...

概念原理

使用任务分片可以缩短任务执行时间,同时也可以解决单机计算能力上限的问题,并降低部分任务失败对整体系统的影响。任务拓扑 任务拓扑(Topology)是由许多通过事件触发的任务的集合,描述了任务依赖关系。子任务可以并发执行或根据条件...

创建EMR Presto节点

Presto(即PrestoDB)是一款灵活、可扩展的分布式SQL查询引擎,支持使用标准的SQL查询语言进行大数据的交互式分析查询(Presto概述),DataWorks为您提供EMR Presto节点,便于您在DataWorks上进行Presto任务的开发和周期性调度。...

创建指标质量规则

调度配置:支持在弹框中筛选调度类型或用调度名称快捷搜索调度。也支持编辑调度。关联知识库文档:规则关联知识库后,可在质量规则和治理工作台中查看关联知识。支持选择未被关联的知识库。如需创建,请参见 新建及管理知识库。删除:删除...

各类型节点的调度参数配置示例

赋值示例如下:内置参数var1赋值取业务时间:var1=$bizdate 自定义参数var2赋值取业务时间:var2=${yyyymmdd} 自定义参数var3赋值取业务时间:var3=$[yyyymmdd]配置及使用调度参数,详情请参见 配置并使用调度参数,更多调度参数的赋值方式...

周期任务基本运维操作

周期任务是指在调度系统按照调度配置周期性自动调度的任务。您可以在 运维中心>周期任务 列表查看指定工作空间下的周期任务,并对任务进行运维操作,包括自动调度和手动运行周期任务、查看任务运行详情、暂停任务、下线任务等。本文为您...

批量上传质量规则

调度配置:可在弹框中筛选调度类型或用调度名称快捷搜索调度。也支持编辑调度。详情请参见 新建调度。说明 批量配置调度时,需要确保所选资源表的分区表达式一致,如果配置的分区和表实际分区不一致,可能会报错。批量配置调度时,非分区表...

批量上传质量规则

调度配置:可在弹框中筛选调度类型或用调度名称快捷搜索调度。也支持编辑调度。详情请参见 新建调度。说明 批量配置调度时,需要确保所选资源表的分区表达式一致,如果配置的分区和表实际分区不一致,可能会报错。批量配置调度时,非分区表...

创建指标质量规则

调度配置:支持在弹框中筛选调度类型或用调度名称快捷搜索调度。也支持编辑调度。关联知识库文档:规则关联知识库后,可在质量规则和治理工作台中查看关联知识。支持选择未被关联的知识库。如需创建,请参见 新建及管理知识库。删除:删除...

管理调度资源组

前提条件 购买和使用调度资源组前,您需了解调度资源组的规格指标及计费规格等细节,提前根据业务场景规划按需购买调度资源组,详情请参见 调度资源组计费说明。已在EMR on ECS页面创建集群或集群模板,详情请参见 创建集群 或 创建集群...

公共调度资源组计费说明:按量付费

DataWorks为您提供公共调度资源组用于任务调度运行。公共调度资源组的计费方式为按量计费,本文为您介绍公共调度资源组的按量计费详情。背景信息 概念介绍 公共调度资源组是DataWorks提供的公共资源组的一种,计费方式为按量计费。所有阿里...

调度集群管理概述

Dataphin支持连接不同调度集群,并将所有集群可用于调度的资源进行统一管理,使每个租户可以使用不同集群的资源用于创建自定义资源组,从而解决跨Region数据传输以及资源隔离等问题。使用限制 当前仅支持基于最新架构部署的客户使用调度...

运维中心概述

运维中心功能模块 当您在DataStudio中完成节点开发,并提交和发布至生产环境后,即可在运维中心对任务进行运维操作,包括周期调度任务的自动调度与手动运行、任务运行详情查看、任务运行状态监控、任务运行使用的资源监控与自动运维;...

实验介绍

数据加工 使用 DataWorks数据开发(DataStudio)模块,将日志数据通过函数正则等方式拆解为可分析字段,并与用户信息表加工汇总产出基本的用户画像数据,并提交调度系统,结合DataWorks调度参数实现周期性数据清洗操作。学习如下内容:如何...

基础术语

中文 英文 释义 简单...使用任务分片可以缩短任务执行时间,同时也可以解决单机计算能力上限的问题,并降低部分任务失败对整体系统的影响。Cron 表达式 Cron expression 固定格式的字符串,用来指定一个时间点或者一个重复触发的时间间隔。

PAI-TF概述

PAI-TF的作业都是基于底层的分布式调度系统动态调度至不同机器。当您提交PAI-TF作业时,无需担心是否需要提前申请GPU物理主机,PAI-TF所需要的GPU资源随作业的提交动态分配,随作业的结束动态释放。全局计算调度 当您在使用MaxCompute计算...

周期任务通用运维概述

周期任务是指调度系统按照调度配置自动定时运行的任务。本文为您介绍周期的脚本任务、明细及汇总表(维度逻辑表、事实逻辑表、汇总逻辑表)任务的通用功能,包括使用说明,支持的调度类型和相关功能说明。使用说明 仅生产环境运维中心支持...

周期任务通用运维概述

周期任务是指调度系统按照调度配置自动定时运行的任务。本文为您介绍周期的脚本任务、明细及汇总表(维度逻辑表、事实逻辑表、汇总逻辑表)任务的通用功能,包括使用说明,支持的调度类型和相关功能说明。使用说明 仅生产环境运维中心支持...

管理工作流

调度周期 调度周期即任务在调度场景下自动执行的周期数,用于定义在生产环境调度系统中,多久会执行一次节点中的代码逻辑。调度任务会根据调度类型及周期数生成相应的周期实例,通过周期实例的方式自动调度运行周期任务。仅 调度器 类型...

如何接入日志服务

阿里巴巴分布式任务调度系统SchedulerX 2.0提供日志服务,您无需修改代码,只需增加一个Log4j或Logback的配置,即可在控制台看到每次任务调度(包括分布式任务)的业务日志。本文介绍如何通过SchedulerX接入并查看日志服务。前提条件(可选...

Check节点

您可直接输入路径,也可使用调度参数获取路径,调度参数的使用,详情请参见 调度参数支持的格式。Check通过条件 定义FTP文件的检查通过条件。若检查到FTP文件存在,则此次检查通过,平台即认为该FTP文件可用。若检查到FTP文件不存在,则...

批量创建质量规则

调度配置:支持在弹框中筛选调度类型或用调度名称快捷搜索调度。也支持编辑调度。详情请参见 新建调度。说明 批量配置调度时,需要确保所选资源表的校验范围表达式一致,如果配置的分区和表实际分区不一致,可能会报错。批量配置调度时,非...

工作流使用案例

立即运行一批工作流,设置工作流业务时间的开始时间和调度周期,运行时系统会将指定调度规则的触发时间作为本工作流的业务时间,时间相关的变量将使用该时间进行计算。一次最多支持100个触发时间点。单机 确定。查看工作流运行记录 运行...

批量创建质量规则

调度配置:支持在弹框中筛选调度类型或用调度名称快捷搜索调度。也支持编辑调度。详情请参见 新建调度。说明 批量配置调度时,需要确保所选资源表的校验范围表达式一致,如果配置的分区和表实际分区不一致,可能会报错。批量配置调度时,非...

任务运行诊断

常见的同步任务执行问题如下:数据同步日志长时间打印WAIT 若数据同步日志长时间打印WAIT,表示DataWorks的调度系统已将同步任务下发,由于当前任务所使用的同步资源组剩余资源无法支持当前任务执行,正在等待其他任务执行完成释放资源。...

创建EMR Shell节点

已购买独享调度资源组并完成资源组配置,包括绑定工作空间、网络配置等,详情请参见 新增和使用独享调度资源组。使用限制 该类任务不支持 公共调度资源组 运行,支持在 2023年12月1号 之后购买的 资源组 运行。DataLake或自定义集群若要在...

数据开发功能索引

本文为您介绍DataWorks数据开发(DataStudio)界面的整体布局,以及进行开发操作的主界面(业务流程和节点)中各组件、按钮的功能作用,方便您快速了解及使用数据开发模块。进入数据开发 登录 DataWorks控制台,单击左侧导航栏的 数据建模...
共有115条 < 1 2 3 4 ... 115 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
批量计算 音视频通信 视觉计算服务 弹性公网IP 短信服务 人工智能平台 PAI
新人特惠 爆款特惠 最新活动 免费试用