快速体验

任务运维 使用DataWorks的 运维中心,周期性调度数据同步、清洗加工任务流程,获得每日的最新业务数据,同时可以监控每日任务运行的状态。数据治理 使用DataWorks的数据地图、数据质量、数据保护伞等功能,实现查看管理元数据、监控数据...

其他问题

为什么不能在调度资源组上进行大数据计算?其他 如何设置任务优先级?如何查看任务优先级?周期任务与周期实例、补数据实例、测试实例是什么关系?DataWorks每晚将根据周期任务,批量生成第二天自动调度的周期实例,周期实例自动生成并且...

资源组说明

资源组分类 资源组是用于执行具体任务的服务,如接收调度引擎的指令执行SQL任务、数据同步任务,也包括按数据API的定义提供数据服务。按使用场景,资源组分为两类:系统资源组:由数据资源平台提供,供所有用户使用,对于QPS和并发有限制,...

查看调度资源大盘

数据统计范围 关于调度资源大盘的数据统计频率和数据统计范围说明如下:数据统计频率:每分钟统计1次。针对分配资源,取当前时间点的快照值;针对消耗资源,取过去1分钟内的峰值(即分钟内峰值)。每次页面刷新触发页面数据更新。数据统计...

资源组说明

资源组分类 资源组是用于执行具体任务的服务,如接收调度引擎的指令执行SQL任务、数据同步任务,也包括按数据API的定义提供数据服务。按使用场景,资源组分为两类:系统资源组:由企业数据智能平台提供,供所有用户使用,对于QPS和并发有...

什么是RDS MySQL

RDS MySQL 阿里云关系型数据库服务RDS(Relational Database Service)支持MySQL引擎,RDS MySQL是基于阿里巴巴MySQL源码分支的在线数据库服务,经过双十一高并发、大数据量的考验,拥有优良的性能。RDS MySQL支持实例管理、账号管理、数据...

DataWorks按量计费概述

例如在DataWorks进行任务开发、定时任务调度数据同步任务调度、规模工作流监控、数据质量监控、数据服务API调用等操作。重要 当实例欠费后有停机风险,系统会提醒或通知您,请及时续费,避免对您的服务造成影响。公共调度资源组、公共...

术语表

本文介绍云原生分布式关系型数据库PolarDB-X使用过程中遇到的术语。控制台术语 名词 描述 地域 数据中心所在的地理位置。可用区 可用区是指在某一地域内,具有独立电力和网络的物理区域。同一可用区内实例之间的网络延时更小。集群(实例)...

开通DataWorks服务

开通DataWorks服务后,在使用DataWorks的各项服务时,不同产品服务的功能模块(例如,任务开发、定时任务调度数据同步任务调度、规模工作流监控、数据质量监控、数据服务API调用)会根据使用量和占用的资源量进行按量计费。详情请参见 ...

资源监控

说明 调度资源大盘的资源监控数据来源于Prometheus,请确保您后台部署的Prometheus监控服务处于正常状态,否则监控数据可能有误或无法展示。操作步骤 使用元仓账号或系统管理员账号进入元仓租户。在Dataphin首页,单击顶部菜单栏 管理中心...

新增和使用独享调度资源组

您可根据业务场景需求选择购买合适规格的独享调度资源组,用于任务的调度运行。购买独享资源组后,在实际使用前您还需进行网络绑定、白名单等配置操作。本文为您介绍从购买至使用独享调度资源组的全流程与步骤详情。前提条件 购买和使用独...

一键MaxCompute数据同步节点

DataWorks支持使用DataStudio一键同步MaxCompute数据至Hologres,您可使用该方式快速查询MaxCompute表数据。本文为您介绍如何创建并使用一键MaxCompute数据同步节点。背景信息 使用一键同步MaxCompute数据至Hologres进行数据查询时,您需要...

数据标准

数据是由特定的环境产生的,这些环境因素包括生产者、时间、系统等,从而造成了同一个语义的数据,有...说明 目前使用DDM进行数据建模可以进行逻辑建模和物理建模,但物理建模仅支持MaxCompute和Hive两种大数据引擎,不支持自定义数据源类型。

用户洞察常见问题

重新导入数据表:用户标签表、用户行为表、统计表、订单明细表、订单汇总表的导入均支持手动调度、日/小时周期调度、通过接口触发调度,导入调度配置请参见 调度任务。更新模型:RFM模型、AIPL模型支持手动更新、跟随底层数据调度更新,...

准备工作:获取CDH或CDP集群信息并配置网络连通

DataWorks提供了与CDH(Cloudera’s Distribution Including Apache Hadoop,以下简称CDH)和CDP(Cloudera Data Platform,以下简称CDP)集群对接的能力,您可在DataWorks中注册CDH及CDP集群,进行任务开发、调度数据地图(元数据管理)...

概述

解决方案 T+1全量同步一键建仓是指通过DLA控制台配置数据源(RDS、PolarDB for MySQL、MongoDB数据源、ECS自建数据数据)和目标OSS数据仓库,系统按照您设定的数据同步时间自动、无缝的帮您把数据源中的数据同步到目标数据仓库OSS中,...

EMR Studio概述

能够无缝关联EMR集群(EMR on ECS和EMR on ACK)的计算引擎提交任务,并提供了交互式开发、任务调度和任务监控等开源大数据开发使用体验。覆盖了大数据处理ETL、交互式数据分析、机器学习和实时计算等多种应用场景。EMR Studio核心优势 ...

节点组

如果需要查看历史日期的调度结果,如前几天的调度数据结果,可以使用补数据功能,具体操作,请参见 新建补数据计划。调度周期 支持按月、周、天、小时和分钟调度。具体时间 根据选择的周期客户自定义具体开始和结束的时间。时间表达式 根据...

节点组

如果需要查看历史日期的调度结果,如前几天的调度数据结果,可以使用补数据功能,具体操作,请参见 新建补数据计划。调度周期 支持按月、周、天、小时和分钟调度。具体时间 根据选择的周期客户自定义具体开始和结束的时间。时间表达式 根据...

查看并管理定时调度数据任务

定时调度数据任务是指任务将按照配置的定时调度时间生成并运行补数据实例,进行历史数据的回刷。本文将为您介绍如何查看并管理定时调度类型的补数据任务。定时调度数据任务入口 请参见 运维中心入口,进入 运维 中心。按照下图操作指引...

准备环境

为保证您可以顺利完成本次实验,请您首先确保自己云账号已开通大数据计算服务MaxCompute、数据工场DataWorks和 人工智能平台 PAI。前提条件 注册阿里云账号,详情请参见 注册阿里云账号。实名认证,详情请参见 个人实名认证 背景信息 本次...

场景:调度参数在数据集成的典型应用场景

场景四:同步历史数据 基于调度参数可根据业务时间将参数自动替换为对应的值这一特性,当您创建任务当天需要将历史数据进行补齐时,您可使用补数据功能,补数据支持补历史一段时间的数据或者未来一段时间的数据调度参数将在任务调度时...

步骤五:设置离线节点的调度信息

如果需要查看历史日期的调度结果,如前几天的调度数据结果,可以使用补数据功能,具体操作,请参见 新建补数据计划。2021-10-28~2021-11-05 调度周期 调度的执行周期,支持月、周、天、小时和分钟。天 具体时间 自定义具体开始的时间。18时...

DataWorks资源组概述

资源组介绍 DataWorks包括独享资源组、公共资源组,各资源组根据任务调度数据集成、数据服务等不同的使用场景,细分为不同类型的资源组,包括:独享调度资源组、独享数据集成资源组、独享数据服务资源组、公共调度资源组、公共数据服务...

步骤五:设置离线节点的调度信息

如果需要查看历史日期的调度结果,如前几天的调度数据结果,可以使用补数据功能,具体操作,请参见 新建补数据计划。2021-10-28~2021-11-05 调度周期 调度的执行周期,支持月、周、天、小时和分钟。天 具体时间 自定义具体开始的时间。18时...

数据集成支持的数据

离线集成支持的数据数据源 读取 写入 大数据存储型数据源 MaxCompute 支持 支持 Hive 支持 支持 Hologres 支持 支持 IMPALA 支持 支持 TDH Inceptor 支持 支持 Kudu 支持 支持 StarRocks 支持 支持 Hudi 支持 支持 Doris 支持 支持 ...

就绪检测节点

如果需要查看历史日期的调度结果,如前几天的调度数据结果,可以使用补数据功能,具体操作,请参见 新建补数据计划。调度周期 支持按月、周、天、小时和分钟调度。具体时间 根据选择的周期客户自定义具体开始和结束的时间。时间表达式 根据...

就绪检测节点

如果需要查看历史日期的调度结果,如前几天的调度数据结果,可以使用补数据功能,具体操作,请参见 新建补数据计划。调度周期 支持按月、周、天、小时和分钟调度。具体时间 根据选择的周期客户自定义具体开始和结束的时间。时间表达式 根据...

新建数据库SQL任务

不支持基于MySQL、Oracle数据源SQL数据更新触发调度数据源质量规则。更新信息,请参见 创建数据表质量规则。查询结果不支持全量下载,仅支持下载样例数据。离线计算模板节点类型不支持数据库SQL。在Dev-Prod模式的项目下使用仅配置了生产...

新建数据库SQL任务

不支持基于MySQL、Oracle数据源SQL数据更新触发调度数据源质量规则。更新信息,请参见 创建全域数据表质量规则。查询结果不支持全量下载,仅支持下载样例数据。离线计算模板节点类型不支持数据库SQL。在Dev-Prod模式的项目下使用仅配置了...

问题汇总

数据数据功能说明 为什么小时分钟任务补数据选择了并行但实际不生效?为什么补数据选择业务时间后不运行,实例显示黄色,实例状态显示等待时间?...为什么不能在调度资源组上进行大数据计算?其他 如何设置任务优先级?

基于混合负载的查询优化

Batch模式:采用批计算架构,通过DAG进行任务切分,分批调度,满足有限资源下大数据量计算,支持计算数据落盘,适用于计算量,吞吐高的复杂分析场景。资源池混合负载隔离 AnalyticDB MySQL版弹性版本支持资源池多租户隔离。通过一个实例...

产品优势

产品功能全 功能涵盖数据传输、开发、生产、治理、安全全领域,每个领域深度覆盖大数据全生命周期,轻松帮助企业应对在搭建数仓、搭建数据中台、数字化转型项目中遇到的难题。支持复杂网络环境、常见数据源的数据同步上云以及实时、历史...

IoT数据自动化同步至云端解决方案

大数据分析是大数据完成数据价值化的重要手段之一,而进行大数据分析的第一步是让数据成功上云。解决方案 IoT数据自动化同步至云端解决方案主要包括存储原始数据和同步数据至分析系统两部分。IoT设备大量的数据通常以半结构化的形式存储。...

用户价值

数据资源平台为用户提供了一站式数据资产定义、生产、管理与服务平台,提供企业级数据资产构建能力和一致性使用体验,助力客户快速构建数据智能平台,实现数据资源统一管理,挖掘潜在规律,优化业务决策,让大数据真正的驱动客户业务。...

设置离线节点的调度信息

如果需要查看历史日期的调度结果,如前几天的调度数据结果,可以使用补数据功能,具体操作,请参见 补数据计划。调度周期 支持按月、周、天、小时和分钟调度。具体时间 根据选择的周期客户自定义具体开始和结束的时间。时间表达式 支持按照...

Delta Lake概述

Delta Lake以数据为中心,围绕数据流走向(数据从流入数据湖、数据组织管理和数据查询到流出数据湖)推出了一系列功能特性,协助您搭配第三方上下游工具,搭建快捷、易用和安全的数据湖。背景信息 通常的数据湖方案是选取大数据存储引擎...

同步节点

如果需要查看历史日期的调度结果,如前几天的调度数据结果,可以使用补数据功能,具体操作,请参见 新建补数据计划。调度周期 支持按月、周、天、小时和分钟调度。具体时间 根据选择的周期客户自定义具体开始和结束的时间。时间表达式 根据...

同步节点

如果需要查看历史日期的调度结果,如前几天的调度数据结果,可以使用补数据功能,具体操作,请参见 新建补数据计划。调度周期 支持按月、周、天、小时和分钟调度。具体时间 根据选择的周期客户自定义具体开始和结束的时间。时间表达式 根据...

数据迁移

本文为您介绍数据迁移的最佳实践,包含将其他业务平台的业务数据或日志数据迁移至MaxCompute,或将MaxCompute的数据迁移至其它业务平台。背景信息 传统关系型数据库不适合处理海量数据,如果您的数据存放在传统的关系型数据库且数据量庞大...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
云数据库 Redis 版 云数据库 RDS 数据库备份 DBS 弹性公网IP 短信服务 人工智能平台 PAI
新人特惠 爆款特惠 最新活动 免费试用