什么是数据传输服务DTS

丰富企业实时数据处理和计算场景,赋能企业数字化转型。什么是ETL 数据校验 为数据迁移或同步任务配置数据校验功能,监控源库与目标库数据的差异,以便及时发现数据不一致的问题。配置数据校验 DTS支持的数据库 DTS支持多种数据源类型,...

水波图

请求数据接口 重新请求服务端数据,上游数据处理节点或图层节点抛出的数据将作为参数。例如水波图配置了API数据源为 https://api.test ,传到 请求数据接口 动作的数据为 { id:'1'},则最终请求接口为 https://api.test?id=1 。更新组件...

水波图

请求数据接口 重新请求服务端数据,上游数据处理节点或图层节点抛出的数据将作为参数。例如水波图配置了API数据源为 https://api.test ,传到 请求数据接口 动作的数据为 { id:'1'},则最终请求接口为 https://api.test?id=1 。移动 将组件...

安全基线检查

策略名称 说明 日志监控审计 数据处理的全生命周期应具备记录和监控能力,确保数据处理过程可审计、可追溯。资产应开启日志审计或日志存储等功能。该策略检测数据库是否开启了安全日志审计、日志存储等功能。身份权限管理 数据的访问和使用...

数据服务入门

步骤三:新建业务流程 数据服务基于业务流程实现以业务为单元的数据服务API开发,并通过业务流程对API及创建API所使用的函数等文件进行组织管理。因此,在数据服务创建API前,需先新建业务流程。步骤四:生成API 业务流程创建完成后,您可...

数据集成

数据源支持情况 数据集成目前支持40种以上的数据源类型(包括关系型数据库、非结构化存储、大数据存储、消息队列等),通过定义来源与去向数据源,并使用数据集成提供的数据抽取插件(Reader)、数据写入插件(Writer),实现任意结构化、...

区域热力层(v2.x版本)

动作 动作 说明 请求地理边界geojson数据接口 重新请求服务端数据,上游数据处理节点或图层节点抛出的数据将作为参数。例如区域热力层配置了API数据源为 http://api.test ,传到 请求地理边界geojson数据接口 动作的数据为 { id:'1'},则...

概述

逻辑节点可以帮助您设置组件和组件、组件和变量或变量和变量之间的交互逻辑,实现看板内所有元素的交互。本文介绍在蓝图编辑器中,如何...各节点的使用方法以及参数详情,请分别参见 全局管理、流程控制、数据处理、设备输入 和 工具方法。

处理治理项问题

使用治理方案模板并配置治理项后,数据治理中心会根据配置的治理项检测目标租户下存在的治理项问题。您可以在DataWorks的治理工作台中查看可优化问题总数、可优化项排行、优化项类别及可优化的任务或表详情,及时发现并处理待治理问题。...

添加处理数据数据管理

数据处理后,需要将处理后的数据添加到数据管理中,以便被用于数仓建设、标签管理等数据中台任务。本文以倾斜数据处理后为例,介绍如何添加处理后数据到数据管理。前提条件 已新建数据处理任务,具体操作,请参见 新建数据处理任务。操作...

查看数据处理任务运维信息

您可以通过查看数据处理任务运维信息,快速定位任务失败的原因。本文以倾斜数据处理后为例,介绍如何查看数据处理任务运维信息。操作步骤 登录 数据资源平台控制台。在页面左上角,单击 图标,选择 协同。在顶部菜单栏,单击 图标,选择...

数据处理

数据处理类节点包括串行数据处理节点。本文介绍在蓝图编辑器中,配置数据处理类节点的方法。串行数据处理节点 串行数据处理 节点,是使用串行方式来处理一个事件。使用场景:例如,小数0.835要转换成整数百分比83%,可经过:单位转换(83.5...

影响查询性能的因素

节点数量 AnalyticDB MySQL版 使用了分布式数据处理架构,一条查询会被分解成多个Stage在不同的节点上并行执行。所以如果集群中的节点数量越多,AnalyticDB MySQL版 处理查询的能力也会越强。您可以根据实际的业务需求来决定集群节点的购买...

新建数据处理任务

系统提供数据处理能力,包括倾斜数据处理、地形数据处理、三维模型处理、影像优化处理。本文以新建倾斜数据处理任务为例,介绍如何新建数据处理任务。前提条件 已添加空间元数据,具体操作,请参见 添加数据。已添加OSS类型云计算资源。...

数据质量管理流程

本文为您介绍数据质量管理概念、数据管理流程数据质量管理是通过划分数据资产等级和分析元数据的应用链路,对不同资产等级的数据采取相对应的质量管理方式。数据质量管理流程图如下。数据管理流程说明如下:分析业务场景,根据应用的影响...

计费说明-半托管

智能研发版定价 数据处理单元规格 定价(CNY/年)500 298,000 1000 397,800 1500 497,600 2000 597,400 2500 697,200 3000 797,000 数据处理单元统计规则:数据处理单元总量=(数据同步任务数+数据集成任务数)/3+计算任务数(离线和实时)...

查看资源使用情况-半托管

资源统计项目 统计口径 描述 数据处理单元 同步&集成任务:每3个离线任务(数据同步任务+数据集成任务数)向上取整计算1个数据处理单元。计算任务:每1个离线计算任务计算1个数据处理单元。维度逻辑表:每1个维度逻辑表计算1个数据处理单元...

代码智能推荐

该功能可以利用AI模型帮助用户生成组件数据处理的代码。用户可以在对话框中描述数据处理的需求,并支持对推荐的代码内容进行修改。前提条件 已登录DataV控制台 已进入画布编辑器页面 操作步骤 在当前数据看板中随机添加一个组件(例如:...

功能简介

数据处理 支持倾斜数据处理能力,可以将OSGB格式数据转化为S3M数据,再将处理后的数据添加到数据管理中,以便被用于数仓建设、标签管理等数据中台任务。支持对数据处理任务进行管理。支持查看数据处理任务详情,包括任务的基本信息、处理的...

空间数据(邀测中)

数据处理 支持倾斜数据处理能力,可以将OSGD格式数据转化为S3M数据,再将处理后的数据添加到数据管理中,以便被用于数仓建设、标签管理等数据中台任务。支持对数据处理任务进行管理。支持查看数据处理任务详情,包括任务的基本信息、处理的...

查看资源使用情况-全托管

资源统计项目 统计口径 描述 数据处理单元 同步&集成任务:每3个离线任务(数据同步任务+数据集成任务数)向上取整计算1个数据处理单元;其中,前200个集成同步任务免费。计算任务:每1个离线计算任务或实时计算任务计算1个数据处理单元。...

教程概述

案例使用阿里云DTS将您的增量数据同步到DataHub上,再通过阿里云实时计算Flink订阅DataHub的数据进行实时计算,并将结果插入到RDS数据库中,最终通过DataV大屏进行展示。说明 本案例仅提供具体的操作指导,业务场景和数据与实际情况会有...

数据保护伞概述

使用流程 数据保护伞为您提供敏感数据规则配置、识别敏感数据、查看识别结果、处理敏感数据等管控流程,帮助您在敏感数据产生的事件前、中、后各阶段管控梳理项目中的敏感数据,保障数据安全。具体流程及相关功能介绍如下。步骤一:事前...

应用场景

处理意味着每一次处理数据量很,而且有很多张大表要做关联,经常要做一些比较复杂的查询,并且更新量也比较,使得传统的集中式数据库,出现了单点瓶颈,垂直扩容成本非常高,几乎不可接受。OceanBase 数据库的 SQL 引擎在经过了近 ...

创建并管理数据

若您想在DataWorks操作您的数据库或数据仓库(例如,MaxCompute项目数据),需先在DataWorks的数据源管理页面,将数据库或数据仓库创建为DataWorks的数据源,并将该数据源绑定至DataWorks相应的功能模块使用。例如,同步MaxCompute数据前,...

任务配置

本章节介绍数据处理-任务配置相关功能。平台可支撑自动驾驶生产线的全流程工作,包括 数据导入、数据标准化、数据预处理、数据预标注、人工标注、数据输出 等。您可拖拽所需任务节点,为其设置属性后,通过连线来快速构建所需工作流,并为...

数据标准概述

通过规范约束标准代码、度量单位、字段标准、命名词典,来保障后续建模与应用过程中数据处理的一致性,从源头上保障数据的标准化生产,节约后续数据应用和处理的成本。应用场景 DataWorks的数据标准包含 字段标准、标准代码、度量单位、...

生成测试数据

背景信息 OceanBase 开发者中心(OceanBase Developer Center,ODC)提供模拟数据功能供用户在测试数据库性能或者验证功能等需要大量模拟数据的场景下,能够快速根据表中的字段类型生成数据。注意事项 单次模拟数据上限为 1 亿行。拥有检查...

数据开发概述

数据处理:通过编写代码的方式构建复杂的数据模型、构建同步任务和构建不同类型的代码任务。即席查询:即主题式查询,面向业务主题的数据查询。屏蔽了物理模型中技术特性带来的影响,基于逻辑模型从业务视角出发对外提供查询服务。双开发...

数据开发概述

数据处理:通过编写代码的方式构建复杂的数据模型、构建同步任务和构建不同类型的代码任务。即席查询:即主题式查询,面向业务主题的数据查询。屏蔽了物理模型中技术特性带来的影响,基于逻辑模型从业务视角出发对外提供查询服务。双开发...

入门实践

本文以实现构建数据标准来设计数据模型,并通过规范化的流程,下发模型至计算引擎为例,为您介绍DataWorks数据建模的流程。前提条件 如果您使用的是阿里云主账号,请下载建模工具。如果您使用的是RAM用户,请完成授权并下载建模工具。详情...

LLM数据处理

本文以开源项目RedPajama在GitHub中的少量数据为例,为您介绍如何使用PAI提供的LLM语言模型数据处理组件,对GitHub代码数据进行数据清洗和处理。前提条件 已创建工作空间,详情请参见 创建工作空间。已将MaxCompute资源关联到工作空间,...

数据迁移和同步方案概览

数据库MongoDB提供了多种数据迁移和同步方案,可满足不同业务场景下MongoDB数据库的数据迁移和同步需求。影响 如果实例的数据库小版本过期或不在维护列表内,当执行以下操作时,为保证提供更出色的性能和稳定性,系统会默认将您的数据库...

外部表概述

随着大数据业务的不断扩展,新的数据使用场景在不断产生,MaxCompute计算框架也在不断演化。MaxCompute原来主要面对内部特殊格式数据的强大计算能力,正一步步地开放给不同的外部数据。现阶段MaxCompute SQL处理的主要是以 cfile 列格式...

数据迁移操作指导

数据迁移可以帮助您实现同构或异构数据源之间的数据迁移,适用于数据上云迁移、阿里云内部跨实例数据迁移、数据库拆分扩容等业务场景。本文介绍数据迁移功能的使用流程,帮助您快速掌握创建、监控、管理数据迁移任务的操作。背景知识 迁移...

使用场景

业务流程自动化 结合DMS任务编排的调度和依赖管理功能,可以实现业务流程的自动化处理,提高工作效率和数据处理的准确性。数据治理与数据管控 DMS任务编排提供了数据源的配置和管理功能,支持对数据源进行统一管理和控制,保证数据的安全性...

技术面临的挑战与革新

在分布式数据库中,同样也可以采用这种模式,将事务集中在一个节点处理,而这限制了事务处理的扩展能力,系统能处理的事务操作的数据范围受限于单个节点所能访问的数据范围,事务处理能力也受限于单个节点的处理能力。

数据资产等级定义

整个流程数据都存放在表中,流转链路大致如下图所示。在数据流转链路上,您需要整理各个表对应的应用业务产品。通过给这些应用业务产品划分数据资产等级,结合数据的上下游血缘,将整个链路打上某一类资产等级的标签。例如,一个A2等级的...

节点类型说明

流式类节点 流式节点,运行于流式云计算资源之上,一般支持对多种类型的数据处理。节点类型 对应的云计算资源类型 说明 Blink Blink 流式节点,运行于Blink云计算资源之上,支持对DataHub、AnalyticDB MySQL、Table Store、MaxCompute、...

互联网、电商行业离线大数据分析

方案介绍 实现互联网、电商行业离线大数据分析的流程如下:同步用户订单等数据至MaxCompute。通过DataWorks对原始数据进行处理,并形成开放API。以API的形式通过DataV在大屏上展示结果数据。方案优势 大规模存储:超大规模存储且自动扩容,...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
云原生大数据计算服务 MaxCompute 数据库备份 DBS 云数据库 RDS 云服务器 ECS 实时计算 Flink版 弹性公网IP
新人特惠 爆款特惠 最新活动 免费试用