调试实时任务

手动输入数据 适用于采集的数据比较少,或者需要修改已采集到的数据的场景。自动抽样数据 自动抽样到的数据是随机的,所以适用于对采集到的数据没有限制的场景。针对HBase、MySQL、MaxCompute、DataHub、Kafka数据源支持自动抽样数据,您...

调试实时任务

手动输入数据 适用于采集的数据比较少,或者需要修改已采集到的数据的场景。自动抽样数据 自动抽样到的数据是随机的,所以适用于对采集到的数据没有限制的场景。针对HBase、MySQL、MaxCompute、DataHub、Kafka数据源支持自动抽样数据,您可...

表设计规范

数据集市的数据比较容易生成,所以无需保留久远的历史数据。按数据变更规划数据的保存方式:记录客户属性、产品属性的历史变化情况,以便追溯某个时点的值。在事实表里冗余维表的字段,即把事件发生时的各种维度属性值与该事件绑定起来。...

常见问题

如果业务对数据要求比较精确,您可以删除目标库的数据,然后重新配置同步任务,并在 任务步骤 同时选中 库表结构同步 和 全量同步(默认已选中 增量同步)。DTS全量同步任务长时间没进度,如何处理?若待同步的表为无主键的表,全量同步会...

文档修订记录

QueryPublicModelEngine 2023.10.20 新增功能 上传与下载 DataWorks的上传与下载模块,提供了便捷的数据上传功能,支持将多种来源(例如,本地文件、OSS文件)的数据上传至MaxCompute大数据引擎中进行分析处理及相关管理操作,致力于为您...

水印使用限制

支持静态脱敏的数据源类型,请参见 支持的数据类型。对待嵌入水印的源数据有什么要求?由于嵌入水印的原理是将水印原子信息嵌入到不同特征的数据中去,因此源数据特征越多,越能嵌入完整的水印信息、提高提取成功率,并且即使缺失部分数据...

Hive兼容数据类型版本

15位以后的数据不作比较。位操作运算符&、|、^Hive兼容数据类型版本:返回参数类型。1.0和2.0数据类型版本:返回类型为BIGINT。LENGTH、LENGTHB、FIND_IN_SET、INSTR、SIZE、HASH、SIGN函数 Hive兼容数据类型版本:返回类型为INT。1.0和2.0...

2.0数据类型版本

本文为您介绍MaxCompute 2.0数据类型版本的定义、使用场景、支持的数据类型以及与其它数据类型版本的差异。定义 项目空间选择数据类型版本为2.0数据类型版本时,项目空间的数据类型属性参数定义如下。setproject odps.sql.type.system.odps...

标注对比饼图

图表样式 标注对比饼图是饼图的一种,与基本饼图相比,标注对比饼图支持真实值和百分比值的切换、多系列数据配置以及标签、图例、动画等配置,适用于比较平面化的数据占比情况展示。样式面板 搜索配置:单击 样式 面板右上角的搜索配置项...

采集数据

user_info_d)表及OSS中的网站访问日志数据(user_log.txt)文件,通过数据集成离线同步任务分别同步至MaxCompute的ods_user_info_d、ods_raw_log_d表为例,为您介绍如何通过DataWorks数据集成实现异构数据源间的数据同步,完成数仓数据...

采集数据

user_info_d)表及OSS中的网站访问日志数据(user_log.txt)文件,通过数据集成离线同步任务分别同步至MaxCompute的ods_user_info_d、ods_raw_log_d表为例,为您介绍如何通过DataWorks数据集成实现异构数据源间的数据同步,完成数仓数据...

数据重排

使用示例 本文将MaxCompute公共数据集TPC-DS中1 TB规格的 customer 表分别以 DISTRIBUTE BY+SORT BY、CLUSTER BY 两种排序方法重排后写入新的数据表,比较写入前后表的大小以验证存储优化效果,MaxCompute公共数据集TPC-DS详情请参见 TPC-...

质量规则参数配置

数据源:选择该物理表所属的数据源 选择比较表:选择物理表中需要比较的表及该物理表需要比较的字段。校验表数据过滤:填写数据过滤内容,例如:id=12-单表 T1.id=12 and T2.name="张三"-双表 对比表数据过滤:填写数据过滤内容,例如:...

质量规则参数配置

数据源:选择该物理表所属的数据源 选择比较表:选择物理表中需要比较的表及该物理表需要比较的字段。校验表数据过滤:填写数据过滤内容,例如:id=12-单表 T1.id=12 and T2.name="张三"-双表 对比表数据过滤:填写数据过滤内容,例如:...

离线同步并发和限流之间的关系

问题二:为什么我的数据同步任务跑的比较慢,实际运行的并发数不够?问题三:为什么我的同步任务并发数配置的很高,但是任务运行速度仍然很慢,为什么我的独享资源组经常等待资源?并发数是指数据同步任务中,可以从源端并行读取和向目标...

TPC-H

TPC-H Benchmark是由国际事务处理性能委员会(Transaction Processing Performance Council)发布的数据库领域权威测试标准之一,是被工业界和学术界普遍认可的决策支持测试标准,也是数据库选型的重要参考指标之一。经过严苛的大规模分析...

数据质量教程概述

在整体数据链路的处理过程中,为保证最终产出数据的质量,您需要对数据仓库ODS、CDM和ADS层的数据分别进行监控。数据仓库分层的定义请参见 数仓分层。本教程基于 搭建互联网在线运行分析平台 教程,ods_user_trace_log、dw_user_trace_log...

数据质量教程概述

在整体数据链路的处理过程中,为保证最终产出数据的质量,您需要对数据仓库ODS、CDM和ADS层的数据分别进行监控。数据仓库分层的定义请参见 数仓分层。本教程基于 搭建互联网在线运行分析平台 教程,ods_user_trace_log、dw_user_trace_log...

限制说明

项目 限制说明 数据类型 云数据库 Memcache 版仅支持 Key-Value 格式的数据,不支持 array、map、list 等复杂类型的数据。数据可靠性 云数据库 Memcache 版的数据存储在内存中,服务并不保证缓存数据不会丢失,有强一致性要求的数据不适合...

适配组件数据

背景信息 本文以使用 静态数据源 为例,因此可以直接在组件的数据源配置区域粘贴准备好的数据。如果您的数据源为 CSV文件、数据库 等其他类型的数据,需要首先 添加数据源。如果您需要使用的数据源为 API,直接在数据源配置栏输入API即可。...

我的资产

通过我的资产清晰掌握可使用、可管理、已授权的数据表和数据服务API数据资产相关信息。通过不同的权限来源,用户可获取数据表、API等类型数据资产的使用权限。我的资产以用户的视角展示自有权限或申请授权成功的数据表、数据服务API数据...

修改组件数据

在下方的数据配置区域内,按照您的需求修改模板已有的数据,或粘贴准备好的JSON格式的数据。说明 添加数据时的字段名要和系统设置保持一致。数据配置完成后,您可以在 设置数据源 页面单击 数据响应结果 的 图标刷新数据响应结果。数据响应...

功能简介

通过我的资产清晰掌握可使用、可管理、已授权的数据表和数据服务API数据资产相关信息。功能特性 支持以用户的视角展示自有权限或申请授权成功的数据表、数据服务API资产。支持特定角色对数据表、数据服务API等数据资产进行管理。工作组管理...

适配组件数据

背景信息 本文以使用 静态数据源 为例,因此可以直接在组件的数据配置区域粘贴准备好的数据。如果您的数据源为 CSV文件、数据库 等其他类型的数据,需要首先 添加数据源。如果您需要使用的数据源为 API,直接在数据配置栏输入API即可。具体...

功能简介

通过我的资产清晰掌握可使用、可管理、已授权的数据表、标签和数据服务API数据资产相关信息。功能特性 支持以用户的视角展示自有权限或申请授权成功的数据表、标签、数据服务API资产。支持特定角色对数据表、标签、数据服务API等数据资产...

修改组件数据

在下方的数据配置区域内,按照您的需求修改模板已有的数据,或粘贴准备好的JSON格式的数据。说明 添加数据时的字段名要和系统设置保持一致。数据配置完成后,您可以在 设置数据源 页面单击 数据响应结果 的 图标刷新数据响应结果。数据响应...

数据集成概述

数据集成是稳定高效、弹性伸缩的数据同步平台,致力于提供复杂网络环境下、丰富的异构数据源之间高速稳定的数据移动及同步能力。使用限制 数据同步:支持且仅支持结构化(例如RDS、DRDS等)、半结构化、无结构化(OSS、TXT等,要求具体同步...

敏感数据保护

Dataphin的数据分级可以在后续的数据脱敏保护、权限申请、权限下载等环节使用,支持按照不同的数据分级使用不同的管控策略。敏感数据识别 Dataphin支持通过自动识别和手动打标两种方式来生成敏感数据清单。自动识别 Dataphin支持使用识别...

敏感数据保护

Dataphin的数据分级可以在后续的数据脱敏保护、权限申请、权限下载等环节使用,支持按照不同的数据分级使用不同的管控策略。敏感数据识别 Dataphin支持通过自动识别和手动打标两种方式来生成敏感数据清单。自动识别 Dataphin支持使用识别...

修改名单抽奖数据

在下方的数据配置区域内,按照您的需求自定义修改模板已有的数据,或直接粘贴准备好的JSON格式的数据。说明 添加数据时的字段名要和系统设置保持一致。数据配置完成后,您可以在 设置数据源 页面单击 数据响应结果 的 图标刷新数据响应结果...

应用场景

数据库网关(DatabaseGateway,简称DG)具有广泛的应用场景,用户可以使用云服务访问并管理本地IDC或其他云厂商的数据库,同时也可以与其他阿里云服务集成提供丰富的解决方案。多云数据库统一管理 数据管理 DMS 是一种集数据管理、结构管理...

应用场景

数据库网关(DatabaseGateway,简称DG)具有广泛的应用场景,用户可以使用云服务访问并管理本地IDC或其他云厂商的数据库,同时也可以与其他阿里云服务集成提供丰富的解决方案。多云数据库统一管理 数据管理 DMS 是一种集数据管理、结构管理...

修改名单抽奖数据

在下方的数据配置区域内,按照您的需求自定义修改模板已有的数据,或直接粘贴准备好的JSON格式的数据。说明 添加数据时的字段名要和系统设置保持一致。数据配置完成后,您可以在 设置数据源 页面单击 数据响应结果 的 图标刷新数据响应结果...

数据页面管理

的数据分组 在 我的数据分组 页面中,您可以对不同的数据类型分成不同的组。您可以实现如下多个功能:功能 说明 新增分组 单击 我的数据分组 列表右侧的,在弹出的 新建分组 对话框中,自定义输入分组名称后单击 OK 即可新增一个数据分组...

敏感数据溯源

背景信息 通过DataWorks 数据保护伞 数据脱敏管理,开启目标 数据识别规则 数据水印 功能后,则在DataWorks中,对命中该规则的数据所执行的所有操作(例如查询、下载等)均会自动生成水印信息。水印信息用于记录用户的访问行为,...

数据页面管理

的数据分组 在 我的数据分组 页面中,您可以对不同的数据类型分成不同的组。您可以实现如下多个功能:功能 说明 新增分组 单击 我的数据分组 列表右侧的,在弹出的 新建分组 对话框中,自定义输入分组名称后单击 OK 即可新增一个数据分组...

数据源开发和生产环境隔离

数据源隔离模式可以满足标准模式下,开发环境和生产环境的数据隔离需求。背景信息 同一个名称的数据源存在开发环境和生产环境两套配置,在配置数据源时,您可基于标准模式工作空间对应底层两个数据库或数据仓库的背景,针对不同环境设置...

数据源管理概述

在使用Dataphin前,您可将需要引入Dataphin的数据源接入到Dataphin中,已接入的数据源可用于读取原始数据和写入数据建设过程中的数据。Dataphin具备丰富的数据源类型接入,支持对接如MaxCompute、Hive等数据仓库,也支持对接企业传统数据库...

数据源管理概述

在使用Dataphin前,您可将需要引入Dataphin的数据源接入到Dataphin中,已接入的数据源可用于读取原始数据和写入数据建设过程中的数据。Dataphin具备丰富的数据源类型接入,支持对接如MaxCompute、Hive等数据仓库,也支持对接企业传统数据库...

数据同步流程

数据传输提供数据同步功能,帮助您实现数据源之间的数据实时同步。适用于数据异地多活、数据异地灾备、数据聚合和实时数据仓库等多种业务场景。您可以参考以下流程进行同步前的准备工作、以及购买、配置和管理数据同步项目。完成准备工作。...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
云数据库 RDS 云数据库 Redis 版 数据库备份 DBS 数据传输服务 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用