应用场景

实时数据通道 1.1 接入多种异构数据并投递到下游多种大数据系统 通过数据总线,您可以实时接入APP、WEB、IoT和数据库等产生的异构数据,统一管理,并投递到下游的分析、归档等系统,构建清晰的数据流,让您更好的释放数据的价值。...

IoT数据自动化同步至云端解决方案

大数据分析是大数据完成数据价值化的重要手段之一,而进行大数据分析的第一步是让数据成功上云。解决方案 IoT数据自动化同步至云端解决方案主要包括存储原始数据和同步数据至分析系统两部分。IoT设备大量的数据通常以半结构化的形式存储。...

构建数据仓库

DataWorks具有通过可视化方式实现数据开发、治理全流程相关的核心能力,本文将为您介绍DataWorks在构建云上大数据仓库和构建智能实时数据仓库两个典型应用场景下的应用示例。构建云上大数据仓库 本场景推荐的架构如下。适用行业:全行业...

概述

解决方案 T+1全量同步一键建仓是指通过DLA控制台配置数据源(RDS、PolarDB for MySQL、MongoDB数据源、ECS自建数据数据)和目标OSS数据仓库,系统按照您设定的数据同步时间自动、无缝的帮您把数据源中的数据同步到目标数据仓库OSS中,...

受众与核心能力

产品定位 DataWorks致力于为数据开发者、数据分析师、数据资产管理者,打造一个具备开放自主开发与全栈数据研发能力的一站式、标准化、可视化、透明化的智能大数据全生命周期云研发平台。DataWorks赋予用户仅通过单一平台,即可实现数据...

典型场景

基于湖构建数据平台,支持BI、挖掘等业务 对象存储OSS可以作为湖存储,DLA基于OSS构建一站式的大数据平台。具体包括构建数据湖、数据ETL、交互式查询、机器学习等功能。构建数据湖 实时数据湖:支持DB的CDC与消息数据(如Kafka)入湖,构建...

创建Hudi数据

背景信息 Hudi即Apache Hudi,Hudi是一个通用的大数据存储系统,将核心仓库和数据库功能直接引入到数据库中,并支持记录级别的插入更新和删除数据的能力。权限说明 仅支持 超级管理员、数据源管理员、板块架构师、项目管理员 角色创建数据...

创建Hudi数据

背景信息 Hudi即Apache Hudi,Hudi是一个通用的大数据存储系统,将核心仓库和数据库功能直接引入到数据库中,并支持记录级别的插入更新和删除数据的能力。更多信息,请参见 Apache Hudi官网。权限说明 仅支持 超级管理员、数据源管理员、...

外部表概述

MaxCompute支持使用外部表功能查询和分析存储于OSS等外部存储系统的数据。该机制使得用户可以无需将数据导入到MaxCompute内部存储,直接对外部数据进行操作,从而提供了数据处理的灵活性和方便性。背景信息 MaxCompute SQL作为分布式数据...

数据分析概述

DataWorks提供的数据分析平台,可以流畅地进行数据处理、分析、加工及可视化操作。在数据分析板块中,您不仅可以在线洞察数据,还可以编辑和共享数据。本文为您介绍数据分析平台的优势、功能、权限等概要信息。产品优势 与本地数据分析相比...

数据迁移

本文为您介绍数据迁移的最佳实践,包含将其他业务平台的业务数据或日志数据迁移至MaxCompute,或将MaxCompute的数据迁移至其它业务平台。背景信息 传统关系型数据库不适合处理海量数据,如果您的数据存放在传统的关系型数据库且数据量庞大...

ETL工作流快速体验

GitHub十大热门编程语言 DataWorks MaxCompute 函数计算 OSS 数据集成 数据开发 基于GitHub Archive公开数据集,通过DataWorks 数据集成 模块获取过去1小时GitHub中提交次数最多的代码语言数据,在DataStudio 数据开发 模块通过函数计算...

JindoFS实战演示

使用Checksum迁移HDFS数据到OSS 使用Checksum迁移HDFS数据到OSS 2021-05-11 通过Checksum算法,你可以在大数据迁移场景中校验数据的完整性、对比数据差异并实现增量迁移。本视频为您介绍如何使用Jindo Distcp迁移HDFS数据到OSS,以及在迁移...

数据质量保障原则

一致性 一致性通常体现在跨度很大的数据仓库中。例如,某公司有很多业务数仓分支,对于同一份数据,在不同的数仓分支中必须保证一致性。例如,从在线业务库加工到数据仓库,再到各个数据应用节点,用户ID必须保持同一种类型,且长度也要...

场景:配置增量数据离线同步任务

离线同步任务支持您通过配置类似的数据过滤功能来决定同步全量数据还是增量数据,配置过滤条件时,将只同步满足过滤条件数据。同时,过滤条件可以结合调度参数使用,实现过滤条件随任务调度时间的动态变化,进而实现增量数据的同步。该...

数据集成概述

离线(批量)的数据通道通过定义数据来源和去向的数据源和数据集,提供一套抽象化的数据抽取插件(Reader)、数据写入插件(Writer),并基于此框架设计一套简化版的中间数据传输格式,从而实现任意结构化、半结构化数据源之间数据传输。...

功能特性

配置管理 数据保护 敏感数据管理 DMS的敏感数据保护能力能根据所选的敏感数据扫描模板、敏感数据识别模型以及脱敏算法对数据进行脱敏处理,以避免敏感数据滥用,有效保护企业的敏感数据资产,防止数据泄露造成企业经营资金损失或罚款。...

离线同步并发和限流之间的关系

限制和最佳实践:分布式执行模式下,配置较大任务并发度可能会对您的数据存储产生较大的访问压力,请评估数据存储的访问负载。如果您的独享资源组机器台数为1,不建议使用分布式执行模式,因为执行进程仍然分布在一台Worker节点上,无法...

功能简介

数据中台建设过程中,搭建核心处理平台,并根据相关标准要求,将源数据或治理后的数据,按照“全面、高效、统筹”的共享原则,“低延时”、“精准化”地传递给用户,方便更多应用消费数据,实现数据价值。协同管控各种组织机构,为智慧化...

统一服务

数据中台建设过程中,搭建核心处理平台,并根据相关标准要求,将源数据或治理后的数据,按照“全面、高效、统筹”的共享原则,“低延时”、“精准化”的传递给用户,方便更多应用消费数据,实现数据价值。协同管控各种组织机构,为智慧化...

功能简介

数据中台建设过程中,搭建核心处理平台,并根据相关标准要求,将源数据或治理后的数据,按照“全面、高效、统筹”的共享原则,“低延时”、“精准化”地传递给用户,方便更多应用消费数据,实现数据价值。协同管控各种组织机构,为智慧化...

数据保护伞入门

数据保护伞 是一款数据安全管理产品,提供数据发现、数据脱敏、数据水印、访问控制、风险识别、数据溯源等功能,帮助您快速梳理敏感数据并进行安全管控,保障数据安全。本文示例使用内置规则对 xc_dpe_e2_dev 项目的 phone 数据脱敏,并...

功能特性

计算 MaxCompute向用户提供了多种经典的分布式计算模型,提供TB、PB、EB级数据计算能力,能够更快速的解决用户海量数据计算问题,有效降低企业成本。功能集 功能 功能描述 参考文档 SQL开发 DDL语句 DDL语句 DDL DML操作 DML操作 DML操作 ...

排序优化

AnalyticDB PostgreSQL版 支持通过组合排序(适用于:查询SQL的等值条件或范围条件包含几个固定列)或多维排序(适用于:查询SQL包含的过滤条件不是固定的列)加速查询。背景信息 您在创建表时,可以定义一个或多个列为排序键,当有数据...

LNNVL函数

例如,某张表中存在如下两行数据:name|id-a|2 b|null 使用不同的条件,LNNVL函数的返回结果如下。条件 是否匹配到数据或空值 LNNVL返回值 lnnvl(id=1)否 a行和b行 lnnvl(id=2)是 b行 lnnvl(id>2)否 a行和b行 lnnvl(id)否 a行和b行 lnnvl...

使用示例

写入数据 本段介绍如何使用 SDK 写入数据。操作前提是您已创建出 TSDB 对象。Point 类为 TSDB 的时间点类。您可以使用 TSDB 对象的 put 方法将 Point 数据写入 TSDB 数据库。示例代码 每秒写入一个 Point(时间点)数据:package ...

Sensors Data(神策)数据

DataWorks数据集成支持使用Sensors Data Writer将数据写至Sensors Data,本文为您介绍DataWorks的Sensors Data数据同步的能力支持情况。使用限制 目前仅华南1(深圳)地域支持绑定Sensors Data数据源,其他地域会陆续支持,敬请期待!不...

大数据安全治理的难点

存储 众所周知,大数据系统以数据类型多(结构化、非结构化、半结构化)、数据(动辄PB级别)著称,某些巨头组织一天就能新增数十万甚至数百万张表,如此体量给数据分级分类带来了极挑战,通过人工进行数据分级分类显然是不现实的,...

配置Teradata输入组件

同步Teradata数据源的数据至其他数据源的场景中,您需要先配置Teradata输入组件读取的源数据源信息,再配置数据同步的目标数据源。本文为您介绍如何配置Teradata输入组件。使用限制 不支持读取Teradata数据库的视图。前提条件 在开始执行...

配置PolarDB-X(原DRDS)输入组件

同步PolarDB-X数据源的数据至其他数据源的场景中,您需要先配置PolarDB-X输入组件读取的源数据源信息,再配置数据同步的目标数据源。本文为您介绍如何配置PolarDB-X输入组件。前提条件 在开始执行操作前,请确认您已完成以下操作:已创建...

配置PolarDB-X(原DRDS)输入组件

同步PolarDB-X数据源的数据至其他数据源的场景中,您需要先配置PolarDB-X输入组件读取的源数据源信息,再配置数据同步的目标数据源。本文为您介绍如何配置PolarDB-X输入组件。前提条件 在开始执行操作前,请确认您已完成以下操作:已创建...

配置Vertica输入组件

同步Vertica数据源的数据至其他数据源的场景中,您需要先配置Vertica输入组件读取的源数据源信息,再配置数据同步的目标数据源。本文为您介绍如何配置Vertica输入组件。在开始执行操作前,请确认您已完成以下操作:已创建Vertica数据源。...

配置Vertica输入组件

同步Vertica数据源的数据至其他数据源的场景中,您需要先配置Vertica输入组件读取的源数据源信息,再配置数据同步的目标数据源。本文为您介绍如何配置Vertica输入组件。在开始执行操作前,请确认您已完成以下操作:已创建Vertica数据源。...

配置OceanBase输入组件

同步OceanBase数据源的数据至其他数据源的场景中,您需要先配置OceanBase输入组件读取的源数据源信息,再配置数据同步的目标数据源。本文为您介绍如何配置OceanBase输入组件。前提条件 在开始执行操作前,请确认您已完成以下操作:已创建...

配置OceanBase输入组件

同步OceanBase数据源的数据至其他数据源的场景中,您需要先配置OceanBase输入组件读取的源数据源信息,再配置数据同步的目标数据源。本文为您介绍如何配置OceanBase输入组件。前提条件 在开始执行操作前,请确认您已完成以下操作:已创建...

配置Teradata输入组件

同步Teradata数据源的数据至其他数据源的场景中,您需要先配置Teradata输入组件读取的源数据源信息,再配置数据同步的目标数据源。本文为您介绍如何配置Teradata输入组件。前提条件 已创建Teradata数据源,如何创建,请参见 创建Teradata...

配置IBM DB2输入组件

同步IBM DB2数据源的数据至其他数据源的场景中,您需要先配置IBM DB2输入组件读取的源数据源信息,再配置数据同步的目标数据源。本文为您介绍如何配置IBM DB2输入组件。前提条件 在开始执行操作前,请确认您已完成以下操作:已创建IBM DB2...

配置IBM DB2输入组件

同步IBM DB2数据源的数据至其他数据源的场景中,您需要先配置IBM DB2输入组件读取的源数据源信息,再配置数据同步的目标数据源。本文为您介绍如何配置IBM DB2输入组件。前提条件 在开始执行操作前,请确认您已完成以下操作:已创建IBM DB2...

DataWorks模块使用说明

使用流程概览:参考文档:数据集成概述 数据建模与开发 子模块:数据建模 功能说明:数据建模是全链路数据治理的第一步,沉淀阿里巴巴数据中台建模方法论,从数仓规划、数据标准、维度建模、数据指标四个方面,以业务视角对业务的数据进行...

配置ClickHouse输入组件

同步ClickHouse数据源的数据至其他数据源的场景中,您需要先配置ClickHouse输入组件读取的数据源信息,再配置数据同步的目标数据源。本文为您介绍如何配置ClickHouse输入组件。前提条件 在开始执行操作前,请确认您已完成ClickHouse数据源...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
云数据库 Redis 版 云数据库 RDS 数据传输服务 数据库备份 DBS 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用