文档修订记录

Check节点 2024.1.12 新增功能 最佳实践 新增DataWorks大数据安全治理实践新增指南,为您介绍数据安全治理的常见思路、DataWorks产品的安全能力,以及在DataWorks上基于“基础防护建设”、“数据安全防护措施”、“数据安全持续运营”三个...

快速体验

DataWorks为您提供智能建模、数据清洗、周期调度运维、数据治理等一站式大数据开发管理能力,本文以一个零售电商行业的数仓搭建实验为例,为您介绍DataWorks在数仓搭建过程中的技术选型、技术流程以及流程实现,帮助您深入了解阿里云...

备份与恢复

克隆实例 通过克隆实例的功能,您可以根据备份文件克隆出一个新的包年包月或者按量付费实例,复杂的数据库开发部署操作采用一键式的图形化界面搞定,极的提高了工作效率。登录 Memcache 管理控制台,定位目标实例。单击实例 ID 或者管理...

数据归档概述

当线上数据库中的历史数据(访问率很低的数据)越来越多,占用的存储越来越,以至于会影响数据库的查询性能与业务运转,此时您可以使用 数据管理DMS 的数据归档功能,周期性地将指定表的数据归档至其他数据库或存储服务中。同时,该功能...

采集数据

本教程以MySQL中的用户基本信息(ods_user_info_d)表及OSS中的网站访问日志数据(user_log.txt)文件,通过数据集成离线同步任务分别同步至MaxCompute的ods_user_info_d、ods_raw_log_d表为例,为您介绍如何通过DataWorks数据集成实现异构...

采集数据

本教程以MySQL中的用户基本信息(ods_user_info_d)表及OSS中的网站访问日志数据(user_log.txt)文件,通过数据集成离线同步任务分别同步至MaxCompute的ods_user_info_d、ods_raw_log_d表为例,为您介绍如何通过DataWorks数据集成实现异构...

简介

当历史数据量较时,可通过冷数据自动转储功能,将数据存放到OSS中,减少70%以上的成本。百亿量级的轨迹查询(比如查询某段时间、某空间范围内经过的轨迹)只需亚秒级。与spark平台无缝衔接,可以提供类似轨迹相似度、OD分析等强大功能。...

测试数据构建

RDS MariaDB、其他来源MariaDB OceanBase MySQL模式 PolarDB PostgreSQL版(兼容Oracle)背景信息 功能测试或者性能测试时,往往需要准备测试数据,通常有以下几种方法:手工编写:效率低,不适用于大数据量场景。维护生成测试数据脚本:成...

时序引擎版本说明

功能优化 优化写入性能。修复单值查询超时后,读资源未释放的问题。修复使用lastest函数查询时,指定的Table未过滤时间分区的问题。修复使用SQL写入数据可能导致OOM的问题。3.4.26 发布日期 类型 说明 2023年03年14日 新特性 数据文件支持...

我是管理员

数据归档 数据归档功能定时将表的数据归档至其他数据库,支持源表数据删除、表空间整理回收等功能数据库迁移 通过创建工单实现数据库迁移、校验和清理的闭环操作。运维管理 通知管理 可根据您的业务需求,订阅不同功能模块的消息事件,...

应用场景

实时数据通道 1.1 接入多种异构数据并投递到下游多种大数据系统 通过数据总线,您可以实时接入APP、WEB、IoT和数据库等产生的异构数据,统一管理,并投递到下游的分析、归档等系统,构建清晰的数据流,让您更好的释放数据的价值。...

生成测试数据

背景信息 OceanBase 开发者中心(OceanBase Developer Center,ODC)提供模拟数据功能供用户在测试数据库性能或者验证功能等需要大量模拟数据的场景下,能够快速根据表中的字段类型生成数据。注意事项 单次模拟数据上限为 1 亿行。拥有检查...

功能特性

Hudi存储 数据导入与导出 功能功能 功能描述 参考文档 大数据数据源 Maxcompute数据源 AnalyticDB for MySQL支持通过外表、DataWorks两种方式将MaxCompute数据导入至数仓版或湖仓版集群,也支持通过外表将AnalyticDB for MySQL数仓版...

什么是MaxCompute

提供持续的SaaS化云上数据保护 为云上企业提供基础设施、数据中心、网络、供电、平台安全能力、用户权限管理、隐私保护等保三级超20项安全功能,兼具开源大数据与托管数据库的安全能力。产品架构 MaxCompute的产品架构如下。其中核心模块...

互联网、电商行业离线大数据分析

概述 电商网站的销售数据通过大数据进行分析后,可以在屏幕展示销售指标、客户指标、销售排名和订单地区分布等业务指标数据。DataV大屏支持可视化动态展示销售数据,触控大屏支持您自助查询数据,极地提高数据的可读性。应用场景 电商...

什么是DataWorks

推荐配置 推荐原因 功能:推荐购买 专业版,专业版满足企业专业的数据仓库构建需求,覆盖数据开发、任务运维、数据地图、数据质量等绝部分功能。资源:推荐购买 独享数据集成资源组,以支持更好的同步体验,支持离线同步、实时同步、全...

功能发布记录

OceanBase 数据库的数据至 RocketMQ 支持 OceanBase 数据库至 Kafka 的同步 DDL 功能,方便用户及时感知 Schema 变化 同步 OceanBase 数据库的数据至 Kafka 目标端 Kafka/DataHub/RocketMQ 支持 Debezium JSON 格式,方便对接下游大数据...

大数据安全治理的难点

存储 众所周知,大数据系统以数据类型多(结构化、非结构化、半结构化)、数据(动辄PB级别)著称,某些巨头组织一天就能新增数十万甚至数百万张表,如此体量给数据分级分类带来了极挑战,通过人工进行数据分级分类显然是不现实的,...

构建数据仓库

DataWorks具有通过可视化方式实现数据开发、治理全流程相关的核心能力,本文将为您介绍DataWorks在构建云上大数据仓库和构建智能实时数据仓库两个典型应用场景下的应用示例。构建云上大数据仓库 本场景推荐的架构如下。适用行业:全行业...

2021年

2021-03-16 全部地域 更新或删除数据(UPDATE|DELETE)MERGE INTO 表操作 ACID语义 MaxCompute管家作业诊断功能发布 MaxCompute管家发布的慢作业、错作业诊断功能,可以帮助大数据开发者和分析师在日常作业运维中,对慢作业和错作业进行...

客户案例

价值体现 从大数据平台上云整体“降本增效”的方案快速切入,迁移到大数据MaxCompute、实时计算、DataWorks后,部分任务有10倍以上的性能提升,存储从自建Hadoop 3PB降到900T,利用Flink实时数据处理能力,将宝宝树现有的场景实时化(...

场景:配置增量数据离线同步任务

离线同步任务支持您通过配置类似的数据...场景示例 同步历史数据:如果您需要将历史增量数据同步至目标表对应时间分区,您可以使用运维中心补数据功能。补数据功能使用详情请参见:执行补数据并查看补数据实例。RDS增量数据同步至MaxCompute

通用数据开发

通常数据开发的总体流程包括数据产生、数据收集与存储、数据分析与处理、数据提取和数据展现与分享。说明 上图中,虚线框内的开发流程均可基于阿里云大数据平台完成。数据开发的流程如下所示:数据产生:业务系统每天会产生大量结构化的...

计算引擎版本说明

1.2.0 新特性 新增 访问Lindorm列存数据 功能。3.2.1 1.7.0 新特性 JDBC数据源支持以Java JDBC方式访问Lindorm时序引擎。功能优化 修复CDC(数据源)的数据读取稳定性问题。JDBC(数据源)增加TSDB SQL Dialect。优化HBase(数据源)的查询...

数据分析:即时快速分析

功能概述 数据分析支持基于个人视角的数据上传、公共数据集、表搜索与收藏、在线SQL取数、SQL文件共享、SQL查询结果下载及用电子表格进行屏幕数据查看等产品功能。适用场景 适合更多非专业数据开发人员,如数据分析、产品、运营等工作...

清除数据

操作步骤 说明 在 参数设置 中禁用 FLUSHALL 命令不会影响控制台中 清除数据 功能。访问 Tair实例列表,在上方选择地域,然后单击目标实例ID。在 实例信息 页面,单击右上角的 清除数据。在弹出的对话框中,选择待清除的对象:图 1.清除...

清除数据

操作步骤 说明 在 参数设置 中禁用 FLUSHALL 命令不会影响控制台中 清除数据 功能。访问 Redis实例列表,在上方选择地域,然后单击目标实例ID。在 实例信息 页面,单击右上角的 清除数据。在弹出的对话框中,选择待清除的对象:图 1.清除...

数据标准

数据是由特定的环境产生的,这些环境因素包括生产者、时间、系统等,从而造成了同一个语义的数据,有...说明 目前使用DDM进行数据建模可以进行逻辑建模和物理建模,但物理建模仅支持MaxCompute和Hive两种大数据引擎,不支持自定义数据源类型。

DataWorks on EMR数据安全方案

数据安全能力:任务管理 DataWorks提供了大数据开发运维等能力,其中工作空间、安全中心等功能模块可实现对大数据计算任务的管理。工作空间:通过DataWorks的工作空间规划可以实现工作空间的人员管理、设置大数据作业可见性和可运维性。...

功能发布记录(2024年)

2024-03 功能名称 描述 发布时间 发布地域 使用客户 相关文档 新版补数据功能上线 周期任务开发完成并提交发布后会按照调度配置定时运行,若您希望在指定时间段运行周期任务,可使用补数据功能。补数据可通过补历史或未来一段时间的数据,...

场景:调度参数在数据集成的典型应用场景

同时,您可以结合 补数据 功能,实现将对应时间内的数据同步至目标端对应分区的功能。例如MySQL、Loghub、Kafka等。场景一:同步增量数据、场景四:同步历史数据 动态表名或文件路径 表名或文件名使用 调度参数,可实现每次同步不同表的...

创建Oracle数据

通过创建Oracle数据源能够实现Dataphin读取Oracle的业务数据或向Oracle写入数据。本文为您介绍如何创建Oracle数据源。背景信息 Oracle是一款可移植好、可靠性好、适应高、功能强大的关系型数据库。如果您使用的是Oracle,在对接Dataphin...

创建Oracle数据

通过创建Oracle数据源能够实现Dataphin读取Oracle的业务数据或向Oracle写入数据。本文为您介绍如何创建Oracle数据源。背景信息 Oracle是一款可移植好、可靠性好、适应高、功能强大的关系型数据库。如果您使用的是Oracle,在对接Dataphin...

管理问题数据

目前仅部分数据质量监控规则支持配置保留问题数据功能,支持保存问题数据的规则,详情请参见:附录:支持保留问题数据的规则列表与问题数据口径。问题数据采集最终将基于您的规则生成数据采集SQL,并在MaxCompute引擎侧执行,此过程将产生...

我是安全管理员

解决方案 数据归档概述 数据归档功能支持定时将表的数据归档至其他数据库,同时支持源表数据删除、表空间整理回收等。一键建仓 一键创建实时同步的数据仓库,数据在秒级的延迟下,同步至AnalyticDB MySQL版数据库中。数据库迁移 通过创建...

周期任务补数据

周期任务补数据功能用于对周期任务在指定的历史业务日期内进行数据回刷。周期任务开发完成并提交发布后,任务会按照调度配置定时运行,如果您希望在指定时间段运行周期任务或回刷历史一段时间区间的数据,可以使用补数据功能。节点使用的...

周期任务补数据

周期任务补数据功能用于对周期任务在指定的历史业务日期内进行数据回刷。周期任务开发完成并提交发布后,任务会按照调度配置定时运行,如果您希望在指定时间段运行周期任务或回刷历史一段时间区间的数据,可以使用补数据功能。节点使用的...

我是DBA

解决方案 数据归档 数据归档功能支持定时将表的数据归档至其他数据库,同时支持源表数据删除、表空间整理回收等。一键建仓 一键创建实时同步的数据仓库,数据在秒级的延迟下,同步至AnalyticDB MySQL版数据库中。数据库迁移 通过创建工单...

购买指引

场景1:新用户推荐配置 推荐配置 推荐原因 功能:推荐购买 专业版,专业版满足企业专业的数据仓库构建需求,覆盖数据开发、任务运维、数据地图、数据质量等绝部分功能。资源:推荐购买 独享数据集成资源组,以支持更好的同步体验,支持离...

概述

归档分区表中的冷数据功能目前处于灰度阶段,如需使用,请前往 配额中心,根据 配额ID polardb_mysql_hybrid_partition 找到配额名称,在对应的操作列单击 申请 来开通该功能。冷数据归档完成后,OSS上的归档表只读,且查询性能较差。在...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
云原生大数据计算服务 MaxCompute 云数据库 RDS 数据传输服务 数据库备份 DBS 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用