将云消息队列 Kafka 版的数据迁移至MaxCompute

本文介绍如何使用DataWorks数据同步功能,将 云消息队列 Kafka 版 集群上的数据迁移至阿里云大数据计算服务MaxCompute,方便您对离线数据进行分析加工。前提条件 在开始本教程前,确保您在同一地域中已完成以下操作:云消息队列 Kafka 版 ...

数据上传

DataWorks的数据上传功能支持将本地文件、数据分析的电子表格、OSS文件等数据上传至MaxCompute、EMR Hive、Hologres等引擎进行分析及管理,为您提供便捷的数据传输服务,助力您快速实现数据驱动业务。本文为您介绍如何使用数据上传功能上传...

数据标准

可以参照数据标准模版中的信息项填写数据标准的主题、中文名称、英文名称等信息。进入【数据标准】模块,点击【批量导入】按钮。定位到本地磁盘中已经编辑好的数据标准Excel文件,点击【打开】按钮,即可将已填写好的数据标准批量维护到Web...

安全基线检查

数据安全中心通过动态检测数据资产配置的方式,以数据为落脚点检测阿里云上数据库资产是否存在配置风险,例如身份验证、访问控制、加密、备份和恢复等方面的配置是否安全,这些检查策略和检查项统称为安全基线检查。安全基线检查功能可以帮...

备份集查询功能概览

背景信息 传统的备份数据查询有两种方式:将备份数据文件导入至数据库,再通过数据库操作对数据进行查询,但是这种方式耗费时间长,且可能会导致数据文件被修改。通过 Hive 的方式直接对文件进行查询,但是这种方式对数据文件格式有严格的...

Kafka实时ETL同步至Hologres

数据输出预览 窗口,您可以根据需要修改输入数据,或者单击 手工构造数据 按钮自定义输入数据,然后单击 预览 按钮,查看当前数据处理节点对数据的处理结果,当数据处理节点处理异常,或者产生脏数据时,也会实时反馈异常信息,能够帮助...

Kafka单表实时入湖OSS(HUDI)

数据输出预览 窗口,您可以根据需要修改输入数据,或者单击 手工构造数据 按钮自定义输入数据,然后单击 预览 按钮,查看当前数据处理节点对数据的处理结果,当数据处理节点处理异常,或者产生脏数据时,也会实时反馈异常信息,能够帮助...

全景视角

背景信息 为提高不同使用场景下的数据治理效率和质量,DataWorks为您提供以下视角:数据管理视角:在数据资产管理、数据安全加固、数据权限管理等数据管理场景下,建议您使用数据管理视角,关注查看数据管理过程中,表的统计数据、安全权限...

SQL查询概述

应用场景 提取并下载数据:通过SQL查询可以对计算源中的数据进行提取、聚合、过滤、排序等操作,并支持下载数据,以满足数据分析和报表生成的需求。数据可视化:通过SQL查询可以对计算源中提取的业务数据以图表的形式展示,可有效的帮助...

SQL查询概述

应用场景 提取并下载数据:通过SQL查询可以对计算源中的数据进行提取、聚合、过滤、排序等操作,并支持下载数据,以满足数据分析和报表生成的需求。数据可视化:通过SQL查询可以对计算源中提取的业务数据以图表的形式展示,可有效的帮助...

EMR+DLF数据湖解决方案

通过EMR+DLF数据湖方案,可以为企业提供数据湖内的统一的元数据管理,统一的权限管理,支持数据湖的多种管理如数据生命周期,湖格式自动优化,存储分析等。同时支持多源数据入湖以及一站式数据探索的能力。本文为您介绍EMR+DLF数据湖方案...

元数据采集

DataWorks数据地图为您提供 元数据采集 功能,方便您将不同系统中的元数据进行统一汇总管理,您可以数据地图查看从各数据源汇集而来的元数据信息。本文为您介绍如何创建采集器,将各数据源的元数据信息汇集至DataWorks。前提条件 您需要...

实时同步任务延迟解决方案

如果确认是事务或者临时的大量变更导致了任务延迟,则可以等待事务或者大量变更包含的变更数据被同步任务处理完成后,任务延迟会逐步被追上。确认是否有写入动态分区频繁切换问题(uploader map size has reached ...

数据脱敏

数据安全中心(Data Security Center,简称DSC)支持静态脱敏和动态脱敏,可以脱敏数据库中的敏感数据。本文介绍如何使用静态脱敏和动态脱敏。脱敏方式 静态脱敏:通过新增脱敏任务,使用脱敏算法对敏感数据进行遮盖、加密或替换,并将脱敏...

数据库高级特性管理

可以在RDS管理控制台查看或修改数据库中的各类属性,也可以手动收缩数据库事务日志和更新数据库统计信息,以优化数据库性能和提高查询效率。前提条件 已创建数据库。创建方法,请参见 创建数据库。实例所在地域必须在:华东1(杭州)、...

新建SQL查询

Dataphin分析平台提供专注高效的SQL查询能力与丰富的数据可视化能力。本文为您介绍如何基于Dataphin分析平台新建SQL查询。操作步骤 在Dataphin首页,单击顶部菜单栏 分析,进入 分析 平台。按照下图操作指引,进入 新建SQL查询 对话框。在 ...

新建SQL查询

Dataphin分析平台提供专注高效的SQL查询能力与丰富的数据可视化能力。本文为您介绍如何基于Dataphin分析平台新建SQL查询。操作步骤 在Dataphin首页,单击顶部菜单栏 分析,进入 分析 平台。按照下图操作指引,进入 新建SQL查询 对话框。在 ...

API概览

本产品(云数据库 OceanBase 版/2019-09-01)的OpenAPI采用 RPC 签名风格,签名细节参见 签名机制说明。我们已经为开发者封装了常见编程语言的SDK,开发者可通过 下载SDK 直接调用本产品OpenAPI而无需关心技术细节。如果现有SDK不能满足...

功能发布记录(2023年)

2023-12 功能名称 功能描述 发布时间 发布地域 使用客户 相关文档 数据开发(DataStudio)绑定数据源 若您要在DataWorks中进行数据建模、数据开发或使用运维中心周期性调度任务,需先将已创建的数据源或集群绑定至数据开发(DataStudio)...

数据连接管理

在配置任务时,您可以直接选择已录入的数据库,DTS将自动填入数据信息而无需您手动输入,避免了重复输入数据信息的繁琐步骤。本文介绍如何录入、保存、编辑或删除数据库实例。前提条件 若您需要录入其他阿里云账号的数据库,需要对登录...

冷热分离

背景信息 在海量大数据场景下,一张表中的部分业务数据随着时间的推移仅作为归档数据或者访问频率很低,同时这部分历史数据体量非常,比如订单数据或者监控数据,降低这部分数据的存储成本将会极的节省企业的成本。因此,如何以极简的...

知识库

背景信息数据治理中心的 治理工作台,您可以查看当前租户下存在的治理项问题及检查项事件的详细信息,单击目标治理项类别的 处置方案,即可跳转至知识库,查看数据治理中心针对该问题提供的解决方案,参考所给方案快速处理当前问题。...

冷热分层

背景信息 在海量大数据场景下,随着业务和数据量的不断增长,性能和成本的权衡成为大数据系统设计面临的关键挑战。Delta Lake是新型数据湖方案,推出了数据流入、数据组织管理、数据查询和数据流出等特性,同时提供了数据的ACID和CRUD操作...

数据归档常见问题

冷数据归档后,PolarDB 仅存储该表的元数据信息,实际的数据信息已经存储在OSS上,对您的存储空间不会造成影响。出现 OSS error:error message:The OSS Access Key Id you provided does not exist in our records.报错,如何处理?以 OSS ...

离线同步并发和限流之间的关系

同步速率:数据同步速率和任务期望最大并发数是比较强相关的参数,两者结合在一起可以保护数据来源和数据去向端的读写压力,以避免数据同步任务对数据源带来较压力,影响数据源的稳定性。同步速率(不限流)是指按照用户配置的任务期望...

申请、续期和交还表权限

已生效数据表权限 您可以数据表 已生效 页签查看数据表基本信息及对数据表执行续期及交还操作。区域 描述 ① 筛选及搜索区 支持按照 到期日期、表类型、表环境、数据板块、表所在项目、账号类型 进行筛选。支持按照数据表的名称、表所在...

申请、续期和交还表权限

已生效数据表权限 您可以数据表 已生效 页签查看数据表基本信息及对数据表执行续期及交还操作。区域 描述 ① 筛选及搜索区 支持按照 到期日期、表类型、表环境、数据板块、表所在项目、账号类型 进行筛选。支持按照数据表的名称、表所在...

API概览

本产品(数据湖构建/2020-...ListDatabases 获取元数据库列表 获取数据湖元数据库列表,分页查询,可以根据数据库名称匹配。表 表 CreateTable 新增元数据表 新增数据湖的元数据表。DeleteTable 删除元数据表 根据名称删除数据湖的元数据表。...

数据建模:智能数据建模

智能数据建模是阿里云DataWorks自主研发的智能数据建模产品,沉淀了阿里巴巴十多年来数仓建模方法论的最佳实践,包含数仓规划、数据标准、维度建模及数据指标四大模块,帮助企业在搭建数据中台、数据集市建设过程中提升建模及逆向建模的...

从PolarDB PostgreSQL版迁移至自建Oracle

通过数据传输服务DTS(Data Transmission Service),您可以将 PolarDB PostgreSQL版 迁移至自建Oracle数据库,可用于数据回流测试、业务功能测试等场景。前提条件 PolarDB PostgreSQL版 集群中,待迁移的表需具备主键或非空唯一索引。自建...

API概览

ListDataCorrectPreCheckSQL 获预检查环节的SQL详情 获取数据变更工单中预检查环节的SQL信息列表。ListDataCorrectPreCheckDB 获取预检查环节的数据库列表 获取数据变更工单中预检查环节的数据库列表。ExecuteDataCorrect 执行数据变更工单...

功能特性

数据迁移 数据迁移功能帮助您实现同构或异构数据源之间的数据迁移,适用于数据上云迁移、阿里云内部跨实例数据迁移、数据库拆分扩容等业务场景 功能集 功能 功能描述 参考文档 同构迁移 逻辑迁移 支持同构数据库间的数据迁移。自建MySQL...

查询并下载数据

通过即席查询您可以根据当前的业务情况自定义并执行查询语句和下载查询的数据。例如,当完成计算任务开发后,您可以通过即席查询验证计算任务是否符合预期。本文为您介绍如何新建即席查询并下载结果数据。背景信息 即席查询任务使用您当前...

DataWorks数据集成

的管理控制台进行IP 白名单设置,详情请参见 添加白名单 数据导入 源端的数据源需要在DataWorks管理控制台进行添加,数据源添加的详细步骤请参考 配置AnalyticDB for PostgreSQL数据源 配置同步任务:配置好数据源后,就可以配置同步任务,...

数据服务概述

数据服务作为统一的数据服务出口,实现了数据的统一市场化管理,有效地降低数据开放门槛的同时,保障了数据开放的安全。前提条件 已购买 数据服务 增值服务,开通Dataphin 常见数据应用问题 一般从需求提出到需求交付分为:需求提出-需求...

添加RDS for PostgreSQL数据

本文为您介绍在DataV中添加RDS for PostgreSQL数据源的方法。前提条件 已准备好待添加的RDS for PostgreSQL数据源。通过内网添加数据源操作步骤 登录 DataV控制台。在 工作台 页面,单击 数据准备>数据源,进入 数据源 页面,单击 新建数据...

添加RDS for PostgreSQL数据

本文为您介绍在DataV中添加RDS for PostgreSQL数据源的方法。前提条件 已准备好待添加的RDS for PostgreSQL数据源。通过内网添加数据源操作步骤 登录 DataV控制台。在 我的数据 页签中选择 数据源管理,单击 添加数据。从 类型 列表中,...

将ECS上单节点或副本集架构的自建MongoDB迁移上云

本文介绍如何使用数据传输服务DTS(Data Transmission Service),将ECS上的单节点或副本集架构的自建MongoDB数据迁移至阿里云MongoDB实例中。通过DTS的增量迁移功能,可以实现在应用不停服的情况下,平滑完成数据库的迁移。本文为旧版DTS...

数据源权限管理

一个数据源分享给目标用户后,源数据可以控制分享关系,随时解除分享,且无需检查已分享数据源的任务依赖情况。一个数据源以 可编辑 模式分享给目标用户后,如果目标用户执行 取消分享 操作,会检查该分享数据源的任务依赖情况。如果有...

添加RDS for SQLServer数据

本文为您介绍在DataV中通过内网和外网添加RDS for SQLServer数据源的方法。前提条件 已准备好待添加的RDS for SQLServer数据源。通过内网添加数据源操作步骤 登录 DataV控制台。在 工作台 页面,单击 数据准备>数据源,进入 数据源 页面,...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
云原生大数据计算服务 MaxCompute 云数据库 RDS 数据传输服务 数据库备份 DBS 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用