创建数据

说明 数据流的最后一个节点必须是 数据输出,提供处理后的数据要写入的目标表。在左侧 任务类型 列表中,拖拽 数据输出 节点到画布的空白区域。单击 数据输出 节点,在页面下方的 数据输出 页签中配置数据输出节点。数据库:配置项 描述 ...

数据脱敏

设置敏感数据要移动的目标位置,测试 写入权限,并单击 下一步。确认处理逻辑。目标位置配置项 是否必填 配置项描述 触发方式选择 是 触发方式表示执行脱敏任务的方式。支持以下方式:仅人工:需要在静态脱敏配置页面,通过手动的方式启动...

采集数据

本教程以MySQL中的用户基本信息(ods_user_info_d)表及OSS中的网站访问日志数据(user_log.txt)文件,通过数据集成离线同步任务分别同步至MaxCompute的ods_user_info_d、ods_raw_log_d表为例,为您介绍如何通过DataWorks数据集成实现异构...

采集数据

本教程以MySQL中的用户基本信息(ods_user_info_d)表及OSS中的网站访问日志数据(user_log.txt)文件,通过数据集成离线同步任务分别同步至MaxCompute的ods_user_info_d、ods_raw_log_d表为例,为您介绍如何通过DataWorks数据集成实现异构...

文档修订记录

DataWorks数据安全治理路线 2023年12月更新记录 时间 特性 类别 描述 产品文档 2023.12.29 新增功能 数据开发 若您在DataWorks中进行数据建模、数据开发或使用运维中心周期性调度任务,需先将已创建的数据源或集群绑定至数据开发...

数据安全治理的难点

通常,大数据系统中的工作流涉及多部门、多责任人且跨系统的数据,如何才能协调好这些业务系统准时、保质保量地产出数据,避免出现因业务系统宕机/脏数据导致数据延时产出、产出脏数据,关乎到企业数据业务的连续性问题甚至高层的信任问题...

概述

同一份数据以不同的格式保存,数据所占用的存储空间不同,使用DLA扫描数据时所花费的时间和费用也不同。通常情况下,同一份数据以ORC格式和PARQUET格式存储时,其数据扫描性能优于普通文本CSV格式。因此,您可以将文本类型的数据转换为...

确定需求

您需要了解真实的业务需求,以及确定数据仓库解决的问题。业务调研 充分的业务调研和需求分析是数据仓库建设的基石,直接决定数据仓库能否建设成功。在数仓建设项目启动前,您需要请相关的业务人员介绍具体的业务,以便明确各个团队的...

确定需求

您需要了解真实的业务需求,以及确定数据仓库解决的问题。业务调研 充分的业务调研和需求分析是数据仓库建设的基石,直接决定数据仓库能否建设成功。在数仓建设项目启动前,您需要请相关的业务人员介绍具体的业务,以便明确各个团队的...

数据库迁移

背景信息 随着业务的发展,数据库会出现升降配、数据库整体迁移的需求,为支持此类业务场景,DMS推出数据库迁移功能,支持对多种数据库的结构、数据进行同构迁移,同时支持库名称修改、迁移前预校验、迁移后数据一致性校验及来源数据库的...

下载数据备份和日志备份

A:主要区别在于下载的备份集是完整数据还是部分数据:实例备份下载:下载对象为整个备份集的数据(整个实例数据或手动备份的单库数据,具体以备份集详情数据为准),可以将对应备份集的数据下载到本地。单库备份下载:全量单库级物理备份...

基本概念

栅格数据(Raster Data)是将地理空间分割成有规律的网格,每一个网格称为一个单元(像元或像素),并在各单元上赋予相应的属性值来表示实体的一种数据形式。栅格数据通常有两种类型的栅格数据:专题数据和影像数据。专题数据:每个栅格像...

数据风险点监控

本文为您介绍在线数据风险点监控和离线数据风险点监控。在线数据风险点监控 在线业务系统的数据生成过程中必须确保数据质量,根据业务规则对数据进行监控。说明 MaxCompute本身未提供相应的监控工具,您可以借助DataWorks进行监控。详情请...

数据源概述

说明 数据同步基于数据源控制任务读写端数据库,您需要在数据集成同步任务配置前,配置好您需要同步的源端和目标端数据库或数据仓库的相关信息,以便在同步过程中,可通过选择数据源名称来控制同步读取和写入的数据库或数据仓库。数据源...

冷热分离

背景信息 在海量大数据场景下,一张表中的部分业务数据随着时间的推移仅作为归档数据或者访问频率很低,同时这部分历史数据体量非常大,比如订单数据或者监控数据,降低这部分数据的存储成本将会极大的节省企业的成本。因此,如何以极简的...

ALTER DATABASE

ALTER DATABASE 更改一个数据库的属性。简介 ALTER DATABASE 更改一个数据库的属性。第一种形式更改某些针对每个数据库的设置。只有数据库拥有者或者超级用户可以更改这些设置。第二种形式更改数据库的名称。只有数据库拥有者或者超级用户...

概览

为了更好地指导您使用数据管理DMS(Data Management),DMS推出解决方案系列文档,旨在通过最佳实践(Step by Step)的形式向您介绍DMS研发流程、数据安全、数据开发的解决方案。研发流程解决方案 DMS为在线流程化系统,可统一管理企业内...

Kafka实时ETL同步至Hologres

数据输出预览 窗口,您可以根据需要修改输入数据,或者单击 手工构造数据 按钮自定义输入数据,然后单击 预览 按钮,查看当前数据处理节点对数据的处理结果,当数据处理节点处理异常,或者产生脏数据时,也会实时反馈异常信息,能够帮助...

管理数据源权限

您可以在数据源管理页面,分享数据源权限给相应的工作空间,并进入被分享的工作空间查看该数据源。本文为您介绍如何管理数据源权限及查看分享的数据源。背景信息 通常数据源会承载数据的具体地址、账户和密码等敏感信息,但普通开发人员仅...

数据加工过程卡点校验

本文为您介绍在线或离线业务系统的数据在生成过程中进行的卡点校验。在线系统卡点校验 在线业务系统产生的数据数据仓库的重要数据来源。在线业务系统复杂多变,每次变更都会产生数据的变化。因此,数据仓库需要适应多变的业务发展,及时...

数据模型架构规范

数据模型定义了数据之间关系和结构,使得我们可以有规律地获取想数据。例如,在一个超市里,商品的布局都有特定的规范,商品摆放的位置是按照消费者的购买习惯以及人流走向进行摆放的。数据模型的作用 数据模型是在业务需求分析之后,...

数据查询与分析管控

该功能仅对数据源查询权限进行管控,若数据源的读写操作进行权限管控,请参考 数据集成任务审批流程。数据源查询结果的操作权限管控 DataWorks支持对查询结果进行展示、复制、下载、分享等操作,并设置数据分析模块中针对该类操作的...

EMR Hive数据整库离线同步至MaxCompute

本文以阿里云EMR Hive离线同步写入MaxCompute场景为例,为您介绍如何一次性把EMR Hive整个数据库的数据离线同步至MaxCompute。背景信息 Hive是基于Hadoop的一个数据仓库工具,用来进行数据的提取、转化、加载,可以存储、查询和分析存储在...

概述

AnalyticDB MySQL Spark全密态计算引擎是首批通过信通院隐私计算可信执行环境《产品性能》和《安全功能》两项认证的产品,它可以加密敏感数据,避免数据泄露。您可以通过本文,了解Spark全密态计算引擎在安全合规等领域的应用场景、功能...

执行补数据并查看补数据实例(新版)

数据可通过补历史或未来一段时间的数据,将写入数据至对应时间分区。代码中的 调度参数,将根据补数据选择的业务时间自动替换为具体值,并结合业务代码将对应时间数据写入指定分区。具体写入的分区与执行的代码逻辑,与任务定义的代码...

准备数据

数据准备阶段,您需要同步原始数据至MaxCompute。前提条件 已完成 准备环境。已新增MaxCompute数据源。详情请参见 创建MaxCompute数据源。准备数据源 通过RDS创建MySQL实例,获取RDS实例ID。详情请参见 快速创建RDS MySQL实例。在RDS控制...

FineReport

添加表 连接AnalyticDB新建数据集:数据集通过SQL查询语句从已经建立连接的数据库中取数,将数据以二维表的形式保存并显示在数据集管理面板处。数据集管理面板选择 模板数据集,单击上方的+。在弹出的下拉列表中,选择 数据库查询。在弹出...

创建数据脱敏规则

DataWorks支持多种脱敏场景,您需根据需要选择合适场景创建相应数据脱敏规则。本文为您介绍如何创建脱敏规则,并在DataWorks中进行脱敏查询。背景信息 DataWorks的脱敏场景分为静态脱敏和动态脱敏:动态脱敏:包括 数据开发/数据地图展示...

产品概述

什么是全密态数据库 全密态数据库是数据库与存储实验室与阿里云数据库团队合作的自研产品,以技术为基石,最小化人员、平台管理等不可控因素造成的潜在数据安全隐患,可以有效杜绝云数据库服务(或应用服务等数据拥有者以外的任何人)接触...

功能概述

当您的数据库中有数据需要被保护时,可以使用RDS MySQL全密态数据库功能,该功能提供的加密解决方案能够在遵守数据保护法规的前提下保障您的数据安全,使被保护数据免受未授权访问。本文介绍全密态数据库的概念、应用场景和安全分级。什么...

产品概述

什么是全密态数据库 全密态数据库是数据库与存储实验室与阿里云数据库团队合作的自研产品,以技术为基石,最小化人员、平台管理等不可控因素造成的潜在数据安全隐患,可以有效杜绝云数据库服务(或应用服务等数据拥有者以外的任何人)接触...

产品概述

什么是全密态数据库 全密态数据库是 达摩院数据库与存储实验室 与阿里云数据库团队合作的自研产品,以技术为基石,最小化人员、平台管理等不可控因素造成的潜在数据安全隐患,可以有效杜绝云数据库服务(或应用服务等数据拥有者以外的任何...

离线同步能力说明

数据集成的离线同步功能为您提供数据读取(Reader)和写入插件(Writer),方便您通过定义来源与去向数据源,并结合DataWorks调度参数使用,将源端数据库中全量或增量数据的同步至目标数据库中。本文为您介绍离线同步的相关能力。使用限制 ...

访问外部数据

本文介绍如何在Databricks数据洞察实现访问外部数据源的需求。背景信息 Databricks数据洞察为了满足您在计算任务里访问您在阿里云上已有的数据,支持通过添加外部数据源的方式,打通集群到您自己VPC下的网络环境。绑定数据源 绑定数据源的...

添加RDS PostgreSQL数据库

本文为你介绍如何添加RDS PostgreSQL数据库。前提条件 添加数据库之前请先安装Ganos插件,详情请参见 GanosBase时空数据库。添加数据库前请先参见 创建RDS PostgreSQL实例,开通对应数据库服务并添加白名单。外网连接数据库 登录 DataV-...

创建数据库

使用云数据库RDS,您需要在实例中创建数据库。本文介绍如何为RDS PostgreSQL实例创建数据库。概念 实例:实例是虚拟化的数据库服务器。您可以在一个实例中创建和管理多个数据库。数据库:数据库是以一定方式储存在一起、能与多个用户...

CREATE DATABASE

CREATE DATABASE 用于创建一个新的PolarDB数据库。简介 CREATE DATABASE 创建一个新的PolarDB数据库。创建一个数据库,你必须是一个超级用户或者具有特殊的 CREATEDB 特权。默认情况下,新数据库将通过克隆标准系统数据库 template1 被...

添加PolarDB PostgreSQL数据库

本文为你介绍如何添加PolarDB PostgreSQL数据库。前提条件 添加数据库之前请先安装Ganos插件,详情请参见 GanosBase时空数据库。添加数据库前请先参见 创建PolarDB PostgreSQL实例,开通对应数据库服务并添加白名单。外网连接数据库 登录 ...

数据安全治理的必要性

其中,第4条“维护数据安全,应当坚持总体国家安全观,建立健全数据安全治理体系,提高数据安全保障能力”和第7条“国家保护个人、组织与数据有关的权益,鼓励数据依法合理有效利用,保障数据依法有序自由流动,促进以数据为关键要素的数字...

管理数据库资产

在进行数据库审计前,您必须在数据库审计系统中添加审计的数据库。本文介绍了在数据库审计系统中添加、编辑、删除数据库的具体操作。背景信息 关于数据库审计服务支持审计的数据库类型,请参见 支持的数据库类型。重要 数据库审计仅支持...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
云数据库 RDS 数据库备份 DBS 数据传输服务 云数据库 Redis 版 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用