本文结合具体业务场景,为您介绍如何使用DLF+EMR两个产品实现数据湖上统一权限的最佳实践。背景说明 元数据和数据权限是DLF产品提供的数据湖构建所需的基础能力,数据湖上引擎及产品。通过DLF提供的统一元数据视图访问湖上数据,解决湖上...
当线上数据库中的历史数据(访问率很低的数据)越来越多,占用的存储越来越大,以至于会影响数据库的查询性能与业务运转,此时您可以使用 数据管理DMS 的数据归档功能,周期性地将指定表的数据归档至其他数据库或存储服务中。同时,该功能...
数据库分组 在SQL变更或结构设计中快速载入创建的数据库分组中的所有数据库。任务管理 任务管理可以对任务进行新建、启停等操作。智能化运维 智能化运维中可以查看到工单量、查询量、用户量、元数据的整体信息。工单 工单管理 DMS提供产品...
阿里云数据资源平台是数据资产定义、加工、管理、服务的全流程平台,提供数据同步、数据查询、数据标准、数据建模、数据加工、质量评估、业务模型构建、资产管理、数据服务等功能,为智能数据应用持续稳定供给全量、标准、干净、智能的数据...
数据安全共享场景:您可以通过控制密钥的所有权,管理数据使用权和数据访问的频次,实现数据安全共享,避免数据泄露。场景如下图所示:版本介绍 Spark全密态计算引擎分为 基础版和高性能版两个版本,区别如下:基础版:基础版的Spark全密态...
数据源支持情况 数据集成目前支持40种以上的数据源类型(包括关系型数据库、非结构化存储、大数据存储、消息队列等),通过定义来源与去向数据源,并使用数据集成提供的数据抽取插件(Reader)、数据写入插件(Writer),实现任意结构化、...
使用数据服务创建API前,需先将您的数据库或数据仓库添加为DataWorks数据源,以此作为数据服务API的数据来源。开发数据服务API时,数据服务将访问该数据源获取数据表的Schema信息,帮助您进一步设置请求和返回参数。本文为您介绍如何配置...
如果您有对敏感数据进行管控和脱敏的需求,可以使用 数据管理DMS 的敏感数据保护功能对数据库进行扫描,识别、脱敏和管理敏感数据。背景信息 通过敏感数据保护功能,可帮助企业及时有效地发现与识别敏感数据资产,避免敏感数据滥用,有效...
需要注意的是,脱敏保护后的数据无法展示为原值,因此推荐用在临时查询等场景,不推荐在数据交换等场景中使用。加解密方案 Dataphin支持在数据集成中针对敏感数据进行加密或者解密。Dataphin支持常见的商密和国密,如AES、RSA、SM4等算法;...
需要注意的是,脱敏保护后的数据无法展示为原值,因此推荐用在临时查询等场景,不推荐在数据交换等场景中使用。加解密方案 Dataphin支持在数据集成中针对敏感数据进行加密或者解密。Dataphin支持常见的商密和国密,如AES、RSA、SM4等算法;...
为保障数据迁移任务的顺利执行,在预检查阶段检查DTS服务器是否能够连通要迁移的目标数据库。本文将介绍目标数据库连接性检查失败可能的原因及修复方法。当目标数据库连接性预检查失败时,可能是以下几种原因。数据库账号或数据库密码不...
数据服务:可以使用设备分组表和设备分组关系表的数据。SQL分析:作为SQL分析任务的查询对象,以便进一步利用和分析设备数据。离线数据集成(DataWorks+MaxCompute):通过 大数据开发治理平台DataWorks 集成到 云原生大数据计算服务...
数据保护伞是一款数据安全管理产品,为您提供数据发现、数据脱敏、数据水印、访问控制、风险识别、数据溯源等多种功能,帮助您快速梳理敏感数据并进行安全管控,保障数据安全。本文为您介绍数据保护伞的使用流程、使用限制等内容。使用流程...
不可查看实例管理、用户管理、任务管理、配置管理、通知管理、数据库分组、智能化运维功能。申请数据库对象权限后,才可以在SQL窗口和数据方案中执行相关操作。安全管理员 进行数据字段安全分级、人员操作审计等。可以是企业的内审人员、...
功能发布更新 2024年 03月 功能名称 变更类型 功能描述 相关文档 数据工作站 新增 支持以文档形式交付查询的数据和数据变化趋势等信息,并支持在交付后使用智能工具解答数据相关问题。使用数据工作站功能可以提高数据交付效率和数据自助...
独享资源组使用场景 独享调度资源组使用场景 独享数据集成资源组使用场景 独享资源组网络配置 独享资源组访问VPC环境下数据的前提条件是什么?如何查看数据源的网络环境?添加独享资源组白名单 独享资源组商业化行为 如何对资源组进行续费...
数据迁移可以帮助您实现同构或异构数据源之间的数据迁移,适用于数据上云迁移、阿里云内部跨实例数据迁移、数据库拆分扩容等业务场景。本文介绍数据迁移功能的使用流程,帮助您快速掌握创建、监控、管理数据迁移任务的操作。背景知识 迁移...
本文介绍 数据库自治服务DAS 不同版本的费用、到期、欠费以及续费说明。计费详情 重要 实际价格以产品购买页为准。企业版 V3 说明 支持企业版 V1和V2免费迁移至企业版 V3,迁移完成前按照当前版本计费,迁移完成后按照迁移目标版本计费。...
您可以通过DataWorks的数据抽样采集器功能,从CDH Hive表中随机抽取表的部分数据用于数据保护伞的敏感数据识别。如果您在数据保护伞中配置了脱敏规则,那么在数据地图表详情页面进行数据预览时,命中的敏感字段将会被脱敏。本文为您介绍...
一、组件说明 在联邦学习任务中,对于数值类...在分组统计计算完成后,用户可以右键组件,选择【查看节点数据报告】,来查看数据的分组统计报告。组件截图 二、参数说明 参数名称 参数说明 选择特征字段 选择想要进行统计计算的字段名,多选。
您在使用数据传输的数据迁移和数据同步功能前,请先在源端和目标端数据库中,为数据迁移或同步任务创建专用的数据库用户。OceanBase 数据源 创建 OceanBase 数据库用户 此处创建的 OceanBase 数据库用户,用于创建 实例类型 为 VPC 内自建...
建立OSS外表及数据写入和导出操作,请参见 使用OSS外表高速导入OSS数据。方式四:通过Client SDK开发高效写入程序 云原生数据仓库 AnalyticDB PostgreSQL 版 Client SDK通过API形式旨在为用户提供高性能写入数据到 云原生数据仓库 ...
说明 EMR引擎暂不支持使用数据开发展示脱敏,Hologres引擎暂不支持使用数据开发/数据地图展示脱敏。数据分析展示脱敏 在 数据分析 通过 SQL Notes 查询数据时,查询的敏感数据会按照配置的脱敏规则进行脱敏。MaxCompute引擎层脱敏 通过...
数据库文件存储 功能集 功能 功能描述 参考文档 DBFS特性 原子写 支持DIRECT IO的原子写,需按4K,8K,16K对齐-共享读写 一份数据可共享式多点挂载并进行读写,读写可线性扩展-存储加密 通过对数据库文件存储实施加密,可以确保数据库文件...
DataWorks的数据上传功能支持将本地文件、数据分析的电子表格、OSS文件等数据上传至MaxCompute、EMR Hive、Hologres等引擎进行分析及管理,为您提供便捷的数据传输服务,助力您快速实现数据驱动业务。本文为您介绍如何使用数据上传功能上传...
包括数据检索、数据预览、查看元数据详情、查看数据血缘关系、分类分组管理数据表等操作。本文为您介绍如何在数据地图查看和管理MaxCompute表。前提条件 已绑定MaxCompute引擎至当前工作空间,绑定后DataWorks会面向引擎自动采集元数据,...
通过Kettle将关系型数据库、Hbase等NoSQL数据源,以及Excel、Access中的数据导入分析型数据库MySQL版中,详细操作步骤请参见 使用kettle将本地数据导入分析型数据库MySQL版。通过 Logstash 插件将采集到的日志等数据等实时写入分析型数据库...
智能数据建模是阿里云DataWorks自主研发的智能数据建模产品,沉淀了阿里巴巴十多年来数仓建模方法论的最佳实践,包含数仓规划、数据标准、维度建模及数据指标四大模块,帮助企业在搭建数据中台、数据集市建设过程中提升建模及逆向建模的...
背景信息 本案例使用的是静态数据源,因此可以直接在组件的数据配置区域粘贴准备好的数据。如果您的数据源为CSV文件、数据库等其他类型的数据,需要首先添加数据源,详情请参见 添加数据源。如果您需要使用数据源为API,直接在数据配置栏...
DataWorks为您提供了 数据开发/数据地图展示脱敏、数据集成静态脱敏、数据分析展示脱敏、MaxCompute引擎层脱敏、Hologres引擎层脱敏 等一级脱敏场景,您可直接使用。若该类场景指定生效的数据范围及用户范围无法满足您更细化的脱敏需求,则...
DataHub数据同步功能 DataHub提供数据Sink/Source功能,即数据同步功能,DataHub支持将对应Topic中的数据 实时/准实时 的同步到第三方阿里云产品中,打通阿里云产品间的数据流通。目前支持MaxCompute(原ODPS)、分析型数据库MySQL(ADS)、...
本文介绍如何将他云/自建数据库录入至数据管理DMS中。前提条件 支持录入的他云/自建数据库类型,请参见 支持的他云/自建数据库。已在他云/自建数据库的白名单中添加DMS的服务器访问地址。详细信息,请参见 设置IP白名单。目标数据库实例的...
DMS提供全域数据资产管理、数据治理、数据库设计开发、数据集成、数据开发和数据消费等功能,致力于帮助企业高效、安全地挖掘数据价值,助力企业数字化转型。视频介绍 功能特性 详情信息,请参见 功能概览。为什么选择数据管理DMS 全域数据...
背景信息 本案例使用的是静态数据源,因此可以直接在组件的数据配置区域粘贴准备好的数据。如果您的数据源为CSV文件、数据库等其他类型的数据,需要首先添加数据源,详情请参见 添加数据源。如果您需要使用数据源为API,直接在数据配置栏...
SELECT(sum(field_key1)/sum(field_key2))*100 AS"calculated_percentage"FROM"measurement_name"WHERE time()-15m GROUP BY time(1m)示例 示例数据 以下示例使用模拟的Apple Stand数据,这些数据记录了在一整天的业务中,装着不同品种苹果...
本文旨在介绍如何购买实例、创建账号、设置白名单、导入数据、连接实例和查询分析图,使您能够了解从购买图数据库GDB到开始使用的流程。前提条件 如果您是初次使用图数据库GDB,请先了解相关使用限制。具体信息,请参见 使用须知。如果您...
您可以在数据源管理页面,分享数据源权限给相应的工作空间,并进入被分享的工作空间查看该数据源。本文为您介绍如何管理数据源权限及查看分享的数据源。背景信息 通常数据源会承载数据的具体地址、账户和密码等敏感信息,但普通开发人员仅...
背景信息 本案例默认使用的是静态数据源,因此可以直接在组件的数据配置区域粘贴准备好的数据。如果您的数据源为CSV文件、数据库等其他类型的数据,需要首先添加数据源,详情请参见 添加数据源。如果您需要使用数据源为API,直接在数据配置...
若您要使用DataWorks进行MaxCompute任务的开发、管理,需先将您的MaxCompute项目创建为DataWorks的MaxCompute数据源。创建完成后,可在DataWorks的各功能模块使用该数据源连接MaxCompute项目,进行相应的数据同步、数据开发、数据分析等...
背景信息 本案例默认使用的是静态数据源,因此可以直接在组件的数据配置区域粘贴准备好的数据。如果您的数据源为CSV文件、数据库等其他类型的数据,需要首先添加数据源,详情请参见 添加数据源。如果您需要使用数据源为API,直接在数据配置...