数据治理

数据地图 为什么数据地图数据总览页存储量和存储趋势相差较大?数据地图血缘展示延迟问题 数据地图新建表搜不到 当前表业务逻辑变更如何通知下游?哪些类型的Hive表支持在数据地图中预览?数据保护伞 数据保护伞为什么有时候查询脱敏有...

数据地图概述

数据地图是在元数据基础上提供的企业数据目录管理模块,涵盖全局数据检索、元数据详情查看、数据预览、数据血缘和数据类目管理等功能。数据地图可以帮助您更好地查找、理解和使用数据。元数据采集与接入 MaxCompute数据 如果您使用了...

DataWorks on EMR Serverless StarRocks最佳实践

DataWorks支持StarRocks数据源,通过数据源对接EMR Serverless StarRocks,可实现EMR Serverless StarRocks的数据集成、开发、分析、数据服务等功能。本文为您介绍EMR Serverless StarRocks在DataWorks上的操作流程。背景信息 了解EMR ...

元数据采集

DataWorks数据地图为您提供 元数据采集 功能,方便您将不同系统中的元数据进行统一汇总管理,您可以在数据地图查看从各数据源汇集而来的元数据信息。本文为您介绍如何创建采集器,将各数据源的元数据信息汇集至DataWorks。前提条件 您需要...

CDH Hive数据抽样采集器

您可以通过DataWorks的数据抽样采集器功能,从CDH Hive表中随机抽取表的部分数据用于数据保护伞的敏感数据识别。如果您在数据保护伞中配置了脱敏规则,那么在数据地图表详情页面进行数据预览时,命中的敏感字段将会被脱敏。本文为您介绍...

数据导入概览

从阿里云对象存储OSS导入数据图数据库GDB实例 图数据库GDB服务端集成有数据导入模块,可以获取您提供的.csv格式的OSS数据文件,并将其解析为中的点数据和边数据,然后将点数据和边数据导入至图数据库GDB实例。步骤 步骤说明 ① 将需要...

创建数据脱敏场景

脱敏场景介绍 DataWorks提供的 数据开发/数据地图展示脱敏、数据分析展示脱敏、MaxCompute引擎层脱敏、Hologres引擎层脱敏 等动态脱敏,及 数据集成静态脱敏 等一级脱敏场景为固定场景,不支持执行新增、编辑、删除等操作。同时,DataWorks...

全景视角

背景信息 为提高不同使用场景下的数据治理效率和质量,DataWorks为您提供以下视角:数据管理视角:在数据资产管理、数据安全加固、数据权限管理等数据管理场景下,建议您使用数据管理视角,关注查看数据管理过程中,表的统计数据、安全权限...

功能发布记录(2024年)

2024.2.21 所有地域 所有DataWorks用户 DataWorks On CDP/CDH使用说明 数据服务支持实例模式的StarRocks数据源 开通E-MapReduce Serverless StarRocks集群后,您可在DataWorks中通过实例模式新增StarRocks数据源,DataWorks数据服务支持...

入门概览

本文旨在介绍如何购买实例、创建账号、设置白名单、导入数据、连接实例和查询分析,使您能够了解从购买图数据库GDB到开始使用的流程。前提条件 如果您是初次使用图数据库GDB,请先了解相关使用限制。具体信息,请参见 使用须知。如果您...

MaxCompute表数据

包括数据检索、数据预览、查看元数据详情、查看数据血缘关系、分类分组管理数据表等操作。本文为您介绍如何在数据地图查看和管理MaxCompute表。前提条件 已绑定MaxCompute引擎至当前工作空间,绑定后DataWorks会面向引擎自动采集元数据,...

DataWorks模块使用说明

使用流程概览:参考文档:数据集成概述 数据建模与开发 子模块:数据建模 功能说明:数据建模是全链路数据治理的第一步,沉淀阿里巴巴数据中台建模方法论,从数仓规划、数据标准、维度建模、数据指标四个方面,以业务视角对业务的数据进行...

快速体验

DataWorks为您提供智能建模、数据清洗、周期调度运维、数据治理等一站式大数据开发管理能力,本文以一个零售电商行业的数仓搭建实验为例,为您介绍DataWorks在数仓搭建过程中的技术选型、技术流程以及流程实现,帮助您深入了解阿里云...

整体流程介绍

本文介绍将数据文件导入至图数据库GDB实例中的前提条件及操作流程。前提条件 已创建图数据库GDB实例,创建方法请参见 创建实例。已创建Bucket,创建方法请参见 创建存储空间。说明 如果是在对象存储OSS控制台创建,必须与已创建的图数据库...

DataWorks On CDP/CDH使用说明

一、数据集成 DataWorks的数据集成模块为您提供读取和写入数据至CDP/CDH Hive、CDP/CDH HBase的能力,您需要将Hive或HBase组件创建为 DataWorks的 Hive或HBase数据源,实现将其他数据源的数据同步至Hive或HBase数据源,或将Hive或HBase数据...

什么是数据库GDB?

图数据库(Graph Database,简称GDB)是一种支持Property Graph模型、用于处理高度连接数据查询与存储的实时、可靠的在线数据库服务。它支持Apache TinkerPop Gremlin查询语言,可以帮您快速构建基于高度连接的数据集的应用程序。图数据...

DataWorks On Hologres使用说明

数据地图概述 安全中心 数据保护伞 审批中心 安全中心是集数据资产分级分类、敏感数据识别、数据授权管理、敏感数据脱敏、敏感数据访问审计、风险识别与响应于一体的一站式数据安全治理界面,帮助用户落地数据安全治理事项。安全中心概述 ...

受众与核心能力

产品受众 从事数据开发、算法开发等岗位的技术人员 从事销售运营、商业智能分析等岗位的业务人员 从事数据安全与合规工作的管理人员 从事数据应用开发的开发人员 把控公司核心数据资产的管理人员 核心能力 基于DataWorks,您可以获得如下...

管理数据

本文介绍数据树的管理功能。前提条件 已登录DataV-Atlas控制台。已添加可用数据库。上传数据 在左侧数据树中单击已添加的数据库名称。单击右上角的 上传数据。在 选择文件 页签,将文件拖拽至添加处或单击 浏览 从本地文件选择需要上传的...

数据导入

prop6:int|-|-|-|-|-|-|-|-|1|vertex|1|2|vertex|2|3|vertex|3|#文件2|id|label|prop1:int|prop2:int|prop3:int|prop4:int|prop5:int|prop6:int|-|-|-|-|-|-|-|-|4|vertex|4|4|4|4|4|6|从Neo4j迁移数据图数据库GDB 图数据库GDB支持从Neo4...

数据传输与迁移概述

MaxCompute提供多种渠道,以便您从业务系统或外部数据源写入数据到MaxCompute,或者从MaxCompute写出数据到外部系统或外部数据源。数据传输渠道 SDK-Tunnel渠道 外表(湖仓一体)JDBC渠道 场景数据写入MaxCompute 离线数据批量写入(数据...

DataWorks On MaxCompute使用说明

数据地图概述 安全中心 数据保护伞 审批中心 安全中心是集数据资产分级分类、敏感数据识别、数据授权管理、敏感数据脱敏、敏感数据访问审计、风险识别与响应于一体的一站式数据安全治理界面,帮助用户落地数据安全治理事项。安全中心概述 ...

从OSS导入数据

准备测试数据 本文将使用air-routes数据集作为测试数据数据库GDB的数据分为点文件和边文件,下载链接如下:下载点文件。下载边文件。说明 进入点文件和边文件网页后,单击右键,然后单击 另存为保存为CSV格式文件。您也可以使用其它...

文档修订记录

关系 2023.8.25 新增功能 数据集成 Amazon Redshift数据源为您提供读取和写入Amazon Redshift的双向通道,方便您后续可以通过向导模式和脚本模式配置数据同步任务。Amazon Redshift数据源 2023.8.24 新增功能 运维中心 在原有调度配置...

名词解释

下表列出了图数据库GDB所涉及到的基本概念。概念 说明 地域 地域(Region)是指您所购买的图数据库GDB实例的服务器所处的地理位置。需要在开通图数据库GDB实例时指定地域,购买实例后暂不支持更改。可用区 可用区是指在同一地域下具有独立...

账号概述

本文介绍登录图数据GDB控制台使用账号和图数据库GDB实例账号。图数据库GDB控制台登录账号 您可以使用以下账号登录图数据库GDB控制台:账号类型 说明 阿里云账号 该账号是阿里云资源的归属和计费主体。购买阿里云产品之前,您需要先注册阿里...

在GDB控制台清除实例数据

图数据库GDB实例中的数据不再使用但需要保留该实例时,您可以通过图数据库GDB提供的清除数据功能清除实例中的数据。本文介绍在图数据库GDB控制台上清除图数据库GDB实例数据的方法。注意事项 清除实例数据后仅保留实例账号信息,且清除的...

内核版本

本文为您介绍图数据库GDB不同内核版本的功能差异。Gremlin Gremlin是Apache TinkerPop框架下的查询语言,使用Gremlin可以很方便地对图数据进行查询、修改、遍历和过滤等操作。GDB Gremlin内核版本高度兼容TinkerPop Gremlin查询语言,...

SQL查询

工作空间已配置数据源:DataWorks的数据源分为引擎绑定时默认创建的引擎数据源和在数据源配置界面创建的自建数据源,若要操作非引擎数据源,请确保已创建数据源,详情请参见 创建并管理数据源。已拥有某数据源在数据分析模块的查询权限:...

常见问题

数据安全中心DSC根据为不同行业预先定义的敏感数据关键字段,扫描MaxCompute、OSS、阿里云数据库服务(RDS、PolarDB-X、PolarDB、OceanBase、表格存储等)和自建数据库中的数据,通过敏感数据规则,判断和打标敏感数据,为数据安全审计、...

使用curl命令导入数据文件

本文介绍使用curl命令将数据文件从对象存储OSS的Bucket中导入至图数据库GDB实例、查看导入任务和取消导入任务的方法。前提条件 已创建目标图数据库GDB实例,创建方法请参见 创建主实例。说明 如果Bucket是在对象存储控制台创建,请确保...

服务关联角色

您可以单击 图数据库 控制台上的 数据导入-OSS授权 按钮,图数据库 会自动创建服务关联角色 AliyunServiceRoleForGDB,用于允许 图数据库 访问 OSS 资源。RAM用户使用服务关联角色需要的权限 如果使用RAM用户创建或删除服务关联角色,必须...

使用GdbLoader脚本导入数据文件

本文介绍使用GdbLoader脚本将数据文件从对象存储OSS的Bucket中导入至图数据库GDB实例、查看导入任务和取消导入任务的方法。前提条件 已创建目标图数据库GDB实例,创建方法请参见 创建主实例。说明 如果Bucket是在对象存储控制台创建,请...

使用DataWorks(离线与实时)

最佳实践 数据库整库离线同步至MaxCompute 整库离线同步至MaxCompute OSS数据离线同步至MaxCompute EMR Hive数据整库离线同步至MaxCompute 数据库增量数据离线同步至MaxCompute RDS增量数据同步至MaxCompute Kafka增量数据同步至MaxCompute...

设置白名单

图数据库GDB实例创建成功后,您需要为图数据库GDB实例设置白名单,以允许外部设备访问图数据库GDB实例。默认的白名单只包含默认的IP地址(127.0.0.1),表示任何设备均无法访问该实例。背景信息 在初次使用目标实例前,需要先设置实例的白...

图片背景层(v2.x版本)

如果您只需要配置一张背景,可以选择在配置面板直接添加并设置图片相关参数,也可以选择在数据面板添加图片对应的字段数据来配置背景,两种方式选其一即可。如果您需要配置多张背景,则必须通过在数据面板内添加多张图片对应的字段...

支持的云服务

数据集成 MaxCompute可以通过数据集成功能加载不同数据源(例如MySQL数据库)的数据,也可以通过数据集成把MaxCompute的数据导出到各种业务数据库。数据集成功能已集成在DataWorks上,您可以直接在DataWorks上配置MaxCompute数据源并读写...

设置白名单

您需要设置白名单后才能获取图数据库GDB的连接地址。本教程将指导您如何设置白名单。前提条件 已根据快速入门完成创建实例步骤,具体操作,请参见 创建实例。操作步骤 登录 图数据库GDB控制台。在页面左上角,选择实例所在地域。单击目标...

数据库连接

示例:connectionPool:{ maxSize:8,maxInProcessPerConnection:4 } 关闭图数据库GDB连接 图数据库GDB每隔一段时间(约300秒)会对您的实例连接性进行保活探测(保留仍在使用的实例连接,关闭不再使用的连接),以提升交互体验,所以建议您...

地图容器

数据源 单击 配置数据源,可在 设置数据源 面板中修改数据源类型和数据查询代码、预览数据源返回结果以及查看数据响应结果。详情请参见 配置组件数据数据过滤器 数据过滤器提供数据结构转换、筛选和一些简单的计算功能。单击 添加过滤器...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
数据传输服务 云数据库 RDS 数据库备份 DBS 图数据库 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用