快速体验

数据治理:大数据开发治理平台 DataWorks数据质量(必选)、大数据开发治理平台 DataWorks数据地图(必选)、大数据开发治理平台 DataWorks数据保护伞(必选),基础版DataWorks已包含。数据展示:智能分析套件Quick BI(必选),您可根据...

电子表格配置操作

在工具栏按照下指引,创建数据透视表。路径1:①在工具栏上点击 菜单->②点击 插入->③点击 数据透视表。路径2:在工具栏上①点击 更多->②点击 数据透视表。在创建数据透视表界面,您可以按照图示方式完成数据透视表的创建。①选择一个...

资源包选购案例

配置字段后,得到的数据透视表如下所示。说明 评估数据存储量资源包时,下表中的数据存储量需要转换为GB单位的相应数值进行近似评估。根据数据透视表中的各数据用量评估所需资源包规格。重要 此处地域以 全国通用(中国内地)为例介绍,...

数据治理

数据地图 为什么数据地图数据总览页存储量和存储趋势相差较大?数据地图血缘展示延迟问题 数据地图新建表搜不到 当前表业务逻辑变更如何通知下游?哪些类型的Hive表支持在数据地图中预览?数据保护伞 数据保护伞为什么有时候查询脱敏有...

如何操作Microsoft的Excel

刷新透视表 刷新前透视表前展示:刷新透视表后展示:示例代码(文件地址需换成自己本地):xls=rpa.app.microsoft.excel.open(r'C:\Users\XXX\Desktop\数据透视表.xlsx',visible=True)sheet1=xls.get_sheet("Sheet1")sheet1.write("D3",...

附录:数据地图权限管控能力总览

DataWorks默认租户成员可进入数据地图模块,在数据地图模块中,默认可查看已接入数据地图的项目元数据,您可通过当前文档针对以上场景进行不同粒度的访问控制。数据地图权限管控介绍 数据地图支持的 功能模块、项目、表 这三个级别的元数据...

文档修订记录

开放平台概览 2023年4月更新记录 时间 特性 类别 描述 产品文档 2023.4.23 新增功能 数据集成 数据集成的MaxCompute同步任务默认使用公共传输资源上传、下载数据至MaxCompute,为满足您业务增长对传输资源的更高要求,MaxCompute推出了独享...

通过 HyperLoglog 实现高性能多维数据透视

本文通过电商类数据透视示例,介绍了使用 AnalyticDB PostgreSQL 通过HLL预计算,实现毫秒级多维数据透视的方法。关于HyperLogLog的用法,请参考 使用HLL。实践总结 本文介绍的操作方法,涉及以下最佳实践。如您已了解操作方法,可以直接...

数据地图:统一管理,跟踪血缘

DataWorks的数据地图功能可以帮助您实现对数据的统一管理和血缘的跟踪。数据地图 以数据搜索为基础,提供表使用说明、数据类目、数据血缘、字段血缘等工具,帮助数据表的使用者和拥有者更好地管理数据、协作开发。

入门概览

本文旨在介绍如何购买实例、创建账号、设置白名单、导入数据、连接实例和查询分析,使您能够了解从购买图数据库GDB到开始使用的流程。前提条件 如果您是初次使用图数据库GDB,请先了解相关使用限制。具体信息,请参见 使用须知。如果您...

数据导入

prop6:int|-|-|-|-|-|-|-|-|1|vertex|1|2|vertex|2|3|vertex|3|#文件2|id|label|prop1:int|prop2:int|prop3:int|prop4:int|prop5:int|prop6:int|-|-|-|-|-|-|-|-|4|vertex|4|4|4|4|4|6|从Neo4j迁移数据图数据库GDB 图数据库GDB支持从Neo4...

数据总览

存储趋势 为当前租户本地域下,MaxCompute项目的逻辑存储总和趋势,此数据包含调度任务的临时文件、删除表后尚未释放的存储空间。此数据为离线统计,有T+1的延迟。项目占用存储Top 为您展示当前租户本地域下,MaxCompute项目的逻辑存储...

从OSS导入数据

本文介绍将数据从OSS导入至图数据库GDB的完整流程。前提条件 已创建图数据库GDB实例,创建方法,请参见 创建主实例。已创建OSS的Bucket,创建方法,请参见 控制台创建存储空间。已获取服务关联角色的ARN(arninfo)信息,获取方法,请参见 ...

血缘查看

使用DataWorks数据地图查看表或数据服务API时,可在对应的详情页面查看详细的血缘信息,这对于数据溯源及管理有很大帮助,本文为您介绍数据地图的血缘查看能力。表血缘 查找某张表并进入表详情页面后,您可以单击 血缘信息 页签,查看表级...

什么是阿里云Cloudera CDP

企业数据平台Cloudera Data Platform(简称阿里云CDP),是阿里云和Cloudera联合打造的阿里云上的大数据平台。Cloudera CDP企业数据平台 Cloudera企业数据云是社区版CDH的全新商业化升级产品,是阿里云和Cloudera联合打造阿里云上的大...

整体流程介绍

本文介绍将数据文件导入至图数据库GDB实例中的前提条件及操作流程。前提条件 已创建图数据库GDB实例,创建方法请参见 创建实例。已创建Bucket,创建方法请参见 创建存储空间。说明 如果是在对象存储OSS控制台创建,必须与已创建的图数据库...

网络运维场景

图数据库GDB可以轻松的对IT、网络运营的海量数据进行建模,将原始关系型数据库中结构化数据转换图数据库中的节点和边,不仅能减少DBA的数据建模工作量,又能够提升查询效率。解决传统解决方案中数据量超过一定量级时不能使用数据库和使用...

DataWorks交流钉钉群

DataWorks作为阿里云大数据平台操作系统,对接各种大数据计算引擎,以all in one box的方式提供专业高效、安全可靠的全域智能大数据平台,高效率完成数据全链路研发流程,建设企业数据治理体系,同时提供优质高效的交流服务,本文为您介绍...

数据地图概述

数据地图是在元数据基础上提供的企业数据目录管理模块,涵盖全局数据检索、元数据详情查看、数据预览、数据血缘和数据类目管理等功能。数据地图可以帮助您更好地查找、理解和使用数据。元数据采集与接入 MaxCompute数据 如果您使用了...

添加用户和数据

本文介绍如何在企业数据智能平台添加用户以及数据源。注意事项 请使用角色为 租户管理员 的账号进行 添加用户 和 添加数据源 操作。如果您是第一次使用企业数据智能平台,请使用阿里云账号进行 添加用户 和 添加数据源 操作。添加用户 登录...

使用DataWorks数据集成从MySQL导入数据到GDB

本文为您介绍通过DataWorks的数据集成功能,从RDS MySQL导入数据图数据库GDB。前提条件 已创建RDS MySQL实例,创建方法请参见 创建RDS MySQL实例。已创建图数据库GDB实例,创建方法请参见 创建实例。已完成独享资源组配置,配置方法请...

什么是数据库GDB?

图数据库(Graph Database,简称GDB)是一种支持Property Graph模型、用于处理高度连接数据查询与存储的实时、可靠的在线数据库服务。它支持Apache TinkerPop Gremlin查询语言,可以帮您快速构建基于高度连接的数据集的应用程序。图数据...

应用场景

该方案优势如下:全托管免运维 弹性扩展能力 开放数据湖架构 一站式的数据开发平台 数据查询与分析场景 在传统数据平台下,数据仓库工程师和数据分析师通常面临两个不同的环境,甚至使用不同的引擎和语法,导致数据指标和算子行为存在差异...

创建数据脱敏场景

脱敏场景介绍 DataWorks提供的 数据开发/数据地图展示脱敏、数据分析展示脱敏、MaxCompute引擎层脱敏、Hologres引擎层脱敏 等动态脱敏,及 数据集成静态脱敏 等一级脱敏场景为固定场景,不支持执行新增、编辑、删除等操作。同时,DataWorks...

业务视角管理:数据专辑

数据专辑功能帮助您按照业务视角,进行数据表的分类、分级组织和管理。您可以将指定表等加入目标专辑中进行收纳,实现快速、便捷地检索和定位。本文为您介绍如何创建并使用数据专辑,及数据专辑的管理等操作。使用限制 仅支持DataWorks专业...

元数据采集

DataWorks数据地图为您提供 元数据采集 功能,方便您将不同系统中的元数据进行统一汇总管理,您可以在数据地图查看从各数据源汇集而来的元数据信息。本文为您介绍如何创建采集器,将各数据源的元数据信息汇集至DataWorks。前提条件 您需要...

CDH Hive数据抽样采集器

您可以通过DataWorks的数据抽样采集器功能,从CDH Hive表中随机抽取表的部分数据用于数据保护伞的敏感数据识别。如果您在数据保护伞中配置了脱敏规则,那么在数据地图表详情页面进行数据预览时,命中的敏感字段将会被脱敏。本文为您介绍...

社交网络

社交类业务场景的数据模型天然具备高度连接的特点,图数据库GDB可以为社交类业务提供天然的模型支持,更加完美的匹配和理解您的数据。使用图数据库GDB,可以显著提升社交类业务程序的开发效率和质量,减少数据模型转换带来的额外损耗。1...

全景视角

背景信息 为提高不同使用场景下的数据治理效率和质量,DataWorks为您提供以下视角:数据管理视角:在数据资产管理、数据安全加固、数据权限管理等数据管理场景下,建议您使用数据管理视角,关注查看数据管理过程中,表的统计数据、安全权限...

相关的云服务

本文为您介绍典型场景下,使用开源大数据平台E-MapReduce时通常会使用到的其他云服务。云服务名称 说明 云服务器ECS 使用云服务器ECS(Elastic Compute Service)作为集群的节点,每个ECS实例集群中的一个节点。专有网络VPC 专有网络VPC...

封装流式数据(DataHub)API

本文介绍如何封装流式数据API。前提条件 工作组管理员账号登录。已创建“信息中心(xxzx)”工作组,具体操作,请参见 新建工作组并添加成员。已在系统设置添加DataHub云计算资源,具体操作,请参见 新建云计算资源。已创建API归属应用,...

账号概述

本文介绍登录图数据GDB控制台使用账号和图数据库GDB实例账号。图数据库GDB控制台登录账号 您可以使用以下账号登录图数据库GDB控制台:账号类型 说明 阿里云账号 该账号是阿里云资源的归属和计费主体。购买阿里云产品之前,您需要先注册阿里...

MaxCompute表数据

包括数据检索、数据预览、查看元数据详情、查看数据血缘关系、分类分组管理数据表等操作。本文为您介绍如何在数据地图查看和管理MaxCompute表。前提条件 已绑定MaxCompute引擎至当前工作空间,绑定后DataWorks会面向引擎自动采集元数据,...

01创建解决方案

已创建“全域数据平台”应用,具体操作,请参见 新建API归属应用。已创建“银行客户根据证件号码查询”API,具体操作,请参见 新建API-向导模式。背景信息 根据应用关联对应资源信息,包括服务、物理表、逻辑表、场景、场景节点、单节点、...

新建数据服务API-向导模式

数据服务API是一种API类型,由云计算资源中的数据通过参数配置生成,生成的API便于后续调用,可减少资源操作成本。本文介绍如何通过向导模式新建API。对原始数据层表“ys_xyk_bkxx”封装API 前提条件 工作组管理员账号登录。已创建“信息...

服务关联角色

您可以单击 图数据库 控制台上的 数据导入-OSS授权 按钮,图数据库 会自动创建服务关联角色 AliyunServiceRoleForGDB,用于允许 图数据库 访问 OSS 资源。RAM用户使用服务关联角色需要的权限 如果使用RAM用户创建或删除服务关联角色,必须...

确认表血缘

任务配置上下游节点依赖前,您需先确认当前节点的表血缘关系(例如,表数据间的血缘关系、表产出的分区数据),基于血缘关系配置节点的调度依赖。本文为您介绍如何确认表血缘,以及未基于表血缘配置节点依赖的影响。背景信息 确认表血缘,...

名词解释

下表列出了图数据库GDB所涉及到的基本概念。概念 说明 地域 地域(Region)是指您所购买的图数据库GDB实例的服务器所处的地理位置。需要在开通图数据库GDB实例时指定地域,购买实例后暂不支持更改。可用区 可用区是指在同一地域下具有独立...

数据库连接

示例:connectionPool:{ maxSize:8,maxInProcessPerConnection:4 } 关闭图数据库GDB连接 图数据库GDB每隔一段时间(约300秒)会对您的实例连接性进行保活探测(保留仍在使用的实例连接,关闭不再使用的连接),以提升交互体验,所以建议您...

数据治理

任务开发上线之后,数据正在稳定生产中,您需要对对应的业务表通过可视化查看、自动的数据质量监控、敏感数据管理等多种不同方式进行治理,而以下这些模块就可以很好的帮助您对数据进行治理。可视化元数据管理 数据地图可以可视化的查看表...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
云数据库 RDS 数据库备份 DBS 阿里邮箱 弹性公网IP 短信服务 人工智能平台 PAI
新人特惠 爆款特惠 最新活动 免费试用