什么是图数据库GDB?

例如,在一个典型的社交网络中,常常会存在“谁认识谁,上过什么学校,常住什么地方,喜欢什么餐馆”之类的查询,传统关系型数据库对于超过3张表关联的查询十分低效难以胜任,但图数据库可轻松应对社交网络的各种复杂存储和查询场景。...

特征管理

社交网络分析:使用用户的社交活动数据、连接性等特征来发现社交网络中的群体。推荐系统:电影推荐:使用用户的观看历史、评分、电影的类型、演员等特征来推荐电影。商品推荐:使用用户的购买历史、浏览行为、产品属性等特征来推荐商品。...

创建主实例

数据库GDB是一种用于处理高度互连数据集场景(例如社交网络、实施图谱)的在线数据库服务。本文介绍创建GDB实例的方法。前提条件 已注册阿里云账号。注册流程请参见 注册阿里云账号。如果您使用RAM账号购买GDB实例,您需要确保已拥有阿里...

查询诊断

AnalyticDB PostgreSQL版 查询分析功能可供您查看SQL执行计划以及对应统计信息,供您对查询进行分析和调优。本文介绍查询诊断功能的...网络传输数据量 Motion算子节点间网络传输的数据总量。网络传输耗时 Motion算子节点间网络传输数据耗时。

独享数据集成资源组

功能介绍 独享数据集成资源组的功能亮点如下:支持复杂网络环境下的数据同步。例如,跨云环境(金融云、政务云等)、跨阿里云账号、本地IDC数据同步。具有丰富的产品能力:支持离线数据同步。例如,增量与全量数据同步,单表及分库分表数据...

独享调度资源组

说明 如果独享调度资源组的应用过程中,不涉及与数据源的交互,则不涉及独享调度资源组与数据源间的网络连通问题,独享调度资源组购买后即可直接使用,无需考虑网络的相关影响。独享调度资源组购买后,需绑定一个VPC网络,后续您可以根据...

云监控控制台查看监控

分布式表文件个数 向分布式表写数据时待插入数据的文件个数。失败Query个数 查询失败的语句个数。MaterializeMySQL同步个数 使用MaterializeMySQL引擎创建的同步数据库个数。失败Insert Query个数 插入失败的语句个数。Kafka外表个数 已...

网络类型

所有经典网络类型的数据库都建立在一个共用的基础网络上。数据库之间不通过网络进行隔离,只能依靠数据库自身的安全策略来阻挡非法访问。VPC:是逻辑隔离的私有网络,用户可以自定义网络拓扑和IP地址,支持通过专线连接。相对经典网络而言...

数据集成概述

数据集成是基于Dataphin构建的简单高效的数据同步平台,致力于提供具有强大的数据预处理能力、丰富的异构数据源之间数据高速稳定的同步能力。背景信息 面对各行各业对大数据的应用,数据集成会有很多的诉求,包括能够简单高效的配置大量...

数据集成概述

数据集成是稳定高效、弹性伸缩的数据同步平台,致力于提供复杂网络环境下、丰富的异构数据源之间高速稳定的数据移动及同步能力。使用限制 数据同步:支持且仅支持结构化(例如RDS、DRDS等)、半结构化、无结构化(OSS、TXT等,要求具体同步...

配置资源组与网络连通

在数据同步任务配置前,您需要确保用于执行同步任务的独享数据集成资源组与您将要同步的数据来源端与目的端数据库的网络连通性,您可以根据数据库所在网络环境,选择合适的网络解决方案来实现网络连通。本文为您介绍数据库在不同网络环境中...

数据集成:全领域数据汇聚

DataWorks的数据集成功能模块是稳定高效、弹性伸缩的数据同步平台,致力于提供复杂网络环境下、丰富的异构数据源之间高速稳定的数据移动及同步能力。功能概述 DataWorks数据集成支持离线同步、实时同步,以及离线和实时一体化的全增量同步...

BigQuery数据

创建数据源 在进行数据同步任务开发时,您需要在DataWorks上创建一个对应的数据源,操作流程请参见 创建并管理数据源。以下对BigQuery数据源的几个配置项进行说明:BigQuery Project ID:Google BigQuery的项目名。BigQuery授权认证信息:...

新增和使用独享数据服务资源组

购买独享数据服务资源组时需要进行网络配置,您可以为独享资源组绑定一个可与目标数据源连通的VPC和该VPC下对应可用区中的V-Switch,实现自动添加路由至整个VPC网段,从而保障独享数据服务资源组与该VPC环境中的数据源之间的网络连通性。...

分组聚合查询优化

因为数据已经经过了局部聚合,所以需要网络传输的数据较少,网络压力较小。数据重分布完成后,执行最终聚合,在最终聚合节点,需要把一个分组的值及其聚合状态维护在内存中,直到所有数据处理完成,以确保某个特定的分组值没有新的数据需要...

网络连通解决方案

数据源在VPC内-VPC和Dataphin不在同一地域 在Dataphin所在地域新建一个VPC网络的ECS。使用高速通道或VPN连通两个VPC(ECS的VPC和数据源的VPC)。在Dataphin中添加数据源时,绑定ECS的VPC。添加Dataphin的IP地址(VPC网络下Dataphin的出网IP...

网络连通解决方案

数据源在VPC内-VPC和Dataphin不在同一地域 在Dataphin所在地域新建一个VPC网络的ECS。使用高速通道或VPN连通两个VPC(ECS的VPC和数据源的VPC)。在Dataphin中添加数据源时,绑定ECS的VPC。添加Dataphin的IP地址(VPC网络下Dataphin的出网IP...

添加实时数仓Hologres数据

在 我的数据 页签中选择 数据源管理,单击 添加数据。从 类型 列表中,选择 实时数仓Hologres。在列表中选择 内网,并选择Hologres实例所在的区域。选择内网数据库的网络类型(包括 专有网络 和 经典网络)。专有网络 打开 VPC 开关,进入 ...

EMR Hive数据整库离线同步至MaxCompute

本文以阿里云EMR Hive离线同步写入MaxCompute场景为例,为您介绍如何一次性把EMR Hive整个数据库的数据离线同步至MaxCompute。背景信息 Hive是基于Hadoop的一个数据仓库工具,用来进行数据的提取、转化、加载,可以存储、查询和分析存储在...

EMR Hive数据整库离线同步至MaxCompute

本文以阿里云EMR Hive离线同步写入MaxCompute场景为例,为您介绍如何一次性把EMR Hive整个数据库的数据离线同步至MaxCompute。背景信息 Hive是基于Hadoop的一个数据仓库工具,用来进行数据的提取、转化、加载,可以存储、查询和分析存储在...

约束和限制

目录下面采样最新和最老的文件,每个文件读取前1000行 元数据发现SLS数据源发现历史投递数据 如果投递中途修改了分区格式,不会发现修改前的数据 一键建仓/多库合并支持的数据网络类型 VPC 一键建仓/多库合并支持的数据源 PolarDB MySQL ...

MySQL节点

访问公网或VPC网络的MySQL数据源,请选择与MySQL数据源网络连通的调度资源组,作为周期调度任务使用的资源组。详情请参见 配置资源组与网络连通。提交并发布节点任务。单击工具栏中的 图标,保存节点。单击工具栏中的 图标,提交节点任务。...

Amazon Redshift数据

创建数据源 在进行数据同步任务开发时,您需要在DataWorks上创建一个对应的数据源,操作流程请参见 创建与管理数据源。以下对Amazon Redshift数据源的几个配置项进行说明。JDBC URL:请填写JDBC连接串,包含IP、端口号、数据库和连接参数。...

新建 TiDB 数据

建议您为数据迁移项目创建一个专属的数据库用户,该用户必须具备相关的数据操作权限。详情请参见 创建 TiDB 数据库用户。如果您需要订阅 TiDB 增量日志,请准备 Kafka 数据源和 Kafka Topic。并且,请根据 TiDB 官方文档,提前创建 TiDB ...

添加实时数仓Hologres数据

新添加的数据源会自动列在数据源列表中。通过外网添加数据源操作步骤 登录 DataV控制台。在 工作台 页面,单击 数据准备>数据源,进入 数据源 页面,单击 新建数据源。从 类型 列表中,选择 实时数仓Hologres。在列表中选择 外网。填写数据...

数据传输作业:数据集成

在配置同步任务前,您需要确保数据集成资源组与您将同步的数据网络环境已经连通,详情请参见 配置资源组与网络连通。实时同步 DataWorks提供的实时数据同步功能,使用单表或整库同步方式,将源端数据库中部分或全部表的数据变化实时同步...

概述

DataHub数据同步功能 DataHub提供数据Sink/Source功能,即数据同步功能,DataHub支持将对应Topic中的数据 实时/准实时 的同步到第三方阿里云产品中,打通阿里云产品间的数据流通。目前支持MaxCompute(原ODPS)、分析型数据库MySQL(ADS)、...

通过DataWorks导入数据

DataWorks提供了可视化的数据导入方式,相对于通过外表导入,DataWorks导入的方式更为轻量化,适合数据量相对较小的数据导入场景。本文介绍如何通过DataWorks将RDS SQL Server数据导入至 AnalyticDB MySQL版 湖仓版(3.0)或 数仓版(3.0)...

资源规划和配置

网络 支持公网、阿里云VPC网络(实例模式&连接串模式)、IDC网络的数据源。支持公网、阿里云VPC(实例模式)、阿里云经典网络的数据源。说明 深圳金融云暂不支持使用公共资源组访问经典网络的数据源。收费方式 根据资源组的规格,...

Napatech案例

业务挑战 随着网络数据流量的爆增以及业务可用性要求的不断提升,Napatech公司的用户可以将数据包采集和分析的能力提升至200G,然而上层软件产生的流量数据包元数据也爆增,给后台数据库(比如开源的HBase/ElasticSearch)的存储和索引能力...

Kafka实时ETL同步至Hologres

专有网络:选择需要同步的数据源所绑定的专有网络。可用区、交换机:优先选择数据源所在的可用区和交换机;如果所在的可用区不可选择,则选择其他任意可用区和交换机。但您需要确保VPC网络跟数据源所在的VPC网络可连通。安全组:可以选择您...

数据源配置常见问题

请根据数据库的网络类型和所在地域,将相应的DataV服务器IP地址加入到您的数据库白名单或ECS的安全组设置中,或者使用代理工具来连接您的数据库,具体请参见 如何使用DataV Proxy。如何配置CSV数据来源?保留CSV的首行作为表头,并且每一个...

数据源配置常见问题

请根据数据库的网络类型和所在地域,将相应的DataV服务器IP地址加入到您的数据库白名单或ECS的安全组设置中,或者使用代理工具来连接您的数据库,具体请参见 如何使用DataV Proxy。如何配置CSV数据来源?保留CSV的首行作为表头,并且每一个...

MySQL整库实时同步至OSS数据

配置页面的右侧为源端数据库表的预览,是根据上述步骤中配置的数据源预览出来的待同步的数据库表和已选择好要同步的数据库表的预览情况。您可根据待同步的源端数据库表的数量,参考以下操作建议,快速选择要同步的库表。如果您的数据库表...

配置MySQL输入

DataWorks的数据集成实时同步MySQL数据是基于实时订阅MySQL实现的,实时同步MySQL数据目前仅支持配置MySQL数据源为RDS的 5.x 或 8.x 版本的MySQL,如果需要同步DRDS的MySQL,请不要将DRDS的MySQL配置为MySQL数据源,您可以参考 配置DRDS...

专有网络VPC的数据源连通独享数据集成资源组

本文以阿里云RDS数据库为例,为您介绍专有网络VPC的数据源如何连通独享数据集成资源组。前提条件 购买RDS MySQL实例。本文以购买MySQL 5.7版本的MySQL实例为例,您可以根据业务需求进行配置。详情请参见 快速创建RDS MySQL实例。在目标实例...

通过DataV展示数据

选择 我的数据>添加数据。填写RDS实例的相关信息,单击 确定。说明 进入 云数据库RDS控制台,单击RDS MySQL实例链接,进入实例的 基本信息 页面,获取以上信息。如果您的网络类型为 内网,则对应的 域名 为RDS MySQL实例的内网地址。如果您...

新建 OceanBase 数据

oblogproxy Port(可选)_OCEANBASE_INNER_DRC_USER 密码(可选)本用户主要用于 OceanBase 数据库内无唯一键表的数据迁移。请注意:您需要在当前数据源所在的租户下创建本用户。单击 测试连接,验证数据传输和数据源的网络连接,以及用户...

整库离线同步至Elasticsearch

同步任务支持的数据源及其配置详情请参见 支持的数据源及同步方案。说明 数据源相关能力介绍详情请参见:数据源概述。已完成数据源环境准备。您可以基于您需要进行的同步配置,在同步任务执行前,授予数据源配置的账号在数据库进行相应操作...

通过DataWorks导入数据

DataWorks提供了可视化的数据导入方式,相对于通过外表导入,DataWorks导入的方式更为轻量化,适合数据量相对较小的数据导入场景。本文介绍如何通过DataWorks将RDS MySQL数据导入至 AnalyticDB MySQL版 湖仓版(3.0)或 数仓版(3.0)。...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
云数据库 RDS 数据库备份 云数据库 Redis 版 弹性公网IP 短信服务 人工智能平台 PAI
新人特惠 爆款特惠 最新活动 免费试用