大数据与网络营销-大数据与网络营销文档介绍内容-阿里云

数据分析整体趋势

大数据与数据库一体化：早期大数据技术以牺牲一定程度一致性为基础提供分布式能力，解决了传统单机数据库的扩展性不足问题，在MapReduce基础上提供了标准SQL接口，架构上也逐步采用了部分MPP数据库技术；另一方面，分布式数据库也快速发展...

BigQuery数据源

网络打通的具体方法可参考：配置资源组与网络连通。数据同步任务开发 BigQuery数据同步任务的配置入口和通用配置流程指导可参见下文的配置指导，详细的配置参数解释可在配置界面查看对应参数的文案提示。创建数据源在进行数据同步任务开发...

PostgreSQL数据源

由于主备数据同步存在一定的时间差，特别在于某些特定情况，例如网络延迟等问题，导致备库同步恢复的数据与主库有较大差别，从备库同步的数据不是一份当前时间的完整镜像。一致性约束 PostgreSQL在数据存储划分中属于RDBMS系统，对外可以...

应用场景

实时数据通道 1.1 接入多种异构数据并投递到下游多种大数据系统通过数据总线，您可以实时接入APP、WEB、IoT和数据库等产生的异构数据，统一管理，并投递到下游的分析、归档等系统，构建清晰的数据流，让您更好的释放数据的价值。...

通用数据开发

通常数据开发的总体流程包括数据产生、数据收集与存储、数据分析与处理、数据提取和数据展现与分享。说明上图中，虚线框内的开发流程均可基于阿里云大数据平台完成。数据开发的流程如下所示：数据产生：业务系统每天会产生大量结构化的...

快速体验

DataWorks为您提供智能建模、数据清洗、周期调度运维、数据治理等一站式大数据开发管理能力，本文以一个零售电商行业的数仓搭建实验为例，为您介绍DataWorks在数仓搭建过程中的技术选型、技术流程以及流程实现，帮助您深入了解阿里云...

通过DataWorks导入

详情请参见：配置资源组与网络连通。操作步骤配置同步的源端数据库读插件。具体操作，请参见 HDFS Reader。配置同步的目标端数据库写插件。具体操作，请参见 AnalyticDB for MySQL 3.0 Writer。配置同步任务。具体操作，请参见通过向导...

通过DataWorks导入数据

详情请参见：配置资源组与网络连通。操作步骤配置同步的源端数据库读插件。具体操作，请参见 DRDS Reader。配置同步的目标端数据库写插件。具体操作，请参见 AnalyticDB for MySQL 3.0 Writer。配置同步任务。具体操作，请参见通过向导...

MySQL分库分表同步至Hologres（方案1.0）

详情请参见：配置资源组与网络连通。已完成数据源环境准备。Hologres：本实践需要在目标端创建Schema，所以您需要先授权数据源配置账号在Hologres创建Schema的权限，详情请参见 Hologres权限模型概述。MySQL：来源数据源为MySQL时，您需要...

同阿里云主账号访问

详情请参见配置资源组与网络连通。场景一：DataWorks与数据源处于同地域时 DataWorks工作空间与数据源同阿里云主账号、同地域时，您可以通过如下两种方案进行网络打通。方案1：将DataWorks资源组与数据源置于同一VPC内资源组侧，新增专有...

配置资源组与网络连通

在数据同步任务配置前，您需要确保用于执行同步任务的独享数据集成资源组与您将要同步的数据来源端与目的端数据库的网络连通性，您可以根据数据库所在网络环境，选择合适的网络解决方案来实现网络连通。本文为您介绍数据库在不同网络环境中...

跨阿里云主账号访问

您在跨账号进行数据同步任务之前，需要设置并确保执行任务的独享数据集成资源组，与源端及目标端数据库之间的网络连通性。本文将为您介绍在使用跨阿里云账号时，数据库与DataWorks工作空间之间的网络连通操作。背景信息网络连通方案选择取...

Memcache（OCS）数据源

Memcache（原名OCS）数据源为您提供其它数据...否 0，0永久有效 batchSize 一次性批量提交的记录数大小，该值可以极大减少数据同步系统与MySQL的网络交互次数，并提升整体吞吐量。如果该值设置过大，会导致数据同步运行进程OOM异常。否 1,024

Vertica数据源

Vertica是一款基于列存储的MPP架构的数据库，Vertica...否无 batchSize 一次性批量提交的记录数大小，该值可以极大减少数据同步系统与Vertica的网络交互次数，并提升整体吞吐量。如果该值设置过大，会导致数据同步运行进程OOM异常。否 1,024

简介

系统兼容开源GeoMesa、GeoServer等生态，内置了高效的时空索引算法、空间拓扑几何算法、遥感影像处理算法等，结合云数据库HBase强大的分布式存储能力以及Spark分析平台能力，广泛应用于空间、时空、遥感大数据存储、查询、分析与数据挖掘...

Oracle数据源

由于主备数据同步存在一定的时间差，在网络延迟等特定情况下，会导致备库同步恢复的数据与主库有较大差别，从备库同步的数据不是一份当前时间的完整镜像。一致性约束 Oracle在数据存储划分中属于RDBMS系统，对外可以提供强一致性数据查询...

ClickHouse数据源

ClickHouse数据源为您提供读取和写入ClickHouse...否无 batchSize 一次性批量提交的记录数大小，该值可以极大减少数据同步系统与ClickHouse的网络交互次数，并提升整体吞吐量。如果该值设置过大，会导致数据同步运行进程OOM异常。否 1,024

数据量

在数据库备份场景下，有4个概念：数据库磁盘空间、数据文件空间、备份数据量、存储数据量。数据量说明数据库磁盘空间由数据库的数据文件空间、数据库的日志文件空间、操作系统文件空间和空闲空间组成。说明 RDS中为：购买时选择的存储...

大数据AI公共数据集分析

本教程通过DataWorks，联合云原生大数据计算服务MaxCompute，使用大数据AI公共数据集（淘宝、飞猪、阿里音乐、Github、TPC等公共数据），指导您如何快速进行大数据分析，快速熟悉DataWorks的操作界面与最基础的数据分析能力。DataWorks的更...

通用参考：添加路由

如果添加路由后，仍然存在网络连通问题，请根据如下因素进行排查：如果独享资源组访问的是本地IDC数据源，或者跨账号访问数据源，请先参考配置资源组与网络连通进行网络连通，再为独享资源组绑定与数据库网络连通的VPC。如果您的数据源已...

产品简介

DLA Ganos是基于云原生数据湖分析（Data Lake Analytics，DLA）系统设计开发的，面向时空大数据存储与计算的数据引擎产品。基于DLA无服务器化（Serverless）数据湖分析服务与内置的Spark计算引擎，DLA Ganos打通了阿里云各个存储系统，如...

通用参考：按量付费转包年包月

若资源组切换后由于网络问题导致任务失败，请参考配置资源组与网络连通对资源组进行网络配置。切换任务配置时的默认资源组您需要进入数据开发界面，在设置>调度设置中修改任务使用的默认资源组，修改后，后续新建的任务将默认使用该...

Kafka单表实时入湖OSS（HUDI）

准备独享数据集成资源组并与数据源网络连通在进行数据同步前，需要完成您的独享数据集成资源组和数据源的网络连通，详情请参见配置资源组与网络连通。说明 OSS数据源在下一步新增OSS数据源时，指定Endpoint地址，即可实现OSS数据源与独享...

元数据采集

DataWorks数据地图为您提供元数据采集功能，方便您将不同系统中的元数据进行统一汇总管理，您可以在数据地图查看从各数据源汇集而来的元数据信息。本文为您介绍如何创建采集器，将各数据源的元数据信息汇集至DataWorks。前提条件您需要...

独享资源组模式

如果做过网络打通，即存在数据库和DataWorks不在同一个region、数据库和DataWorks不在同一个阿里云账号、数据库在本地IDC环境下等需要网络打通的情况，请为独享绑定数据库已经打通的VPC，请参见新增和使用独享数据集成资源组，再在绑定...

Kafka实时ETL同步至Hologres

准备独享数据集成资源组并与数据源网络连通在进行数据同步前，需要完成您的独享数据集成资源组和数据源的网络连通，详情请参见配置网络连通。说明 Kafka与Hologres支持的网络类型如下：Kafka:指定VPC网络、公网。Hologres:指定VPC网络、...

SQL Server数据源

由于主备数据同步存在一定的时间差，特别在于某些特定情况，例如网络延迟等问题，导致备库同步恢复的数据与主库有较大差别，从备库同步的数据不是一份当前时间的完整镜像。一致性约束 SQL Server在数据存储划分中属于RDBMS系统，对外可以...

AnalyticDB for PostgreSQL数据源

AnalyticDB for PostgreSQL数据源...否无 batchSize 一次性批量提交的记录数大小，该值可以极大减少数据集成与AnalyticDB for PostgreSQL的网络交互次数，并提升整体吞吐量。但是该值设置过大可能会造成数据集成运行进程OOM情况。否 1,024

ApsaraDB For OceanBase数据源

ApsaraDB for OceanBase数据源提供读取和写入...否无 batchSize 一次性批量提交的记录数大小，该值可以极大减少数据同步系统与服务器端的网络交互次数，并提升整体吞吐量。说明 fetchSize 值过大（>2048）可能造成数据同步进程OOM。否 1,024

DB2数据源

由于主备数据同步存在一定的时间差，特别在网络延迟等情况下，会导致备库同步恢复的数据不是一份当前时间的完整镜像，与主库有较大差别。一致性约束 DB2在数据存储划分中属于RDBMS系统，对外可以提供强一致性数据查询接口。例如，一次同步...

连接方式概述

OceanBase Connector/C 也称为 LibOBClient，用于应用程序作为独立的服务器进程通过网络连接与数据库服务器 OBServer 节点进行通信。客户端程序在编译时会引用 C API 头文件，同时可以连接到 C API 库文件。说明 LibOBClient 生成的 so ...

DM（达梦）数据源

DM（达梦）数据源作为数据中枢，为您提供读取和写入DM...否无 batchSize 一次性批量提交的记录数大小，该值可以极大减少数据集成与DM（达梦）的网络交互次数，并提升整体吞吐量。但是该值设置过大可能会造成数据集成运行进程OOM情况。否 1024

GBase8a数据源

GBase8a数据源为您提供读取和写入GBase8a双向通道的...否无 batchSize 一次性批量提交的记录数大小，该值可以极大减少数据同步系统与Gbase8a的网络交互次数，并提升整体吞吐量。如果该值设置过大，会导致数据同步运行进程OOM异常。否 1,024

离线同步任务调优

跨云、跨区域同步数据时，建议网络打通后走内网进行同步，网络连通解决方案详情请参见：配置资源组与网络连通。检查数据库负载情况。限制同步速度数据集成同步任务默认不限速，任务将在所配置的并发数的限制上以最高能达到的速度进行同步...

客户案例

客户简介快狗打车则一直坚持通过“连接网络化”、“运力共享化”、“过程数据化”、“匹配智能化”等数字信息化解决方案，将闲散运力统一整合到平台上，通过大数据将运力精准匹配市场需求，实现运力的节能减排，降低空驶率，有效提升行业...

数据服务入门

步骤一：创建数据源并配置网络连通性使用数据服务创建API前，您需将数据库或数据仓库添加为DataWorks的数据源，并保障数据服务资源组与您的目标数据源网络连通，以便调用API时DataWorks可成功访问数据源。说明 DataWorks工作空间将集群或...

网络连通解决方案

添加数据源时需要根据数据源所在网络环境，通过对应的网络解决方案，实现Dataphin与数据源的网络连通。本文为您介绍数据源在不同网络环境中与Dataphin的网络连通方案。网络连通方案根据数据源所在的网络环境，在下图中选择对应的网络连通...

系统管理

详情请参见配置资源组与网络连通。数据上传：引擎限制：仅支持将数据上传至MaxCompute、EMR Hive、Hologres引擎。资源组限制：数据上传功能需指定调度资源组和数据集成资源组。上传数据至MaxCompute引擎：支持使用公共资源组及独享资源组...

引擎简介

典型场景大数据场景：海量数据存储与分析广告场景：海量广告营销数据的实时存储金融&零售：海量订单记录与风控数据的实时存储车联网：车辆轨迹与状况数据的高效存储处理互联网社交：高效、稳定的社交Feed流信息存储访问方式通过...

大数据与网络营销

新品推荐