应用场景

1.2 收益 系统解耦 对外,大数据系统与业务系统解耦,对内,大数据系统各组件之间解耦。实时通道 通过数据总线,业务数据能够实时汇入大数据系统,缩短数据分析周期。2.实时数据清洗和分析 2.1 接入多种异构数据,实时清洗并归一化 通过...

大数据安全治理的难点

同时,大数据系统基于“存储、用户、入口、流转、交付”等多方面的特点,存在诸多安全治理难点。数据安全治理的关键问题 数据安全治理能否清楚、准确地回答如下问题,将从侧面反映安全治理项目是否能有效地落地。哪些资产需要被保护?您有...

功能概览

1.4 生态融合 系出飞天,与阿里云大数据系统深度整合,无缝对接MaxCompute、实时计算、交互式分析等产品,打通整个数据体系。2.产品功能 2.1 数据接入 提供多种SDK、API和Flume、Logstash等第三方插件,让您高效便捷的把数据接入到数据...

冷热分层

背景信息 在海量数据场景下,随着业务和数据量的不断增长,性能和成本的权衡成为大数据系统设计面临的关键挑战。Delta Lake是新型数据湖方案,推出了数据流入、数据组织管理、数据查询和数据流出等特性,同时提供了数据的ACID和CRUD操作...

Oracle数据

由于主备数据同步存在一定的时间差,在网络延迟等特定情况下,会导致备库同步恢复的数据与主库有较差别,从备库同步的数据不是一份当前时间的完整镜像。一致性约束 Oracle在数据存储划分中属于RDBMS系统,对外可以提供强一致性数据查询...

文档修订记录

查看运维大屏 2023.6.25 新增功能 数据建模 数仓规划>系统管理 支持自定义使用代码模式建模时,其他引擎DDL语句中Comment字段对应可视化建模界面中的名称还是描述信息。系统管理 2023.6.16 新增功能 数据开发 流程参数支持Hologres SQL节点...

产品简介

开源大数据开发平台E-MapReduce(简称EMR)是运行在阿里云平台上的一种大数据处理系统解决方案。EMR基于开源的Apache Hadoop和Apache Spark,让您可以方便地使用Hadoop和Spark生态系统中的其他周边系统分析和处理数据。EMR还可以与阿里云...

生态集成

云原生数据仓库AnalyticDB PostgreSQL版 具备完善和开放的生态系统,支持无缝对接业界以及阿里云生态的数据管理工具,BI报表可视化工具,ETL工具,数据迁移工具,同时可以与业界流行的流式处理系统,日志类系统大数据系统,传统数仓及...

Vertica数据

Vertica是一款基于列存储的MPP架构的数据库,Vertica...否 无 batchSize 一次性批量提交的记录数大小,该值可以极减少数据同步系统与Vertica的网络交互次数,并提升整体吞吐量。如果该值设置过,会导致数据同步运行进程OOM异常。否 1,024

ClickHouse数据

ClickHouse数据源为您提供读取和写入ClickHouse...否 无 batchSize 一次性批量提交的记录数大小,该值可以极减少数据同步系统与ClickHouse的网络交互次数,并提升整体吞吐量。如果该值设置过,会导致数据同步运行进程OOM异常。否 1,024

数据分析整体趋势

Hadoop也在早期的MapReduce接口基础上增加了SQL接口,SQL语法逐渐成为大数据分析系统的标准配置。随着AWS,Azure,Alibaba,Google等云厂商的出现,云原生分布式数据仓库成为目前数据分析技术的主要解决方案,代表性云服务包括Amazon ...

概述

背景信息 在大数据生态系统中,Alluxio位于数据驱动框架或应用(例如Apache Spark、Presto、TensorFlow、Apache Flink和Apache Hive等)和各种持久化存储系统(例如HDFS和阿里云OSS)之间,使得上层的计算应用可以通过统一的客户端API和...

应用场景

前端的监控系统大数据处理系统会利用 TSDB 的数据查询和计算分析能力进行业务监控和分析结果的实时展现。电力化工及工业制造监控分析 传统电力化工以及工业制造行业需要通过实时的监控系统进行设备状态检测,故障发现以及业务趋势分析。...

DB2数据

否 无 fetchSize 该配置项定义了插件和数据库服务器端每次批量数据获取条数,该值决定了数据同步系统和服务器端的网络交互次数,能够较的提升数据抽取性能。说明 fetchSize 值过(>2048)可能造成数据同步进程OOM。否 1024 Writer脚本...

SQL Server数据

SQL Server数据源为您提供读取和写入SQL ...否 insert batchSize 一次性批量提交的记录数大小,该值可以极减少数据同步系统与SQL Server的网络交互次数,并提升整体吞吐量。如果该值设置过,会导致数据同步运行进程OOM异常。否 1,024

产品简介

数据搬站迁云方案咨询 为客户提供原大数据系统上云迁移方案咨询服务,包括云上数据搬站架构规划、设计迁云方案服务。数据专家高阶培训 提供针对数据建设、管理、治理相关的高阶能力培训,涵盖离线/实时数仓体系建设管理、数仓建模...

GBase8a数据

GBase8a数据源为您提供读取和写入GBase8a双向通道的...否 无 batchSize 一次性批量提交的记录数大小,该值可以极减少数据同步系统与Gbase8a的网络交互次数,并提升整体吞吐量。如果该值设置过,会导致数据同步运行进程OOM异常。否 1,024

数仓规划概述

数仓规划是基于Dataphin建设数据中台的第一步,同时也是数据体系的顶层设计中至关重要的一步。在您开始数据开发前,需要完成数据仓库的规划,包括定义数据板块、项目、数据源、计算源和统计周期。功能介绍 数仓规划包括逻辑空间与物理空间...

产品概述

什么是E-MapReduce 开源大数据开发平台E-MapReduce(简称EMR),是运行在阿里云平台上的一种大数据处理的系统解决方案。EMR基于开源的Apache Hadoop和Apache Spark,让您可以方便地使用Hadoop和Spark生态系统中的其他周边系统分析和处理...

JindoData概述

JindoData是阿里云开源大数据团队自研的数据湖存储加速套件,面向大数据和AI生态,为阿里云和业界主要数据湖存储系统提供全方位访问加速解决方案。JindoData套件基于统一架构和内核实现,主要包括JindoFS存储系统(原JindoFS Block模式)、...

管理从集群

当您的数据量较时,推荐您购买 PolarDB 存储包,相比按小时付费,预付费购买存储包有折扣,购买的容量越,折扣力度就越,详情请参见 搭配存储包。移除从集群 登录 PolarDB控制台。单击左侧导航栏中的 全球数据网络(GDN)。找到...

数据服务入门

步骤一:创建数据源并配置网络连通性 使用数据服务创建API前,您需将数据库或数据仓库添加为DataWorks的数据源,并保障数据服务资源组与您的目标数据网络连通,以便调用API时DataWorks可成功访问数据源。说明 DataWorks工作空间将集群或...

容量规划

容量规划是指根据业务需求和系统性能,包括用户量、数据量、并发量等指标,合理规划和配置系统集群资源,以满足系统扩展、用户增长和负载增加的需求。通过容量规划可以确定系统能够承载的最大用户量和并发请求量,并提前预防系统资源不足和...

面临的业务挑战

数据来源上包含数据数据、日志数据、对象数据以及已有数仓上的存量数据等。这些不同来源、不同格式的数据,各自又有不同的访问和分析方式,而大量传统企业基于关系数据库构建自己的业务系统,已经非常熟悉按SQL的方式去使用数据,这无疑...

资源组说明

资源组网络拓扑 系统资源组部署在数据资源平台VPC,需要使用公网地址连接用户云资源(部分云资源支持VPC打通),即云资源注册时需要填写公网地址,云资源白名单需要添加数据资源平台的公网出口IP。独享资源组部署在数据资源平台VPC,通过...

资源组说明

资源组网络拓扑 系统资源组部署在企业数据智能平台VPC,需要使用公网地址连接用户云资源(部分云资源支持VPC打通),即云资源注册时需要填写公网地址,云资源白名单需要添加企业数据智能平台的公网出口IP。独享资源组部署在企业数据智能...

DataWorks模块使用说明

使用流程概览:参考文档:数据集成概述 数据建模与开发 子模块:数据建模 功能说明:数据建模是全链路数据治理的第一步,沉淀阿里巴巴数据中台建模方法论,从数仓规划数据标准、维度建模、数据指标四个方面,以业务视角对业务的数据进行...

创建集群

专有网络(VPC)专有网络交换机 如果已创建符合您网络规划的VPC,直接选择该VPC。例如,如果您已创建ECS,且该ECS所在的VPC符合您的规划,那么选择该VPC。如果您未创建符合您网络规划的VPC,您可以使用默认VPC和交换机。更多详情,请参见 ...

恢复已释放的集群

如果您未创建符合您网络规划的VPC,您可以使用默认VPC和交换机:默认VPC:在您选择的地域中是唯一的。网段掩码是16位,如192.168.0.0/16,最多可提供65536个私网IP地址。不占用阿里云为您分配的VPC配额。默认交换机:在您选择的可用区中是...

恢复已释放的集群

如果您未创建符合您网络规划的VPC,您可以使用默认VPC和交换机:默认VPC:在您选择的地域中是唯一的。网段掩码是16位,如192.168.0.0/16,最多可提供65536个私网IP地址。不占用阿里云为您分配的VPC配额。默认交换机:在您选择的可用区中是...

概述

数据组织 ZooKeeper的数据组织方式与标准文件系统类似,组织成类似文件树的结构,在ZooKeeper中使用znode(ZooKeeper node)来描述文件,与标准文件系统不同的是,znode并不区分目录或者文件的概念,每个znode都可以存储数据。ZooKeeper...

从集群回收站恢复误删的集群

表名小写 设置集群表名是否区分小写,您可以选择 不区分小写(默认)或当本地数据库区分大小时,您可以选择 区分小写,便于您迁移数据。说明 集群创建后该参数无法修改,请谨慎选择。删除(释放)集群时 设置删除(释放)集群时的...

购买包年包月集群

如果您未创建符合您网络规划的VPC,您可以使用默认VPC和交换机:默认VPC:在您选择的地域中是唯一的。网段掩码是16位,如192.168.0.0/16,最多可提供65536个私网IP地址。不占用阿里云为您分配的VPC配额。默认交换机:在您选择的可用区中是...

什么是MaxCompute

提供持续的SaaS化云上数据保护 为云上企业提供基础设施、数据中心、网络、供电、平台安全能力、用户权限管理、隐私保护等保三级超20项安全功能,兼具开源大数据与托管数据库的安全能力。产品架构 MaxCompute的产品架构如下。其中核心模块...

购买按量付费集群

如果您未创建符合您网络规划的VPC,您可以使用默认VPC和交换机:默认VPC:在您选择的地域中是唯一的。网段掩码是16位,如192.168.0.0/16,最多可提供65536个私网IP地址。不占用阿里云为您分配的VPC配额。默认交换机:在您选择的可用区中是...

购买包年包月集群

如果您未创建符合您网络规划的VPC,您可以使用默认VPC和交换机:默认VPC:在您选择的地域中是唯一的。网段掩码是16位,如192.168.0.0/16,最多可提供65536个私网IP地址。不占用阿里云为您分配的VPC配额。默认交换机:在您选择的可用区中是...

安装Agent

说明 如果您要审计的数据库所在ECS使用的是经典网络,您需要先通过ClassicLink功能实现经典网络的ECS与VPC中的数据库审计系统网络互通,然后在ECS服务器上安装Agent。连通经典网络中的ECS和数据库审计系统VPC的具体操作,请参见 审计经典...

内置时空数据引擎Ganos

提供拓扑网络路径分析和规模点云存储与查询支持 Ganos所包含的几何网络数据库引擎支持Node-Edge拓扑网络构建,支持Turn、U-Turn等概念,支持TSP(旅行商问题)、KSP(多条线路最短路径)、TRSP(转向限制的最短路径)等一系列路径规划...

离线同步任务调优

本文为您介绍影响数据同步速度的因素、如何通过调整同步任务的并发配置来实现同步速度最大化、作业的限速选项,以及数据同步过慢的场景。文档概述 同步速度受同步任务本身配置、数据库、网络等多方面影响,详情请参见:数据同步速度的影响...

查询概述

数据库 SelectDB 版 高度兼容MySQL相关生态,支持湖仓一体化,并确保了上游与下游数据生态系统的无缝整合。本文介绍SelectDB在查询方面的能力概述。基础能力 云数据库 SelectDB 版 支持标准SQL语法,在SQL方言方面向MySQL兼容。采用MySQL...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
数据库备份 DBS 云数据库 RDS 云数据库 Redis 版 弹性公网IP 短信服务 人工智能平台 PAI
新人特惠 爆款特惠 最新活动 免费试用