产品概述

阿里云流数据处理平台数据总线DataHub是流式数据(Streaming Data)的处理平台,提供对流式数据的发布(Publish),订阅(Subscribe)分发功能,让您可以轻松构建基于流式数据的分析应用。数据总线 DataHub服务可以对各种移动设备,应用...

构建数据仓库

DataWorks具有通过可视化方式实现数据开发、治理全流程相关的核心能力,本文将为您介绍DataWorks在构建云上大数据仓库构建智能实时数据仓库两个典型应用场景下的应用示例。构建云上大数据仓库 本场景推荐的架构如下。适用行业:全行业...

操作流程

流程图 流程说明 操作 说明 新建场景 通过新建开发场景,并在开发场景画布中编排节点工作流、配置运行参数调度参数,来验证数据处理流程的正确性。具体操作,请参见 步骤一:新建开发场景。编排场景流程 通过在开发场景画布中,添加系统...

操作流程

流程图 流程说明 操作 说明 新建场景 通过新建开发场景,并在开发场景画布中编排节点工作流、配置运行参数调度参数,来验证数据处理流程的正确性。具体操作,请参见 步骤一:新建开发场景。编排场景流程 通过在开发场景画布中,添加系统...

减灾与应急时空解决方案与案例

可在表级操作级充分利用时空并行处理能力加快大数据计算效率。系统原生部署在云端,支持直接使用SQL实现传统GIS服务软件提供的大部分功能,还支持性能及存储空间同时线性扩展。项目价值 领域专业数据一体化融合管理和处理能力,提供存储...

缓存数据持久化

当您使用云数据库RDS MySQL并需要提升数据处理速率降低访问延迟时,阿里云为您提供了缓存数据持久化的高效方案,该解决方案通过整合云数据库Redis与RDS、云数据库Memcache与RDS协同工作,确保数据的高速访问持久化存储,具备高吞吐、低...

SmartData常见问题

JindoFS是阿里云开源大数据E-MapReduce产品提供的一套Hadoop文件系统,主要对HadoopSpark大数据生态系统使用阿里云OSS提供多层次的封装支持优化。基础功能提供适配OSS支持访问,您可以直接使用JindoFS SDK;标准功能针对OSS提供分布...

处理存储空间不足问题

本章节介绍如何通过DAS查看、处理和预防数据库存储空间不足的问题。操作视频 查看空间问题 空间分析:直观地查看某个数据库实例的空间使用概况、空间剩余可用天数,以及数据库中某个表的空间使用情况、空间碎片、空间异常诊断等。优化空间...

公交出行:启迪公交

解决方案 启迪公交采用 PolarDB-X 分布式数据库方案构建了全部业务系统,既支持海量大数据处理能力,又支持高并发、高可用很强的弹性伸缩能力。票务管理工作台通过用户检录数据,实时同步到阿里云AnalyticDB分析型数据库,分析出实时...

查看资源用量大盘

资源用量大盘为您展示当前租户下已使用的数据处理单元总量按任务类型分别统计的消耗趋势以及按项目粒度统计的消耗增量排行,帮助您了解数据处理单元的消耗情况以及时调整资源规格配置。本文为您介绍如何查看资源用量大盘。前提条件 需...

区域图(v4.0及以上版本)

本文介绍区域图的图表样式配置面板的功能。重要 本文介绍v4.0及以上版本的区域图配置项,如需查看v4.0以下版本,请参见 区域图(v4.0以下版本)。图表样式 区域图是折线图的一种,以折线区域相结合的方式,智能地展示多维的实时数据的...

新建数据处理任务

系统提供数据处理能力,包括倾斜数据处理、地形数据处理、三维模型处理、影像优化处理。本文以新建倾斜数据处理任务为例,介绍如何新建数据处理任务。前提条件 已添加空间元数据,具体操作,请参见 添加数据。已添加OSS类型云计算资源。...

气泡图

动作 动作 说明 请求气泡图接口描述 重新请求服务端数据,上游数据处理节点或图层节点抛出的数据将作为参数。例如气泡图配置了API数据源为 https://api.test ,传到 请求气泡图接口描述 动作的数据为 { id:'1'},则最终请求接口为 ...

气泡图

动作 动作 说明 请求气泡图接口描述 重新请求服务端数据,上游数据处理节点或图层节点抛出的数据将作为参数。例如气泡图配置了API数据源为 https://api.test ,传到 请求气泡图接口描述 动作的数据为 { id:'1'},则最终请求接口为 ...

产品简介

开源大数据开发平台E-MapReduce(简称EMR)是运行在阿里云平台上的一种大数据处理系统解决方案。EMR基于开源的Apache HadoopApache Spark,让您可以方便地使用HadoopSpark生态系统中的其他周边系统分析处理数据。EMR还可以与阿里云...

EMR Workbench

阿里云EMR Workbench是一个综合性的大数据分析开发环境,作为阿里云E-MapReduce的一部分,它提供了EMR NotebookEMR Workflow两个核心功能。通过EMR Workbench,您可以轻松进行数据开发,以及交互式数据分析,并设计复杂的数据处理工作...

基础散点图

动作 动作 说明 请求基础散点图接口描述 重新请求服务端数据,上游数据处理节点或图层节点抛出的数据将作为参数。例如散点图配置了API数据源为 https://api.test ,传到 请求基础散点图接口描述 动作的数据为 { id:'1'},则最终请求接口为 ...

基础散点图

动作 动作 说明 请求基础散点图接口描述 重新请求服务端数据,上游数据处理节点或图层节点抛出的数据将作为参数。例如散点图配置了API数据源为 https://api.test ,传到 请求基础散点图接口描述 动作的数据为 { id:'1'},则最终请求接口为 ...

Iceberg概述

您可以借助Iceberg快速地在HDFS或者阿里云OSS上构建自己的数据湖存储服务,并借助开源大数据生态的Spark、Flink、HivePresto等计算引擎来实现数据湖的分析。核心能力 Apache Iceberg设计初衷是为了解决Hive数仓上云的问题,经过多年迭代...

产品概述

什么是E-MapReduce 开源大数据开发平台E-MapReduce(简称EMR),是运行在阿里云平台上的一种大数据处理的系统解决方案。EMR基于开源的Apache HadoopApache Spark,让您可以方便地使用HadoopSpark生态系统中的其他周边系统分析处理...

数据分析整体趋势

这些云原生数据仓库技术分别起源于数据库和大数据,提供标准SQL接口和ACID保证,底层存储通过Share Everything或Share Nothing实现资源池化和横向扩展能力。资源隔离,数据共享是目前业务应用对云原生数据仓库的普遍需求。综上所述,数据...

未来规划

云计算架构的核心逻辑就是通过虚拟化技术带来池化资源,云原生数据库采用分布式数据库架构,实现规模扩展,每套数据库系统横跨多台服务器虚拟,带来了全新的系统管理挑战。其中最核心的挑战就是如何实现弹性以及高可用,实现按需按量...

引擎类型

流引擎是面向流式数据处理的引擎,提供了流式数据的存储和轻计算功能,帮助您轻松实现将流式数据存储至 云原生多模数据库 Lindorm,满足基于流式数据的处理和应用需求。结合宽表引擎的Ganos时空服务,可以实现基于流式数据的实时轨迹分析...

X-Engine简介

因为目标是面向大规模的海量数据存储,提供高并发事务处理能力降低存储成本,在大部分大数据量场景下,数据被访问的机会是不均等的,访问频繁的热数据实际上占比很少,X-Engine根据数据访问频度的不同将数据划分为多个层次,针对每个层次...

客户案例

迁移到大数据MaxCompute、实时计算、DataWorks后,部分任务有10倍以上的性能提升,存储从自建Hadoop 3PB降到900T,利用Flink实时数据处理能力,将宝宝树现有的场景实时化(“基于用户ID维度内容类型的实时行为”、“获取用户的实时群聊ID...

整体架构

AnalyticDB MySQL版 是基于数据库大数据一体化的理念和趋势,在工程上深度打磨出的云原生数据仓库。技术架构 AnalyticDB MySQL版 采用云原生架构,计算存储分离、冷热数据分离,支持高吞吐实时写入和数据强一致,兼顾高并发查询和大吞吐批...

大数据安全治理的难点

流转 大数据系统通常是端到端的一整套数据开发治理服务,不仅要采集数据、加工数据,更要将数据提供给业务方使用。因此,其存在错综复杂的数据流转链路,包括但不限于即席查询链路、离线传输链路、实时传输链路、数据服务API链路、其他...

Transaction Table2.0概述

随着当前数据处理业务场景日趋复杂,很多业务场景并不要求延时秒级更新可见或者行级更新,更多的需求是分钟级或者小时级的近实时数据处理叠加海量数据批处理场景,MaxCompute支持基于Transaction Table2.0实现近实时的增全量一体的数据存储...

实时数据消费概述

为您提供了一个强大的工具,用于结合流处理和批处理的数据分析。更多信息,请参见 实时数据源集成。使用场景 构建实时分析报表及其他实时分析应用。结合增量实时物化视图构建流批一体的实时数仓。在采用SQL方式写入数据(UPSERT或UPDATE)...

数据组织优化

MaxCompute会根据系统状态自动触发执行,以保证Clustering服务的高效运行,减少对计算I/O资源的消耗,从而解决读写放大的问题,从而提高整体的数据组织和处理性能。Compaction 当前痛点 Transactional Table 2.0支持UpdateDelete格式的...

东软案例

如下图所示,阿里Lindorm数据库在赋能政企数字运维团队更强大的运维大数据分析能力的同时,大幅度提升了政府、企业数字系统性能在线服务的客户数字体验,降低了低价值密度监控数据存储管理成本。图 1.阿里云Lindorm数据库驱动的IT运维...

基于MaxFrame实现语言模型数据处理

随着人工智能的发展,许多业务数据分析可以基于语言模型(LLM)进行广泛的应用,而数据处理是LLM开发尤为重要的一环,数据质量的好坏直接影响模型训练、推理的最终效果。相较于昂贵的GPU资源,MaxCompute的海量弹性CPU资源能够成为...

数据治理中心概述

量化评估:健康分 健康分是依据数据资产在数据生产、数据流通及数据管理中的用户行为、数据特性、任务性质等元数据,使用数据处理及机器学习等技术,对各类型数据进行综合处理和评估,通过个人、工作空间维度客观呈现数据资产状态的综合...

PyODPS概述

数据处理方式 描述 场景示例 拉取到本地处理(不推荐,易OOM)例如DataWorks中的PyODPS节点,内置了PyODPS包以及必要的Python环境,是一个资源非常受限的客户端运行容器,并不使用MaxCompute计算资源,有较强的内存限制。PyODPS提供了 to_...

发现并处理大Key热Key

在使用 云原生内存数据库Tair 的过程中,如果未能及时发现并处理Big keys(下文称为“Key”)与Hotkeys(下文称为“热Key”),可能会导致服务性能下降、用户体验变差,甚至引发面积故障。本文将介绍Key与热Key产生的原因、其可能...

企业版标准版功能对比

通过列存索引,PolarDB MySQL版 实现了一体化的实时事务处理和实时数据分析的能力,成为一站式HTAP数据库产品解决方案。通过一套数据库系统,即可满足业务的OLTP及OLAP需求。支持 支持 弹性并行查询(ePQ)弹性并行查询(Elastic Parallel ...

产品优势

提高开源组织版本管理效率,快速支持业务创新 更多开源软件支持 更高软件版本支持 覆盖从边缘到AI全场景 企业级的服务支持,降低运维成本,缩短故障处理时间 来自阿里云Cloudera的7*24小时大数据专家服务支持 快速定位使用中遇到的问题,...

基本折线图(v4.0及以上版本)

基本折线图是折线图的一种,与双轴折线图相比,基本折线图的一个类目只对应一个值,主要通过多系列数据配置的方式,展示同一类目下不同数据的变化,能够以折线区域相结合的方式,智能地展示多维的数据变化趋势。本文介绍基本折线图各配置...

原理优势

充分利用各个主机节点的处理能力,当某些节点处于空闲状态时,将工作负载过的节点上的数据库迁移到空闲的专属集群主机,从而实现系统的负载平衡。以下是 MyBase 与自建数据库的综合对比优势:MyBase与自建数据对比优势 专属集群 MyBase ...

状态卡片

[{"name":"虚拟已启动","value":"1"/此处与样式>状态种类>状态类型名的内容对应 }]请求数据接口 重新请求服务端数据,上游数据处理节点或图层节点抛出的数据将作为参数。例如状态卡片配置了API数据源为 https://api.test ,传到 请求数据...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
云原生大数据计算服务 MaxCompute 云数据库 RDS 数据库备份 DBS 云数据库 Redis 版 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用