2019年阿里云首次购买大数据计算-2019年阿里云首次购买大数据计算文档介绍内容-阿里云

功能特性

计算引擎访问宽表数据宽表引擎动态列 Lindorm宽表引擎支持动态列功能，用于在实际业务中动态写入数据并执行查询，减少了数据结构设计的复杂性。动态列二级索引 Lindorm宽表引擎提供了Tabular模型下的二级索引功能。在非主键匹配的查询...

功能简介

数据查询为用户提供对云计算资源中物理表基本情况的概览能力，帮助用户直观了解物理表基础信息、字段内容分布等情况，建立对数据表的宏观理解，为建立数据标准、定义数据模型、定义数据加工逻辑等工作提供基础依据。如果数据表格存储的是...

存储费用

MaxCompute会对存储的数据（例如表或资源）及备份的数据，按照数据容量大小进行计费。本文为您介绍存储费用的计费规则。背景信息 MaxCompute数据的压缩比一般在5倍左右，因此多数情况下，您上传的数据文件大小与实际存储在MaxCompute的大小...

云产品集成

常见云产品如下：大数据开发治理平台 DataWorks 实时计算 Flink 版数据库管理 DMS DataV 数据可视化 Quick BI 数据分析与展现前提条件已获取 OceanBase 数据库的基本连接信息，详细步骤请参见获取连接参数。大数据开发治理平台 ...

什么是物联网边缘计算

提供的路由路径如下：设备至IoT Hub 设备至函数计算设备至流数据分析函数计算至函数计算函数计算至IoT Hub 流数据分析至IoT Hub 流数据分析至函数计算 IoT Hub至函数计算断网续传边缘计算节点在断网或弱网情况下提供数据恢复能力。...

应用场景

本文介绍函数计算的典型应用场景，包括Web应用、数据ETL处理、AI推理、视频转码等。Web应用函数计算和其他云产品搭配使用，可以让工程师只需编写业务代码即能够快速构建可弹性扩展的Web应用。同时这些程序可在多个数据中心高可用运行，不...

2024年

对应地域所有项目的生命周期都将与按量付费标准服务的生命周期保持一致，所有项目的存储、下载等按量付费账单归属的产品明细为 大数据计算服务MaxCompute（按量付费），同时对应的用量明细选择的计量规格变为 大数据计算服务MaxCompute...

应用场景

本文介绍函数计算的典型应用场景，包括Web应用、数据ETL处理、AI推理、视频转码等。Web应用函数计算和其他云产品搭配使用，可以让工程师只需编写业务代码即能够快速构建可弹性扩展的Web应用。同时这些程序可在多个数据中心高可用运行，不...

数据库访问失败的常见原因

本文介绍函数计算访问数据库失败的常见原因。常见原因排查数据库连接偶现失败如果您访问数据库偶现失败，可按照以下步骤进行原因排查。数据库断开连接时，是否使用 destroy()替换 end()使用。由于函数实例在空闲2~5分钟左右后，会自动...

数据查询

数据查询为用户提供对云计算资源中物理表基本情况的概览能力，帮助用户直观了解物理表基础信息、字段内容分布等情况，建立对数据表的宏观理解，为建立数据标准、定义数据模型、定义数据加工逻辑等工作提供基础依据。如果数据表格存储的是...

导入导出表数据

MaxCompute Studio可以将CSV、TSV等格式的本地数据文件导入至MaxCompute表中，也可将MaxCompute表中的数据导出到本地文件。MaxCompute Studio通过Tunnel导入导出数据。前提条件导入导出数据使用MaxCompute Tunnel，因此要求MaxCompute ...

物化视图

随着MaxCompute的深入使用，会出现对MaxCompute的表有很多重复查询的情况，并且不同使用者之间互相不知道其他人也在使用同样的计算逻辑。为了提高用户的计算效率、减少重复计算，同时加速用户计算。MaxCompute提供物化视图智能计算加速，为...

升级和降配

在变配页面，配置升级后所需的CU数量，并勾选 大数据计算服务MaxCompute服务等级协议和阿里云产品服务协议-MaxCompute，单击立即购买。订单价格计算规则如下：升级订单价格计算=新配置剩余时长购买金额（新配置的月单价/30/24×剩余时...

COST SQL

计量预估，基于一条SQL作业的输入数据量大小、UDF个数以及SQL复杂等级估算作业执行费用。需要注意的是，如果UDF涉及分区裁剪，由于无法确定最终会扫描多少个分区，该场景下的费用无法预估。使用限制目前外部表不支持Cost SQL功能。注意...

推送记录

在推送记录页面，您可单击离线计算、实时计算、数据质量或数据服务页签，查看对应模块的推送记录。不同功能模块的页签展示一致，下图以离线计算为例。区域描述 ①筛选与搜索区您可根据推送记录对象名称的关键字进行搜索，也可...

PyODPS概述

PyODPS提供了 to_pandas 接口，可以直接将MaxCompute数据转化成Pandas DataFrame数据结构，但这个接口只应该被用于获取小规模数据做本地开发调试使用，而不是用来大规模处理数据，因为使用这个接口会触发下载行为，将位于MaxCompute中的...

其它操作

计量预估基于一条SQL作业的输入数据量大小、UDF个数以及SQL复杂等级估算作业执行费用。需要注意的是，如果UDF涉及分区裁剪，由于无法确定最终会扫描多少个分区，该场景下的费用无法预估。说明该信息不能作为实际计费标准，仅供参考，实际...

SDK接口

本文为您介绍流式数据通道SDK接口的使用方法。使用说明您可以基于MaxCompute Studio通过Java SDK使用MaxCompute流式数据通道服务。您可以使用以下配置在MaxCompute Studio上添加指定版本的pom依赖。groupId>...

创建Hologres计算源

Dataphin支持使用Hologres为MaxCompute计算引擎作为加速计算源或单独作为离线计算源，作为加速源使用时可加速数据服务中的Dataphin数据源的查询速度，以满足对查询速度有要求的业务场景。本文为您介绍如何创建Hologres计算源。操作步骤请...

PyODPS节点实现避免将数据下载到本地

通常，可以调用 head、tail 方法返回少量数据进行数据探查，当数据量较大时，建议调用Persist方法，将数据直接保存在MaxCompute表中。详情请参见执行。在表或SQL实例上直接执行Open_reader方法获取表数据。当数据量大时，建议使用PyODPS ...

使用DataWorks

MaxCompute支持通过DataWorks的数据集成功能将MaxCompute中的数据以离线方式导出至其他数据源。当您需要将MaxCompute中的数据导出至其他数据源执行后续数据处理操作时，您可以使用数据集成功能导出数据。本文为您介绍如何将MaxCompute的...

复合指标

由于派生指标只是针对某业务活动某段时间的数据量统计，无法满足贴近用户实际使用的业务增长率、差值计算等数据的比对需求（例如，统计某业务活动的周环比增长率）。因此，DataWorks为您提供了由派生指标通过运算规则进行计算而形成的复合...

自定义函数（邀测中）

AnalyticDB for MySQL 未开启压缩，将数据直接传输至函数计算服务，函数计算服务经过计算后，将计算结果使用GZIP格式压缩后返回给 AnalyticDB for MySQL，导致 AnalyticDB for MySQL 无法解析数据。调用 REMOTE_CALL 函数时，出现 parse ...

Tunnel SDK常见问题

如果数量较大且是持续上传模式，Block的数据量在64 MB~256 MB之间；如果是每天传一次的批量模式，Block可以设置为1 GB左右。使用新版BufferedWriter可以更简单地进行上传且可以避免小文件等问题，详情请参见 TunnelBufferedWriter。遇到...

计算费用（包年包月）

如果您的任务量较稳定，建议对于消耗资源较少的任务购买包年包月预留计算资源，资源较大的任务购买按I/O按量计费资源，这样可以保证任务运行时一直有CU资源。包月标准版和包年包月套餐版规格详情，请参见包年包月标准版和包年包月套餐版...

挂载NAS

1.背景绝大部分计算模型下，客户数据直接存储于云端 NAS 里。为了方便客户读写云端计算数据，批量计算根据用户提供的挂载信息，自动将 NAS 的挂载点挂载到本地目录。完成 NAS 挂载后，对挂载目录里数据的读写行为将和读写本地数据完全相同...

全球数据库最佳实践

（可选）购买固定规格计算包若创建主集群或从集群时选择付费方式为按量付费，您还可以购买固定规格计算包来抵扣按量付费集群的计算节点费用。购买固定规格计算包后，按量付费集群的计算节点费用将由固定规格计算包自动抵扣费用，更加...

支持的云服务

MaxCompute和DataWorks提供完善的ETL、数据分析、数据地图、数据治理和数据仓库管理能力，并支持SQL、MapReduce、Graph等多种经典的分布式计算模型，能够更快速地解决用户海量数据计算问题，有效降低企业成本，保障数据安全。更多DataWorks...

流式ETL

数据传输服务DTS提供的流式数据ETL（Extract Transform Load）功能是一种高效的实时数据加工工具。ETL支持通过可视化拖拉拽操作、Flink SQL语句配置任务，并结合DTS的高效流数据复制能力，可以实现流式数据的抽取、数据转换和加工、数据...

什么是ETL

数据传输服务DTS提供的流式数据ETL（Extract Transform Load）功能是一种高效的实时数据加工工具。ETL支持通过可视化拖拉拽操作、Flink SQL语句配置任务，并结合DTS的高效流数据复制能力，可以实现流式数据的抽取、数据转换和加工、数据...

什么是物联网边缘计算

物联网边缘计算可以结合阿里云的大数据、AI学习、语音、视频等能力，打造出云边端三位一体的计算体系。功能特性功能特性描述边缘一体机边缘一体机是物联网边缘计算服务配套的硬件，是一个边缘实例业务的核心，提供整个边缘实例所需要的...

Paimon概述

目前阿里云开源大数据平台E-MapReduce常见的计算引擎（例如Flink、Spark、Hive或Trino）都与Paimon有着较为完善的集成度。您可以借助Apache Paimon快速地在HDFS或者云端OSS上构建自己的数据湖存储服务，并接入上述计算引擎实现数据湖的分析...

概述

日常工作中，企业通常会对实时日志数据进行开发。其中：日志数据来源可以为ECS、容器、移动端、开源软件、网站服务或JavaScript。本文为您介绍如何通过Tunnel、DataHub、LogHub以及DataWorks数据集成将日志数据迁移至MaxCompute。方案说明...

转换计费方式

说明当您修改项目默认计算Quota前，请确认已购买目标计费方式的计算资源，购买请单击 购买计算资源。使用新版控制台，每个项目都是独立配置默认计算Quota。登录 MaxCompute控制台，在左上角选择地域。在左侧导航栏单击项目管理。在项目...

概述

流数据分析提供了连接边缘端消息总线的能力，您可以通过配置消息路由将设备数据传入到流数据分析中，利用流数据分析方便地对设备数据进行实时计算，并将结果输出到RDS、本地文件、函数计算或IoTHub中。本使用示例将会从多个使用场景来讲述...

Logview诊断实践

比如：某些UDF在内存计算、排序的数据量比较大时，会报内存溢出错误。内存不足引起gc频率过高。这时可以尝试调整内存参数，不过此方法只能暂时缓解，具体的优化还是需要从业务上去处理。示例如下：set odps.sql.udf.jvm.memory=-设定UDF ...

2023年

2023-06 功能名称功能描述发布时间发布地域相关文档新增JSON数据类型新增JSON数据类型，MaxCompute支持写入JSON数据类型时，自动优化存储，提高JSON数据计算分析性能。2023-06-27 全部地域 MaxCompute JSON类型使用指南（试用Beta...

长周期指标的计算优化方案

本文为您介绍如何对长周期指标的计算进行优化。实验背景电子商务公司在电商数据仓库和商业分析场景中，经常需要计算最近N天...计算老买家数量时，判断最近一次购买时间是否在30天之内，从而最大程度上的数据关系对去重，减少计算输入数据量。

内建函数概述

MaxCompute自身预置了诸多函数，可以满足大部分业务场景的数据处理需求。本文为您介绍MaxCompute提供的函数类型及函数使用相关说明。背景信息使用MaxCompute内建函数过程中，需要注意的事项请参见注意事项。MaxCompute预置的函数类型如下...

2019年阿里云首次购买大数据计算

新品推荐