调优集群性能

UPDATE SQL 如果单个UPDATE WHERE语句命中了较多行数据计算引擎需要计算出所有命中行的主键,并更新其对应的字段值,然后再逐个下发给存储节点进行标记旧行以及追加(Append)新行的操作。一个UPDATE SQL操作步骤可能会放大很多倍,从而...

ISNAN

判断表达式的值是否为 NaN,如果值为 NaN,返回True,否则返回False。命令格式 boolean isnan()参数说明 expr:必填。DOUBLE类型。...相关函数 ISNAN函数属于数学函数,更多数据计算、数据转换的相关函数请参见 数学函数。

ATAN2

计算 expr1/expr2 的反正切函数。命令格式 double atan2(,)参数说明 expr1:必填。DOUBLE类型。输入为STRING、BIGINT、DECIMAL类型时,会隐式转换为...相关函数 ATAN2函数属于数学函数,更多数据计算、数据转换的相关函数请参见 数学函数。

基础版Spark全密态计算引擎使用示例

本文 以云数据库RDS MySQL例,介绍使用基础版Spark全密态计算引擎加密数据计算和分析密态数据,解密计算结果的完整过程。前提条件 AnalyticDB MySQL 湖仓版(3.0)集群与OSS存储空间位于相同地域。已创建数据库账号。如果您是通过阿里云...

FILTER

将ARRAY数组 a 中的元素利用 func 进行过滤,返回一个新的ARRAY数组。命令格式 array<T>filter(array<T><a>,function,boolean>)参数说明 a:必填。...相关函数 FILTER函数属于数学函数,更多数据计算、数据转换的相关函数请参见 数学函数。

UNHEX

返回十六进制字符串所代表的字符串。此函数为MaxCompute 2.0扩展函数。命令格式 binary unhex(string)参数说明 number:必填。为十六进制字符串。...相关函数 UNHEX函数属于数学函数,更多数据计算、数据转换的相关函数请参见 数学函数。

Purge

清除当前表或者整个项目下所有表的备份数据,清除后不可以恢复。注意事项 表的备份数据被清除后不可以恢复,请谨慎操作。命令格式 清除单张表的备份数据:purge table;table_name:指定清除备份数据的表名称。清除当前项目下所有表的备份...

资产全景

在 流动 页面,为您可视化展示 数据引入、物理表数 和 逻辑表数,为您提供数据输出后的数据查询及应用功能:将鼠标悬停在 数据引入 模块上,为您展示的 数据源 个数、数据表接入量Top5 和 数据表接入量Least5。数据源:统计昨天有数据同步...

RDS迁移至MaxCompute实现动态分区

本文为您介绍如何使用DataWorks数据集成同步功能自动创建分区,动态地将RDS中的数据迁移至MaxCompute大数据计算服务。前提条件 准备DataWorks环境 开通MaxCompute。在DataWorks上完成创建业务流程,本例使用DataWorks简单模式。详情请参见 ...

存储成本优化

本文从数据分区、表生命周期和定期删除表3个方面为您介绍如何优化存储成本。对于存储优化而言,有三个关键点:合理地进行数据分区。设置合理的表生命周期。定期删除废表。合理设置数据分区 MaxCompute将分区列的每个值作为一个分区。您可以...

数据分析作业

MaxCompute是适用于数据分析场景的企业级SaaS模式云数据仓库,支持在多种工具上使用MaxCompute运行大数据计算分析作业。如果您需要进行简单的查询等数据分析作业,推荐您使用SQL查询或DataWorks的临时查询等工具,高效便捷地完成数据分析...

计算费用(包年包月)

如果您的任务量较稳定,建议对于消耗资源较少的任务购买包年包月预留计算资源,资源较大的任务购买按I/O按量计费资源,这样可以保证任务运行时一直有CU资源。包月标准版和包年包月套餐版规格详情,请参见 包年包月标准版 和 包年包月套餐版...

整体架构

Transaction Table2.0的增量存储和处理架构的特殊设计主要集中在五个模块:数据接入、计算引擎、数据优化服务、元数据管理、数据文件组织,其他部分与MaxCompute通用的架构一致。本文为您介绍Transaction Table2.0的核心架构要点。...

数仓分层

降低数据计算口径和算法不统一风险。公共维度层的表通常也被称为逻辑维度表,维度和维度逻辑表通常一一对应。公共汇总粒度事实层(DWS):以分析的主题对象作为建模驱动,基于上层的应用和产品的指标需求,构建公共粒度的汇总指标事实表,...

Pandas API支持

MaxFrame提供了兼容Pandas的API接口,您可以用类似于Pandas的方式来操作MaxCompute中的数据,同时利用MaxCompute强大的分布式计算能力,简化您在大数据环境下的数据处理工作,本文为您介绍Pandas API的支持情况。当前MaxFrame支持的API详情...

数据上云场景

MaxCompute平台提供了丰富的数据上传下载工具,可以广泛应用于各种数据上云的应用场景,本文为您介绍三种经典数据上云场景。Hadoop数据迁移 您可使用MMA、Sqoop和DataWorks进行Hadoop数据迁移。使用DataWorks结合DataX进行Hadoop数据迁移的...

MaxCompute湖仓一体概述

MaxCompute提供湖仓一体方案,该方案可以打破数据湖与数据仓库割裂的体系,并将数据湖的灵活性、生态丰富能力与数据仓库的企业级部署能力进行融合,助力构建数据湖和数据仓库相融合的数据管理平台。本文介绍如何通过MaxCompute和异构数据...

数据质量衡量

在了解保障基于MaxCompute的数据仓库数据质量的方案后,您还需要进一步学习如何制定一套标准度量方案,以及判断质量监控方案是否合适业务需求以及如何改进。例如,针对每一个数据质量事件,必须分析原因和处理过程,制定后续同类事件预防...

数据质量管理流程

数据质量的管理流程包括业务数据资产定级、加工卡点、风险点监控和及时性监控,您可以构建属于自己的数据质量保障体系。数据质量管理的流程图如下。数据质量管理的流程说明如下:分析业务场景,对数据流转链路上的整个依赖关系,进行资产...

兼容性概览

为了帮助您更清晰地使用外部工具连接访问MaxCompute,本文将为您介绍MaxCompute支持连接的数据库管理工具,以及工具与MaxCompute在数据库连通性、列举数据库、查看表等方面的兼容性。数据库管理工具与MaxCompute的兼容性如下。工具 连接...

近实时增量导入

实际业务数据处理场景中,涉及的数据源丰富多样,可能存在数据库、日志系统或者其他消息队列等系统,为了方便用户将数据写入MaxCompute的Transactional Table 2.0,MaxCompute深度定制开发了开源 Flink Connector工具,联合DataWorks数据...

概述

MaxCompute Tunnel是MaxCompute的数据通道,您可以通过Tunnel向MaxCompute中上传或者下载数据。MaxCompute提供的 数据上传和下载工具 是基于Tunnel SDK编写的。本文将为您介绍Tunnel SDK的主要接口,不同版本的SDK在使用上有所差别,准确...

数据质量管理流程

本文为您介绍数据质量管理概念、数据管理流程。数据质量管理是通过划分数据资产等级和分析元数据的应用链路,对不同资产等级的数据采取相对应的质量管理方式。数据质量管理流程图如下。数据管理流程说明如下:分析业务场景,根据应用的影响...

ProjectProtection

开启或关闭项目空间的数据保护机制。您只能在项目空间中访问数据数据只能在项目空间内流动,不允许流出到项目空间之外,以提高数据的安全性。使用限制 本文中的命令您需要在 MaxCompute客户端 执行。本命令为CMD命令,仅支持在客户端...

配额

配额(Quota)是MaxCompute的计算资源池,为MaxCompute SQL、MapReduce、Spark、Mars、PAI等计算作业提供所需计算资源(CPU及内存)。您可以根据实际业务合理设置配额组,确保资源的合理分配和利用,防止某一部分任务占用过多资源而影响...

组件与数据类型的兼容

不支持 不支持 PAI 支持除Decimal之外的其它数据类型 2.0新增的数据类型中仅支持INT 部分功能支持map数据类型 不支持 不支持 PyODPS 支持 DataFrame不支持2.0数据类型 其它功能都支持2.0数据类型 支持 DataFrame不支持2.0数据类型 其它功能...

PyODPS概述

PyODPS提供了 to_pandas 接口,可以直接将MaxCompute数据转化成Pandas DataFrame数据结构,但这个接口只应该被用于获取小规模数据做本地开发调试使用,而不是用来规模处理数据,因为使用这个接口会触发下载行为,将位于MaxCompute中的...

概述

它在统一的计算资源和数据集权限体系之上,提供Spark计算框架,支持您以熟悉的开发使用方式提交运行Spark作业,满足更丰富的数据处理分析需求。使用限制 MaxCompute Spark支持如下场景:离线计算场景,例如GraphX、Mllib、RDD、Spark-SQL、...

时区配置操作

对于早于1900-01-01的DATETIME数据,SQL的计算显示结果和Tunnel传输数据仍然可能存在343秒的差异。对于新版本SDK或客户端,之前已经上传的早于1928-01-01的DATETIME数据,在新版本中日期时间会减少352秒。如果继续使用不带有-oversea 后缀...

数据质量教程概述

数据质量是数据分析结论有效性和准确性的基础。本文为您介绍数据质量保障教程的业务场景以及如何衡量数据质量的高低。前提条件 在开始本教程前,请您首先完成 搭建互联网在线运行分析平台 教程,详情请参见 业务场景与开发流程。业务场景 ...

查询账单

对于使用DAS企业版 V3的数据库实例:在 计费项 为 下载数据量 的消费明细中,查看数据导出的费用。在 计费项 为 洞察分析 的消费明细中,查看洞察分析的费用。在 计费项 为 实时搜索分析 的消费明细中,查看实时搜索分析的费用。在 计费项 ...

准备环境

为保证您可以顺利完成本次实验,请您首先确保自己云账号已开通大数据计算服务MaxCompute、数据工场DataWorks和 人工智能平台 PAI。前提条件 注册阿里云账号,详情请参见 注册阿里云账号。实名认证,详情请参见 个人实名认证 背景信息 本次...

数据建模新能力解读

以下为您系列讲解阿里云智能数据建模新能力解读。课程视频列表 课程简介 课程内容:数据建模的发展背景。主要产品:DataWorks 课程时长:5分钟 课程内容:当前主流的数据建模方法论。主要产品:DataWorks 课程时长:4分钟 课程内容:数据...

JSON_TYPE

返回JSON数据所属的数据类型名称。命令格式 string|number|boolean|null|object|array json_type()参数说明 json:必填,待处理的JSON表达式。返回值说明 返回STRING类型。使用示例 示例1:返回JSON内的数据类型(array类型)。select json...

计费概览

版本 小版本 计费方式 计费项 基础版 无 免费 无 经济版 无 包年包月 初级包 中级包 高级包 企业企业版 V0(原专业版旧版,使用老链路)按量付费 SQL洞察的存储费用(按量付费)V1(原旧版专业版)包年包月+按量付费 使用实例总数(包年...

导入数据

本文为您介绍如何通过MaxCompute客户端,使用Tunnel Upload将本地数据文件中的数据导入创建好的表中。前提条件 请确认您已满足如下条件:已创建表。更多创建表操作,请参见 创建表。已将CSV或TXT数据文件下载至本地。本文提供的数据文件样...

常见问题

对比项 DAS企业版 V3 DAS企业版 V2 DAS企业版 V1 DAS企业版 V0 计费项 采用按量计费的模式,计费项为:数据引入 实时搜索分析 洞察分析 数据热存储 数据冷存储 数据查询 数据导出 企业版 V3在冷热存储混合的基础上,按使用的功能细分计费项...

SELECT MATERIALIZED VIEW

背景信息 物化视图状态分为如下两种:物化视图有效 执行查询语句时,MaxCompute会从物化视图中直接查询数据,不会从源数据中查询数据。物化视图无效 执行查询语句时,MaxCompute无法从物化视图中直接查询数据,会从源数据中查询数据,无法...

计算资源使用

配额组(Quota)是MaxCompute的计算资源池,为MaxCompute中的计算作业提供所需计算资源(CPU及内存)。在MaxCompute中支持根据计算作业对计算资源的需求,指定匹配的Quota,助力您高效使用计算资源。本文为您介绍如何使用MaxCompute的Quota...

数据类型版本说明

MaxCompute目前提供了三种不同类型的数据类型版本,包括1.0数据类型、2.0数据类型以及Hive兼容数据类型,您可以根据业务需求选择合适的数据类型版本。本文为您介绍三种数据类型版本、选择数据类型版本以及查看和修改项目的数据类型版本。...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
云原生大数据计算服务 MaxCompute 云数据库 RDS 云服务器 ECS 弹性公网IP 短信服务 人工智能平台 PAI
新人特惠 爆款特惠 最新活动 免费试用