SQL调优

非读表的Task 主要有如下三种方式调整并发度:调整 odps.sql.mapper.split.size 值:非读表Task的并发度会受到输入Task的并行度影响,通过调整读表Task的并发度间接调整非读表Task的并发度。调整 odps.sql.reducer.instances 值:使用如下...

开发ODPS SQL任务

DataWorks为您提供ODPS SQL节点,可用于周期性调度...MaxCompute+DLF+OSS实践 SQL调优 统计MaxCompute TOPN费用账号及耗时作业 基于Policy对具备内置角色的用户进行权限管理 资源规划及规格选型 实现GROUP_CONCAT函数能力案例 合并小文件

数据类型版本说明

MaxCompute数据类型版本 MaxCompute设置数据类型版本属性的参数共有3个:odps.sql.type.system.odps2:MaxCompute 2.0数据类型版本的开关,属性值为True或False。odps.sql.decimal.odps2:MaxCompute 2.0的Decimal数据类型的开关,属性值为...

SET

更多信息,请参见 数据倾斜调优odps.sql.reducer.instances 设置哈希桶的数量。更多哈希桶信息,请参见 表操作。取值范围:0~4000 个。odps.sql.udf.ppr.deterministic 设置是否在自定义函数中开启分区裁剪机制。更多分区裁剪信息请参见 ...

DESC FUNCTION

您可以编写自定义函数并在MaxCompute SQL中使用入口对象的 create_function()方法来创建函数。DELETE FUNCTION:删除函数。您可以编写自定义函数并在MaxCompute SQL中使用入口对象的delete_function()方法来删除函数。DROP FUNCTION:在...

报错FAILED:ODPS-0420061:Invalid parameter in ...

问题现象 如果您购买了MaxCompute服务,在项目中执行相应的MaxCompute SQL语句时,您可能会收到以下的报错信息:FAILED:ODPS-0420061:Invalid parameter in ...问题原因 小文件过多。解决方法 您可以通过以下命令来查看表中的小文件数量:desc...

DQL操作常见问题

问题类别 常见问题 GROUP BY 在执行MaxCompute SQL过程中,报错Repeated key in GROUP BY,如何解决?在执行MaxCompute SQL过程中,报错Expression not in GROUP BY key,如何解决?对表A执行GROUP BY生成表B,表B比表A的行数少,但表B的...

SQL概述

MaxCompute SQL是MaxCompute中用于数据查询和分析的SQL语言,其语法类似于标准SQL,但在标准语法ANSI SQL92的基础上进行了一些扩展和限制以更好地服务于大规模数据仓库的场景。本文为您介绍MaxCompute SQL使用场景、使用向导及支持的工具...

SQL使用限制项

MaxCompute SQL是专门为大规模数据集设计的SQL语言,在服务大规模数据场景的同时,也需要遵循一定的限制来确保系统的稳定性和运行效率,本文为您介绍MaxCompute SQL的限制项。限制项 最大值/限制条件 分类 说明 表名长度 128字节 长度限制 ...

配置MaxCompute Studio

MaxCompute SQL配置选项 在 Settings 对话框左侧导航栏上,单击 MaxCompute Studio>MaxCompute SQL,进入MaxCompute SQL配置选项页。在MaxCompute SQL配置选项对话框配置如下信息:语法高亮 选中 Enable syntax coloring,启动语法高亮功能...

大量数据导出方案

本文将通过示例,为您介绍导出MaxCompute SQL计算结果的方法。说明 本文中所有SDK部分仅以Java举例。概述 您可以通过以下方法导出SQL的运行结果:如果数据比较少,请使用 SQL Task 得到全部的查询结果。如果需要导出某个表或者分区,请使用...

使用DataWorks连接

使用DataWorks连接MaxCompute有如下方式:数据分析的 SQL查询 功能:实现编辑MaxCompute SQL、查询数据、分析数据(电子表格)、在线分享数据及下载数据等功能。SQL查询功能详情请参见 SQL查询。数据开发的MaxCompute任务节点:DataWorks将...

SQL其他常见问题

SQL作业调优 SQL作业运行过慢,如何优化?MaxCompute的时间类型字段是否可以不带时分秒?时间类型字段可以使用DATE数据类型。使用该数据类型时,您需要打开MaxCompute 2.0数据类型开关。更多MaxCompute 2.0数据类型信息,请参见 2.0数据...

CREATE FUNCTION

您可以编写自定义函数并在MaxCompute SQL中使用入口对象的delete_function()方法来删除函数。DROP FUNCTION:在MaxCompute项目中注销已注册的自定义函数。DESC FUNCTION:查看MaxCompute项目中指定自定义函数的信息,包含函数名称、所有者...

MapReduce常见问题

Backups就是一种加速调优MaxCompute会查看您的任务,如果存在一些任务的工作量特别大,便为其开启备份任务,两个任务执行一样的数据,结果用最先执行结束的任务,因此存在Backups。但是如果任务非常大,Backups也无法起作用,因为原本的...

SETPROJECT

工具平台 本文中的命令您可以在 MaxCompute客户端、云命令行(odpscmd)或 DataWorks的ODPS SQL节点 中执行。注意事项 项目空间非工作空间。项目空间名称获取方式:登录 MaxCompute控制台,选择 工作区>项目管理,项目管理 页面的...

概述

管理MaxCompute项目,相关文档如下:DBeaver连接MaxCompute DataGrip连接MaxCompute SQL Workbench/J连接MaxCompute 注意事项 通过MaxCompute JDBC驱动执行SQL并获取结果,需要执行账号满足以下要求:是项目空间的成员。有项目空间的...

使用SQL管理外部项目

与常规MaxCompute SQL不同的是,External Project表需要以 external_project_name.table_name 格式引用。目前暂不支持在外部项目中创建表。向表中插入数据。向非分区表插入数据。进入关联的MaxCompute项目(非外部项目)。use doc_test_...

2021年

2021-08-31 全部地域 复杂类型函数 日期与时间函数 字符串函数 数学函数 其他函数 MaxCompute SQL UPDATE、DELETE和MERGE INTO功能商业化 自2021年8月10日起,MaxCompute SQL的UPDATE、DELETE和MERGE INTO功能结束免费公测,开始正式计费。...

ODPS-0420095

解决方案 按量计费开发者版仅支持MaxCompute SQL(支持使用UDF)、PyODPS作业。请购买并绑定按量计费或包年包月的Quota运行Spark作业,Spark相关操作请参见 概述。错误6:You have no privilege 'odps:Usage' on {acs:odps:*:tanents/...

统计MaxCompute TOPN费用账号及耗时作业

说明 如果需要同时对多个MaxCompute项目的元数据进行统计分析,您可以创建多个ODPS SQL节点,将这些MaxCompute项目的元数据写入到同一张数据备份表中。步骤四:创建统计TOPN费用账号及耗时作业 TASKS_HISTORY视图中的settings会记录上层...

Tablestore外部表

set odps.sql.unstructured.tablestore.put.row=true;tablestore.read.mode 否 当遇到脏数据时行为定义字段,取值说明如下:permissive(默认值):当遇到脏数据时,可以跳过。failfast:当遇到脏数据时,直接报错。关于脏数据处理示例,...

UDF开发(Java)

UDF开发完成后:UDF调用说明 按照上述 UDF开发流程,完成Java UDF开发后,您即可在odpscmd中通过MaxCompute SQL调用Java UDF。调用方法如下:在归属MaxCompute项目中使用自定义函数:使用方法与 内建函数 类似,您可以参照内建函数的使用...

Flag参数列表

具体操作,请参见 数据倾斜调优。SELECT JOIN SQL Session odps.sql.udf.ppr.deterministic 设置是否在自定义函数中开启分区裁剪机制。关于分区裁剪信息的更多信息,请参见 WHERE子句(where_condition)。True:打开。False:关闭。UDF ...

Spark访问湖仓一体外部数据源

访问基于Hadoop外部数据源的外部项目 MaxCompute SQL访问外部项目表-hadoop_external_project 为外部项目,映射的是EMR的Hive数据库-访问非分区表 SELECT*from hadoop_external_project.testtbl;访问分区表 SELECT*from hadoop_external_...

DML操作常见问题

MaxCompute SQL中使用到新数据类型(TINYINT、SMALLINT、INT、FLOAT、VARCHAR、TIMESTAMP或BINARY)时,需要执行如下语句开启新数据类型开关:Session级别:如果使用新数据类型,您需要在SQL语句前加上 set odps.sql.type.system.odps2=...

开发ODPS MR任务

返回结果:OK 在ODPS SQL节点中查询输出表 wc_out 的数据。select*from wc_out;返回结果:+-+-+|key|cnt|+-+-+|package|1|pad|1|problem|1|project|1|val_a|2|val_pro|2|+-+-+编辑代码:进阶示例 更多场景的ODPS MR任务开发,请参见:...

PyODPS参数传递

0001,互联网,本科,20190715,beijing 0002,教育,大专,20190716,beijing 0003,金融,硕士,20190715,shandong 0004,互联网,硕士,20190715,beijing 右键单击业务流程,选择 新建节点>MaxCompute>ODPS SQL。输入 节点名称,并单击 确认。在ODPS ...

建立性能基准

记录查询执行时间及预估费用 登录 DataWorks控制台,进入 数据开发 页面,创建 ODPS sql 节点。您可以在运行任务时或通过单击 图标直接通过图形页面查看预估费用。任务完成运行后,可在运行日志中查看到运行时间。icmsDocProps={'...

PyODPS查看一级分区

0001,互联网,本科,20190715,beijing 0002,教育,大专,20190716,beijing 0003,金融,硕士,20190715,shandong 0004,互联网,硕士,20190715,beijing 右键单击业务流程,选择 新建节点>MaxCompute>ODPS SQL。输入 节点名称,并单击 确认。在ODPS ...

MaxCompute后付费消费突增排查

说明 如果需要同时对多个MaxCompute项目的元数据进行统计分析,您可以创建多个ODPS SQL节点,将这些MaxCompute项目的元数据写入到同一张数据备份表中。步骤四:通过费用中心分析高额消费项目和计费项 进入费用中心请参见 进入费用中心,在...

自定义镜像

在SQL或Python开发过程中,会存在较为复杂的业务逻辑,依赖三方包众多,引用资源复杂,因此MaxCompute推出自定义镜像管理功能,您可自由、灵活的使用Docker镜像来构建自己所需的完整开发环境,并在MaxCompute SQL、Python(PyODPS或...

MaxCompute如何访问Hologres

MaxCompute SQL外部表的方式访问Hologres,详情请参见 MaxCompute SQL外部表方式访问Hologres。MaxCompute Spark方式访问Hologres,如下所示。MaxCompute Spark访问Hologres:Local提交模式。MaxCompute Spark访问Hologres:Cluster提交...

JSON数据从OSS迁移至MaxCompute

右键单击业务流程,选择 新建节点>MaxCompute>ODPS SQL。在 新建函数 对话框中,输入 函数名称,单击 新建。在ODPS SQL节点编辑页面输入如下语句。查询表mq_data数据。SELECT*from mqdata;获取JSON文件中的EXPENSIVE值。SELECT GET_JSON_...

Paimon外部表

步骤三:通过MaxCompute创建Paimon外表 使用本地客户端(odpscmd)连接 或其他可以运行MaxCompute SQL的工具,创建MaxCompute Paimon外部表。本文以 oss_extable_paimon_1 为例。create external table oss_extable_paimon_1(dt STRING,id ...

使用Kafka(离线与实时)

set odps.sql.allow.fullscan=true;select*from table_text;返回结果如下:#这里由于我们odps-sink-connector.json配置文件中的mode值为VALUE,所以只保留value的内容,key字段为NULL+-+-+-+-+-+-+|topic|partition|offset|key|value|pt|+-...

Python 2 UDAF

MaxCompute SQL Type Python 2 Type BIGINT INT STRING STR DOUBLE FLOAT BOOLEAN BOOL DATETIME INT FLOAT FLOAT CHAR STR VARCHAR STR BINARY BYTEARRAY DATE INT DECIMAL DECIMAL.DECIMAL ARRAY LIST MAP DICT STRUCT COLLECTIONS....

UDF开发(Python3)

创建ODPS SQL节点的操作请参见 开发ODPS SQL任务,命令示例如下。set odps.sql.python.version=cp37;python3 UDF需要使用该命令开启python3 select UDF_GET_URL_CHAR("http://www.taobao.com/a.htm",1);使用odpscmd 准备工作。使用odpscmd...

INITCAP

返回固定格式的字符串,单词之间以空格分隔,转换后的格式为:字符串中每个单词首...使用示例-返回Odps Sql。SELECT initcap("oDps sql");相关函数 INITCAP函数属于字符串函数,更多查找字符串、转换字符串格式的相关函数请参见 字符串函数。

SQL

PyODPS支持对MaxCompute SQL的基本操作,本文为您介绍如何在PyODPS中使用SQL。背景信息 PyODPS提供对MaxCompute SQL的基本操作方法,方法如下所示。方法名称 方法说明 execute_sql()/run_sql()执行SQL语句。open_reader()读取SQL执行结果。...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
云原生数据仓库AnalyticDB MySQL版 云数据库HBase版 云原生大数据计算服务 MaxCompute 云备份 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用