非读表的Task 主要有如下三种方式调整并发度:调整 odps.sql.mapper.split.size 值:非读表Task的并发度会受到输入Task的并行度影响,通过调整读表Task的并发度间接调整非读表Task的并发度。调整 odps.sql.reducer.instances 值:使用如下...
DataWorks为您提供ODPS SQL节点,可用于周期性调度...MaxCompute+DLF+OSS实践 SQL调优 统计MaxCompute TOPN费用账号及耗时作业 基于Policy对具备内置角色的用户进行权限管理 资源规划及规格选型 实现GROUP_CONCAT函数能力案例 合并小文件
MaxCompute数据类型版本 MaxCompute设置数据类型版本属性的参数共有3个:odps.sql.type.system.odps2:MaxCompute 2.0数据类型版本的开关,属性值为True或False。odps.sql.decimal.odps2:MaxCompute 2.0的Decimal数据类型的开关,属性值为...
更多信息,请参见 数据倾斜调优。odps.sql.reducer.instances 设置哈希桶的数量。更多哈希桶信息,请参见 表操作。取值范围:0~4000 个。odps.sql.udf.ppr.deterministic 设置是否在自定义函数中开启分区裁剪机制。更多分区裁剪信息请参见 ...
您可以编写自定义函数并在MaxCompute SQL中使用入口对象的 create_function()方法来创建函数。DELETE FUNCTION:删除函数。您可以编写自定义函数并在MaxCompute SQL中使用入口对象的delete_function()方法来删除函数。DROP FUNCTION:在...
问题现象 如果您购买了MaxCompute服务,在项目中执行相应的MaxCompute SQL语句时,您可能会收到以下的报错信息:FAILED:ODPS-0420061:Invalid parameter in ...问题原因 小文件过多。解决方法 您可以通过以下命令来查看表中的小文件数量:desc...
问题类别 常见问题 GROUP BY 在执行MaxCompute SQL过程中,报错Repeated key in GROUP BY,如何解决?在执行MaxCompute SQL过程中,报错Expression not in GROUP BY key,如何解决?对表A执行GROUP BY生成表B,表B比表A的行数少,但表B的...
MaxCompute SQL是MaxCompute中用于数据查询和分析的SQL语言,其语法类似于标准SQL,但在标准语法ANSI SQL92的基础上进行了一些扩展和限制以更好地服务于大规模数据仓库的场景。本文为您介绍MaxCompute SQL使用场景、使用向导及支持的工具...
MaxCompute SQL是专门为大规模数据集设计的SQL语言,在服务大规模数据场景的同时,也需要遵循一定的限制来确保系统的稳定性和运行效率,本文为您介绍MaxCompute SQL的限制项。限制项 最大值/限制条件 分类 说明 表名长度 128字节 长度限制 ...
MaxCompute SQL配置选项 在 Settings 对话框左侧导航栏上,单击 MaxCompute Studio>MaxCompute SQL,进入MaxCompute SQL配置选项页。在MaxCompute SQL配置选项对话框配置如下信息:语法高亮 选中 Enable syntax coloring,启动语法高亮功能...
本文将通过示例,为您介绍导出MaxCompute SQL计算结果的方法。说明 本文中所有SDK部分仅以Java举例。概述 您可以通过以下方法导出SQL的运行结果:如果数据比较少,请使用 SQL Task 得到全部的查询结果。如果需要导出某个表或者分区,请使用...
使用DataWorks连接MaxCompute有如下方式:数据分析的 SQL查询 功能:实现编辑MaxCompute SQL、查询数据、分析数据(电子表格)、在线分享数据及下载数据等功能。SQL查询功能详情请参见 SQL查询。数据开发的MaxCompute任务节点:DataWorks将...
SQL作业调优 SQL作业运行过慢,如何优化?MaxCompute的时间类型字段是否可以不带时分秒?时间类型字段可以使用DATE数据类型。使用该数据类型时,您需要打开MaxCompute 2.0数据类型开关。更多MaxCompute 2.0数据类型信息,请参见 2.0数据...
您可以编写自定义函数并在MaxCompute SQL中使用入口对象的delete_function()方法来删除函数。DROP FUNCTION:在MaxCompute项目中注销已注册的自定义函数。DESC FUNCTION:查看MaxCompute项目中指定自定义函数的信息,包含函数名称、所有者...
Backups就是一种加速调优。MaxCompute会查看您的任务,如果存在一些任务的工作量特别大,便为其开启备份任务,两个任务执行一样的数据,结果用最先执行结束的任务,因此存在Backups。但是如果任务非常大,Backups也无法起作用,因为原本的...
工具平台 本文中的命令您可以在 MaxCompute客户端、云命令行(odpscmd)或 DataWorks的ODPS SQL节点 中执行。注意事项 项目空间非工作空间。项目空间名称获取方式:登录 MaxCompute控制台,选择 工作区>项目管理,项目管理 页面的...
管理MaxCompute项目,相关文档如下:DBeaver连接MaxCompute DataGrip连接MaxCompute SQL Workbench/J连接MaxCompute 注意事项 通过MaxCompute JDBC驱动执行SQL并获取结果,需要执行账号满足以下要求:是项目空间的成员。有项目空间的...
与常规MaxCompute SQL不同的是,External Project表需要以 external_project_name.table_name 格式引用。目前暂不支持在外部项目中创建表。向表中插入数据。向非分区表插入数据。进入关联的MaxCompute项目(非外部项目)。use doc_test_...
2021-08-31 全部地域 复杂类型函数 日期与时间函数 字符串函数 数学函数 其他函数 MaxCompute SQL UPDATE、DELETE和MERGE INTO功能商业化 自2021年8月10日起,MaxCompute SQL的UPDATE、DELETE和MERGE INTO功能结束免费公测,开始正式计费。...
解决方案 按量计费开发者版仅支持MaxCompute SQL(支持使用UDF)、PyODPS作业。请购买并绑定按量计费或包年包月的Quota运行Spark作业,Spark相关操作请参见 概述。错误6:You have no privilege 'odps:Usage' on {acs:odps:*:tanents/...
说明 如果需要同时对多个MaxCompute项目的元数据进行统计分析,您可以创建多个ODPS SQL节点,将这些MaxCompute项目的元数据写入到同一张数据备份表中。步骤四:创建统计TOPN费用账号及耗时作业 TASKS_HISTORY视图中的settings会记录上层...
set odps.sql.unstructured.tablestore.put.row=true;tablestore.read.mode 否 当遇到脏数据时行为定义字段,取值说明如下:permissive(默认值):当遇到脏数据时,可以跳过。failfast:当遇到脏数据时,直接报错。关于脏数据处理示例,...
UDF开发完成后:UDF调用说明 按照上述 UDF开发流程,完成Java UDF开发后,您即可在odpscmd中通过MaxCompute SQL调用Java UDF。调用方法如下:在归属MaxCompute项目中使用自定义函数:使用方法与 内建函数 类似,您可以参照内建函数的使用...
具体操作,请参见 数据倾斜调优。SELECT JOIN SQL Session odps.sql.udf.ppr.deterministic 设置是否在自定义函数中开启分区裁剪机制。关于分区裁剪信息的更多信息,请参见 WHERE子句(where_condition)。True:打开。False:关闭。UDF ...
访问基于Hadoop外部数据源的外部项目 MaxCompute SQL访问外部项目表-hadoop_external_project 为外部项目,映射的是EMR的Hive数据库-访问非分区表 SELECT*from hadoop_external_project.testtbl;访问分区表 SELECT*from hadoop_external_...
MaxCompute SQL中使用到新数据类型(TINYINT、SMALLINT、INT、FLOAT、VARCHAR、TIMESTAMP或BINARY)时,需要执行如下语句开启新数据类型开关:Session级别:如果使用新数据类型,您需要在SQL语句前加上 set odps.sql.type.system.odps2=...
返回结果:OK 在ODPS SQL节点中查询输出表 wc_out 的数据。select*from wc_out;返回结果:+-+-+|key|cnt|+-+-+|package|1|pad|1|problem|1|project|1|val_a|2|val_pro|2|+-+-+编辑代码:进阶示例 更多场景的ODPS MR任务开发,请参见:...
0001,互联网,本科,20190715,beijing 0002,教育,大专,20190716,beijing 0003,金融,硕士,20190715,shandong 0004,互联网,硕士,20190715,beijing 右键单击业务流程,选择 新建节点>MaxCompute>ODPS SQL。输入 节点名称,并单击 确认。在ODPS ...
记录查询执行时间及预估费用 登录 DataWorks控制台,进入 数据开发 页面,创建 ODPS sql 节点。您可以在运行任务时或通过单击 图标直接通过图形页面查看预估费用。任务完成运行后,可在运行日志中查看到运行时间。icmsDocProps={'...
0001,互联网,本科,20190715,beijing 0002,教育,大专,20190716,beijing 0003,金融,硕士,20190715,shandong 0004,互联网,硕士,20190715,beijing 右键单击业务流程,选择 新建节点>MaxCompute>ODPS SQL。输入 节点名称,并单击 确认。在ODPS ...
说明 如果需要同时对多个MaxCompute项目的元数据进行统计分析,您可以创建多个ODPS SQL节点,将这些MaxCompute项目的元数据写入到同一张数据备份表中。步骤四:通过费用中心分析高额消费项目和计费项 进入费用中心请参见 进入费用中心,在...
在SQL或Python开发过程中,会存在较为复杂的业务逻辑,依赖三方包众多,引用资源复杂,因此MaxCompute推出自定义镜像管理功能,您可自由、灵活的使用Docker镜像来构建自己所需的完整开发环境,并在MaxCompute SQL、Python(PyODPS或...
MaxCompute SQL外部表的方式访问Hologres,详情请参见 MaxCompute SQL外部表方式访问Hologres。MaxCompute Spark方式访问Hologres,如下所示。MaxCompute Spark访问Hologres:Local提交模式。MaxCompute Spark访问Hologres:Cluster提交...
右键单击业务流程,选择 新建节点>MaxCompute>ODPS SQL。在 新建函数 对话框中,输入 函数名称,单击 新建。在ODPS SQL节点编辑页面输入如下语句。查询表mq_data数据。SELECT*from mqdata;获取JSON文件中的EXPENSIVE值。SELECT GET_JSON_...
步骤三:通过MaxCompute创建Paimon外表 使用本地客户端(odpscmd)连接 或其他可以运行MaxCompute SQL的工具,创建MaxCompute Paimon外部表。本文以 oss_extable_paimon_1 为例。create external table oss_extable_paimon_1(dt STRING,id ...
set odps.sql.allow.fullscan=true;select*from table_text;返回结果如下:#这里由于我们odps-sink-connector.json配置文件中的mode值为VALUE,所以只保留value的内容,key字段为NULL+-+-+-+-+-+-+|topic|partition|offset|key|value|pt|+-...
MaxCompute SQL Type Python 2 Type BIGINT INT STRING STR DOUBLE FLOAT BOOLEAN BOOL DATETIME INT FLOAT FLOAT CHAR STR VARCHAR STR BINARY BYTEARRAY DATE INT DECIMAL DECIMAL.DECIMAL ARRAY LIST MAP DICT STRUCT COLLECTIONS....
创建ODPS SQL节点的操作请参见 开发ODPS SQL任务,命令示例如下。set odps.sql.python.version=cp37;python3 UDF需要使用该命令开启python3 select UDF_GET_URL_CHAR("http://www.taobao.com/a.htm",1);使用odpscmd 准备工作。使用odpscmd...
返回固定格式的字符串,单词之间以空格分隔,转换后的格式为:字符串中每个单词首...使用示例-返回Odps Sql。SELECT initcap("oDps sql");相关函数 INITCAP函数属于字符串函数,更多查找字符串、转换字符串格式的相关函数请参见 字符串函数。
PyODPS支持对MaxCompute SQL的基本操作,本文为您介绍如何在PyODPS中使用SQL。背景信息 PyODPS提供对MaxCompute SQL的基本操作方法,方法如下所示。方法名称 方法说明 execute_sql()/run_sql()执行SQL语句。open_reader()读取SQL执行结果。...