PyODPS的列运算

本文为您介绍如何进行PyODPS的列运算。前提条件 请提前完成如下操作:已 开通MaxCompute。已 开通DataWorks。在DataWorks上完成业务流程创建,本例使用DataWorks简单模式。详情请参见 创建业务流程。操作步骤 创建表并导入数据。下载 鸢尾...

将数据写入OSS

odps.sql.unstructured.oss.commit.mode 属性设置不同取值时的实现原理如下:取值为False:MaxCompute写入到OSS外部表的数据,会存储在 LOCATION 目录下的.odps 文件夹中。odps 文件夹中维护了一个.meta 文件,用于保证MaxCompute数据的...

授权实践

Policy内容如下:{"Statement":[{"Action":["odps:List","odps:CreateTable","odps:CreateInstance","odps:CreateResource","odps:CreateFunction"],"Effect":"Allow","Resource":["acs:odps:*:projects/<project_name>"]},{"Action":[...

通过DataWorks使用PyODPS

from odps import options options.sql.settings={'odps.sql.mapper.split.size':16} o.execute_sql('select*from pyodps_iris')#会根据全局配置添加hints 使用三方包 DataWorks节点预装了以下三方包,版本列表如下:包名 Python 2节点版本...

创建并使用MaxCompute资源

说明 新创建的资源如果未在MaxCompute(ODPS)客户端上传过,则需勾选 上传为ODPS资源,如果该资源已上传至MaxCompute(ODPS)客户端,则需取消勾选 上传为ODPS资源,否则上传均会报错。通过DataWorks可视化方式创建或上传的资源,若上传时...

使用DataWorks连接

MaxCompute任务节点包括:ODPS SQL节点、ODPS Spark节点、PyODPS 2节点、PyODPS 3节点、ODPS Script节点、ODPS MR节点。使用场景 数据分析使用场景 数据分析的 SQL查询 功能使用场景如下:您可以通过数据分析的 SQL查询 功能查询数据,并...

Quick BI配置抽取任务报错“ODPS-0130071:[1,50]...

问题描述 用户配置抽取加速时,任务报错“ODPS-0130071:[1,50]Semantic analysis exception-column XXX cannot be resolved;问题原因 用户使用的物理表结构有调整,有字段无效了。解决方案 数据集点击表名,清理无效字段。适用于 Quick BI ...

Dataphin创建表时配置字段默认值报错:"cannot be ...

问题描述 Dataphin创建表时配置字段默认值报错:"cannot be cast to com.aliyun.odps.compiler.Literal"问题原因 字段默认值是随机导致的。解决方案 将字段默认值修改为固定值即可。适用于 Dataphin 公共云

PyODPS使用第三方包

datestr 0 2016-08-26 14:03:29 1 2015-08-26 14:03:29 全局配置使用到的三方库如下:from odps import options def get_year(t):from dateutil.parser import parse return parse(t).strftime('%Y')options.df.libraries=['six.whl','...

安装PyODPS

PyODPS是MaxCompute的Python版本的SDK,提供对MaxCompute对象的基本操作及DataFrame框架,帮助您在MaxCompute上使用Python进行数据分析,支持在DataWorks或本地环境上使用。本文为您介绍在本地环境上使用PyODPS时,如何安装PyODPS。前提...

周期性调度作业概述

如果您希望周期性运行MaxCompute作业,可使用DataWorks的DataStudio开发周期性MaxCompute作业,并配置周期性调度的时间属性、调度依赖等配置项,将作业整体提交至DataWorks的运维中心进行周期性调度。本文为您概要介绍当前使用DataWorks...

SQL

from odps import options options.sql.settings={'odps.stage.mapper.split.size':16} o.execute_sql('select*from pyodps_iris')#会根据全局配置添加hints。读取SQL执行结果 您可以通过 open_reader 操作读取SQL执行结果。有以下两种情况...

PyODPS常见问题

本文为您介绍使用PyODPS时的常见问题。问题类别 常见问题 安装PyODPS 安装PyODPS时,提示Warning:XXX not installed,如何解决?安装PyODPS时,提示Project Not Found,如何解决?安装PyODPS时,报错Syntax Error,如何解决?在Mac上安装...

开发PyODPS脚本

新建MaxCompute PyODPS脚本后,PyODPS脚本模板会通过PyODPS Room自动初始化 odps 和 o 两个对象。通过DataWorks开发PyODPS脚本时,系统会自动创建Room。通过IntelliJ IDEA开发PyODPS脚本时,需要创建Room,详情请参见 PyODPS文档。

Python SDK常见问题

本文为您介绍Python SDK常见问题,即PyODPS。问题类别 常见问题 安装PyODPS 安装PyODPS时,提示Warning:XXX not installed,如何解决?安装PyODPS时,提示Project Not Found,如何解决?安装PyODPS时,报错Syntax Error,如何解决?在Mac上...

ODPS-0420095

错误码:ODPS-0420095:Access Denied 错误1:You have no privilege to create external project-you have to be owner,super admin or admin of the referred project.错误信息 ODPS-0420095:Access Denied-You have no privilege to ...

快速入门

该方法返回的行数受到 options.df.odps.sort.limit 的限制,详情请参见 配置选项。print(users.occupation.value_counts()[:10])返回值 occupation count 0 student 196 1 other 105 2 educator 95 3 administrator 79 4 engineer 67 5 ...

ODPS-0123091

错误码:ODPS-0123091:Illegal type cast 错误1:in function cast,value 'xx' cannot be casted from yy to zz 错误信息示例 ODPS-0123091:Illegal type cast-in function cast,value 'xx' cannot be casted from YY to ZZ 问题描述 执行...

ODPS-0130252

错误码:ODPS-0130252:Cartesian product is not allowed 错误1:cartesian product is not allowed without mapjoin 错误信息示例 ODPS-0130252:[m,n]Cartesian product is not allowed-cartesian product is not allowed without mapjoin...

MapReduce错误码(ODPS-07CCCCX)

ODPS-07CCCCX:通用描述-上下文相关说明 MapReduce错误包含META(CCCC段为1000~1999)、PARSER(CCCC段为2000~2999)、INTERNAL(CCCC段为3000~3999)模块错误。具体错误码列表如下。错误码 模块 严重等级 触发条件 处理方法 ODPS-0720001:...

API错误码(ODPS-04CCCCX)

ODPS-04CCCCX:通用描述-上下文相关说明 API错误包含Web(CCCC段为1000~1999)、Worker(CCCC段为2000~2999)、Scheduler(CCCC段为3000~3999)、Executor(CCCC段为4000~4999)和Message Service(CCCC段为5000~5999)模块错误。...

ODPS-0130241

错误码:ODPS-0130241:Illegal union operation 错误1:Illegal union operation-type mismatch for column xx of UNION,left is YY while right is ZZ 错误信息示例 ODPS-0130241:[m,n]Illegal union operation-type mismatch for column ...

ODPS-0130013

错误码:ODPS-0130013:Authorization exception 错误1:Authorization Failed[4011],You have NO privilege 'odps:Select' on {acs:odps:*:projects/<project_name>/tables/<table_name>}.Explicitly denied by policy.Context ID:...

ODPS-0110042

错误码:ODPS-0110042:current table is in INF version 错误:current table is in INF version you can't update cluster version 错误信息示例 FAILED:ODPS-0110042:current table is in INF version you can't update cluster version ...

ODPS-0123031

错误码:ODPS-0123031:ODPS partition exception 错误1:maximum 60000 partitions allowed 错误信息示例 ODPS-0123031:ODPS partition exception-maximum 60000 partitions allowed 错误描述 每张MaxCompute的分区表最多允许存在 60000 个...

ODPS-0110061

错误码:ODPS-0110061:Failed to run ddltask 错误1:Schema evolution DDLs is not enabled in current project:xxxx 错误信息 FAILED:Catalog Service Failed,ErrorCode:152,Error Message:ODPS-0110061:Failed to run ddltask-Schema ...

PL错误码(ODPS-02CCCCX)

ODPS-02CCCCX:通用描述-上下文相关说明 PL错误包含CLIENT\LEXER\PARSER(CCCC段为1000~1999)和SEMANTIC(CCCC段为2000~2999)模块错误。具体错误码列表如下。错误码 模块 严重等级 触发条件 处理方法 ODPS-0210001:Unable to open input ...

ODPS-0010000

错误码:ODPS-0010000:System internal error 错误1:fuxi job failed,caused by:kWorkerOutOfMemory(errCode:256)at Odps/xxx/xxx.Detail error msg:KILL_NAKILL_NA:plannedResource({Memory=xxx,CPU=xxx})usedResource({Memory=xxx,CPU=...

Common错误码(ODPS-00CCCCX)

ODPS-00CCCCX:通用描述-上下文相关说明 Common错误包含系统错误、用户非法请求和无权限三种。三种错误类型都有对应的 CCCC 编码段,系统异常错误以1开头,用户非法请求错误以2开头,无权限错误以3开头。具体错误码列表如下。错误码 类别 ...

PyODPS节点实现结巴中文分词

本文为您介绍如何使用DataWorksPyODPS类型节点,结合开源结巴中文分词库,对数据表中的中文字段进行分词处理并写入新的数据表,以及如何通过闭包函数使用自定义词典进行分词。前提条件 已创建DataWorks工作空间并绑定了MaxCompute计算...

ODPS-0121096

错误码:ODPS-0121096:MetaStore transaction conflict 错误1:Reached maximum retry times because of OTSStorageTxnLockKeyFail(Inner exception:Transaction timeout because cannot acquire exclusive lock.)错误信息 ODPS-0121096:...

PyODPS制作第三方包

PyODPS自V0.11.3版本开始提供了 pyodps-pack 命令行工具,用于制作符合PyODPSDataWorks PyODPS节点标准的三方包,使用方法类似 pip 命令。您可以使用该工具将所有依赖项目制作成一个后缀为.tar.gz 的压缩包,其中包含所有依照MaxCompute...

PyODPS参数传递

本文为您介绍如何在DataWorks中进行PyODPS参数的传递。前提条件 请提前完成如下操作:已 开通MaxCompute。已 开通DataWorks。在DataWorks上完成业务流程创建,本例使用DataWorks简单模式。详情请参见 创建业务流程。操作步骤 准备测试数据...

PyODPS读取分区表数据

本文为您介绍如何通过PyODPS读取分区表数据。前提条件 您需要完成以下操作:已 开通MaxCompute。已 开通DataWorks。在DataWorks上完成业务流程创建,本例使用DataWorks简单模式。详情请参见 创建业务流程。操作步骤 准备测试数据。创建表并...

2019年

PyODPS参数传递 2019-07-12 新增set命令odps-sql-reshuffle-dynamicpt说明。新命令 该命令用于设置动态分区,以避免拆分动态分区时产生过多小文件。SET操作 2019-07-11 新增tablestore-columns-mapping说明点。新说明 在指定映射时,提供的...

Schema

使用DataWorks:创建好PyODPS 2节点或PyODPS 3节点,详情请参见 通过DataWorks使用PyODPS。使用本地PC环境:安装好PyODPS并初始化ODPS入口对象。基本操作 当前MaxCompute Schema功能还在公测中,如果您需要使用的话,请提交新功能测试申请...

2024年

2024年02月29日-DataWorks独享资源组PyODPS节点升级公告 尊敬的MaxCompute用户:DataWorks将于北京时间 2024年04月08日(周一)至 2024年05月30日(周四)期间,逐步升级各个地域的独享资源组,以增强PyODPS支持。本次升级的主要内容及各...

配置MySQL输入

数据集成通过实时订阅MySQL Binlog实现增量数据实时同步,您需要在DataWorks配置同步任务前,先开启MySQL Binlog服务。已购买合适规格的独享数据集成资源组。详情请参见 新增和使用独享数据集成资源组。已配置数据同步资源组与数据库的网络...

最佳实践:集成第三方调度系统

DataWorks配置:开启并配置消息订阅(OpenEvent)开启并配置消息订阅的详细步骤请参见 开启消息订阅,以下为本实践中的核心配置流程与注意事项。在 EvenBridge控制台,跳过事件源等配置,快速创建一个自定义总线。在 EvenBridge控制台 对应...

配置并使用调度参数

本文为您介绍如何配置及使用调度参数,并以ODPS SQL节点为例,讲解调度参数配置完成后使用冒烟测试功能测试调度参数的替换情况。注意事项 运行()与高级运行()功能需手动为代码中的变量赋值常量,因此无法校验配置的调度参数是否符合...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
大数据开发治理平台 DataWorks 云服务器 ECS 阿里邮箱 弹性公网IP 商标服务 短信服务
新人特惠 爆款特惠 最新活动 免费试用