错误

解决方案:请提交 工单,或联系Dataphin的支持人员协助处理。DPN.Bbox.MetaCenterServiceError 错误原因:元数据服务不可用。解决方案:请提交 工单,或联系Dataphin的支持人员协助处理。DPN.Bbox.ModelNotFound 错误原因:根据模型ID查询...

PAI-TF概述

PAI-TF的作业都是基于底层的分布式调度系统动态调度至不同机器。当您提交PAI-TF作业时,无需担心是否需要提前申请GPU物理主机,PAI-TF所需要的GPU资源随作业的提交动态分配,随作业的结束动态释放。全局计算调度 当您在使用MaxCompute计算...

使用Gang scheduling

ACK基于新版的Kube-scheduler框架实现Gang scheduling的能力,解决原生调度器无法支持All-or-Nothing作业调度的问题。本文介绍如何使用Gang scheduling。重要提示 请预留足够资源:使用弹性节点池时请保证弹性节点池的最大资源量以及节点...

使用Gang scheduling

ACK基于新版的Kube-scheduler框架实现Gang scheduling的能力,解决原生调度器无法支持All-or-Nothing作业调度的问题。本文介绍如何使用Gang scheduling。重要提示 请预留足够资源:使用弹性节点池时请保证弹性节点池的最大资源量以及节点...

云盘存储卷FAQ

类型 问题 云盘创建 动态创建PV失败且提示InvalidDataDiskCatagory.NotSupported 动态创建PV失败且提示The specified AZone inventory is insufficient 动态创建PV失败且提示disk size is not supported 动态创建PV失败且提示waiting for ...

云盘存储卷FAQ

云盘挂载失败,出现timeout错误 升级系统后,云盘报错input/output error 卸载云盘时提示The specified disk is not a portable disk 挂载云盘的Pod无法启动且提示had volume node affinity ...,提示can't find disk 动态创建PV失败...

任务常见问题

可以通过控制台动态修改超时时间。具体操作,请参见 任务管理。为什么实例停止之后还会执行?问题现象:实例停止之后仍然执行。可能原因:任务实例停止后,SchedulerX会把Kill消息发送到客户端。客户端接收到Kill消息后,会停止下发和停止...

使用负载热点打散重调度

ack-koordinator组件提供负载热点打散重调度能力,可以感知集群内节点负载的变化,自动地优化超过负载水位安全阈值的节点,防止出现负载极端不均衡的情况。本文介绍如何使用负载热点打散重调度及其高级配置参数。使用限制 仅支持ACK Pro版...

版本说明

说明 需手动开启动态库(即 nvidia.nvml.enabled=true),解决基于命令方式在某些系统下卡死的隐患。可用性探测的生效时间支持cron表达式。Prometheus采集支持通过HTTP Header进行鉴权。新增对如下地域的支持:cn-wuhan-lr:武汉本地域。...

历史功能发布记录(2023年)

全部 无 云原生AI套件 GPU调度支持GPU节点动态划分MIG ACK托管集群 安装 云原生AI套件 的调度组件ack-ai-installer后,通过给GPU节点打上特殊标签,可以让GPU节点开启MIG能力以及动态划分。节点按最大支持MIG实例数上报MIG资源,每个Pod的...

任务常见问题

可以通过控制台动态修改超时时间。具体操作,请参见 任务管理。为什么实例停止之后还会执行?问题现象:实例停止之后仍然执行。可能原因:任务实例停止后,SchedulerX会把Kill消息发送到客户端。客户端接收到Kill消息后,会停止下发和停止...

任务常见问题

可以通过控制台动态修改超时时间。具体操作,请参见 任务管理。为什么实例停止之后还会执行?问题现象:实例停止之后仍然执行。可能原因:任务实例停止后,SchedulerX会把Kill消息发送到客户端。客户端接收到Kill消息后,会停止下发和停止...

消息 Mesh

由于上述计算逻辑十分复杂,需要包含过滤和聚合,且存在动态和并发行为,一旦因计算错误则会严重影响到消息投递的正确性。因此,当前 MOSN 绕过了该指令的代理,只利用客户端的控制指令进行相关数据的校验,以及更新客户端连接的映射信息...

使用阿里云CDN加速后网站访问速度较慢

客户端DNS设置错误 客户端DNS设置错误需要用户侧修改使用对应所在地对应运营商的DNS:一个广东移动的用户,使用了联通的DNS服务器,则会导致该用户请求到联通的CDN节点,远距离调度会延长网络链路。一个广东移动的用户,使用了哈尔滨移动的...

Java SDK

本文介绍SchedulerX产品的Java SDK发布的功能变更,包括新增功能、功能优化、重要问题修复等,帮助您了解SchedulerX的Java SDK发布动态。发布记录 1.11.4,2024-03-20 功能名称 变更类型 功能描述 相关文档 工作流 新增 JobContext可以获取...

功能发布记录 2022年之前

本文为您介绍2022年之前DataWorks产品功能和对应的文档动态。MaxCompute的重要功能发布详情请参见 产品重大更新。2021-12 功能名称 功能描述 发布时间 发布地域 相关文档 数据质量支持选择规则模板来批量配置数据质量规则。DataWorks数据...

产品优势

短信服务可以为您提供以下服务优势,带给您安全可靠的发送体验。快速稳定 国内短信秒级可达,99%到达率。国内短信三网合一专属通道,与工信部携号转网平台实时互联。400+通道支持,可实现1秒切换...高效的调度算法解决高峰时段的业务压力。

调度参数支持的格式

调度参数是DataWorks任务调度时使用的参数,可根据您配置的调度参数取值规则,在每次任务运行时自动替换为真实的取值,实现任务调度时间内参数的动态替换。本文为您介绍调度参数支持的格式及相关使用。背景信息 您可在代码中通过${变量名} ...

任务实例状态异常

解决措施 按照下图所示,在 工作空间配置 页面,检查工作空间是否开启调度。说明 如有需要请协调主账号开启工作空间调度。有周期任务,有其他周期实例,但是这个任务没有产生周期实例 问题现象 有周期任务,有其他周期实例,但是这个任务...

Quick BI v4.3版本说明

支持多种调度方式,包括手动调度,周期调度动态参数调度。支持任务发布状态管理和运维管理。移动端 移动端图表展示支持栅格布局,一行可放置多个图表。支持布局缩放来调整单个组件尺寸和位置。支持布局个性化隐藏Tab内的单个图表。可视化...

负载均衡调度算法介绍

动态负载调度:当服务器的连接数和负载情况经常发生变化时,可以通过实时监控连接数并进行动态调整,实现动态的负载均衡。高稳定性要求:对于需要实时响应和高稳定性的应用场景,通过加权最小连接数算法可以降低服务器的负载,提高系统的...

数据开发功能索引

批量操作():用于快速对表、资源、函数进行批量修改(包括修改责任人、引擎实例、调度资源组、调度重跑属性、调度类型、调度周期、调度超时时间等操作)。导入():用于快速将本地数据上传至目标表中。目前仅支持上传数据至MaxCompute表...

错误

错误码 识别成功 错误错误信息 描述 0 SUCCESS 成功 配置或参数错误 错误错误消息 描述 解决方案 240999 DEFAULT_ERROR 内部默认错误。内部错误,请重试。240001 NUI_CONFIG_INVALID 配置文件错误。配置文件错误,请确认传入的资源...

错误

错误码 识别成功 错误错误信息 描述 0 SUCCESS 成功 配置或参数错误 错误错误消息 描述 解决方案 240999 DEFAULT_ERROR 内部默认错误。内部错误,请重试。240001 NUI_CONFIG_INVALID 配置文件错误。配置文件错误,请确认传入的资源...

数据开发:开发者

本文以使用MaxCompute数据源,在DataWorks上运行MaxCompute作业任务为例,为您介绍开发人员如何使用数据开发(DataStudio)创建一个周期调度任务,帮助您快速了解数据开发(DataStudio)模块的基本使用。前提条件 已完成开发前的环境准备,...

错误

4301 内部协程调度错误。4302 解码错误。4303 缓冲区非正常溢出。4304 未知的视频封装格式(非MP4)。4400 未知错误MEDIA_ERR_SRC_NOT_SUPPORTED(由于服务器或网络原因不能加载资源,或者格式不支持)。4500 服务端请求错误,查看Network...

400错误

解决方案:请参考下表参数说明完成Authorization头部计算。AccessKeyId or Signature is missing in Authorization header value 错误原因:Authorization头部计算方法中缺失AccessKey ID和Signature参数。解决方法:在Authorization头部...

调度至Arm节点

注意事项 如果您的ACK集群同时存在Arm节点和x86节点,为了防止不支持Arm的应用和组件被错误调度到Arm节点,请为Arm节点添加污点 kubernetes.io/arch=arm64:NoSchedule。如果您的集群版本为v1.24之前,在使用 nodeSelector 或者 ...

配置Arm节点池

注意事项 如果您的ACK集群同时存在Arm节点和x86节点,为了防止不支持Arm的应用和组件被错误调度到Arm节点,请为Arm节点添加污点 kubernetes.io/arch=arm64:NoSchedule。如果您的集群版本为v1.24之前,在使用 nodeSelector 或者 ...

其他常见问题

解决方案 检查客户端应用配置文件中的 AntVIP 地址。详情请参见 properties 配置项。任务调度客户端不在线 问题现象 任务调度控制台显示客户端不在线。问题原因 客户端和服务端之间的 TCP 长连接建立失败。解决方案 控制台显示客户端在线,...

通过ack-co-scheduler组件实现协同调度

Gang scheduling 阿里云容器服务ACK基于新版的Kube-scheduler框架实现Gang scheduling的能力,解决原生调度器无法支持All-or-Nothing作业调度的问题。使用以下模板向集群中提交Tensorflow分布式作业。关于如何运行Tensorflow的分布式作业,...

ODPS-0123031

错误码:ODPS-0123031:ODPS partition exception 错误1:maximum 60000 partitions allowed 错误信息示例 ODPS-0123031:ODPS partition exception-maximum 60000 partitions allowed 错误描述 每张MaxCompute的分区表最多允许存在 60000 个...

任务触发与执行问题

任务执行超时 问题现象 出现 TIMEOUT 错误。问题原因 客户端处理超时。解决方法 查看超时时间是否配置太小。建议根据任务的实际执行情况设置合理的超时时间。查看客户端错误日志 common-error.log。自定义参数不存在 问题现象 出现 javax....

功能特性

Fleet实例会根据任务需要的资源和关联集群的剩余资源,执行动态调度策略,选择适合的关联集群下发任务。托管ArgoCD(GitOps)ACK One舰队的Fleet实例托管了ArgoCD,同时集成ACK One多集群能力,实现多集群的GitOps持续交付,满足应用的高可用...

存储多可用区部署的推荐配置

调度应用时,出现错误 0/x node are available,x nodes had volume node affinity conflict。以上这些问题,均会导致应用发布中断受阻,本文推荐一种存储多可用区部署的最佳配置,最大程度的减少上述问题。推荐配置 使用云盘进行持久化存储...

接入问题

解决方案:登录Worker查看SchedulerX的日志,日志路径为/${user.home}/logs/schedulerx/worker.log。如果是admin账号启动进程,日志路径为/home/admin/logs/schedulerx/worker.log。如果是root账号启动进程,日志路径为/root/logs/...

权限管理与规范化数据开发

调度参数 调度参数是DataWorks在调度场景下支持自动根据业务时间替换为具体值的参数,节点中使用调度参数后,在调度场景下,可以实现将对应业务时间的业务数据动态写入对应的时间分区中。详情请参见 调度参数支持的格式。依赖关系 调度依赖...

应用场景

接驳优化推荐:动态公交调度、公交线网优化、公交排班优化、地铁运营与检修排班。MaaS出行服务:个性化联程方式出行规划、一码通乘服务、出行核验、用户运营管理。案例说明 场景:某城市希望提升公共交通在城市级大型赛会活动时的服务水平...

云原生AI套件概述

异构计算集群概述 开启集群GPU监控 共享GPU调度概述 AI任务调度 多种调度策略支持:针对AI分布式训练等典型批量任务类型,ACK调度器扩展Kubernetes原生调度框架,支持实现多种典型批量调度策略,包括Gang Scheduling(Coscheduling)、FIFO...

接入问题

解决方案:登录Worker查看SchedulerX的日志,日志路径为/${user.home}/logs/schedulerx/worker.log。如果是admin账号启动进程,日志路径为/home/admin/logs/schedulerx/worker.log。如果是root账号启动进程,日志路径为/root/logs/...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
音视频通信 批量计算 视觉计算服务 弹性公网IP 短信服务 人工智能平台 PAI
新人特惠 爆款特惠 最新活动 免费试用