使用ack-descheduler组件对Pod进行调度优化

为了解决实际运行中集群资源无法充分利用或浪费的问题,可以使用ack-descheduler组件对集群的Pod进行调度优化,使部分不合理的Pod能够重新调度到合适的节点上。本文介绍如何使用ack-descheduler组件优化Pod调度。前提条件 已创建ACK集群...

开发PyODPS 2任务

注意事项 DataWorks支持可视化创建Python资源,如果您需要在 PyODPS节点中调用第三方包,请使用 独享调度资源组 并通过 运维助手 进行安装。DataWorks运维助手中安装的Python第三方包,仅支持在DataWorks独享调度资源组本地运行PyODPS任务...

开发PyODPS 2任务

注意事项 DataWorks支持可视化创建Python资源,如果您需要在 PyODPS节点中调用第三方包,请使用 独享调度资源组 并通过 运维助手 进行安装。DataWorks运维助手中安装的Python第三方包,仅支持在DataWorks独享调度资源组本地运行PyODPS任务...

注册集群概述

混合云计算弹性:ACK注册集群可以帮助您为自建Kubernetes集群弹性扩容云上计算虚拟机、物理机和无服务器化资源,通过协同调度器可以支持灵活的扩容缩容调度策略,实现IDC资源和云上计算资源的逐级扩容和按需缩容,多副本容器组按比例分布在...

用户交流

阿里云机器学习平台以社区化的方式进行用户运营,会经常举行用户活动,同时为企业级用户提供高效支持。如果您在产品使用过程中遇到问题,请...相关地址 产品首页 计费说明 算法组件 深度学习框架 模型在线服务 离线调度 产品BUG反馈、工单系统

ACK One概述

智能调度 利用容器服务ACK调度器,实现Gang Scheduling、CPU拓扑感知、ECI弹性调度等高阶调度能力。利用分布式缓存ACK Fluid应对存算分离场景,提升访问效率和减少带宽占用。注册集群相关文档,请参见 注册集群概述。多集群舰队 当您同时...

工作原理

本文介绍文本分析功能的背景信息、功能介绍、基本概念、调度与执行场景、使用建议等信息。背景信息 服务在运行过程中会生成大量的日志,包括系统日志和业务日志等。日志被广泛地应用在系统监控和故障定位中,传统的日志分析手段以分析日志...

工作原理

本文介绍时序预测的背景信息、功能、调度与执行场景、使用建议等信息。背景信息 服务在运行过程中会产生各种各样的时序数据,记录了服务的各种指标随时间的变化情况。时序数据的监控分析被广泛地应用在系统监控和故障定位中。对于时序数据...

常见问题

移动调度中心 SDK 内置有移动调度中心域名的 IP 硬编码,防止 App 首次安装后运营商的 DNS 不可用。Q:移动调度中心域名获取IP的策略有哪些?A:移动调度中心域名获取自身域名 IP 的策略如下:从移动调度中心后台配置中获取,移动调度中心...

工作原理

本文介绍智能巡检的背景信息、工作原理、功能特性、基本概念、调度与执行场景和使用建议。背景信息 基于时间的数据(例如日志、指标)日积月累后会积累大量的数据。例如,某个服务每天产生1000万条数据,则一年大约为36亿条数据。对于这些...

工作原理

本文介绍下探分析的背景信息、功能、调度与执行场景、使用建议等信息。背景信息 服务运行过程中会产生各种各样的时序数据,通过监控这些时序数据是否存在异常(例如监控KPI指标异常突变),及时获知服务运行是否异常,异常时可以及时进行...

虚拟节点调度方案对比及介绍

针对虚拟节点,ACK托管集群(Pro版和基础版)和 ACK专有集群 支持的调度方式不同,且有其特定的使用场景,例如直接指定Pod只调度到虚拟节点、跨可用区打散等。您可以依据调度场景以及集群类型,参考本文选择合适的调度方式。常见虚拟节点...

ack-kube-queue

ack-kube-queue是云原生AI套件提供的任务队列组件,主要围绕着Kube Queue任务队列,结合调度器和Quota系统,提供队列管理、优先级调度、使用弹性配额等功能,帮助您优化Kubernetes中的AI/ML工作负载和批处理工作负载的管理效率和调度性能。...

节点组

节点组用于对依赖计算资源的算法节点进行组合,组合的算法节点在部署和运行时会被打包在一起进行调度。本文介绍节点组的配置参数说明。节点属性 节点属性 关键参数说明如下:配置项 说明 节点组名称 节点组的名称。节点组标识 节点组的唯一...

节点组

节点组用于对依赖计算资源的算法节点进行组合,组合的算法节点在部署和运行时会被打包在一起进行调度。本文介绍节点组的配置参数说明。节点属性 节点属性 关键参数说明如下:配置项 说明 节点组名称 节点组的名称。节点组标识 节点组的唯一...

配置共享GPU调度节点选卡策略

安装GPU资源查询工具。策略介绍 在共享GPU调度中,如果节点存在多张GPU卡,从节点中挑选GPU卡分配给Pod时,有两种策略可以考虑:Binpack:默认策略,调度系统先分配完节点的一张GPU卡后,再分配节点上另一张GPU卡,避免节点出现GPU资源...

安装共享GPU调度组件

本文介绍如何在GPU节点上安装共享GPU组件和GPU资源查询工具,实现GPU的调度和隔离能力。前提条件 共享GPU调度目前已实行收费。在使用共享GPU调度前,需开通云原生AI套件。具体收费信息,请参见 云原生AI套件计费说明。关于云原生AI套件的更...

开发环境场景画布概览

节点组中的算法节点在部署和运行时均被打包在一起进行调度。计算节点:在场景画布中添加的包含处理数据代码的算法节点,仅适用于当前场景。公共节点:在公共节点管理界面中添加的算法节点,在多个场景中可复用。说明 公共节点和计算节点的...

开发环境场景画布概览

节点组中的算法节点在部署和运行时均被打包在一起进行调度。计算节点:在场景画布中添加的包含处理数据代码的算法节点,仅适用于当前场景。公共节点:在公共节点管理界面中添加的算法节点,在多个场景中可复用。说明 公共节点和计算节点的...

HTTP任务签名认证

为确保HTTP任务的服务接收方能安全地处理分布式任务调度平台SchedulerX发起的调度请求,调度端会在HTTP请求头中默认采用SHA1-RSA签名算法生成schedulerx-signature字段签名串,用于服务端做认证处理。本文介绍如何进行HTTP任务签名认证。...

ACK对接ECI

ECI能为Kubernetes提供基础的容器Pod运行环境,但业务间的依赖、负载均衡、弹性伸缩、定期调度等能力依然需要Kubernetes来提供。本文为您介绍阿里云容器服务Kubernetes版(简称ACK)如何与ECI对接,使用ECI作为Pod的运行资源。对接方式 ECI...

配置共享GPU调度cGPU算力调度策略

步骤一:查看是否已安装共享GPU组件 配置共享GPU算力分配策略时,未安装共享GPU组件和已安装共享GPU组件的操作方式不同,因此需要您确认集群是否已安装共享GPU组件。登录 容器服务管理控制台,在左侧导航栏选择 集群。在 集群列表 页面,...

计费概述

本文介绍分布式任务调度SchedulerX的各计费项及其计费规则。基本概念 任务类型:调度任务的类型。包含单机任务和非单机任务(广播、分片、并行和网络任务等)。任务调度总量:通过SchedulerX配置并启用的分布式任务调度总规模,单位为CU...

如何创建秒级调度任务

秒级任务适合对实时性要求比较高的业务,例如不停做轮询的准实时业务,通过内存网格和秒级调度,可以让您不停地处理海量的数据。本文介绍如何创建秒级调度任务并将设置固定延迟。SchedulerX的秒级别任务属于定时调度类型,适用于简单Java...

Fixed rate

Cron原生不支持无法被60整除的分钟间隔调度,例如每40分钟执行一次的任务。为解决此类精细化定时需求,可采用Fixed rate定期轮询机制,它能够简洁地表达非标准时间间隔的定期任务执行,且表达式简单,但不支持秒级别。Fixed rate定时配置...

任务管理

本文介绍如何在任务管理页面对调度任务进行一系列操作。创建调度任务 重要 创建任务前,请确保您已经创建了任务分组。更多信息,请参见 应用管理。登录 分布式任务调度平台。在顶部菜单栏选择地域。在左侧导航栏,选择 任务管理。在 任务...

API调度

您可以使用API触发任务调度。关于API触发的使用方式,请参见 服务接入点。

Second delay

Second delay支持1~60秒间隔的秒级延迟调度,即每次任务执行完成后,间隔秒级时间再次触发调度。Second delay具有以下优势:高可靠:SchedulerX的秒级别任务具有高可靠的特性,如果某台机器宕机了,可以在30秒内在另一台机器上重新运行。...

欠费说明

本文介绍分布式任务调度SchedulerX的欠费停机策略。欠费停机影响 欠费后,控制台无法新建调度任务。欠费超过7天后,控制台自动释放调度任务实例。结清账单后,被释放的实例不可恢复。如果欠费影响了业务,例如调度任务被禁用,需要加入钉群...

Cron

6#3 每月的第三个周五10:15触发 Cron定时调度配置示例 在创建调度任务时可以使用Cron定时调度,创建调度任务的详细操作步骤请参见 创建调度任务。本文仅介绍在创建调度任务时如何配置Cron定时调度。进入 定时配置 页签,详情请参见 创建...

调度失败的Pod重新调度到ECI

在Pod进行调度时,如果没有匹配节点(例如已有ECS Worker节点资源不足)时,该组件会接管调度任务,将调度失败的Pod重新调度到ECI(虚拟节点)上。重要 virtual-kubelet-autoscaler组件的安装会占用节点Pod资源。如果您的集群类型为 ACK...

如何重刷数据

重刷调度任务 如果您的业务发生变更,如数据库增加一个字段或者上一个月数据有错误,需要把过去一段时间的任务重新执行一遍,可以重刷调度任务数据。说明 任务和工作流都支持重刷数据(只支持天级别的调度周期)。如果您之前执行的某个调度...

名词解释

调度时间 JobInstance每次调度的时间叫做调度时间,JobProcessor可以根据 context.getScheduleTime()获取。数据时间 SchedulerX可以处理有数据状态的任务。创建任务的时候可以填数据偏移。例如一个任务是每天00:30运行,但是实际上要处理上...

产品简介

大数据专家服务 大数据专家服务(Bigdata Expert Service)是由阿里云大数据专家基于阿里云多年大数据架构、应用、运维、AI算法建模等最佳实践经验及方法论为用户提供全方位的大数据产品技术、咨询服务及售后专家服务运维保障,帮助用户...

产品功能

通过SchedulerX可以管理定时调度任务、查询任务执行记录和运行日志。本文介绍SchedulerX调度、执行和运维三个方面的功能。定时调度 Crontab 支持Unix Crontab表达式,不支持秒级别调度。更多信息,请参见 Cron。Fixed rate Crontab必须被60...

如何重刷数据

重刷调度任务 如果您的业务发生变更,如数据库增加一个字段或者上一个月数据有错误,需要把过去一段时间的任务重新执行一遍,可以重刷调度任务数据。说明 任务和工作流都支持重刷数据(只支持天级别的调度周期)。如果您之前执行的某个调度...

什么是分布式任务调度SchedulerX

分布式任务调度SchedulerX是阿里巴巴自研的分布式任务调度平台,兼容开源XXL-JOB、ElasticJob、Spring Schedule,K8s Job,支持Cron定时、一次性任务、可视化工作流任务编排和分布式跑批,具有高可用、可观测、可运维和低延时等能力。...

创建资源

本文介绍如何创建微服务空间、调度任务分组、调度任务和调度工作流。背景信息 资源 描述 使用场景 命名空间 在具体地域(Region)中,命名空间用于实现资源和服务的隔离。当您对资源有较高的安全要求时,需要创建命名空间。应用 在具体的...

资源包(专业版)

背景信息 SchedulerX针对 任务调度CU 推出了一种预付费资源包模式,帮助您以更优惠的价格享受同等的任务调度CU数量,从而减少费用支出。资源包类型与定价 SchedulerX目前只提供一种类型的资源包,即任务调度CU资源包,用于抵扣SchedulerX...

操作记录

您可以通过操作记录页面,查看应用分组、调度任务和流程的操作记录。操作步骤 登录 分布式任务调度平台,在顶部菜单栏选择地域,在左侧导航栏,单击 操作记录,在 操作记录 页面选择目标命名空间,查看操作记录。说明 操作记录 页面仅记录...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
风险识别 地址标准化 视觉计算服务 智能开放搜索 OpenSearch 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用