本文介绍支持在 统计图表 页签对日志进行的常用操作。统计图表界面 统计图表支持展示多个查询分析结果,并支持对不同查询分析的结果进行个性化的可视化设置。更多信息,请参见 统计图表(Pro版本)概述。添加图表到仪表盘 仪表盘是实时数据...
为了解决实际运行中集群资源无法充分利用或浪费的问题,可以使用ack-descheduler组件对集群的Pod进行调度优化,使部分不合理的Pod能够重新调度到合适的节点上。本文介绍如何使用ack-descheduler组件优化Pod调度。前提条件 已创建ACK集群...
本文介绍下探分析的背景信息、功能、调度与执行场景、使用建议等信息。背景信息 服务运行过程中会产生各种各样的时序数据,通过监控这些时序数据是否存在异常(例如监控KPI指标异常突变),及时获知服务运行是否异常,异常时可以及时进行...
混合云计算弹性:ACK注册集群可以帮助您为自建Kubernetes集群弹性扩容云上计算虚拟机、物理机和无服务器化资源,通过协同调度器可以支持灵活的扩容缩容调度策略,实现IDC资源和云上计算资源的逐级扩容和按需缩容,多副本容器组按比例分布在...
节点组用于对依赖计算资源的算法节点进行组合,组合的算法节点在部署和运行时会被打包在一起进行调度。本文介绍节点组的配置参数说明。节点属性 节点属性 关键参数说明如下:配置项 说明 节点组名称 节点组的名称。节点组标识 节点组的唯一...
节点组用于对依赖计算资源的算法节点进行组合,组合的算法节点在部署和运行时会被打包在一起进行调度。本文介绍节点组的配置参数说明。节点属性 节点属性 关键参数说明如下:配置项 说明 节点组名称 节点组的名称。节点组标识 节点组的唯一...
具体操作,请参见 安装共享GPU调度组件。运行cGPU服务 影响cGPU服务的环境变量如下表所示,您可以在创建容器时指定环境变量的值,该值可以控制容器通过cGPU服务获得算力。环境变量名称 取值类型 说明 示例 CGPU_DISABLE Boolean 是否禁用...
阿里云机器学习平台以社区化的方式进行用户运营,会经常举行用户活动,同时为企业级用户提供高效支持。如果您在产品使用过程中遇到问题,请...相关地址 产品首页 计费说明 算法组件 深度学习框架 模型在线服务 离线调度 产品BUG反馈、工单系统
智能调度 利用容器服务ACK调度器,实现Gang Scheduling、CPU拓扑感知、ECI弹性调度等高阶调度能力。利用分布式缓存ACK Fluid应对存算分离场景,提升访问效率和减少带宽占用。注册集群相关文档,请参见 注册集群概述。多集群舰队 当您同时...
本文介绍支持的数据脱敏算法。算法分类 分类描述 算法描述 输入参数 适用类型和典型场景 哈希脱敏 不可逆算法。适用于密码或需要通过对比进行敏感数据确认的场景。支持常见的哈希算法,并支持偏移量(加盐值)配置。MD5 Salt值 敏感类型:...
ack-kube-queue是云原生AI套件提供的任务队列组件,主要围绕着Kube Queue任务队列,结合调度器和Quota系统,提供队列管理、优先级调度、使用弹性配额等功能,帮助您优化Kubernetes中的AI/ML工作负载和批处理工作负载的管理效率和调度性能。...
常见问题 SchedulerX接管后原Spring定时器依旧运行 由于应用中配置了自定义的Scheduler调度器导致SchedulerX覆盖自定义处理器。请排查业务应用工程中是否存在实现 org.springframework.scheduling.annotation.SchedulingConfigurer 接口的...
为确保HTTP任务的服务接收方能安全地处理分布式任务调度平台SchedulerX发起的调度请求,调度端会在HTTP请求头中默认采用SHA1-RSA签名算法生成schedulerx-signature字段签名串,用于服务端做认证处理。本文介绍如何进行HTTP任务签名认证。...
步骤一:查看是否已安装共享GPU组件 配置共享GPU算力分配策略时,未安装共享GPU组件和已安装共享GPU组件的操作方式不同,因此需要您确认集群是否已安装共享GPU组件。登录 容器服务管理控制台,在左侧导航栏选择 集群。在 集群列表 页面,...
已安装GPU资源查询工具。策略介绍 在共享GPU调度中,如果节点存在多张GPU卡,从节点中挑选GPU卡分配给Pod时,有两种策略可以考虑:Binpack:默认策略,调度系统先分配完节点的一张GPU卡后,再分配节点上另一张GPU卡,避免节点出现GPU资源...
同时支持资产安全策略的自动安装,并可以查看算法安装日志,精确掌握安装状态。自定义掩码算法优化,新增自定义替换值的脱敏算法、自定义正则表达式的脱敏算法。更新说明 项目安全策略 脱敏算法 2022年07月19日 资产质量新增全局角色定义 ...
本文介绍如何在GPU节点上安装共享GPU组件和GPU资源查询工具,实现GPU的调度和隔离能力。前提条件 共享GPU调度目前已实行收费。在使用共享GPU调度前,需开通云原生AI套件。具体收费信息,请参见 云原生AI套件计费说明。关于云原生AI套件的更...
您可以在开发环境场景画布中编排节点工作流、配置节点属性参数、运行参数和调度参数。本文介绍开发环境场景画布的各功能区以及场景中各类型的节点,方便您快速熟悉开发环境场景画布功能,为新建开发环境场景做准备。序号 区域 说明 ① 左侧...
您可以在开发环境场景画布中编排节点工作流、配置节点属性参数、运行参数和调度参数。本文介绍开发环境场景画布的各功能区以及场景中各类型的节点,方便您快速熟悉开发环境场景画布功能,为新建开发环境场景做准备。序号 区域 说明 ① 左侧...
ECI能为Kubernetes提供基础的容器Pod运行环境,但业务间的依赖、负载均衡、弹性伸缩、定期调度等能力依然需要Kubernetes来提供。本文为您介绍阿里云容器服务Kubernetes版(简称ACK)如何与ECI对接,使用ECI作为Pod的运行资源。对接方式 ECI...
本文介绍如何在任务管理页面对调度任务进行一系列操作。创建调度任务 重要 创建任务前,请确保您已经创建了任务分组。更多信息,请参见 应用管理。登录 分布式任务调度平台。在顶部菜单栏选择地域。在左侧导航栏,选择 任务管理。在 任务...
说明 权重:设置一条软约束规则的权重,介于1~100,通过算法计算满足软约束规则的节点的权重,将Pod调度到权重最大的节点上。应用非亲和性 决定应用的Pod不与哪些Pod部署在同一拓扑域。应用非亲和性调度的场景包括:将一个服务的Pod分散...
6#3 每月的第三个周五10:15触发 Cron定时调度配置示例 在创建调度任务时可以使用Cron定时调度,创建调度任务的详细操作步骤请参见 创建调度任务。本文仅介绍在创建调度任务时如何配置Cron定时调度。进入 定时配置 页签,详情请参见 创建...
关于如何安装和使用共享GPU调度,请参考:安装共享GPU调度组件 运行共享GPU调度示例 除此以外,还有一些进阶能力,您可以根据业务需求选择:通过共享GPU调度实现多卡共享 通过共享GPU调度实现算力分配 配置共享GPU调度节点选卡策略 配置...
调度规则 支持 日常不调度、按日调度、按周调度、按月调度 四种,配置后会按配置的周期定时跑该任务。日常不调度:配置后不运行任务。按日调度:每天运行任务。按周调度:每周运行任务。按月调度:每月运行任务。训练类型 仅支持特征切分。...
在Pod进行调度时,如果没有匹配节点(例如已有ECS Worker节点资源不足)时,该组件会接管调度任务,将调度失败的Pod重新调度到ECI(虚拟节点)上。重要 virtual-kubelet-autoscaler组件的安装会占用节点Pod资源。如果您的集群类型为 ACK...
大数据专家服务 大数据专家服务(Bigdata Expert Service)是由阿里云大数据专家基于阿里云多年大数据架构、应用、运维、AI算法建模等最佳实践经验及方法论为用户提供全方位的大数据产品技术、咨询服务及售后专家服务运维保障,帮助用户...
背景信息 Azkaban是一套作业调度系统,可以调度Command、Hadoop MapReduce、Hive、Spark、Pig等类型作业,而且支持自定义Plugin,其中最简单而且最常用的是Command类型。更多Azkaban信息,请参见 Azkaban。您需要将待调度作业依赖的源数据...
通过SchedulerX可以管理定时调度任务、查询任务执行记录和运行日志。本文介绍SchedulerX调度、执行和运维三个方面的功能。定时调度 Crontab 支持Unix Crontab表达式,不支持秒级别调度。更多信息,请参见 Cron。Fixed rate Crontab必须被60...
本文汇总使用SchedulerX过程中的常见问题和对应解决方法。任务管理常见问题 Spring应用找不到Bean怎么办?任务失败,报错“submit jobInstanceId to worker timeout”任务失败,报错“used space beyond 90.0%!任务失败,报错...
常见的容错策略如下:负载均衡:通过合理的负载均衡算法,将请求或任务均匀地分配到不同的节点上,以实现负载的均衡。这样可以充分利用系统的计算资源,提高整个系统的性能。资源调度:根据系统的负载情况和资源利用率,动态调整资源的分配...
SchedulerX可以对多重任务进行调度(定时、编排、重刷历史数据等),提供Java、Python、Shell和Go等多语言分片模型,帮助您处理大数据业务需求。背景信息 分片模型主要包含静态分片和动态分片。静态分片:主要场景是处理固定的分片数,例如...
“机器人监控”主要功能为查看当前系统中所有机器人的连接状态、认证状态、调度模式以及正在运行的应用。机器人监控列表 说明:【IP】:安装机器人的物理机IP地址。【连接状态】:已连接、未连接、空闲,共三种状态。【认证状态】:已认证...
kubectl-n kube-system edit deployment ack-virtual-node-controller 常用的变更操作如下:更新virtual-node controller版本 当您使用更新虚拟节点功能时,需要更新Virtual Node Controller镜像至最新版本。修改安全组配置ECI_SECURITY_...
DLA Serverless Spark除了上述调度集成之外,还提供了SDK以及Spark-Submit工具用于提交Spark作业、查询作业状态、获取作业日志等功能,详情请参见:SDK安装与使用 Spark-Submit命令行工具 您可以利用上述工具,使用第三方任务编排调度系统...
本文介绍数据开发的其他常见问题。为何周期调度中某个节点的实例实际运行时间和计划时间有差异?当两个节点的调度周期不同时,即上游节点5分钟调度一次,下游节点20分钟调度一次,下游节点如何获取数据?为何周期调度中某个节点的实例实际...
设置离线节点调度信息 开发场景运行成功后,可以设置离线节点的调度信息为生产场景调度使用。具体操作,请参见 设置离线节点的调度信息。上线开发场景 通过将相应的开发场景进行上线操作,发布成生产场景。具体操作,请参见 上线开发场景。...
本文汇总使用SchedulerX过程中的常见问题和对应解决方法。报警常见问题 killed from server don't update progress more than 30s 任务管理常见问题 Spring应用找不到Bean怎么办?任务失败,报错“submit jobInstanceId to worker timeout...
在部署支持国密算法的SSL证书时,为了确保与各类浏览器的兼容性,通常会采用SM2/RSA双证书部署方案,即您需要在服务器同时配置国际通用的RSA算法证书和国密标准的SM2算法证书。本文为您介绍如何使用Tengine+Tongsuo组合方式,实现Tengine...
设置离线节点调度信息 开发场景运行成功后,可以设置离线节点的调度信息为生产场景调度使用。具体操作,请参见 设置离线节点的调度信息。上线开发场景 通过将相应的开发场景进行上线操作,发布成生产场景。具体操作,请参见 上线开发场景。...