模型版本准入状态及事件触发

模型管理支持通过模型准入状态变更来触发模型下游事件。适用场景包括模型版本准入后自动更新EAS模型服务,模型版本准入状态发生变化后自动发送钉钉群机器人消息,模型版本准入状态变化后自动调用指定的HTTP或HTTPS服务。前提条件 工作空间...

服务定时自动部署

如果测试服务发生异常,则使用下述命令回滚模型服务。home/admin/usertools/tools/eascmd64-i<yourAccessKeyID>-k<yourAccessKeySecret>-e pai-eas.cn-shanghai.aliyuncs.com version -f <The name of the model to be rolled back> 1重要 ...

DDoS高防和CDN或DCDN联动

例如,在CDN和高防联动且回源到OSS的场景,由于CDN回源支持修改回源HOST,而DDoS高防不支持,导致发生攻击自动切换到DDoS高防后,DDoS高防回源到OSS的正常流量无法被识别,出现业务故障。前往DNS服务商处修改DNS解析,将DNS解析指向流量...

数据开发功能索引

批量操作():用于快速对表、资源、函数进行批量修改(包括修改责任人、引擎实例、调度资源组、调度重跑属性、调度类型、调度周期、调度超时时间等操作)。导入():用于快速将本地数据上传至目标表中。目前仅支持上传数据至MaxCompute表...

工作原理

日志服务智能异常分析App提供模型训练和实时巡检功能,支持对日志、指标等数据进行自动化、智能化、自适应地模型训练和异常巡检。本文介绍智能巡检的背景信息、工作原理、功能特性、基本概念、调度与执行场景和使用建议。背景信息 基于时间...

多语言版本分片模型

SchedulerX可以对多重任务进行调度(定时、编排、重刷历史数据等),提供Java、Python、Shell和Go等多语言分片模型,帮助您处理大数据业务需求。背景信息 分片模型主要包含静态分片和动态分片。静态分片:主要场景是处理固定的分片数,例如...

产品功能

通过SchedulerX可以管理定时调度任务、查询任务执行记录和运行日志。本文介绍SchedulerX调度、执行和运维三个方面的功能。定时调度 Crontab 支持Unix Crontab表达式,不支持秒级别调度。更多信息,请参见 Cron。Fixed rate Crontab必须被60...

故障管理

通过建立一个规范可遵循、全流程闭环的故障管理体系,配合技术手段的提升,可以有效降低故障发生的几率,缩短故障的MTTR,最终使故障造成的破坏性趋近于0。在日常运营中,无论什么原因导致业务服务中断、服务品质下降或用户服务体验下降的...

kube-scheduler

kube-scheduler是一个控制面组件,负责结合节点资源使用情况和Pod的调度要求将Pod调度到集群的合适节点上。组件介绍 基于Pod申明的Request和节点的Allocatable属性,kube-scheduler可以为调度队列中每个Pod确定其可放置的节点,并保证节点...

产品架构

日常巡检、业务监控、故障诊断发现风险事件,并将其上报至风险管理中心,由风险管理中心进行统一调度,如触发故障诊断、应急预案等。运行总览集中展示整个平台的运行状态、风险情况。部署架构 HAS 部署时,需要依赖以下底层服务:数据库 ...

任务管理

重刷调度任务 如果您的业务发生变更,如数据库增加一个字段或者上一个月数据有错误,需要把过去一段时间的任务重新执行一遍,可以重刷调度任务数据。说明 任务和工作流都支持重刷数据(只支持天级别的调度周期)。如果您之前执行的某个调度...

任务管理

重刷调度任务 如果您的业务发生变更,如数据库增加一个字段或者上一个月数据有错误,需要把过去一段时间的任务重新执行一遍,可以重刷调度任务数据。说明 任务和工作流都支持重刷数据(只支持天级别的调度周期)。如果您之前执行的某个调度...

模型服务网格

模型服务网格(Model Service Mesh)提供了一个可扩展的、高性能的基础架构,用于将多个模型服务进行管理、部署和调度,以此更好地处理模型的部署、版本管理、路由和推理请求的负载均衡。本文介绍模型服务网格的概念和相关功能。什么是模型...

云原生AI套件概述

异构计算集群概述 开启集群GPU监控 共享GPU调度概述 AI任务调度 多种调度策略支持:针对AI分布式训练等典型批量任务类型,ACK调度器扩展Kubernetes原生调度框架,支持实现多种典型批量调度策略,包括Gang Scheduling(Coscheduling)、FIFO...

调度概述

功能 描述 参考文档 负载感知调度调度过程中,通过参考节点负载的历史统计,将Pod优先调度到负载较低的节点,实现节点负载均衡的目标,避免出现因单个节点负载过高而导致的应用程序或节点故障。使用负载感知调度 使用负载热点打散重调度...

节点伸缩概述

当集群的容量规划无法满足应用Pod调度时,您可以使用ACK提供的节点伸缩功能,自动扩缩节点资源以进行调度容量的补充。ACK目前提供 节点自动伸缩 与 节点即时弹性 两种弹性方案,后者相较于前者有着更快的弹性速度、更高的交付效率和更低的...

多语言版本分片模型

SchedulerX可以对多重任务进行调度(定时、编排、重刷历史数据等),提供Java、Python、Shell和Go等多语言分片模型,帮助您处理大数据业务需求。背景信息 分片模型主要包含静态分片和动态分片。静态分片:主要场景是处理固定的分片数,例如...

多语言版本分片模型

SchedulerX可以对多重任务进行调度(定时、编排、重刷历史数据等),提供Java、Python、Shell和Go等多语言分片模型,帮助您处理大数据业务需求。背景信息 分片模型主要包含静态分片和动态分片。静态分片:主要场景是处理固定的分片数,例如...

操作说明

插件是智能体API应用中重要的一环,结合增强大语言模型的规划调度能力和生成能力,更好地在您的业务场景中落地。我们提供两类插件:官方插件和自定义插件 官方插件 百炼平台官方提供的插件,您可以根据业务需求进行选择。官方插件名称 插件...

产品功能

SchedulerX主要提供调度、执行和运维三方面的功能。多种表达式的定时调度 Crontab:支持Unix Crontab表达式,详情请参见 Cron。不支持秒级别。Fixed rate:Crontab必须被60整除,不支持其它数量级时间间隔的任务,如每隔40分钟的定时任务。...

AI推理服务概述

借助ACK云原生AI套件提供的Arena命令行工具、AI负载调度、GPU管理、资源弹性伸缩等基础能力,您可以在Kubernetes集群中简便、高效地把训练好的模型部署为AI推理服务。阿里云容器服务ACK支持为推理服务提供弹性伸缩、GPU共享调度、性能监控...

产品功能

通过SchedulerX可以管理定时调度任务、查询任务执行记录和运行日志。本文介绍SchedulerX调度、执行和运维三个方面的功能。定时调度 Crontab 支持Unix Crontab表达式,不支持秒级别调度。更多信息,请参见 Cron。Fixed rate Crontab必须被60...

工作原理

功能介绍 时序预测作业通过SQL方式抽取或聚合时序指标,按照调度规则定时拉取数据输入预测模型,将预测结果写入到目标日志库(internal-ml-log)中,并在仪表盘中展示预测结果,帮助您快速查看时序预测的结果。基本概念 日志服务时序预测...

工作原理

文本分析作业按照调度规则定时拉取数据输入文本分析模型,文本分析模型将分析结果写入目标日志库(internal-ml-log)中,并将分析结果绘制为仪表大盘,帮助您快速了解文本分析的结果。配置监控对象:配置待分析的日志字段(字段值为文本...

API插件管理

说明 插件名称租户内唯一 插件名称不能超过50个字符,插件描述不能超过500个字符 重要 插件描述,是LLM 调度插件 的重要判断依据。LLM会根据插件的描述信息判断是否使用该插件解决用户问题,同时会根据插件描述、插件出入参等信息构建 ...

工作原理

背景信息 服务运行过程中会产生各种各样的时序数据,通过监控这些时序数据是否存在异常(例如监控KPI指标异常突变),及时获知服务运行是否异常,异常时可以及时进行故障定位与恢复。时序数据往往是由多个维度的时序数据聚合而成的。下探...

可视化MapReduce模型

可视化MapReduce模型在MapReduce模型的基础上,新增了可视化可运维的能力。您无需修改后端代码,只需在SchedulerX控制台将分布式模型改为可视化MapReduce,即可新增一个子任务列表页面,并且可以查看每个子任务的详情、结果和日志,同时...

历史功能发布记录(2023年)

全部 自助诊断GPU节点问题 ACK调度器支持IP感知调度和拓扑调度等功能 IP感知调度 当Pod调度到某节点上时,由于可用IP不足无法启动,该节点将被标记为缺少IP状态并被拉黑五分钟。IP感知调度可防止大量Pod由于IP不足而导致的启动失败问题。...

AIPL模型

更新设置:选择>更新设置,可以在弹窗中开启自动更新开关,并设置更新时间,在设置的日期区间内,该模型将在使用的用户行为表每次完成调度任务后自动开始更新。说明 若已在管理中心设置空间内的更新并发数,则超过限制的AIPL模型自动更新...

概述

任务调度 TS(Task Scheduler)提供分布式任务调度框架,实现任务的分布式处理,并能规范化、自动化、可视化和集中化对金融企业不同业务系统的任务进行统一的调度和全方位监控运维管理,达到所有任务有序、高效运行的目的,极大降低开发和...

EventBridge事件调度

EventBridge事件调度包括云产品事件调度和自定义事件源事件调度。云产品事件调度支持包括弹性计算、存储服务、数据库、容器、大数据处理、可观测性服务及中间件服务在内的几乎所有阿里云官方事件源,而自定义事件源事件调度支持包括SLS、...

UpdateJob-更新任务配置信息

变更历史 变更时间 变更内容概要 操作 2023-06-07 OpenAPI 入参发生变更 变更项 变更内容 入参 OpenAPI 入参发生变更 新增入参:XAttrs 新增入参:Template 2023-03-30 API 内部配置变更,不影响调用 变更项 变更内容 API 内部配置变更,不...

新建调度任务

已发布的离线模型支持配置自动化调度任务。本文主要介绍新建调度任务。前提条件 已新建离线模型模型已发布,具体操作,请参见 新建离线模型。已创建云计算资源作为数据源,具体操作,请参见 新建计算资源。操作步骤 登录 数据资源平台...

什么是SCDN

多级调度:支持多级的调度策略,节点故障不会造成用户服务不可用。多系统联动:和阿里云其他产品形成多系统联动,与安全防御系统、刷新系统、内容管理系统等协调工作,达到各模块的最优性能。流量预测:数据化实时调度,支持节点级别流量...

异构计算集群概述

阿里云容器服务ACK支持对各种异构计算资源进行统一调度和运维管理,能够显著提高异构计算集群资源的使用效率。本文介绍阿里云容器服务ACK支持的异构计算集群。背景信息 随着5G、人工智能、HPC(High Performance Computing)、边缘计算等...

人气模型

人气模型是什么 人气模型属于离线计算的模型,是淘宝搜索最基础的排序算法模型。人气模型会计算量化出每个商品的静态质量及受欢迎的程度的值,这个值称之为商品人气分。虽然人气模型来自淘宝搜索业务,但其实这个模型对于其他的搜索场景也...

多云场景全局容灾

预实现效果 中国内地的用户流量调度到线下IDC 中国香港用户的访问流量调度到阿里云中国香港 境外访问流量调度到华为云新加坡 IDC故障场景下,流量调度至阿里云 华为云故障场景下,流量调度至阿里云 阿里云故障场景下,流量调度至华为云 ...

创建实时元表规则

如果涉及到配置了该调度方式的表发生变更,则会开始执行质量规则。说明 适用于表的修改任务不固定/重点监控表,每次变更都需要监控的情况。固定任务触发调度:仅在指定的任务完成后,执行配置的质量规则。支持选择指定SQL、离线管道、...

创建实时元表规则

如果涉及到配置了该调度方式的表发生变更,则会开始执行质量规则。说明 适用于表的修改任务不固定/重点监控表,每次变更都需要监控的情况。固定任务触发调度:仅在指定的任务完成后,执行配置的质量规则。支持选择指定SQL、离线管道、...

创建指标质量规则

如果涉及到配置了该调度方式的表发生变更,则会开始执行质量规则。说明 适用于表的修改任务不固定或者是重点监控表,每次变更都需要监控的情况。固定任务触发调度:仅在指定的任务完成后,执行配置的质量规则。支持选择指定SQL、离线管道、...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
表格存储 音视频通信 数据库自治服务 负载均衡 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用