立即运行一批工作流,设置工作流业务时间的开始时间和调度周期,运行时系统会将指定调度规则的触发时间作为本工作流的业务时间,时间相关的变量将使用该时间进行计算。一次最多支持100个触发时间点。单机 确定。查看工作流运行记录 运行...
非机房级故障(某个机房的单产品故障,例如其中一个机房的ECS服务器损坏),可以通过对单产品的灾备设计来保障发生故障时系统及时切换。应用设计相关参考标准 应用设计相关参考标准如下:无状态化。分布式集群设计、避免单点逻辑出现。幂等...
主机故障处理策略 设置主机故障时系统的处理策略:自动替换主机:系统会自动替换故障主机。说明 如果故障主机是云盘主机,云盘会自动迁移计算资源以自动替换主机。如果故障主机是非云盘主机,则系统会先将故障主机上的实例迁移走,然后自动...
主机故障处理策略 设置主机故障时系统的处理策略:自动替换主机:系统会自动替换故障主机。说明 如果故障主机是云盘主机,云盘会自动迁移计算资源以自动替换主机。如果故障主机是非云盘主机,则系统会先将故障主机上的实例迁移走,然后自动...
配置变更是调整系统运行时的行为的有效手段之一。动态配置和静态配置 系统配置可以是静态或者动态配置。配置的版本与软件本身的版本强绑定的称之为静态配置。反之,在同一个版本的系统部署且运行期间配置可以连续发生多次变更的则称之为...
问题现象 Linux系统的ECS实例出现运行卡顿、系统响应变慢、某些进程无法正常运行、系统负载较高等现象,在/var/log/message 日志中出现大量类似如下错误信息。[8291809.483930]INFO:task jbd2/vda1-8:366 blocked for more than 120 ...
背景信息 当主机发生故障时,系统会通过短信通知您某台主机有故障待修复,同时对应的主机状态会显示为 待替换。您可以在 计划内事件 中查看本次故障信息。影响 执行替换主机操作会有如下影响:系统会将主机设置为停止分配实例。迁移走本...
背景信息 当主机发生故障时,系统会通过短信通知您某台主机有故障待修复,同时对应的主机状态会显示为 待替换。您可以在 计划内事件 中查看本次故障信息。影响 系统会将主机设置为停止分配实例。迁移走本主机上所有实例。系统会保证把实例...
通过流量分发扩展应用系统对外的服务能力,通过消除单点故障提升应用系统的可用性。API 应用程序编程接口,是一些预先定义的函数,或指软件系统不同组成部分衔接的约定。API 分组 用于将 API 进行逻辑的分组,分组下的 API 使用相同的分组...
您可以通过容器服务Kubernetes版ACK(Container Service for Kubernetes)控制台,可视化地升级您节点上的安全沙箱运行时。本文介绍安全沙箱运行时的升级原理、注意事项以及如何升级安全沙箱运行时。使用限制 仅当您的集群为安全容器集群时...
对象类型 触发条件 描述 任务节点、基线、工作空间、业务流程 完成 表示从任务运行的起始时间点开始监控,在任务运行成功时系统发送报警。当对象类型为 基线 或 业务流程 时,仅当基线、业务流程上的所有任务都运行成功时,才会触发报警。...
重要 当脚本源在Windows系统,但需在Linux系统上运行时,文件格式 选择 unix。步骤三:选择执行器 Agent 接入前提:需提前部署一个SchedulerX-Agent,用于运行脚本。具体操作,请参见 Agent接入(脚本或HTTP任务)。执行模式:单机运行:...
重要 当脚本源在Windows系统,但需在Linux系统上运行时,文件格式 选择 unix。步骤三:选择执行器 Agent 接入前提:需提前部署一个SchedulerX-Agent,用于运行脚本。具体操作,请参见 Agent接入(脚本或HTTP任务)。执行模式:单机运行:...
查看或修改参数 查看或修改系统参数 Alibaba Cloud Linux 2在配置文件/etc/sysctl.d/50-aliyun.conf 中更新了下列内核配置参数,运行 sysctl 命令,可查看或修改Alibaba Cloud Linux 2运行时的系统参数。系统参数 说明 kernel.hung_task_...
备份与恢复(Backup-Restore)如上图所示,在备份与恢复模式下,系统运行时会备份应用和数据,故障或灾难发生时,系统会将备份的应用和数据在另一地点进行恢复,并切换业务流量。由于数据无法实时备份,在恢复数据时会有一定的数据丢失,...
TIMEOUT(运行超时):表示从实例运行的起始时间点开始监控,到指定的运行时长后,该任务仍未结束运行,则系统发送报警。通常用于监控实例任务的运行时间。更多触发报警规则的内容,详情请参见 自定义规则。MaxAlertTimes Integer 否 3 ...
从节点具有高可用保障,即某个从节点故障时,系统会自动将其与隐藏节点切换,若未自动切换,您可以自行切换,从节点的连接地址保持不变。说明 如何切换从节点和隐藏节点,请参见 切换节点角色。触发节点的角色切换后,会产生1次30秒内的...
Total Priority:表示作业运行时经过系统判断后授予的优先级。SubStatus History:单击后,可以查看作业执行的详细历史状态,包含状态码、状态描述、开始时间、持续时间等(某些版本暂时无历史信息)。Task 信息 在Logview页面中,下半部分...
主机故障处理策略 主机故障时,系统的处理策略:自动替换主机:系统会自动替换故障主机。说明 如果故障主机是云盘主机,云盘会自动迁移计算资源以自动替换主机。如果故障主机是非云盘主机,则系统会先将故障主机上的实例迁移走,然后自动...
主机故障处理策略 主机故障时,系统的处理策略:自动替换主机:系统会自动替换故障主机。说明 如果故障主机是云盘主机,云盘会自动迁移计算资源以自动替换主机。如果故障主机是非云盘主机,则系统会先将故障主机上的实例迁移走,然后再替换...
主机故障处理策略 主机故障时,系统的处理策略:自动替换主机:系统会自动替换故障主机。说明 如果故障主机是云盘主机,云盘会自动迁移计算资源以自动替换主机。如果故障主机是非云盘主机,则系统会先将故障主机上的实例迁移走,然后自动...
主机故障处理策略 主机故障时,系统的处理策略:自动替换主机:系统会自动替换故障主机。说明 如果故障主机是云盘主机,云盘会自动迁移计算资源以自动替换主机。如果故障主机是非云盘主机,则系统会先将故障主机上的实例迁移走,然后再替换...
重要 使用故障诊断功能时,系统将在您的集群节点上执行数据采集程序并收集检查结果。采集的信息包括系统版本,以及负载、Docker、Kubelet等运行状态及系统日志中关键错误信息。数据采集程序不会采集您的业务信息及敏感数据。诊断支持的异常...
名称 标识符 操作系统 架构 Custom Runtime(Debian10)custom.debian10 Debian 10 x86_64 Custom Runtime custom Debian 9 x86_64 运行时终止策略 随着运行时的版本迭代,函数计算 会停止对部分运行时的维护,不再继续提供对该运行时的...
名称 标识符 操作系统 架构 Custom Runtime(Debian10)(公测中)custom.debian10 Debian 10 x86_64 Custom Runtime custom Debian 9 x86_64 运行时终止策略 随着运行时的版本迭代,函数计算 会停止对部分运行时的维护,不再继续提供对该...
只读节点与从节点的区别 节点 说明 适用场景 只读节点(ReadOnly)只读节点具有高可用保障,即某个只读节点故障时,系统会自动将其与隐藏节点切换,若未自动切换,您可以自行切换,只读节点的连接地址保持不变。说明 如何切换只读节点和...
重要 如未设置备地址池集合,则代表当主地址池集合出现故障时,系统将摘除故障地址,但不支持故障切换。如主地址池集合摘除故障地址后,还有存活的IP地址,那么则响应剩余存活的IP地址。基于访问延时的访问策略配置 在 基本配置 页面,点击...
网络故障是系统运行过程中时常遇到的问题,所以需要提升系统在网络异常情况下的容错能力。Java 场景名称 特性 虚拟机场景 故障演练支持的虚拟机场景。代码逻辑场景 故障演练支持的代码逻辑场景。JVM注入动态脚本 向指定的Java方法注入一段...
主机故障处理策略 主机故障时,系统的处理策略:自动替换主机:系统会自动替换故障主机。说明 如果故障主机是云盘主机,云盘会自动迁移计算资源以自动替换主机。如果故障主机是非云盘主机,则系统会先将故障主机上的实例迁移走,然后再替换...
纯缓存应用 单副本集群版的分片服务器由单节点组成,分片服务器某节点出现故障时,系统会重新拉起一个Redis进程(没有数据),当节点故障业务自动切换完成后,数据将会丢失,有可能流量被冲击到后端数据库,需要做好应用程序的预热保护机制...
原因:逻辑上需要暂停任务时,系统无法连接任务运行的服务器节点。解决方法:请联系技术支持解决。DTS.Msg.SQLExecuteError.JDBC4CommunicationsException 测试链接通过后获取源库库表。原因:通讯链路故障,JDBC驱动程序数据包成功发送到...
解决方案 针对上述原因,您需要具体分析网站的访问情况,例如,了解网站访问量的变化趋势或分析网站运行中遇到的具体故障原因。本方案以建在Windows操作系统主机上的网站为例,主要介绍使用WebLog Expert Lite工具分析网站日志的方法。下载...
重要 使用故障诊断功能时,系统将在您的集群 节点上 执行数据采集程序并收集检查结果。采集的信息包括系统版本,以及负载、Docker、Kubelet等运行状态及系统日志中关键错误信息。数据采集程序不会采集您的业务信息及敏感数据。诊断支持的...
自动运维 您可以根据业务需求,对独享资源组创建运维规则并关联已创建的监控规则,当关联的监控规则被触发时,系统将对运行在目标独享资源组上且满足 过滤条件 的任务自动执行运维动作,以达到自动运维的目的。说明 目前只支持关联调度资源...
journalctl-u kubelet 集群常见问题 下表罗列了一部分ACK集群常见的故障原因以及处理方法。故障场景 处理方法 API Server组件停止或Master组件停止:不能创建、停止、更新Pod、Service、Deployment等资源。已有的Pod和Service仍然能够正常...
SysAK(System Analyse Kit)是阿里云操作系统提供的一个全方位的系统运维工具集,可以覆盖系统的日常监控、线上问题诊断和系统故障修复等常见运维场景。本文为您介绍Alibaba Cloud Linux 2/3系统的SysAK 2.2.0版本导致运行DNF(Dandified ...
SysAK(System Analyse Kit)是阿里云操作系统提供的一个全方位的系统运维工具集,可以覆盖系统的日常监控、线上问题诊断和系统故障修复等常见运维场景。本文为您介绍SysAK的安装部署和使用方法。运维场景 阿里云通过对百万服务器运维经验...
告警关联分析:在故障发生时,系统会自动产生告警信息。为了更好地定位故障原因,需要对各种告警信息进行关联分析。这样可以快速确定故障的范围和影响,并且能够帮助排查故障的根本原因。告警关联分析可以使用各种工具和算法,如事件关联...
您可以对kubelet、操作系统和容器运行时按需组合升级。使用须知 节点池升级功能仅支持有节点的节点池。替盘升级时会对节点进行排水,排水时干扰预算机制PDB(Pod Disruption Budgets)和终止宽限期为30分钟。届时即使节点上运行的Pod无法...
当发现节点故障时,ACK会根据故障原因触发对应恢复任务,并记录相应的事件。当恢复任务完成后,故障状态解除,节点恢复正常状态。当恢复任务完成后,故障状态依然存在,节点会被置为恢复失败状态。说明 如果集群中存在多个节点池,节点池...