Warm Up(冷启动)

对于长期处于低水位状态的系统,可以使用Warm Up(冷启动)功能来避免流量骤增导致水位瞬间升高系统不可用的情况。功能原理 Warm Up,即冷启动/预热的方式。当系统长期处于低水位的情况下,若流量突然增加,可能会把系统水位瞬间拉高把系统...

功能特性

产品主要功能包括风险管理、日常巡检、故障诊断、应急预案、故障演练等。风险管理 风险管理 是高可用管理平台核心,是风险事件汇集、处置的中枢平台,具体如下。风险事件 风险事件汇集:负责将监控、巡检、诊断产生的风险或告警信息进行...

DATASOURCE:ECS:DedicatedHosts

永久性故障,专有宿主机不可用。ZoneId String 否 是 可用区ID。无 ResourceGroupId String 否 是 资源组ID。无 DedicatedHostName String 否 是 专有宿主机的名称。无 DedicatedHostType String 否 是 专有宿主机的规格类型。无 ...

什么是Alibaba Cloud Toolkit

Alibaba Cloud Toolkit(后文简称Cloud Toolkit)可以帮助开发者更高效地部署、测试、开发和诊断应用。Cloud Toolkit与主流IDE及阿里云其他产品无缝集成,帮助您大大简化应用部署到服务器,尤其是阿里云服务器中的操作。您还可以通过其内嵌...

手动更换可用

例如当需要将备可用区更换为目标主可用区时,平均耗时为5分钟/节点,若集群中有4个节点,是否意味着业务会有约20分钟的不可用时间?A:更换主可用区所需的时间不等于业务不可用时间。整个切换过程中,仅在主备切换时会出现1~2次约30秒的闪...

公共错误码

系统内部错误,请稍后重试 诊断 500 InternalServerError Internal Server Error 系统暂时不可用,请稍后重试 诊断 500 InternalFailure An error occurred while processing your request.系统内部错误,请稍后重试 诊断 408 ...

CreateApplicationMonitor-创建源站探测任务

接口说明 您可以使用 CreateApplicationMonitor 接口创建源站探测任务,实时监测从探测点经过全球加速至源站的全链路网络质量,从而快速定位网络故障,针对性的进行网络优化。调用本接口,请注意以下事项:仅包年包月、中型Ⅰ及以上规格的...

安全隧道概述

访问端与设备端均成功连接安全隧道后,您可在访问端基于安全隧道远程登录设备(例如通过SSH服务),进行设备的远程诊断故障排查、运维操作、配置更新和其他操作任务等。名词解释 名词 说明 安全隧道 设备端和访问端与物联网平台之间建立...

公共错误码

实例规格不支持该操作 诊断 500 InternalServerError Internal Server Error 系统暂时不可用,请稍后重试 诊断 400 InvalidDBClusterId.NotFound The DBClusterId provided does not exist in our records.您指定的 DBClusterId 不存在,请...

系统架构

Region内可用区的DNS解析请求就近访问,当某可用区解析服务器集群全部不可用时,可就近访问其他可用区解析服务器集群。任一可用区解析服务器集群可承担Region下其他可用区所有解析请求流量。Region之间内网DNS解析服务不可相互容灾。

节点异常问题排查

本文目录 类别 内容 诊断流程 诊断流程 常见排查方法 节点故障诊断 检查节点的详情 检查节点的状态 检查节点的事件 检查节点的诊断日志 检查节点的关键组件 检查节点的监控 检查节点的安全组 常见问题及解决方案 节点关键组件异常处理 ...

节点异常问题排查

本文目录 类别 内容 诊断流程 诊断流程 常见排查方法 节点故障诊断 检查节点的详情 检查节点的状态 检查节点的事件 检查节点的诊断日志 检查节点的关键组件 检查节点的监控 检查节点的安全组 常见问题及解决方案 节点关键组件异常处理 ...

故障演练常见问题

欢迎您反馈在使用故障演练过程中遇到的问题,目前提供以下常见问题供您参考。单个演练活动成功状态怎么判断?因为一个活动可能会有很多目标机器,当所有机器执行完毕之后,如果有机器没有执行成功,那么这个演练活动就会被系统判断为失败。...

使用ACK AI助手进行故障排查和智能问答

若ACK AI助手无法定位问题的根因并提供可用的解决方案,您可以发起进一步发起诊断,对异常的Pod、Node节点发起基于ACK技术专家诊断经验的深度故障诊断功能。更多信息,请参见 使用集群诊断。前提条件 已开通 容器服务 Kubernetes 版 并已...

高性能版实例

而高性能版实例单个节点故障会导致整个实例不可用,必须重启整个实例恢复。计算节点宿主机故障 计算节点宿主机故障属于比较少见的极端情况,会触发宿主机的自动迁移。对于高可用版实例,仍然可以触发副本自动切换,实例可以正常运行,同时...

无影23.8寸一体机US01

V6.4.0-2023年8月 变更类型 变更点 变更说明 新增 新增外设故障诊断功能 无影云电脑 外设管理面板的 操作 列新增 诊断 功能,从而检查USB外设的连接链路是否正常。优化 提升网络检测能力 在原有网络检测能力的基础上,增强IP地址冲突、外网...

可运维性咨询服务内容说明

第三方软件的安装、测试、故障诊断、优化等日常运维服务。3.前提条件 客户应提前至少15个自然日申请该服务,以便于阿里云评估甲方需求实现可能性,确认是否承接该服务申请。甲方应在项目开始时提供必要的办公条件包括办公桌、办公椅、洗手...

实例的节点故障处理机制

节点故障期间实例的相关服务不可用。说明 单节点实例适用于测试、培训、非核心业务等场景,生产环境建议使用副本集实例或分片集群实例以保障服务的高可用性。副本集 图 1.副本集架构 副本集实例提供多个节点供用户访问,当其中的某个节点...

节点诊断

容器智能运维平台 构建了基于专家经验的故障诊断系统,并基于海量数据训练了AI智能故障诊断模型。基于专家经验和AI智能诊断两种诊断模式,节点诊断可以深入定位问题根因。节点诊断包括诊断检查项和诊断根因。诊断检查项:包括Node检查、...

Pod诊断

容器智能运维平台 构建了基于专家经验的故障诊断系统,并基于海量数据训练了AI智能故障诊断模型。Pod诊断融合了基于专家经验和AI智能诊断两种诊断模式,进一步深入定位问题根因。Pod诊断包括诊断检查项和诊断根因。诊断检查项:包括Pod检查...

基础版

说明 由于基础版只有一个数据节点,没有备节点作为热备份,因此当该节点意外宕机或者执行变更配置、版本升级等任务时,会出现一段时间的不可用。如果业务对数据库的可用性要求较高,不建议使用基础版,可选择其他系列(如高可用版)。基础...

内存诊断

重要 使用故障诊断功能时,系统将在您的集群节点上执行数据采集程序并收集检查结果。采集的信息包括系统版本,负载、Docker、Kubelet等运行状态及系统日志中关键错误信息。数据采集程序不会采集您的业务信息及敏感数据。内存总览 内存总览...

支持计划FAQ

与阿里云产品相关的部分第三方软件配置指导以及故障排查 服务支持计划服务范围包含:代码开发 在附录列表的第三方软件配置指导以及故障排查 所有第三方软件的安装、补丁更新、测试、故障诊断、优化等日常运维服务 注:对于在阿里...

集群管理FAQ

当Kubernetes集群出现问题或者节点异常时,您可通过容器服务ACK提供的一键故障诊断功能,辅助您定位集群中出现的问题,详情请参见 使用集群诊断。如果集群诊断功能无法满足需求,您需要分别在Master节点和异常的Worker节点上收集Kubernetes...

新建集群

22.8 副本配置 单副本版:一个节点只有一个副本,该副本服务不可用时,会导致整个集群不可用,需要等待副本完全恢复服务状态,集群才能继续提供稳定服务。双副本版:一个节点包含两个副本,某个副本服务不可用的时候,同一分片的另一个副本...

实时分析链路数据

单机故障不会造成服务大面积不可用,但是会造成少量的用户请求失败或超时,持续影响用户体验和答疑成本,需要及时处理。单机故障可以分为宿主机故障和容器故障两类(在Kubernetes环境可以分为Node和Pod)。例如CPU超卖、硬件故障等都是宿...

ACK集群概述

使用集群诊断:提供一键故障诊断能力,包括节点诊断、Pod诊断、Service诊断、Ingress诊断、内存诊断、网络诊断,可以辅助您定位集群中出现的问题。成本分析:支持可视化集群资源使用量及成本分布,以提升集群资源利用率。安全中心:支持...

公共错误码

特性%s在可用区%s支持 诊断 400 IncorrectStatus.VpcEndpoint The status of%s[%s]is incorrect.资源%s[%s]的状态无效。诊断 400 IncorrectStatus.VpcEndpointConnection The status of%s[%s]is incorrect.资源%s[%s]的状态无效。诊断 ...

什么是高可用管理平台

事前:通过应用巡检、故障诊断以及和监控平台的联动,实现应用运行风险的主动发现。事中:通过故障诊断、应急预案、容灾切换实现风险事件快速定位和恢复。事后:通过风险定级、回溯,实现风险事件的闭环管理。有效提升 IT 技术风险防御水平...

AIOps 解决方案专家服务内容说明

异常诊断类算法 LocalOutlierFactor 基于历史批量数据的做算法学习并进行异常诊断 异常诊断类算法 AutoEncoder 基于历史批量数据的做算法学习并进行异常诊断 根因分析算法 Random Forest和PCA 根因分析 时序异常诊断算法 K-Sigma 根据实时...

故障恢复

PROBLEM_UPDATE 通告类型 PROBLEM_NOTIFY:故障通告 PROBLEM_UPDATE:故障更新 PROBLEM_UPGRADE:故障升级 PROBLEM_DEGRADE:故障降级 PROBLEM_RECOVER:故障恢复 PROBLEM_REISSUE:故障补发 PROBLEM_CANCEL:故障取消 返回数据 名称 类型 ...

故障取消

故障取消 调试 您可以在OpenAPI Explorer中直接运行该接口,免去您计算签名的困扰。运行成功后,OpenAPI Explorer可以自动生成SDK代码示例。请求头 该接口使用公共请求头,无特殊请求头。请参见公共请求参数文档。请求语法 POST/problem/...

远程调试

如果您想要远程诊断部署在 Serverless应用引擎SAE(Serverless App Engine)上的应用,可以使用 SAE 远程调试功能。本文介绍如何通过跳板机使用OpenSSH实现远程调试。前提条件 创建应用 背景信息 跳板机(Jump Server)是一台可以访问的...

通过CCR跨集群复制解决跨集群容灾场景

当其中一个集群(如远程集群)发生故障时,通过访问其他集群(本地集群)来获取故障集群的数据进行恢复,保证数据丢失。使用CCR功能,需要准备两种类型的集群。一个是远程集群,即提供源数据(Leader index)的集群;一个是本地集群,即...

产品系列概述

变更系列 基础系列升级为高可用系列:支持MySQL 5.7(基础系列)、MySQL 8.0(基础系列)高可用系列升级为集群系列:支持MySQL 5.7(高可用云盘版)、MySQL 8.0(高可用云盘版)说明 其它实例暂支持变更实例系列,如需变更,您需要新建...

词汇表

这意味着如果一个可用区发生故障,其他可用区仍能保持正常运行,从而保证了高可用性。同一地域内的不同可用区之间内网互通,使用低时延链路相连。不同地域之间的可用区完全隔离。下图以地域1(包含3个可用区)和地域2(包含3个可用区)为例...

启动Windows实例时,提示“no bootable device”错误...

您可以在诊断结果界面单击 VNC远程连接,使用诊断报告中提供的临时登录实例的 Administrator 用户及密码信息登录挂载了修复盘的ECS实例。具体操作,请参见 使用VNC登录实例。根据需要,选择其中一种方式安装磁盘适配器驱动。假设挂载盘符为...

托管节点池节点自动恢复

RuntimeOffline containerd或Docker停止工作,节点不可用。高 90s 重启containerd或Docker。如果打开了 当节点故障时重启节点 开关,则重启ECS实例。NTPProblem 时间同步服务(ntpd或chronyd)异常。高 10s 重启ntpd或chronyd。...

什么是消息演练

这些消息服务之前并没有在系统中实际经历过真实流量考验,其中某些隐患或缺陷很难被发现,急需通过故障演练来评测高可用性。AHAS提供了强大且高灵活度的故障演练功能,可以根据不同的场景注入对应的故障类型。为了使您的演练服务更便捷,...

故障协同处理(基于钉钉)

2.故障应急场景群:事件升级故障后,群内推出 故障处理中 消息卡片,如果满足自动生成故障场景群的需求(下文详细介绍创建故障场景群逻辑),故障场景群内同时推出 故障处理中 消息卡片。本群故障消息卡片包含按钮:签到、签到记录、应急...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
DDoS防护 数据传输服务 负载均衡 应用高可用服务 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用