应用故障自动诊断

故障定界:这一部分包含了诊断模型推测出的导致应用故障的浅层原因,一般包含以下3种情况:应用的某个实例故障导致的整体故障。应用的某个接口或者服务故障导致的整体故障。应用的下游应用故障导致本应用故障。根因分析:这一部分包含了...

ListHoneypotPreset-查询蜜罐模板列表

运行成功,OpenAPI Explorer可以自动生成SDK代码示例。调试 授权信息 下表是API对应的授权信息,可以在RAM权限策略语句的 Action 元素中使用,用来给RAM用户或RAM角色授予调用此API的权限。具体说明如下:操作:是指具体的权限点。访问...

无法连接Windows实例

故障现象 无法ping通ECS实例,在排除Iptables和网卡IP配置问题且回滚系统,仍然无法ping通。故障原因 可能是ECS实例安全组默认的公网规则被删除。解决方法 重新配置ECS实例的安全组公网规则,具体操作请参见 ECS实例安全组默认的公网规则...

故障复盘

故障复盘规范 故障复盘作为故障体系中的重要一环,整体复盘流程包括故障处理过程、改进分析、故障定责,基于包含标准化的复盘SOP、对应预防action推荐、问责管理机制,全面地回溯线上故障的发生,产出故障复盘报告和改进措施,避免故障重复...

故障协同处理(基于钉钉)

2.故障应急场景群:事件升级故障后,群内推出 故障处理中 消息卡片,如果满足自动生成故障场景群的需求(下文详细介绍创建故障场景群逻辑),故障场景群内同时推出 故障处理中 消息卡片。本群故障消息卡片包含按钮:签到、签到记录、应急...

部署初始化

请输入:用户名:owner 密码:changepassword 登录成功显示下面的界面:输入命令:ls/etc/sysconfig/network-scripts 上面示例,显示有6个网卡配置文件(ifcfg-enp61s0f0、ifcfg-enp61s0f1、ifcfg-enp95s0f0、ifcfg-enp95s0f1、ifcfg-...

以太网接口频繁Up/Down

单模光纤一般为黄颜色,多光纤一般为橘黄色。相互对接的两个光模块波长需要保持一致。如果对应关系不正确,请根据实际情况选择更换光模块或光纤。设备间光纤的长度和光模块支持的传输距离是否匹配。光纤的长度应该小于光模块支持的传输...

以太网接口无法接通

单模光纤一般为黄颜色,多光纤一般为橘黄色。光纤连接的两个光模块的波长需要保持一致。如果光模块和光纤的对应关系不正确,请根据实际情况选择更换光模块或光纤。设备间光纤的长度和光模块支持的传输距离是否匹配。光纤的长度需小于光...

远程登录Windows系统界面显示异常如何处理?

界面显示黑色只能看到cmd命令行 问题描述 远程登录Windows系统后显示黑色,只能看到cmd命令行,无法正常进入Windows系统。说明 以Windows Server 2012操作系统为例。问题原因 在安装Windows Server 2012系统时选择的核心模式,图形界面没有...

设备使用物模型通信

您可在物联网平台控制台的 云端运行日志 页签,复制目标Topic消息的 messageID 或 traceID,追踪对应消息在物联网平台流转的全路径,快速定位故障。详细信息,请参见 消息轨迹。物模型数据存储 设备上报的物模型数据默认会自动写入时序数据...

查看事件与监控信息

故障列表 故障列表显示当前应用分组正在报警的全部资源,如果正在报警的规则被禁用,则故障列表中不再显示被禁用规则的故障信息。可用性监控 查看服务实例可用性的监控信息。组进程监控 查看组进行监控的进程ID、动态规则匹配和状态等信息...

使用API终止和恢复VBR来确认冗余物理专线

本文介绍本地IDC(Internet Data Center)通过冗余专线接入阿里云,您如何使用白屏化的OpenAPI工具调用API来完成专线故障演练。背景信息 当本地IDC通过冗余物理专线正常接入阿里云,您需要通过单条专线故障演练来确认冗余物理专线。您...

自助诊断GPU节点问题

ACK集群提供节点级别的GPU诊断功能,供您进行部分GPU相关问题的故障排查。如果您在ACK Pro版集群中使用GPU节点时遇到问题,可以启用GPU节点自助诊断,采集GPU诊断的基础指标进行问题排查。本文介绍如何使用节点诊断功能,自助排查GPU节点...

CLB健康检查FAQ

负载均衡因端数据库故障导致健康检查失败,如何处理?负载均衡服务TCP端口健康检查成功,为什么在端业务日志中出现网络连接异常信息?为什么业务本身没有异常但是健康检查显示异常?健康检查的原理是什么?负载均衡采用集群部署。四层...

创建DDH

例如,g6s的物理CPU核数为52,如果设置CPU超分为4,则DDH创建完成vCPU总数显示为416。重要 超分型规格中,g6s、c6s、r6s支持自定义CPU超分,但v5的超分是固定值,不可自定义。保持默认 购买时长 根据实际需求,选择购买时长。1个月...

配置算法实例

算法实例是根据算法模板创建的具体实例,可以根据您设置的检测参数结合算法模型,完成对相关数据中异常信息的检测及诊断,协助您更好地解读设备数据,监测设备运行状态,及时发现潜在故障。前提条件 已创建算法实例。具体操作,请参见 创建...

创建专有宿主机

例如,g6s的物理CPU核数为52,如果设置CPU超分为4,则DDH创建完成vCPU总数显示为416。重要 超分型规格中,g6s、c6s、r6s支持自定义CPU超分,但v5的超分是固定值,不可自定义。保持默认 购买时长 根据实际需求,选择购买时长。1个月...

物联网终端定向访问阿里云物联网平台

配置 说明 基本信息 地域 显示需要创建云连接器实例的地域。名称 输入云连接器实例的名称。运营商 APN所属运营商。选择APN,系统自动选定对应的运营商。APN 选择网络接入方式。物联网终端通过指定的专用APN,定向访问阿里云服务。网络...

Windows实例网络访问丢包延时高的排查方法

概述 当网站访问很慢或无法访问时,若已经排除显著的问题,而使用ping命令检测到有明显丢包时,建议您做链路测试。在Windows环境中,推荐优先使用WinMTR工具,或者tracert命令行进行链路测试以判断问题来源。通常情况下,链路测试步骤如下...

客户端离线排查

云安全中心控制台显示客户端离线时,表示该服务器已失去云安全中心的防护。此时,该服务器可能存在被黑客入侵的风险。建议您参考本文内容尽快排查离线原因,保障客户端在线。背景信息 云安全中心提供客户端问题一键排查功能,如果您发现...

主机健康诊断

说明 如果您的主机底座k8s-launcher版本不存在,则界面显示立即升级,请按照界面指引进行升级再进行健康诊断。诊断完成,单击 查看报告 查看诊断结果,并根据提示诊断结果和建议进行问题修复。系统配置诊断 诊断项 说明 内核参数检测 ...

即席分析表格中的操作

操作内容 单个度量 两个度量 多个度量 排序 支持 不支持 不支持 仅保留 支持 支持 支持 抑制 支持 支持 支持 计算 支持(数值排行、数值占、自定义)支持(百分比、差异百分比、四则运算、自定义)支持(总和、平均值、最值、自定义)...

什么是物模型

事件(Event)设备运行时,主动上报给云端的信息,一般包含需要被外部感知和处理的信息、告警和故障。事件中可包含多个输出参数。例如,某项任务完成的通知信息;设备发生故障时的温度、时间信息;设备告警时的运行状态等。事件可以被...

功能说明

健康检查 针对地址池,可以配置健康检查,开启健康检查是指对地址池中的IP地址配置健康检查,开启可实现实时监测应用服务的可用性状态,并最终帮助企业实现自动故障隔离和自动故障切换的功效。健康检查支持的方式:ping、tcp、http(s)。...

DBGateway常见问题

长时间 已授权,验证中 一般情况下,正确授权1~2分钟,实例接入状态会变为 连接正常。如长时间(超过2分钟)显示 已授权,验证中:检查DBGateway的运行状态。尝试重启DBGateway并观察实例授权是否成功。推荐升级到DBGateway最新版。

使用ping命令丢包或不通时的链路测试方法

当客户端访问目标服务器或负载均衡,使用ping命令测试出现丢包或网络不通时,可以通过链路测试工具进行链路测试来判断问题来源。本文介绍如何使用链路测试工具进行链路测试。链路测试流程 通常情况下,链路测试流程如下图所示。链路测试...

常见问题-FAQ

重要 标准版最快可在4分钟左右准确发现故障并切换 故障发现时间:GTM可保障故障发现时间,目前默认的健康检查配置可以在故障的4分钟左右准确发现故障并切换;全网生效时间:GTM无法保障全网的最终生效时间,因受限于全国各地运营商的TTL...

设置Pod故障处理策略

默认情况下,ECI Pod创建失败,系统会自动重试尝试创建。如果您希望尽快得到创建结果以便及时处理故障,可以修改Pod故障处理策略。配置说明 在虚拟节点上创建ECI Pod时,可能会因为库存不足等原因导致Pod创建失败,默认情况下,系统会...

多可用区部署

云原生多数据库 Lindorm 支持创建多可用区的实例。该方案将一个Lindorm实例部署在多个可用区,多可用区实例具备更高的容灾能力,同时Lindorm实例可以实现多个可用区之间数据的强一致,也可以在数据最终一致下发出请求返回最快的结果,...

实例的节点故障处理机制

本文档介绍云数据库MongoDB版实例的节点故障处理机制。单节点实例 由于单节点实例架构的特殊性,单节点实例仅拥有一个节点。当节点发生故障后,系统会对故障节点进行检查与修复。节点故障期间实例的相关服务不可用。说明 单节点实例适用于...

访问云虚拟主机的PHP网站时显示为空白页面

缓存问题 部分程序在缓存文件中占过大时会导致网站页面显示空白,出现这种问题时,一般网站后台还是可以访问,您可以登录网站后台清空程序缓存即可。访问网站时,部分网站程序会生成一个静态页面,在生成过程中因种种原因,生成的首页...

如何查看安全加速SCDN是否已生效

详细信息 在域名服务商添加完CNAME记录,不同的服务商CNAME生效的时间也不同,一般新增的CNAME记录会立即生效,修改的CNAME记录会需要较长时间生效。您可以 ping 或 dig 您所添加的加速域名,如果被转向*.*scdn*.com 的域名,即表示CNAME...

配置健康检查

将边界路由器VBR(Virtual Border Router)连接至云企业网实例,您可以通过云企业网的健康检查功能探测VBR实例关联的物理专线的连通性。在云企业网和本地数据中心存在冗余路由的场景下,健康检查探测到物理专线故障后支持自动切换到可用...

域名检测工具

答:如果您的域名已过期,过期进行续费,一般续费成功需要24-48小时可恢复使用,期间无加速生效的方法,建议您在域名过期前完成续费。(b)域名已经续费,为什么域名检测工具仍然显示域名已过期?答:域名检测模块是调用whois进行查询...

MQ订阅消息

取值:新建:"New"处理中:"Processing"已取消:"Cancel"已完结:"Close"重新开启:"Reopen"消息内容 基站 离线 基站与云价签系统连接中断触发消息,例如:门店网络故障或基站故障 {"EventCatgory":"DEVICE","Event":"DEVICE_OFFLINE",...

本地IDC通过专线访问云服务器ECS

警告 若您选择关闭本功能,请确保您有其他方式保证链路的冗余性,否则当物理专线连接故障后,会导致网络中断。说明 健康检查会以您指定的发包时间间隔发送探测报文,当连续发送的所有探测报文(即您指定的探测报文个数)都丢包时,则判断...

基本概念

本主要介绍运维事件中心的基本...故障比事件优先级更高,事件在处理过程中出现影响扩大或恶化时,需升级为故障进行深度跟进。更多请查看 什么是故障 服务中心 名词概念 说明 服务 服务是企业业务连续性管理的最小单元。更多请查看 什么是服务

设计方案

从提前发现系统风险、提升测试质量、完善风险预案、加强监控告警、提升故障应急效率等方面做到故障发生前有效预防,故障发生时及时应对,故障恢复回归验证。基于故障本身打造分布式系统韧性,持续提升软件质量,增强团队对软件生产运行的...

SanityCheck:算力健康检测

功能介绍 在执行DLC任务时,可能会遇到以下问题:在任务花费一定时间加载模型Checkpoint或其他初始化操作,由于申请的资源存在故障,无法顺利开始训练,需要调查定位故障问题并重新提交任务。该过程中会导致GPU资源的浪费。在任务运行...

边缘物业一体机网络配置错误

1.问题现象 1.ping不通网关和外网 2.ping不通部分外网 3.可以ping通外网,但IP不是自己配置的那个,或者是一个网卡有两个IP 4.DNS1配置的不是223.5.5.5 ​ 2.排查方法 2.1网络配置之前需要注意以下几点:1.插上网线,一般插在LAN1口,插上...
共有117条 < 1 2 3 4 ... 117 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
数据库自治服务 应用高可用服务 云数据库 OceanBase 版 负载均衡 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用