ping不通云服务ECS(SAG-1000)

可能原因 终端到设备的链路故障。设备到阿里云的VPN链路故障。目标ECS故障。运营商网络故障。解决方案 登录 智能接入网关控制台。单击智能接入网关实例ID,查看设备状态是否为 可用。如果离线,请参见 设备显示离线 处理。如果在线,请跳转...

无法连接到同一个云连接网内的本地客户端

可能原因 终端到设备的链路故障。设备到阿里云的VPN链路故障。目标PC环境的网络故障。运营商网络故障。解决方案 登录 智能接入网关控制台。单击智能接入网关实例ID,查看当前设备状态是否为 可用。如果离线,请参见 设备显示离线 处理。...

ping不通云服务(SAG-100WM)

可能原因 终端到设备的链路故障。设备到阿里云的VPN链路故障。目标ECS故障。运营商网络故障。解决方案 登录 智能接入网关控制台。单击智能接入网关实例ID,查看设备状态是否为 可用。如果离线,请参见 设备显示离线 处理。如果在线,请参见...

健康检查

如延长健康检查的间隔时间,后端服务器出现故障时,ALB 发现故障后端服务器的时间也会变长。方式二:通过服务器组详情页 登录 应用型负载均衡ALB控制台。在顶部菜单栏处,选择后端服务器组所属的地域。在左侧导航栏,选择 应用型负载均衡...

DeviceSwitched

告警信息 事件名称 事件级别 状态码 状态描述 DeviceSwitched CRITICAL switched Device Role Changed 可能原因 智能接入网关主设备故障。智能接入网关主设备动态路由邻居故障。处理方法 无需处理。icmsDocProps={'productMethod':'created...

Linux系统的ECS实例系统无响应,系统日志中出现“BUG:...

BUG:soft lockup-CPU#0 stuck for 61s 问题原因 该问题通常是由于ECS实例中,系统内核长时间占用CPU资源导致出现软死锁(soft lockup)故障,内核长时间占用CPU资源可能有以下原因:系统负载过高 内核死循环或死锁 内核调度问题 内核出现...

创建和管理服务器组

若延长健康检查的间隔时间,后端服务器出现故障时,NLB 发现故障后端服务器的时间也会变长。移除后端服务器 您可以根据业务需要移除服务器组中的后端服务器。警告 如果直接在服务器组中移除后端服务器,可能会造成业务中断,建议您先将后端...

基本概念

更多请查看 什么是事件 故障 在日常运营中,无论什么原因导致业务服务中断、服务品质下降或用户服务体验下降的现象,称为故障,但不包括用户侧环境或用户自身操作引起的问题。故障比事件优先级更高,事件在处理过程中出现影响扩大或恶化时...

分析视图简介

Java GC日志分析视页面中每个视图的主要功能 基础信息...GC原因 GC原因视图按照GC发生的原因维度,展示不同GC的次数,间隔,时长等指标。日志详情 逐条显示每一次GC的发生的具体情况,支持按照GC原因,GC事件类型,最小暂停时间维度进行查询。

ConnectionDisconnect

告警信息 事件名称 事件级别 状态码 状态描述 ConnectionDisconnect CRITICAL disconnect Connection Disconnected 可能原因 主备IPsec链路均出现网络故障。处理方法 检查用户侧运营商网络接入是否正常。icmsDocProps={'productMethod':'...

Link Visual的常见问题

首帧耗时=请求播放地址耗时(300ms)+连接播放地址耗时(150ms)+等待设备I帧耗时(300ms)+播放器内部缓冲延迟(200ms)+解码渲染耗时(10ms)导致首帧延迟时间大的原因主要有以下两种情况。设备未正常响应强制I帧指令时,会增加一个GOP...

GTM如何实现同城容灾

在健康检查间隔设置为15秒,TTL10秒,连续失败次数3次的配置下,GTM能在1分钟左右准确发现故障并切换,故障切换后理论上10秒左右可以全网生效,但实际情况取决于全国各地运营商的缓存设置时间。DNS未使用云解析DNS,也可以使用全局流量管理...

GTM实现跨网访问加速与故障切换

概述 方案介绍 大部分企业的应用服务都会使用多个运营商的IP地址,因此可能会存在跨网延迟、丢包、故障不可用等问题,而全局流量管理产品方案可以根据用户请求源地址的运营商,解析就近的应用服务器IP地址,实现就近接入、访问加速、故障...

使用集群诊断

容器智能运维平台 提供一键故障诊断能力,包括Pod诊断、Service诊断、Ingress诊断,可以辅助您定位集群中出现的问题。本文介绍如何在ACS集群中使用集群诊断功能。前提条件 已创建ACS集群。具体操作,请参见 创建ACS集群。确保ACS集群运行...

如何处理健康检查导致的大量日志

方案风险说明 延长健康检查的间隔时间后,后端ECS实例出现故障时,负载均衡发现故障ECS实例的时间也会变长。操作步骤 登录 传统型负载均衡CLB控制台。在 实例管理 页面中找到相应的CLB实例,单击实例ID。在 监听 页签下,找到目标监听,在 ...

使用集群诊断

容器智能运维平台 提供一键故障诊断能力,包括节点诊断、Pod诊断、Service诊断、Ingress诊断、内存诊断、网络诊断,可以辅助您定位集群中出现的问题。本文介绍如何在ACK集群中使用集群诊断功能。前提条件 已创建Kubernetes托管版集群。具体...

动态与公告

功能/版本 历史版本GTM标准版 新版GTM标准版 新版GTM旗舰版 全网故障恢复时间=故障切换时间+全网生效时间 在健康检查间隔设置为1分钟,TTL60秒,连续失败次数3次的配置下,GTM能在4分钟左右准确发现故障并切换,故障切换后理论上60秒左右...

产品价格

版本配置 功能项 标准版 旗舰版 全网故障恢复时间=故障切换时间+全网生效时间 在健康检查间隔设置为1分钟,TTL60秒,连续失败次数3次的配置下,GTM能在4分钟左右准确发现故障并切换,故障切换后理论上60秒左右可以全网生效,但实际情况取决...

故障应急协同

故障通告及更新 基于7x24监控值班工作特性,对于业务异常达到故障等级时,以用户定制的(语音、短信、IM)的方式在约定时间内将故障影响信息以及处理进展通知给对应的接收人/组,并持续更新直至故障结束。故障应急协同群 故障发生后,可以...

围绕混沌工程的平台实践

原则3在生产环境中运行实验 混沌工程推荐故障演练是在生产环境中进行,主要的原因有以下两点:系统的行为会根据环境和流量模式的变化,例如系统依赖的组件在测试环境和生产环境会有比较大的差异。系统的监控和人员的应急响应在测试环境和...

GxP欧盟附录11标准合规包

16.1 为了提供支持关键过程的计算机化系统,应作出规定,确保在系统出现故障(例如手动或替代系统)时继续为这些流程提供支持。采用替代安排所需的时间应视风险而定,并适合特定系统及其所支持的业务流程。应充分记录和测试这些安排。17.1 ...

开启健康检查

开启健康检查是指对地址池中的地址配置健康检查策略,开启后可监测应用服务的可用性状态,并最终帮助企业实现自动故障隔离和自动故障切换的功效。健康检查的类型包括:Ping监控、TCP监控、HTTP(S)监控。前提条件 已完成 创建实例、创建...

为何Pod中仍存在已恢复故障的“僵尸进程”?

在K8s环境中,下发的故障已经被恢复了,但是Pod中仍存在该故障的“僵尸进程”。本文介绍该情况可能的原因以及解决方案。可能原因 这是因为容器中存在PID Namespace隔离。在容器中,故障演练进程的父进程是PID=1的进程,容器中的一号进程不...

本地IDC通过主备冗余专线连接上云

阿里云按照您配置的健康检查的发包时间间隔探测主用线路连通性,当探测到主用线路故障时,自动将流量切换至备用线路,保证您的业务不受影响。场景示例 本文以下图场景为例介绍本地IDC如何通过主备冗余专线方式接入阿里云。某企业在上海拥有...

应用场景

场景四:异地容灾 由于地区断电、断网等客观原因,产品可用性并不能达到 100%。当出现这些故障时,如果用户业务部署在单个地区,那么就会因为地区故障导致服务不可用,且不可用时间完全依赖故障恢复时间。通过构建灾备库,使用数据同步服务...

接入FAQ

调用“查询视频合成任务详情”接口异常 异常信息:“code:400,Request was denied due to user flow control.request id:xx-xx-xx-xx-xx”异常原因:出现该异常表示触发了接口限流,建议降低轮询间隔间隔最小不要小于1s,建议设置为3s,...

产品服务等级协议

2.3 除外情形 因 下述原因导致的服务不可用的时长不计入服务不可用时间:(1)阿里云预先通知客户后进行系统维护所引起的,包括割接、维修、升级和模拟故障演练;(2)任何阿里云所属设备以外的网络、设备故障或配置调整引起的;(3)任何...

GetProblem-故障详情

故障详情。调试 您可以在OpenAPI Explorer中直接运行该接口,免去您计算签名的困扰。运行成功后,OpenAPI Explorer可以自动生成SDK代码示例。请求头 该接口使用公共请求头,无特殊请求头。请参见公共请求参数文档。请求语法 POST/problem/...

故障基础数据管理

故障场景等级定义 日常运营中,除用户方环境或自身操作引起的问题外,无论什么原因导致的服务中断、服务品质下降或用户服务体验下降的现象,都称为故障。对故障影响程度的划分就是故障等级定义。定义故障等级是为了指定故障等级定义作为各...

0040-00000276

问题原因 用户提交水印请求,其中水印平铺时单个水印间的水平间隔padx参数不符合规范,取值范围为[0,4096]。问题示例 GET/example_image?x-oss-process=image/watermark,text_SGVsbG8gV29ybGQ,fill_1,padx_5000 ...

设备无法上电

可能原因 未打开设备电源开关。设备电源线缆没有插牢。设备的外接电源有故障。设备的电源适配器有故障。解决方案 确认设备电源开关是否打开。确认设备电源线缆是否插牢。确认外接电源是否有故障。更换其它可以正常供电的外接电源,如果设备...

服务等级说明

2.3 除外情形 因下述原因导致的服务不可用的时长不计入服务不可用时间:(1)阿里云预先通知客户后进行系统维护所引起的,包括割接、维修、升级和模拟故障演练;(2)任何阿里云所属设备以外的网络、设备故障或配置调整引起的;(3)客户的...

耗资源用户处理流程

为了保证您的站点能够安全、...关于网站耗资源的原因以及排查方法,更多信息,请参见 网站耗资源(客户程序故障)常见问题。增强版共享虚拟主机和独享虚拟主机可以更好地应对耗资源问题,避免站点被关停。更多信息,请参见 云虚拟主机官网。

任务触发与执行问题

问题原因 对于以 Cron 表达式触发的 CALLBACK 类型的任务,两次触发的时间间隔必须大于 5 分钟。解决方案 修改 Cron 表达式,使得定时任务的触发间隔时间大于 5 分钟,例如 1 0/5*?有关 Cron 表达式的详细说明,参见 CRON 表达式详解。集群...

IDC通过BGP主备专线链路上云方案

发包时间间隔(秒)指定健康检查时发送连续探测报文的时间间隔。单位:秒。默认值:2。取值范围:2~3。探测报文个数(个)指定健康检查时发送探测报文的个数。单位:个。默认值:8。取值范围:3~8。切换路由 是否开启健康检查的路由切换...

更新故障详情

P1 故障等级 relatedServiceId Long Body 否 123 关联服务 progressSummary String Body 否 进展摘要xxxx 进展摘要 preliminaryReason String Body 否 原因是服务宕机 初步原因 mainHandlerId Long Body 否 678 主要处理人 feedback String...

使用日志服务自定义WAF监控与告警

如果因网络异常等原因执行检查失败,不计入累计次数。说明 关于在告警配置中用到的监控指标以及监控指标的阈值设置建议,请参见 常用监控指标。通知间隔 两次告警通知之间的时间间隔。如果某次执行满足了触发条件,而且累计的触发次数已经...

本地IDC通过负载冗余专线连接上云

该企业为了避免单点故障问题,需要分别向两个运营商各申请一条物理专线,两条物理专线同时转发流量,将本地IDC连接至阿里云。本文中,与两条物理专线连接的两个云上边界路由器VBR(Virtual Border Router)的配置如下表所示。VBR配置项 VBR...

归档存储服务等级协议

阿里云将对不可用时间进行赔偿,但不包括以下原因所导致的服务不可用时间:(1)阿里云预先通知用户后进行系统维护所引起的,包括割接、维修、升级和模拟故障演练;(2)任何阿里云所属设备以外的网络、设备故障或配置调整引起的;(3)...

主备切换

若您收到短信、邮件、控制台站内信等通知,告知您 Tair 实例已完成主备切换,您可以参考本文了解主备切换的原因、影响和处理建议等。为什么会触发主备切换?实例底层主机故障 阿里云检测到实例底层主机发生故障,例如进程异常中断、实例...
共有178条 < 1 2 3 4 ... 178 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
数据库自治服务 云数据库 OceanBase 版 负载均衡 应用高可用服务 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用