跨地域容灾

容灾系统部署在阿里云的两个地域中,当生产站点发生故障(例如海啸、地震)时,业务系统切换到容灾站点。生产站点和容灾站点部署在不同的地域,提供容灾即服务,分钟级的高可靠的业务持续性保障,有效避免了地域性灾害导致的系统故障

光模块故障

本文介绍光模块发生故障的原因和处理方法。问题现象 光模块连接后,接口指示灯没有变为绿色。可能原因 光模块不兼容或损坏。智能接入网关设备支持的光模块型号请参见 光模块型号。说明 目前仅SAG-1000设备支持光模块插入。解决方案 通用多...

设备和交换机之间的链路故障

本文介绍SAG-1000设备发生设备和交换机之间链路故障的原因和处理方法。问题现象 设备和交换机接口之间ping不通。设备的Web端口配置页,端口前的状态灯为红色。动态路由OSPF接入时,Web端口配置页,端口前的状态灯为红色。设备的Web状态查询...

故障复盘改进详情

0c4840fd3812 幂等校验token 返回数据 名称 类型 示例值 描述 requestId String 4361a0e1-6747-4834-96ce-0c4840fd3811 Id of the request data Object data problemId String 231231 故障ID problemReason String 故障的原因 故障原因 ...

捷顺

DAS服务自动SQL限流和自动SQL调优,帮助DBA从救火员转向数据库架构师,有更多时间和精力帮助研发优化系统架构,审核数据库的变更和各种操作,进一步降低系统故障的概率。DAS服务自动对数据库实例进行治理,帮助捷顺科技把数据库的运维成本...

强弱依赖治理概述

如果商品详情页对下游依赖是弱依赖,例如当下游依赖 评价、店铺 等系统出现故障的时候,将导致商品详情页部分内容加载不全,出现如下图的情况,但核心业务流程仍可继续推进,用户体验并未受到太多影响。通过以上对比可以看出,当下游依赖...

网络配置

建议您选择与所需接入堡垒机系统进行运维的ECS服务器相同的网络类型:如果ECS服务器都处于专有网络环境,堡垒机实例的网络应选择 专有网络(VPC)。如果ECS服务器都处于经典网络环境,堡垒机实例的网络应选择 经典网络。如果需要接入ECS...

ECS系统事件概述

时长说明如下:通知修复故障的系统事件通常在10分钟内完成。突发故障、违规操作等非计划内因素导致的非预期运维事件,只有短暂的事件执行窗口期。ECS事件Code和云监控事件名称的格式 ECS事件Code、云监控事件名称遵循了一定的命名格式,...

网络类场景

排除端口 无需注入网络延迟调用故障的端口,与本地服务端口和远程服务端口功能互斥。可以指定多个,使用逗号分隔,使用连接符表示范围。例如80,8000-8080。远端服务IP 指定演练对象访问的远端服务IP。可以通过子网掩码来指定一个网段的IP...

概述

再者云计算平台会提供冗余存储和备份能力,避免系统因为硬件故障或其他原因导致的停机或数据丢失。这种备份机制可以提高系统的可靠性。责任共担模型 阿里云平台提供高可用的基础设施,并提供应用稳定性相关工具体系。用户可以基于阿里云...

演练场景说明

网络故障系统运行过程中时常遇到的问题,所以需要提升系统网络异常情况下的容错能力。Java 场景名称 特性 虚拟机场景 故障演练支持的虚拟机场景。代码逻辑场景 故障演练支持的代码逻辑场景。JVM注入动态脚本 向指定的Java方法注入一段...

出错提示S0客户端调用SMC服务出错

其中S0_*可能的错误码如下:S0_U28 S0_U7 S0_U56 S0_U6 S0_U35 问题原因系统到SMC的服务域名网络访问不通。解决方案 确认SMC服务域名。默认激活码域名(通过控制台自动导入或手动生成激活码的方式):默认公网域名:...

网络资源

容灾:建立容灾和高可用的系统架构,将系统部署在多个地理位置或数据中心,并使用负载均衡和故障切换技术,以确保即使发生网络分区,系统仍然可以继续提供服务。网络闪断故障网络连接在短时间内频繁中断和恢复,造成网络连接不稳定的...

开通读写分离(只读地址)

由于网络故障或其他原因导致主实例不可用时,系统将自动触发主备实例切换。系统会自动将备实例升级为主实例,以保证系统的可用性。在此过程中,主备实例的读写权重会自动切换,即原来的只读实例会变成读写实例,从而继续提供业务服务。同时...

混访混挂迁移示例

迁移示例二 当迁移如下图所示的系统时(待迁移系统二),如果采取迁移示例一的操作顺序,先迁移ECS1和ECS2,由于SLB只支持混挂,不支持混访,会造成迁移后的专有网络内的ECS无法访问经典网络的ECS实例。迁移该系统的基本步骤如下:准备网络...

系统运维工具集SysAK使用说明

SysAK(System Analyse Kit)是阿里云操作系统提供的一个全方位的系统运维工具集,可以覆盖系统的日常监控、线上问题诊断和系统故障修复等常见运维场景。本文为您介绍SysAK的安装部署和使用方法。运维场景 阿里云通过对百万服务器运维经验...

系统故障排查

概述 本文主要介绍使用阿里云服务器ECS时的系统故障排查,包含CPU、磁盘I/O、内存、硬盘、带宽资源占用异常的问题排查与定位。详细信息 说明 阿里云提醒您:如果您对实例或数据有修改、变更等风险操作,务必注意实例的容灾、容错能力,...

智能负载均衡

能力 未启用智能负载均衡 启用智能负载均衡 容灾能力 多节点单活的接入防护能力 统一容灾切换 基于多节点负载均衡的接入防护能力 基于智能DNS的自动网络故障容灾切换 访问加速 无 就近接入防护及就近回源的最短链路 智能负载均衡的价值 ...

读写访问文件类问题

问题原因 网络或者后端有临时小故障发生,某些Linux分发版(如Suse)的SMB客户端功能较弱,不能很好的支持这种故障切换。解决方案 建议选用NAS SMB推荐的Linux版本,NAS SMB支持的Linux操作系统版本如下表所示:操作系统类型 操作系统版本 ...

归档存储服务等级协议

赔偿方案 阿里云对用户存在故障的每个Archive按不可用时间的100倍赔偿,即赔付金额=发生故障的Archive故障前24小时平均每分钟费用×不可用时间×100倍;其中:(1)赔偿只针对使用归档存储服务已产生费用的用户,以归档存储代金券的形式赔偿,...

设计原则

面向风险的应急快恢原则 在一些场景下,即使设计了各种技术手段去提高系统的冗余、保持业务的高可用,但还是避免不了生产系统故障的发生,所以需要面对故障建立一个高效的故障应急流程机制和稳定的技术平台,实现故障风险实时发现、应急...

诊断指标与诊断结果条目说明

实例健康诊断功能是一种自助诊断方式,可以对实例的系统状态、网络状态、磁盘状态等进行全方位的诊断,帮助您了解实例健康情况,及时发现并解决常见的问题。本文介绍该功能支持的诊断指标,并提供了详细的诊断范围及建议操作供您参考。基本...

GxP欧盟附录11标准合规包

13.1 应报告和评估所有事件,而不仅仅是系统故障和数据错误。应确定重大事件的根本原因,并应成为纠正和预防行动的基础。使用云安全中心企业版 使用云安全中心企业版或者更高级别的版本,视为“合规”。1.1 风险管理应贯穿计算机化系统的...

自动/手动主备切换

如果切换第一个节点失败(例如,网络原因、复制状态异常等),系统会尝试切换下一个,直至成功。手动主备切换 登录 PolarDB管理控制台。在控制台左上角,选择集群所在地域。找到目标集群,单击集群ID。在 基本信息 页的 数据库节点 区域,...

自动/手动主备切换

如果切换第一个节点失败(例如,网络原因、复制状态异常等),系统会尝试切换下一个,直至成功。手动主备切换 登录 PolarDB管理控制台。在控制台左上角,选择集群所在地域。找到目标集群,单击集群ID。在 基本信息 页的 数据库节点 区域,...

网络规划

由于系统调用复杂、跨可用区调用等原因可能会增加系统网络延迟。建议您对系统进行优化及适配,以满足您对高可用和低延迟的实际需求。具体使用多少个交换机还和系统规模、系统规划有关。如果前端系统可以被公网访问并且有主动访问公网的...

Ping健康检查

原因:黑洞是在阿里云网络和运营商网络的互联网生效的ACL策略,但阿里云IP之间的流量基本上是在云网络内部流动,降低探测效果。节点类型 地理位置 BGP节点 张家口市、青岛市、杭州市、上海市、呼和浩特市、深圳市、北京市 国际节点 中国...

挂载访问FAQ

目前仅支持Linux操作系统挂载NFS文件系统,Windows操作系统挂载SMB文件系统、Windows操作系统挂载NFS文件系统及Linux操作系统挂载SMB文件系统场景,请您登录ECS实例执行命令挂载。更多信息,请参见 Windows系统挂载SMB文件系统、Windows...

产品服务等级协议

2.3 除外情形 因 下述原因导致的服务不可用的时长不计入服务不可用时间:(1)阿里云预先通知客户后进行系统维护所引起的,包括割接、维修、升级和模拟故障演练;(2)任何阿里云所属设备以外的网络、设备故障或配置调整引起的;(3)任何...

服务等级说明

2.3 除外情形 因下述原因导致的服务不可用的时长不计入服务不可用时间:(1)阿里云预先通知客户后进行系统维护所引起的,包括割接、维修、升级和模拟故障演练;(2)任何阿里云所属设备以外的网络、设备故障或配置调整引起的;(3)客户的...

服务协议

赔偿范围不包括以下原因所导致的请求失败或服务不可用:(1)阿里云预先通知客户后进行系统维护所引起的,包括割接、维修、升级和模拟故障演练;(2)任何阿里云所属设备以外的网络、设备故障或配置调整引起的;(3)客户的应用程序受到...

SLA服务等级协议

2.3 除外情形 因下述原因导致的服务不可用的时长不计入服务不可用时间:(1)阿里云预先通知客户后进行系统维护所引起的,包括割接、维修、升级和模拟故障演练;(2)任何阿里云所属设备以外的网络、设备故障或配置调整引起的;(3)客户的...

性能监控最佳实践

这些工具往往需要单独配置和管理,而且监控数据也分散在不同的系统中,导致监控效率低下。而一体化性能监控则可以将多个监控工具集成在一起,通过一个统一的监控平台进行管理和监控。这样可以大大提高监控效率,减少监控人员的工作量,同时...

地址标准化服务等级协议

2.3除外情形 因下述原因导致的服务不可用的时长不计入服务不可用时间:(1)阿里云预先通知客户后进行系统维护所引起的,包括割接、维修、升级和模拟故障演练;(2)任何阿里云所属设备以外的网络、设备故障或配置调整引起的;(3)客户的...

服务等级协议

2.3除外情形 因 下述原因导致的服务不可用的时长不计入服务不可用时间:(1)阿里云预先通知客户后进行系统维护所引起的,包括割接、维修、升级和模拟故障演练;(2)任何阿里云所属设备以外的网络、设备故障或配置调整引起的;(3)客户的...

自动/手动主备切换

系统发生故障时,PolarDB 集群会自动进行主备切换。您也可以手动进行主备切换,指定一个只读节点为新的主节点。注意事项 不论是自动切换还是手动切换,当只读节点未开启热备时,主备切换过程中可能会出现20~30秒左右的闪断,因此切换前请...

启动Others Linux实例后,网络服务不正常是什么原因

本文主要介绍使用SMC迁移后,启动Others Linux实例后,网络服务不正常的问题描述、问题原因及其解决方案。问题描述 使用SMC迁移后,启动Others Linux实例后,网络服务不正常。问题原因 如果是非主流的Linux系统,可能会被识别为Others ...

服务等级协议

2.3 除外情形 因 下述原因导致的服务不可用的时长不计入服务不可用时间:(1)阿里云预先通知用户后进行系统维护所引起的,包括割接、维修、升级和模拟故障演练;(2)任何阿里云所属设备以外的网络、设备故障或配置调整引起的;(3)用户...

Linux系统网络进程不存在

问题描述 Linux系统内对应的网络进程不存在,且网络配置为DHCP,则会在IP地址的租约到期之后,出现无法续租导致网络中断的问题。解决方案 说明 如果您对实例或数据有修改、变更等风险操作,务必注意实例的容灾、容错能力,确保数据安全。...

围绕混沌工程的平台实践

原则3在生产环境中运行实验 混沌工程推荐故障演练是在生产环境中进行,主要的原因有以下两点:系统的行为会根据环境和流量模式的变化,例如系统依赖的组件在测试环境和生产环境会有比较大的差异。系统的监控和人员的应急响应在测试环境和...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
共享流量包 弹性公网IP 高速通道 负载均衡 短信服务 人工智能平台 PAI
新人特惠 爆款特惠 最新活动 免费试用