混沌工程缓存实战系列-Redis

因为服务端出现故障更加真实,所以可以从服务端层面去制造故障,但对于问题定位和排查的要求会更高。注入故障,观察指标的变化。缓存监控指标 目前支持的可监控的缓存指标如下:指标 说明 缓存QPS QPS是最通用也是最易观察的指标。缓存命中...

部署高可用架构应用集群

背景信息 高可用架构应用集群具备的特点如下所述:轻应用负载均衡可以将公网访问的流量分发到后端多台轻应用服务器上,在增强应用吞吐能力的同时,可以消除服务器的单点故障,提升应用可用性。通过自定义镜像功能,您可以快速创建部署...

附录:SOFAStack 产品目录

提高研发效率:模拟或虚拟化服务,以验证设计要求或协助集成测试,提高研发效率。异构系统集成场景 统一集成:降低企业内部系统集成成本,无缝连接不同的软件应用程序。遗留系统兼容:选择最适合技术栈,在转型过程中兼容遗留系统,加速...

代码逻辑场景

本文列出了故障演练支持的代码逻辑场景。篡改Java方法返回值 修改Java指定方法的返回值,返回指定的值。具体示例,请参见 JVM注入动态脚本。参数名称 是否必选 默认值 参数说明 类名 是 无 完整的类名,包含包名。例如:...

网站流量异常导致网站无法访问

解决方案 针对上述原因,您需要具体分析网站的访问情况,例如,了解网站访问的变化趋势或分析网站运行中遇到的具体故障原因。本方案以建在Windows操作系统主机上的网站为例,主要介绍使用WebLog Expert Lite工具分析网站日志的方法。下载...

JVM注入动态脚本

如果模拟接口故障,需填写接口的实现类。方法名 是 无 方法名,例如:方法getUser(Long userId),则填写getUser。如果存在多个重载方法,如:getUser(String name)和getUser(Long userId),则对两个方法均生效。返回值 是 无 指定方法的...

光模块故障

本文介绍光模块发生故障原因和处理方法。问题现象 光模块连接后,接口指示灯没有变为绿色。可能原因 光模块不兼容或损坏。智能接入网关设备支持的光模块型号请参见 光模块型号。说明 目前仅SAG-1000设备支持光模块插入。解决方案 通用多...

设备和交换机之间的链路故障

本文介绍SAG-1000设备发生设备和交换机之间链路故障原因和处理方法。问题现象 设备和交换机接口之间ping不通。设备的Web端口配置页,端口前的状态灯为红色。动态路由OSPF接入时,Web端口配置页,端口前的状态灯为红色。设备的Web状态查询...

基于MSE云原生网关实现同城多活

云原生网关默认采用多可用区部署,提供了地域级的、...压测执行到1分钟以后,手动把可用区I集群中的所有工作负载删除掉,模拟集群故障,观察流量损失。可以看到MSE在I可用区的集群挂掉后,可实现秒级切流,切流过程中仅有不到1%的流量损失。

故障协同处理(基于钉钉)

2.故障应急场景群:事件升级故障后,群内推出 故障处理中 消息卡片,如果满足自动生成故障场景群的需求(下文详细介绍创建故障场景群逻辑),故障场景群内同时推出 故障处理中 消息卡片。本群故障消息卡片包含按钮:签到、签到记录、应急...

Redis客户端重连指南

引发暂时性故障原因 原因 说明 故障触发了高可用机制 云数据库Redis支持节点健康状态监测,当监测到实例中的主节点不可用时,会自动触发主备切换,例如将主节点和从节点进行互换,保障实例的高可用性。此时,客户端可能会遇到下列暂时性...

ModifyDBCluster-修改集群功能配置

模拟主可用区故障场景中,主可用区所有的计算节点均不可用,该场景的容灾切换是有损的。0 StorageAutoScale string 否 标准版集群是否开启存储自动扩容。取值范围如下:Enable:开启存储自动扩容。Disable:关闭存储自动扩容。Enable ...

应用服务器的状态为已禁用

问题原因应用服务器已到期,轻应用服务器到期后,服务器将会自动关机。从到期时间开始计算,15天内服务器的状态显示为 已禁用,该状态下服务器的数据保留,您只需要续费服务器即可启动服务器。如果在15天内您没有续费服务器,服务器...

采集客户端数据的高可用方案

但是在一些相对极端的场景下,单集群可能由于一些预期外原因存在故障停服风险。针对该单集群故障风险,日志服务提供两种异地多活的客户端数据采集方案。方案比较 对比项 方案1:双写 方案2:数据加工复制+写入切换 部署复杂度 低 需要额外...

云助手Agent卸载或者停止后,命令助手等功能出现异常...

本文主要介绍云助手Agent卸载或者停止后,命令助手等功能出现异常的问题描述、问题原因及其解决方案。问题描述 手动卸载或者停止轻应用服务器中的 云助手Agent,使用命令助手等功能时,会出现功能异常。以使用命令助手为例,报错信息如下...

测试与验证

可靠性测试 可靠性测试主要是模拟各种故障(网络中断,服务异常、HA切换)下,系统是否能正确切换,处理能力是否有明显变化。测试实施及报告 基于测试工具,构建对应测试场景的脚本,执行后,通过测试结果,并根据观测的性能指标,撰写测试...

产品服务等级协议

2.3 除外情形 因 下述原因导致的服务不可用的时长不计入服务不可用时间:(1)阿里云预先通知客户后进行系统维护所引起的,包括割接、维修、升级和模拟故障演练;(2)任何阿里云所属设备以外的网络、设备故障或配置调整引起的;(3)任何...

无法连接Windows实例

故障原因 可能是网卡驱动未开启或网卡配置有问题。解决方法 使用管理终端 登录实例,检查网卡驱动,如果存在异常,则重新安装。步骤三:检查重置实例密码后是否未重启实例 确认是否存在故障现象,如果存在,则参考本步骤解决问题,如果不...

查看运行分析

该指标协助您进行作业诊断,排查作业Task级别的故障原因。个 TM自JVM启动以来已加载的类总数(TM ClassLoader)TM自JVM启动以来已加载的类总数。JM所在的JVM创建后加载类的总数或卸载类的总数过大,会导致占用过大内存空间,从而影响作业...

企业邮箱服务等级协议

赔偿范围不包括以下原因所导致的服务不可用时间:(1)阿里云预先通知客户后进行系统维护所引起的,包括割接、维修、升级和模拟故障演练;(2)任何阿里云所属设备以外的网络、设备故障或配置调整引起的;(3)客户的应用程序受到黑客攻击...

服务协议

赔偿范围不包括以下原因所导致的请求失败或服务不可用:(1)阿里云预先通知客户后进行系统维护所引起的,包括割接、维修、升级和模拟故障演练;(2)任何阿里云所属设备以外的网络、设备故障或配置调整引起的;(3)客户的应用程序受到...

应用故障自动诊断

在EDAS中进入应用总览页面时,会按照您自定义的时间段对该应用的运行情况做一个自动诊断。...数据支持:这一部分包含了得到推测结论的数据支持,不同故障原因的诊断报告中包含的分析数据将不一样。图 1.故障诊断报告示例图-RT诊断

容灾演练断网方式说明

安全组断网 安全组断网是一种借助阿里云专有网络安全组技术实现的轻级且精细化的断网方式,可以针对用户的ECS、Redis及RDS实例进行断网模拟。针对ECS实例的断网模拟采用的是变更安全组策略的方式。如果ECS绑定了多块辅助网卡,每一块辅助...

功能概述

数据库发生故障后,无法在发生故障时定位到原因,可以通过智能压测功能,在克隆库上复现故障场景,定位故障原因。功能架构 智能压测的功能架构如下图所示:源数据库:将要进行大促、将要业务变更或者已经发生故障,需要进行流量捕获的数据...

故障管理

包括根因检查点(如故障原因、最近活动、注入方式、恢复方式等)、故障变更检查、监控检查,并需要对每一个故障明确责任人及团队;故障改进:支持对故障制定明确的改进及验收措施、责任人及完成时间,确保每个深度复盘后的故障都能对业务...

地址标准化服务等级协议

2.3除外情形 因下述原因导致的服务不可用的时长不计入服务不可用时间:(1)阿里云预先通知客户后进行系统维护所引起的,包括割接、维修、升级和模拟故障演练;(2)任何阿里云所属设备以外的网络、设备故障或配置调整引起的;(3)客户的...

租户内存使用率告警

处理方法 查看租户的写入监控,如果发现内存告警期间同时写入突然增大,那么需要根据业务场景来调整租户的内存规格,如果集群内存资源已经分配满了,可以考虑对集群规格进行扩容。如果是集群转储功能出现问题引起的内存暴涨,请联系...

云数据库RDS MySQL版主实例与只读实例之间存在复制...

问题原因 原因一:执行过涉及数据较大的DDL语句。涉及数据较大的DDL语句可能会产生大量的临时数据表,并且DDL语句通常是单线程执行的,所以速度比较慢,例如 optimize table big_data_table。原因二:对单表执行过大量的DML语句或者...

云数据库Redis版产品选型必读

选择容灾方案 当云数据库Redis实例因不可预料的原因(例如设备故障、机房断电等)发生故障,容灾机制可用于保障数据的一致性和业务可用性。云数据库Redis提供多种灾备方案供您选择,可满足不同的业务场景。选择大版本 推荐使用更新的大版本...

Tair选型指南

3 选择容灾方案 云原生内存数据库Tair 实例若因不可预料的原因(例如设备故障、机房断电等)发生故障,容灾机制保障数据的一致性和业务可用性。云原生内存数据库Tair 提供多种灾备方案供您选择,可满足不同的业务场景。4 预估内存规格 提前...

网站耗资源(客户程序故障)常见问题

本文汇总了使用云虚拟主机出现网站耗资源(客户程序故障)时的常见问题。什么是网站耗资源(客户程序故障)?网站程序占用CPU及内存过多,是对资源的一种浪费。当您使用普通版共享云虚拟主机建站后,可能会因为网站程序编写不合理、代码...

查看消费者状态

应用场景 消费者状态信息包括在线状态、订阅关系、消费TPS、消息堆积和线程堆栈信息等,经常被应用于以下故障排查场景:故障场景 现象 处理建议 订阅关系不一致 在 Group 详情 页面,看到Group ID的 订阅关系 显示 订阅关系不一致,请...

灾备方案

Tair 容灾架构演进 当 Tair 实例因不可预料的原因(例如设备故障、机房断电等)发生故障,容灾机制可用于保障数据的一致性和业务可用性。Tair 提供多种灾备方案供您选择,可满足不同的业务场景。图 1.Tair 容灾架构演进 灾备方案 灾备级别 ...

表格存储容量型实例存在预留读吞吐费用的原因

本文主要介绍表格存储容量型实例存在预留读吞吐收费的原因。表格存储容量型实例默认不支持预留读/写吞吐,所有的读写访问均按照按量读/写吞吐进行计费。如果使用的容量型实例产生了预留读吞吐费用,请检查您是否使用了多元索引。...

主备方案介绍

主备容灾:当云数据库HBase实例因不可预料的原因(例如设备故障、机房断电断网等)发生故障,容灾机制可用于保障数据的一致性和业务可用性。功能优势 主备双活:请求低毛刺。故障自动容错。资源利用率高。主备容灾:支持云数据库HBase、EMR...

灾备方案介绍

云数据库Redis容灾架构演进 当云数据库Redis实例因不可预料的原因(例如设备故障、机房断电等)发生故障,容灾机制可用于保障数据的一致性和业务可用性。云数据库Redis提供多种灾备方案供您选择,可满足不同的业务场景。图 1.Redis容灾架构...

单实例快速恢复

当出现1分钟容器响应超时(可能是内存溢出、硬件故障、软件Bug等原因导致),Resource Manager会自动拉起新的计算节点,并迁移数据分片(Shard)职责到新的节点上(例如Worker Node3响应超时,Resource Manager拉起Worker Node4取代Worker ...

实例健康诊断

实例健康诊断功能可以对 轻应用服务器 实例的计算服务状态、网络服务、存储服务和配置管理等进行全方位的诊断,帮助您了解实例的健康状态,及时发现并解决常见的问题。前提条件 轻应用服务器...轻应用服务器故障问题,请参见 故障排除。

概览

公网流入 流出流量 公网流入 流出带宽 边界以外 CDN 访问突增、访问突降、访问波动较大、访问持续峰值或响应时间增加 系统负载过高、缓存不足、CDN节点不足;用户访问突增;请求失败后大量请求重试等。边缘网络带宽 每秒访问次数...

测试指标

磁盘吞吐 定义及解释 磁盘吞吐是指在无磁盘故障的情况下单位时间内通过磁盘的数据。简称 Disk Throughput。标准 磁盘指标主要有每秒读写多少兆,磁盘繁忙率,磁盘队列数,平均服务时间,平均等待时间,空间利用率。其中磁盘繁忙率是...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
轻量应用服务器 负载均衡 对象存储 云数据库 Redis 版 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用