服务等级目标SLO概述

多窗口能够在计算一段时间的故障率时同时设置一个短时间窗口,当短时间窗口内的故障率低于阈值时结束告警。设置短时间窗口可以保障故障处理后,及时解除告警。以设置30天的SLO为例:当1小时内错误预算消耗2%(即该小时内错误率高于阈值的14...

服务等级目标SLO概述

多窗口能够在计算一段时间的故障率时同时设置一个短时间窗口,当短时间窗口内的故障率低于阈值时结束告警。设置短时间窗口可以保障故障处理后,及时解除告警。以设置30天的SLO为例:当1小时内错误预算消耗2%(即该小时内错误率高于阈值的14...

实例健康诊断

实例健康诊断功能可以对 轻量应用服务器 实例的计算服务状态、网络服务、存储服务和配置管理等进行全方位的诊断,帮助您了解实例的健康状态,及时发现并解决常见的问题。前提条件 轻量应用服务器...轻量应用服务器故障问题,请参见 故障排除。

云盒故障服务器维修流程

本文介绍当云盒内的服务器出现故障时,阿里云如何进行更换和维修,保证数据安全。背景信息 当云盒内的服务器出现故障,需要更换和维修时,出于客户成本考虑,云盒内没有部署数据擦除服务,阿里云不在客户现场进行数据擦除。重要 在您购买...

ECS灾备解决方案

为了保障企业业务稳定、IT系统功能正常以及数据安全,灾备解决方案变得越来越重要,并且正在迅速...即使其中一台ECS服务器故障或资源利用超负荷,服务仍然可以持续对外提供,从而保障业务的连续性和可用性。更多信息,请参见 部署高可用架构。

部署高可用及共享存储Web服务

sudo chmod+x/etc/systemd/system/sync_nas.sh sudo chmod+x/etc/systemd/system/sync_check_switch.sh 配置上述脚本的开机自动启动,确保服务器故障恢复后,NAS可用性检测及容灾切换服务可以正常执行。创建 sync-check-switch.service ...

CentOS系统时区错误的排查思路

概述 本文主要介绍CentOS系统时区错误的排查思路。详细信息 CentOS系统时区错误,显示为UTC时区,以下为...将正常服务器/usr/share/zoneinfo/Asia/Shanghai 文件拷贝到故障服务器后,执行 date 命令,确认时区恢复正常。适用于 云服务器ECS

解析设置类常见问题总结

服务器故障时,如何通过智能DNS实现将用户请求流量切换到正常的服务器上?答:智能解析不支持摘除故障IP和自动切换的功能。如果您需要实现此效果,建议您参阅 什么是全局流量管理?产品操作手册。如何通过API来添加解析记录?答:云解析...

响应云盒维修事件

具体维修流程,请参见 云盒故障服务器维修流程。操作步骤 当您收到云盒维修事件通知时,可以在控制台授权阿里云上门更换硬件设备。打开 云盒列表页。单击目标云盒ID。在云盒详情页,单击 监控 页签。在页面下方,单击 云盒维修 页签。找到...

SLA服务等级协议

(2)因客服工作台故障导致的正常请求未能到达客服工作台服务器端的请求(通过故障前7天内使用客服工作台的域名的平均请求数计算)。1.4有效的总请求:客户某一阿里云账号下客服工作台服务器端接收到的所有请求视为有效的总请求。1.5每5...

API网关流量安全

API网关后端服务器错误过高告警 告警ID sls_app_audit_dataflow_at_api_err_rate 告警名称 API网关后端服务器错误过高告警 版本号 1 类别 云平台、阿里云、流量安全、API网关流量安全 作用 监控API网关中API请求的后端服务器错误。...

服务等级协议

1.5 每5分钟错误:根据区域的不同 以每5分钟为单位按照如下方式计算:每5分钟错误=每5分钟失败请求数/每5分钟有效总请求数x100%注:当出现平台服务故障而无法获取失败请求数时,将通过计算前7个自然日用户每分钟请求数的平均值,用该...

GPU计算

主售(推荐类型)GPU计算型实例规格族gn7e GPU计算型实例规格族gn7i GPU计算型实例规格族gn7s GPU计算型实例规格族gn7 GPU计算型实例规格族gn7r GPU计算型实例规格族gn6i GPU计算型实例规格族gn6e GPU计算型实例规格族gn6v GPU计算型弹性裸...

混沌工程缓存实战系列-Redis

雪崩:当缓存服务器重启或者大量缓存集中在某一个时间段失效,这样在失效的时候,也会给后端系统(例如数据库)带来很大压力。缓存RT 缓存响应时间。缓存RT对业务的影响分成多个方面。如果RT变化较少,对于业务访问缓存很少次数的情况下...

PAI灵骏智服务概述

PAI灵骏 是一种大规模高密度计算服务,全称“PAI灵骏智服务”,提供高性能AI训练、高性能计算所需的异构计算算力服务。PAI灵骏 主要面向图形图像识别、自然语言处理、搜索广告推荐、通用大模型等大规模分布式的AI研发场景,适用于自动...

新功能发布记录

2023-08-02 部分 实例规格族 2023年07月 功能名称 功能概述 发布时间 发布地域 相关文档 实例规格族 发布GPU计算型弹性裸金属服务器实例规格族ebmgn7ix。2023-07-05 部分 实例规格族 2023年05月 功能名称 功能概述 发布时间 发布地域 相关...

故障隔离

最大隔 离数量 设置服务器的隔离数量,即多台服务器故障时最多隔离几台。取值≥0。流量精确匹配(可选)符合流量精确匹配的流量才进行隔离。可配置多条匹配规则,各匹配规则之间是与的关系。参数配置如下:字段:选择 系统字段。字段名:...

设计原则

数据容灾是指在数据中心或服务器发生故障、灾难或意外情况时,能够保证数据的安全性和可用性的一系列措施和策略。数据容灾的目标是确保在不可避免的情况下,数据的完整性、可恢复性和可用性不受到严重影响,以保障业务的持续运行和数据的...

轻量应用负载均衡概述

当其中一部分轻量应用服务器发生故障后,负载均衡会自动屏蔽故障的轻量应用服务器,将请求分发给正常运行的轻量应用服务器,保证应用程序仍能正常工作。弹性管理应用程序的服务能力。您可以根据业务发展的需要,自行添加或移除轻量应用负载...

健康检查

为确保ALB后端服务器的业务可用性,您可以通过为ALB服务器组配置健康检查来检查服务器组的运行状况,以避免后端服务器异常对业务的影响,并提升业务可靠性。本文为您介绍如何创建、编辑和删除健康检查等操作。背景信息 ALB 支持基于每个...

什么是MX解析?

当您的域名解析记录中存在多条MX记录的时候,邮件发送方的服务器会优先把邮件投递到MX优先级最高的服务器,当此服务器出现故障无法接收邮件的时候,发送方的服务器会自动选择下一个优先级最高的服务器,直到邮件投递成功,或者所有服务器都...

步骤五:应用容灾

当被保护的服务器完成阿里云复制服务(AReS)安装并重启后,您就可以对受保护的服务器启动、停止容灾复制、故障切换、容灾演练等一系列的应用容灾操作。前提条件 已安装阿里云复制服务。更多信息,请参见 步骤四:安装阿里云复制服务。操作...

配置负载均衡实例

创建负载均衡实例后,您需要对负载均衡实例进行配置才能进行流量转发,您需要添加至少一个监听和一组后端服务器。本指南指引您配置一个TCP监听并添加部署了静态网页...这表明在单台后端服务器出现故障时,负载均衡仍然能够保证业务的可用性。

服务器迁移至轻量应用服务器

服务器迁移中心支持将其他厂商轻量服务器(腾讯云轻量应用服务器、AWS Lightsail Instance和华为云云耀云服务器)、IDC服务器、虚拟机和其他云平台的云主机迁移至阿里云轻量应用服务器。本文介绍如何将其他厂商轻量服务器迁移至轻量应用...

服务器迁移至轻量应用服务器

服务器迁移中心 支持将其他厂商轻量服务器(腾讯云轻量应用服务器、AWS Lightsail Instance和华为云云耀云服务器)迁移至阿里云 轻量应用服务器。本文介绍如何将其他厂商轻量服务器迁移至轻量应用服务器。前提条件 已导入迁移源信息。您...

创建和管理服务器

在使用 网络型负载均衡NLB(Network Load Balancer)服务前,您必须创建服务器组并至少添加一台后端服务器来接收 NLB 转发的客户端请求。默认情况下,NLB 使用您为服务器组指定的端口和协议将请求发送到对应的后端服务器。本文为您介绍如何...

如何处理健康检查导致的大量日志

方案风险说明 延长健康检查的间隔时间后,后端ECS实例出现故障时,负载均衡发现故障ECS实例的时间也会变长。操作步骤 登录 传统型负载均衡CLB控制台。在 实例管理 页面中找到相应的CLB实例,单击实例ID。在 监听 页签下,找到目标监听,在 ...

移动推送到达能达到多少

但是,实际的推送到达,会受到很多因素影响的,例如:第三方推送服务器故障,导致 mPaaS 向其推送信息的失败。第三方推送服务器与设备端的问题,导致信息未能成功送达。推送服务器与互联网间的通讯问题,导致信息未能成功送达。用户...

创建和管理服务器

在使用应用型负载均衡ALB服务前,您必须创建服务器组并至少添加一台后端服务器来接收ALB转发的客户端请求。默认情况下,ALB使用您为服务器组指定的端口和协议将请求发送到对应的后端服务器。前提条件 在向服务器组添加云服务器ECS(Elastic...

配置远程鉴权

如果您有自己的鉴权服务器,可以通过配置远程鉴权,将用户请求转发至您指定的鉴权服务器,由鉴权服务器对用户请求进行校验。功能介绍 远程鉴权和URL鉴权的作用一样,都用于保护资源,让资源只被授权成功的用户访问,非授权用户将无法访问。...

产品高可用

最佳实践:会话同步可以保证长连接不受集群内服务器故障的影响,但是对于短连接或连接未触发会话同步规则时(未完成三次握手),集群内的服务器故障仍可能会影响用户请求。为了防止集群中某台机器故障导致的会话中断,您可以在业务逻辑中...

Windows实例网络访问丢包延时高的排查方法

如果服务器有回应就会传送回封包,并附带返回封包来回的时间 tracert 返回从用户的电脑到指定的服务器中间经过的所有节点(路由)以及每个节点的回应速度。WinMTR是mtr工具在Windows环境下的图形化实现,适合Windows下做路由追踪及ping测试...

如何通过 mPaaS 框架解决 App 线上问题

如果真的在线上发生故障,开发者就可以通过服务器推送开关,及时将故障代码关闭。这种推拉结合的方式,即时到达 100%。发布 H5 离线包更新如果某些故障是发生在离线包内,在定位到问题后,可以直接通过实时发布控制台发布新的版本即可。...

拉高服务器内存占用

若需要测试应用在内存占用高的情况下是否能正常运行,您可以通过 PelicanDT 轻松地模拟服务器内存占用高的测试环境。本文将介绍使用 PelicanDT 拉高服务器内存占用的方法。前提条件 您已安装 PelicanDT SDK,请参见 安装 PelicanDT ...

网络资源

DNS服务异常可能由多种原因引起,如DNS服务器故障、网络连接问题、配置错误等。DNS服务异常可能会造成域名解析失败,导致无法外部服务调用等,或导致服务不可用。常使用的容错策略如下:DNS缓存:在客户端或本地网络环境中设置DNS缓存,将...

拉高服务器 CPU 占用

若您需要测试应用在 CPU 占用高的情况下是否能正常运行,通过 PelicanDT 可轻松地模拟服务器 CPU 占用高的测试环境。本文将介绍使用 PelicanDT 拉高服务器 CPU 占用的方法。前提条件 您已安装 PelicanDT SDK,请参见 安装 PelicanDT ...

概览

使用云监控的Dashboard,您不仅能够查看服务概览,还可以查看监控细节,并排查故障。展示多个实例的监控数据走势 例如:您的一个应用部署在多台ECS实例上,可以将部署了相同应用的多台ECS实例监控信息添加在同一张监控图表中,查看相关多台...

远程连接FAQ

检查服务器的负载是否过高 轻量应用服务器的带宽和CPU使用过高,可能会导致服务器无法远程登录。如果是带宽或CPU占用过高导致的无法登录,请参考以下操作:关闭暂时不使用的进程后再尝试。尝试重启轻量应用服务器。重置系统,重置前请...

访问控制常见问题

配置限制访问CDN资源的用户时,如果遇到疑问请参考以下常见问题及处理建议。...远程鉴权服务器发生故障或宕机时,CDN与鉴权服务器之间的数据交互超时后,按照设置的 鉴权超时之后的动作 参数,选择是否放行鉴权超时的用户请求。

故障基础数据管理

在定义故障等级的时候,需要从功能等级、业务体量、业务特性、量化影响4个维度进行设计,一个简要的通用故障等级定义参考模板如下:业务量级 功能分类 影响面 P1 P2 P3 P4 大体量 核心功能 成功下跌30%及以上 P1 成功下跌20%~30%P2 ...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
轻量应用服务器 云服务器 ECS 负载均衡 Web应用防火墙 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用