设计方案

容灾演练可以帮助企业更好的验证RPO、RTO指标,及时发现和解决相关问题,提高系统的可用性和可靠性。红蓝攻防 红蓝攻防是在想定情况诱导下进行的作战指挥和行动演练,是部队在完成理论学习和基础训练之后实施的,近似实战的综合性训练,是...

服务管控和治理

故障隔离 某个服务故障或者异常时,如果该服务触发熔断会造成整个服务的不可用。而故障隔离能够定位到异常的服务实例,实现实例级别精细化的隔离和摘流,使故障影响的范围更小、更可控。更多信息,请参见 故障隔离。服务拓扑 实际业务中,...

可用

优势 可用性 采用经典高可用架构,主备之间通过复制(默认半同步)实现数据同步,一旦主库发生故障,将迅速检测并触发主备切换来保证可用性。备库故障对业务无影响,但会快速被检测到并触发备库自愈。可靠性 计算与存储分离,计算节点的...

为RDS创建灾备实例

应用场景 创建RDS灾备实例可以为主实例提供数据备份和灾难恢复保障,当主实例出现故障不可用时,灾备实例将自动接管数据服务,保证业务的连续性和可用性。风险等级 默认风险等级:中风险。当您使用该规则时,可以按照实际需求变更风险...

实时分析链路数据

单机故障不会造成服务大面积不可用,但是会造成少量的用户请求失败或超时,持续影响用户体验和答疑成本,需要及时处理。单机故障可以分为宿主机故障和容器故障两类(在Kubernetes环境可以分为Node和Pod)。例如CPU超卖、硬件故障等都是宿...

读多写少型业务场景多活实践

导购链路对商品应用是强依赖,强依赖故障将导致业务不可用,因此故障的爆炸半径应该控制在单元内。创建故障演练。创建杭州单元商品中心故障的演练,具体操作,请参见 创建演练。故障注入。在多活容灾的 监控大盘 页面 异地双活 区域,查看...

服务治理概述

部署和运维 EDAS多语言互通 查询多语言应用服务 为多语言应用配置故障注入 安全和可用性 使用服务鉴权实现多语言应用的访问控制 使用离群实例摘除保障多语言应用的可用性.aliware-toc-container.list-item{ white-space:normal;}

数据安全

表格存储支持同城冗余功能,可实现多可用区数据容灾,确保数据的高可用性和容灾能力。表格存储支持通过云备份服务对重要数据进行备份,可防止数据误删除或者数据恶意篡改。表格存储支持使用V4签名算法实现对用户密钥的保护,降低用户密钥的...

Pod诊断

ClusterComponent 检查集群常见问题,检查项包括API Service可用性、DNS可用性、NAT网关状态等。Pod 检查项名称 检查项说明 修复方案 Pod容器重启次数统计 统计Pod中容器重启次数。请检查Pod状态及日志。更多信息,请参见 Pod异常问题排查...

Pod诊断

ClusterComponent 检查集群常见问题,检查项包括API Service可用性、DNS可用性、NAT网关状态等。Pod 检查项名称 检查项说明 修复方案 Pod容器重启次数统计 统计Pod中容器重启次数。请检查Pod状态及日志。更多信息,请参见 Pod异常问题排查...

同城冗余

通过创建使用同城冗余的实例存储数据,即使当由于断网、断电或者灾难事件导致某个机房不可用时,表格存储 仍能继续提供强一致性的服务。同城冗余功能确保了数据的高可用性和容灾能力。冗余类型 表格存储 提供了本地冗余和同城冗余两种冗余...

Pod诊断

ClusterComponent 检查集群常见问题,检查项包括API Service可用性、DNS可用性、NAT网关状态等。ECSControllerManager 检查ECS实例常见问题,检查项包括ECS实例状态、网络链路、操作系统、磁盘IO等。Pod 检查项名称 检查项说明 修复方案 ...

自动切换可用

概述 PolarDB 开启跨可用区自动切换后,当主可用区故障(例如,主可用区所有计算节点同时故障)时,集群会自动进行主备可用区切换,备可用区中的备库升级为新的主库,恢复集群的可用性。同时,PolarDB 还提供了半同步模式来进行跨可用区的...

什么是云拨测

云拨测(Synthetics Monitor)通过部署在全球各地的监测点,模拟真实用户从全球不同地区不同网络条件访问在线服务,持续对网络质量、网站性能、文件传输等场景进行可用性监测和性能监测。您可以通过可视化大盘查看监测数据,并对数据进行多...

多可用区架构最佳实践

阿里云中不同可用区的可用性完全独立并且相互影响。使用多可用区的业务架构,数据可靠性更高,当主可用区故障时能快速恢复业务。此合规包可以帮助您检测未使用多可用区架构的云资源。应用场景 多可用区架构最佳实践应用于对服务连续性和...

使用OpenAPI诊断工具进行故障排查

阿里云OpenAPI平台提供使用诊断工具。本文介绍如何使用OpenAPI诊断工具进行故障排查。您可以登录 OpenAPI使用诊断,输入完整的RequestID或SDK报错信息,然后...如果诊断工具仍未能解决您的问题,您可以参考 故障排除、常见问题 获取解决方案。

启用可用性监控任务

当您需要继续探测资源的本地或远程指定路径和端口时,可以重新启用应用分组中的可用性监控任务。前提条件 请您确保可用性监控任务的 监控状态 为 禁用。操作步骤 登录 云监控控制台。在左侧导航栏,选择 云资源监控>应用分组。在 应用分组 ...

连接保持

PolarDB 新增支持连接保持功能,避免由于一些运维操作(如升级配置、主备切换或升级小版本等)或非运维操作故障(如节点所在服务器故障)导致的连接闪断或新建连接短暂失败的问题,进一步提高 PolarDB 的高可用性。前提条件 PolarDB 数据库...

删除可用性监控任务

当您不再需要应用分组中的某条可用性监控任务时,可以对其执行删除操作。操作步骤 登录 云监控控制台。在左侧导航栏,选择 云资源监控>应用分组。在 应用分组 页签,单击目标应用分组名称链接。在目标应用分组的左侧导航栏,单击 可用性...

部署和使用跨可用区实例

在索引配置了副本的情况下,当某一可用区出现故障时,剩余的可用区依然可以间断地提供服务,显著增强了集群的可用性。同时,您可以通过控制台的切流操作,将出现故障的可用区隔离,这时系统会自动在剩余的可用区中补充计算资源,满足业务...

增强ASM网关高可用性

ASM网关作为业务的流量入口,为了避免服务不可用,增强ASM网关的高可用性非常重要。本文介绍如何增强ASM网关的高可用性。前提条件 已创建ASM实例。具体操作,请参见 创建ASM实例。已创建ACK或 ACK Serverless集群。具体操作,请参见 创建...

增强ASM网关高可用性

ASM网关作为业务的流量入口,为了避免服务不可用,增强ASM网关的高可用性非常重要。本文介绍如何增强ASM网关的高可用性。前提条件 已创建ASM实例。具体操作,请参见 创建ASM实例。已创建ACK或 ACK Serverless集群。具体操作,请参见 创建...

什么是故障演练

适用场景 故障演练可适用于以下典型场景:衡量微服务的容错能力 通过模拟调用延迟、服务不可用、机器资源满载等,查看发生故障的节点或实例是否被自动隔离、下线,流量调度是否正确,预案是否有效,同时观察系统整体的QPS或RT是否受影响。...

阿里云工业大脑服务等级协议

2 服务可用性 2.1 服务可用性计算公式 服务可用性以单个工业大脑产品为维度,按照如下方式计算:服务可用性=((服务周期总分钟数-服务不可用时段次数*5)/服务周期总分钟数)×100%2.2 服务可用性承诺 工业大脑产品服务可用性不低于99.9%,...

服务等级说明

2.3 除外情形 因下述原因导致的服务不可用的时长不计入服务不可用时间:(1)阿里云预先通知客户后进行系统维护所引起的,包括割接、维修、升级和模拟故障演练;(2)任何阿里云所属设备以外的网络、设备故障或配置调整引起的;(3)客户的...

概述

当主实例出现计划内或计划外(多数派副本故障)的不可用情况时,备实例可以接管服务,并且提供无损切换(RPO=0)和有损切换(RPO>0)两种容灾能力,最大限度降低服务的停机时间。详情参见 切换为主实例。主备实例均可提供读服务,只有主...

SLA服务等级协议

2.3 除外情形 因下述原因导致的服务不可用的时长不计入服务不可用时间:(1)阿里云预先通知客户后进行系统维护所引起的,包括割接、维修、升级和模拟故障演练;(2)任何阿里云所属设备以外的网络、设备故障或配置调整引起的;(3)客户的...

产品服务等级协议

2.服务可用性 2.1 服务可用性计算公式 服务可用性以单个实例为维度,按照如下方式计算:服务可用性=(服务周期总分钟数-服务可用分钟数)/服务周期总分钟数╳100%2.2 服务可用性承诺 数据资源平台服务可用性不低于99.95%,如数据资源平台...

主从(备)切换

MyBase MySQL 实例支持主从(备)切换,当主实例不可用时,备(从)实例会切换为新的主实例,保障实例的高可用性。此外,您还可以手动切换主从(备)实例。背景信息 自动切换:高可用版实例默认开启自动切换,当主实例出现故障无法访问时,...

Dataphin智能数据建设与治理服务等级协议(半托管)

2.服务可用性 2.1 服务可用性计算公式 服务可用性以单个实例为维度,按照如下方式计算:服务可用性=(服务周期总分钟数-服务可用分钟数)/服务周期总分钟数╳100%2.2 服务可用性承诺 Dataphin服务可用性不低于99.50%,如Dataphin未达到...

地址标准化服务等级协议

2.3除外情形 因下述原因导致的服务不可用的时长不计入服务不可用时间:(1)阿里云预先通知客户后进行系统维护所引起的,包括割接、维修、升级和模拟故障演练;(2)任何阿里云所属设备以外的网络、设备故障或配置调整引起的;(3)客户的...

服务等级协议

2.服务可用性 2.1 服务可用性计算公式 运维事件中心服务可用性按服务周期统计,服务可用性将根据服务周期内每5分钟错误率之和除以服务周期内5分钟的总个数计算出每5分钟错误率的平均值,从而计算得出服务可用性,即:服务可用性=(1-服务...

服务协议

赔偿范围不包括以下原因所导致的请求失败或服务不可用:(1)阿里云预先通知客户后进行系统维护所引起的,包括割接、维修、升级和模拟故障演练;(2)任何阿里云所属设备以外的网络、设备故障或配置调整引起的;(3)客户的应用程序受到...

服务等级协议

本服务等级协议(Service Level Agreement,以下简称“SLA”)规定了阿里云向客户提供的基因分析平台(简称“平台”)的服务可用性等级指标及补偿方案。1.定 义 1.1 服务周期:一个服务周期为一个自然月。1.2 服务周期总分钟数:服务周期内...

企业邮箱服务等级协议

版本生效日期:2018年2月1日 本服务等级协议(Service Level Agreement,简称“SLA”)规定了阿里云向客户提供的企业邮箱标准版/集团版/尊享版(简称“企业邮箱”)的服务可用性等级指标及赔偿方案。特别提示您本服务等级协议仅适用于企业...

可观测的设计原则

通过在系统中实现分布式跟踪,可以快速定位问题并进行有效的故障排除。链路跟踪可以通过在系统中添加跟踪标识符来实现。当请求进入系统时,标识符将被添加到请求中,并在整个系统中传递。每个组件都可以将标识符添加到它们的日志中,以便在...

自动或手动主备切换

当主实例发生故障不可用时(例如操作系统错误、硬件故障等),系统会自动触发主备切换,主实例和备实例将进行互换,切换后实例地址保持不变,应用程序会自动连接到新的主实例(原备实例),从而保障业务的连续性和高可用性。此外,您还...

修改可用性检测方式

阿里云通过短连接或长连接的方式对您的MyBase实例做可用性检测,以判断实例的健康状况。默认使用长连接。前提条件 已创建MyBase MySQL高可用版实例。具体操作,请参见 创建MyBase MySQL实例。操作步骤 登录 云数据库专属集群控制台。在页面...

自动或手动主备切换

当主实例不可用时,会自动触发主备切换,将主实例和备实例进行互换,切换后实例地址保持不变,应用自动连接到新的主实例(原备实例),从而保障实例的高可用性。此外,您还可以手动切换主备实例。前提条件 实例为高可用系列实例。说明 基础...

管理项目空间

跨可用区具有更高的可用性和同城容灾能力,当单个可用区故障,Flink作业能够在另外一个可用区内正常运行,从而有效确保作业的持续性和高可用性。同城高可用功能详情请参见 同城高可用。资源分配 单个项目空间至少需要1CU。单击 确定。进入...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
轻量应用服务器 负载均衡 弹性公网IP 云服务器 ECS 短信服务 人工智能平台 PAI
新人特惠 爆款特惠 最新活动 免费试用