灾备方案

Tair 容灾架构演进 当 Tair 实例因可预料的原因(例如设备故障、机房断电等)发生故障,容灾机制可用于保障数据的一致和业务可用。Tair 提供多种灾备方案供您选择,可满足不同的业务场景。图 1.Tair 容灾架构演进 灾备方案 灾备级别 ...

服务等级协议

2.3 除外情形 因 下述原因导致的服务可用的时长计入服务可用时间:(1)阿里云预先通知用户后进行系统维护所引起的,包括割接、维修、升级和模拟故障演练;(2)任何阿里云所属设备以外的网络、设备故障或配置调整引起的;(3)用户...

灾备方案介绍

云数据库Redis容灾架构演进 当云数据库Redis实例因可预料的原因(例如设备故障、机房断电等)发生故障,容灾机制可用于保障数据的一致和业务可用。云数据库Redis提供多种灾备方案供您选择,可满足不同的业务场景。图 1.Redis容灾架构...

云数据库 OceanBase 版数据传输服务等级协议

2.3 除外情形 赔偿范围包括以下原因所导致的服务可用时间:(1)阿里云预先通知客户后进行系统维护所引起的,包括割接、维修、升级、运维变更和模拟故障演练;(2)由于源端数据库或目标端数据库自身原因导致的;(3)由于源端数据库...

产品服务等级协议

2.3 除外情形 因 下述原因导致的服务可用的时长计入服务可用时间:(1)阿里云预先通知客户后进行系统维护所引起的,包括割接、维修、升级和模拟故障演练;(2)任何阿里云所属设备以外的网络、设备故障或配置调整引起的;(3)任何...

基于Kubernetes容器集群的容灾架构与方案

在进行系统架构设计时,您必须考虑到信息系统和基础设施可能遇到的各种潜在威胁,例如:硬件故障、软件系统崩溃、人为操作失误、安全攻击、自然灾害等。为了确保系统能够在各种异常故障场景下快速恢复并保持业务连续,您必须为系统设计...

邮件推送服务等级协议

2.服务可用 2.1 服务可用计算方式 邮件推送服务可用按服务周期统计,以客户的阿里云账号为维度,根据服务周期内每5分钟错误率之和除以服务周期内5分钟的总个数计算出每5分钟错误率的平均值,从而计算得出服务可用,即:(注:服务...

设置Pod故障处理策略

默认情况下,ECI Pod创建失败后,系统会自动重试尝试创建。如果您希望尽快得到创建结果以便及时处理故障,可以修改Pod故障处理策略。配置说明 在虚拟节点上创建ECI Pod时,可能会因为库存不足等原因导致Pod创建失败,默认情况下,系统会...

网络资源

网络资源需要支持安全的数据传输和通信协议,以保护分布式系统的敏感数据和通信内容的机密和完整。网络资源还需要提供高带宽、低延迟和稳定的网络连接,以确保节点之间的通信和数据传输的效率和可靠。网络资源是流量入口和数据交互的...

MySQL灾备恢复演练

您可以通过该功能验证备份数据的准确与容灾系统的可靠,确保当发生数据灾难时,容灾系统能够顺利接替生产系统并继续对外提供服务。背景信息 通常在灾难发生时,可能由于恢复流程熟练或备份源数据有误等原因导致恢复失败。为避免这种...

跨可用区批量克隆ECS实例

功能介绍 跨可用区克隆实例功能允许用户在不同的可用区之间创建相同的实例,实现以下目标:故障切换:当一个可用区出现异常或故障时,可以将实例迅速克隆到另一个可用区,以确保业务的高可用和持续。负载均衡:为了实现多个可用区之间...

使用ASM构建分布式系统的容错能力

重要 请勿频繁地重试或重试过长时间,避免出现级联的系统故障。解决方案 ASM支持使用虚拟服务定义HTTP请求重试策略。以下示例定义网格中的服务请求httpbin应用时,如果httpbin应用无响应或与httpbin应用建立连接失败,会重新请求httpbin...

使用ASM构建分布式系统的容错能力

重要 请勿频繁地重试或重试过长时间,避免出现级联的系统故障。解决方案 ASM支持使用虚拟服务定义HTTP请求重试策略。以下示例定义网格中的服务请求httpbin应用时,如果httpbin应用无响应或与httpbin应用建立连接失败,会重新请求httpbin...

智能分析-异常根因定位分析利器

开发需要依赖更多的人员和部门,部署模式和运行环境也变得更加动态和不确定。IT行业已经进入需要更加系统化、体系化进行观测的这一过程。可观测概念最早出现于20世纪70年代的电气工程,其核心思想是根据外部输出去推断系统目前运行的状态...

定制和订阅运营报表

如果您第二天在控制台查询仍没有数据,有以下两种原因:您定制的报表与在控制台查询的报表一致。检查是否一致,请参见 定制和订阅运营报表。如果确定不一致,您需要重新定制实际要查询的报表。日志数据存在延迟,建议您过段时间再查询。...

应用场景

由于该新闻网站的业务量波动无规律,访问量突增和回落的具体时间难以预测,所以手动调整实例很难做到及时,而且调整数量也不确定。您可以利用弹性伸缩的报警任务,由阿里云自动根据CPU使用率等衡量指标进行弹性伸缩。示例一:您可以设置...

云盘异步复制容灾常见问题

ECS网络存在以下限制:单网卡限制如下:部分操作系统在切换后能自动配置容灾端网卡。请在故障切换后参考 配置辅助弹性网卡 检查和配置容灾端网卡,确保网络正常工作。多网卡存在限制如下:ECS实例在绑定辅助弹性网卡后,部分镜像无法自动...

创建操作系统迁移任务

导入迁移源信息后,SMC控制台会自动生成迁移源记录,您需要在控制台为迁移源创建操作系统迁移任务,并完成操作系统的迁移。说明 关于操作系统迁移的更多信息,请参见 操作系统迁移(Linux)和 操作系统迁移(Windows)。前提条件 已导入...

主备切换

当 云数据库Redis版 监测到实例的主节点可用时,会自动触发主备切换,将备节点提升为主节点,保障实例的高可用。若您收到短信、邮件、控制台站内信等通知,告知您 Redis 实例已完成主备切换,您可以参考本文了解主备切换的原因、影响和...

主备切换

当 云原生内存数据库 Tair 监测到实例的主节点可用时,会自动触发主备切换,将备节点提升为主节点,保障实例的高可用。若您收到短信、邮件、控制台站内信等通知,告知您 Tair 实例已完成主备切换,您可以参考本文了解主备切换的原因、...

ECS容灾常见问题

操作系统 版本 Windows Server 2008R2、2012、2012R2、2016 Linux 重要 Linux系统的/boot 分区和/分区必须在同一磁盘,若满足同一磁盘要求,建议手动调整磁盘后,再注册受保护实例进行ECS容灾。Red Hat Enterprise Linux 7.0~7.9 Red Hat...

ECS容灾常见问题

操作系统 版本 Windows Server 2008R2、2012、2012R2、2016 Linux 重要 Linux系统的/boot 分区和/分区必须在同一磁盘,若满足同一磁盘要求,建议手动调整磁盘后,再注册受保护实例进行ECS容灾。Red Hat Enterprise Linux 7.0~7.9 Red Hat...

通过快照一致组回滚云盘

当您的系统遇到故障,如硬件或软件问题,或者由于误操作而导致的数据损失或异常时,您可以通过快照一致组回滚一个或多个云盘,将您的云盘数据恢复到误操作发生前的状态,保证数据的持续和业务的连续。本文介绍如何使用快照一致组回...

主从实例读写分离部署(共享存储)

当出现1分钟容器响应超时(可能是内存溢出、硬件故障、软件Bug等原因导致),Resource Manager会自动拉起新的计算节点,并迁移Shard职责到新的节点上(例如Worker Node3响应超时,Resource Manager拉起Worker Node4取代Worker Node3),...

什么是多活容灾

阶段三,可信的量化问题 经过阶段二,“基础设施”和“业务系统”已经初步具备确定性。这时候需要开始关注“保障工具”、“生产制度”、“应急人员”这三个动态因素对整体结果带来的影响。这一阶段可以采用类似攻防对抗、突袭的方式来驱动...

跨地域容灾

容灾系统部署在阿里云的两个地域中,当生产站点发生故障(例如海啸、地震)时,业务系统切换到容灾站点。生产站点和容灾站点部署在不同的地域,提供容灾即服务,分钟级的高可靠的业务持续保障,有效避免了地域灾害导致的系统故障

管理事件订阅(推荐)

通过合并降噪您可以从系统事件和阈值事件的订阅范围对报警进行合并,然后通过条件降噪来控制报警的有效,避免大量重复报警造成报警风暴。对于合并降噪后的有效报警通知,云监控可以直接发送给报警联系人,如果报警在预定时间内未恢复,云...

什么是PolarDB MySQL企业版

Serverless秒级动态弹降,轻松应对不确定的业务波峰波谷场景。超高性能 深度优化数据库内核,同时采用物理复制、RDMA高速网络和分布式共享存储,大幅提高性能,相比开源MySQL性能最大提升6倍。高可用和高可靠保障,数据安全可靠 共享分布式...

产品简介

资源预留 ACS提供资源预留功能,进一步提高资源供应的确定性。资源预留创建成功后,ACS集群Pod会尽量优先抵扣对应的资源预留。更多信息,请参见 资源预留概述。资源配额 资源配额用于指定其他云产品在ACS上资源使用的额度限制,当云产品...

通过IO HANG诊断并排查磁盘繁忙问题

IO HANG诊断的作用 IO HANG诊断可用于检测当前系统中的IO HANG事件并确定问题边界,即是磁盘原因,还是OS原因,为进一步的根因分析给出指导意见。IO HANG诊断的优势 IO HANG诊断的输出信息准确且结果直观,即使您具备内核IO子系统知识也...

可运维咨询服务内容说明

5.服务流程 流程说明:流程 流程说明 完工标准 项目启动 确定项目目标和范围 明确咨询开展计划 召开项目启动会 双方确认《可运维咨询启动报告》调研报告 采用调查表、访谈、工具等方式获取目标应用系统的平台、配置、架构及关联等信息 ...

集群高可用架构推荐配置

高可用(High Availability,HA)是指系统的设计能够确保服务可靠和持续的一种特性。容器服务 Kubernetes 版 基于Kubernetes架构提供了多种集群高可用保障机制,以确保集群控制面、节点与节点池、工作负载、负载均衡等维度的高可用,...

演练场景

故障演练是业务系统上线前必要的演练环节,旨在对应急预案的可行,进一步完成应急预案,从而帮助提升产品、集群、机房的稳定,减少故障的发生,提高故障应急效率,进而提升产品竞争力。一个完整的故障演练过程为 创建故障原子服务>创建...

分配辅助私网IP地址

负载均衡场景:通过为实例分配多个辅助私网IP地址,可以实现负载均衡机制,将流量均匀地分发到多个实例上,提高系统的可伸缩和性能。使用限制 分配辅助私网IP地址存在如下使用限制:安全组限制:专有网络类型安全组可容纳的私网IP地址...

操作系统迁移及升级

当操作系统因生命周期、第三方支持、开源计划演进等原因停止技术支持后,如果您的操作系统后续想得到维护和技术支持,需要将操作系统迁移或升级至稳定的软件版本。本文介绍如何通过ECS控制台迁移或升级操作系统。前提条件 确保阿里云账号...

操作系统迁移及升级

当操作系统因生命周期、第三方支持、开源计划演进等原因停止技术支持后,如果您的操作系统后续想得到维护和技术支持,需要将操作系统迁移或升级至稳定的软件版本。本文介绍如何通过ECS控制台迁移或升级操作系统。前提条件 确保阿里云账号...

可信计算能力概述

UEFI固件可以在引导操作系统启动的过程中,实现对系统固件、系统引导加载程序以及系统内核模块的完整度量,以构建系统启动信任链。启动度量 度量是逐级的,先启动的组件对后一级启动的组件进行度量,度量值验证成功则标志着可信链从前...

附录:SOFAStack 产品目录

只要保证消息格式不变,消息的发送方和接收方并需要直接连接,任何一方的系统故障都不会对其他应用产生影响。分布式事务的数据一致 应用解耦后还需要确保数据的最终一致,利用消息队列事务消息和消息的可靠传递机制,可以在实现系统...

漏洞管理介绍

阿里云漏洞脆弱评分系统在使用CVSS确定漏洞修复优先级和严重的基础上,根据云上实际攻防场景下漏洞严重级别(严重、高、中和低),结合互联网实际披露的漏洞可利用程序状态,以及云安全中心入侵检测数据模型中的黑客利用漏洞的成熟度...

网站耗资源(客户程序故障)常见问题

常见的造成网站耗资源(客户程序故障)现象的原因如下所示:网站程序编写合理,例如ASP程序变量没有清空。网站数据库调用频繁,例如当ACCESS数据库的容量比较大时(超过100 MB以上),性能可能会出现问题。网站访问量过大或者流量过大...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
轻量应用服务器 弹性公网IP 云服务器 ECS 负载均衡 短信服务 人工智能平台 PAI
新人特惠 爆款特惠 最新活动 免费试用