自动或手动主备切换

此外,您还可以手动切换主备实例,应对系统升级、维护或故障排查等情况。前提条件 实例系列为高可用系列或集群系列。说明 集群系列实例只支持自动切换,不支持手动切换。集群系列实例未直接开放手动主备切换功能,如有需求,请联系阿里云...

自治服务(CloudDBA)

实例报告 针对指定时间段的实例运行状况发起诊断,帮助您从性能水位、访问倾斜情况、慢日志等多方面评估实例的健康状况,快速定位实例的异常情况。时延洞察 可以对Redis数据库所有命令以及自定义特殊事件进行时延统计,并给精确到微秒...

网络架构容灾

网络是数字世界的基础设施,没有网络的联通,所有信息都无法交互,因此网络架构的设计在应用系统中至关重要,特别是针对网络架构的高可用及灾能力的设计,是业务在异常发生时,实现快速恢复、降低业务损失的关键。云上网络规划设计 为...

上海博卡:借助云效+ACK实现3分钟快速发布

通过Pod的健康监测和就绪监测,再加上应用暴露一个健康监测接口(比如SpringBoot的Actuator的health)即可简单实现故障自动重启,在应用初期问题较多的时候,或者发生突发问题的时候,自动重启大多数都能立马缓解问题,虽然不能根本解决,...

实例及版本选型

ACM协议 支持 支持 多语言互通 支持 支持 无损迁移 支持 支持 服务及配置推送轨迹 支持 不支持 ZooKeeper 说明 ZooKeeper专业版为保证集群稳定性,限制单个session创建的ephemeral节点个数为2000个,请检查客户端使用情况,以及升级后流...

系统类故障排查

概述 本文主要介绍使用阿里云服务器ECS时的系统类故障排查,包含CPU、磁盘I/O、内存、硬盘、带宽资源占用异常的问题排查与定位。详细信息 说明 阿里云提醒您:如果您对实例或数据有修改、变更等风险操作,务必注意实例的灾、容错能力,...

弹性伸缩常见问题

为了有效排查和解决弹性伸缩服务相关问题,本文为您汇总了使用弹性伸缩服务时遇到的一些常见问题。类别 相关问题 弹性伸缩计费 弹性伸缩收费吗?为什么刚欠费的ECS实例或ECI实例就被全部释放了?停用伸缩组后,ECS实例或ECI实例还收费吗?...

购买企业版实例

高可用(SLA 99.99%):采用多单元部署架构,支持双副本灾,具备故障发生时秒级切换的能力。重要 标准型:华东2(上海)和 华北2(北京)地域支持 标准(SLA 99.95%)和 高可用(SLA 99.99%),且支持购买后将 标准(SLA 99.95%)升级为 ...

性能优化与诊断简介

在RDS MySQL日常运维中,您可以通过数据库自治服务DAS(Database Autonomy Service)来处理数据库故障、优化性能、提升效率、降低运维成本。DAS是一种基于机器学习和专家经验的云服务,实现数据库自感知、自修复、自优化、自运维和自安全,...

K8s应用运维管理最佳实践

以免底层资源不稳定等情况引发业务问题。如需了解更多的集群监控信息,请参见 集群监控。高并发时态 在高并发前,做好应用压测。建议用 性能测试PTS 对应用做全链路压测,根据压测水位提前预估好所需Pod和Node数量,在高并发前完成扩;还...

历史功能发布记录(2022年)

全部 通过容器存储卷可观测性定位客户端IO问题 ESSD云盘在线扩自动完成数据备份 支持ESSD云盘扩时,通过自动快照实现数据备份,因此可防止云盘扩时导致的数据丢失。扩成功,快照会自动删除。扩失败,快照会自动保留24小时后自动...

新用户须知

常见问题解答 1、智能外呼机器人如何收费?智能外呼机器人的收费规则包含两种模式,分别是并发包月及按量付费,具体收费参照 产品定价;并且除机器人费用以外,还需要进行采购号码线路,号码费用单独由号码供应商收取。说明 按量付费模式为...

功能特性

通过数据闪回按时间点恢复数据 高可用 自动和手动执行主备切换 支持自动HA实现故障转移,支持手动执行主备切换(即切换节点角色),便于您进行实时灾演练。手动执行主备切换 重启或重搭代理节点 支持手动重启或重新搭建代理节点,便于您...

基本概念

在保证整体系统稳定的情况下,帮助您尽早发现问题和修复问题。更多信息,请参见 基于ASM完成蓝绿和灰度发布、通过TrafficLabel实现全链路灰度发布 和 在Knative on ASM中基于流量灰度发布服务。蓝绿发布 蓝绿发布提供了一种零宕机的部署...

基本概念

可以通过流量分发扩展应用系统对外的服务能力,通过消除单点故障提升应用系统的可用性。VPC 专有网络 VPC(Virtual Private Cloud)是基于阿里云创建的自定义私有网络。不同的专有网络之间二层逻辑隔离,您可以在自己创建的专有网络内创建...

什么要选择云备份

数据灾备的必要性 数据灾备是企业保护核心数据的重要手段,能有效降低勒索病毒、系统故障、自然灾害和运维事故导致的数据丢失和损坏问题,同时满足行业安全和合规要求。数据面临的风险 企业数据面临勒索病毒、系统故障、自然灾害和运维事故...

DNS最佳实践

DNS是Kubernetes集群中至关重要的基础服务之一,在客户端设置不合理、集群规模较大等情况下DNS容易出现解析超时、解析失败等现象。本文介绍Kubernetes集群中DNS的最佳实践,帮助您避免此类问题。前提条件 创建Kubernetes托管版集群 获取...

DNS最佳实践

DNS是Kubernetes集群中至关重要的基础服务之一,在客户端设置不合理、集群规模较大等情况下DNS容易出现解析超时、解析失败等现象。本文介绍Kubernetes集群中DNS的最佳实践,帮助您避免此类问题。前提条件 创建Kubernetes托管版集群 获取...

什么是弹性伸缩ESS

帮助您全面了解阿里云上资源的使用情况和业务运行状况,并及时对故障资源进行处理,保证业务正常运行。消息服务MNS 是一种高效、可靠、安全、便捷和可弹性扩展的分布式消息服务。能够帮助开发者在应用的分布式组件之间自由地传递数据、通知...

故障管理

故障管理概述 故障管理是源于ITIL的一个概念,在IT企业或者互联网企业进行故障管理的目的是当生产环境出现重大宕机时尽快恢复正常的服务运营,将组件失败对业务所造成的负面影响降到最低,从而确保满足事先与业务客户之间所约定的服务级别...

什么故障

“服务中断、服务品质下降”说明即使用户没有投诉(甚至没有用户使用),但是如企业提供的服务问题,也是故障;“无论什么原因”指无论是企业自身原因,还是第三方如供应商、运营商的原因,只要影响到了用户,就都是故障故障等级 每...

步骤五:应用容灾

说明 在故障切换或者切换恢复点完成,并且已经确认被灾保护的服务器恢复的应用已经接管了业务的情况下,完成故障切换操作是为了清理灾复制在云上占用的资源,节约资源使用。如果检查后发现当前时间点应用状态不符合要求,例如数据库...

号码百科使用FAQ

本文为您介绍使用号码百科服务时的常见问题问题概览 查询准确性如何?返回错误码后重试结果是否一样?unknown是什么意思?未启用、未开卡、挂失,返回什么?功能性停机是什么意思?什么情况会返回操作受限?什么情况会返回运营商限制?...

跨可用区容灾

说明 在故障切换或者切换恢复点完成,并且已经确认被灾保护的服务器恢复的应用已经接管了业务的情况下,完成故障切换操作是为了清理灾复制在云上占用的资源,节约资源使用。如果检查后发现当前时间点应用状态不符合要求,例如数据库...

跨地域容灾

说明 在故障切换或者切换恢复点完成,并且已经确认被灾保护的服务器恢复的应用已经接管了业务的情况下,完成故障切换操作是为了清理灾复制在云上占用的资源,节约资源使用。如果检查后发现当前时间点应用状态不符合要求,例如数据库...

跨地域容灾

说明 在故障切换或者切换恢复点完成,并且已经确认被灾保护的服务器恢复的应用已经接管了业务的情况下,完成故障切换操作是为了清理灾复制在云上占用的资源,节约资源使用。如果检查后发现当前时间点应用状态不符合要求,例如数据库...

跨可用区容灾

说明 在故障切换或者切换恢复点完成,并且已经确认被灾保护的服务器恢复的应用已经接管了业务的情况下,完成故障切换操作是为了清理灾复制在云上占用的资源,节约资源使用。如果检查后发现当前时间点应用状态不符合要求,例如数据库...

步骤七:故障切换

立即切换 该故障恢复会尝试停止保护组中被保护的实例,不会等待所有被保护的实例停止,也不会进行最后一轮数据同步,立即启动切换,会导致数据有部分丢失,主要用在故障容灾的场景。数据同步后切换 正向保护-故障切换 请参考以下步骤进行...

回切至本地VMware

本文主要介绍如何利用阿里云连续复制型灾(CDR)服务,在本地虚拟机出现问题后把云上恢复出来的ECS回切到云下VMware环境中。前提条件 已部署CDR网关。更多信息,请参见 步骤三:部署CDR网关。已在被保护的Windows服务器上安装阿里云复制...

流水单据型业务场景多活实践

多活灾MSHA(Multi-Site High Availability)是在阿⾥巴巴电商业务环境演进出的多活灾架构解决⽅案。本文通过一个电商业务下单链路案例,介绍典型的流水单据型业务场景,如何基于多活灾...相关文档 什么故障演练 为什么需要多活灾?

读多写少型业务场景多活实践

多活灾MSHA(Multi-Site High Availability)是在阿⾥巴巴电商业务环境演进出的多活灾架构解决⽅案。本文通过一个电商业务导购链路案例,介绍典型的读多写少型业务场景,如何基于多活灾...相关文档 什么故障演练 为什么需要多活灾?

运维服务内容说明

运维服务专家定期向客户负责人汇报云上资源运行情况、风险修复情况问题处理进展、费用消耗情况等,并给相应的优化建议。故障应急处理包括故障上报、资源协调、进展通报以及故障报告等服务。重大故障处理,原则上只针对P1级别的故障...

功能特性

自动SQL流 自动SQL优化 自动识别问题SQL,生成索引优化建议,并在不引发锁表的情况下自动创建索引。自动SQL优化 智能压测 确认数据库实例规格是否需要扩,并验证在真实业务场景下的实际效果,降低上线后引发故障的风险。此外,在数据库...

网络资源

灾:建立灾和高可用的系统架构,将系统部署在多个地理位置或数据中心,并使用负载均衡和故障切换技术,以确保即使发生网络分区,系统仍然可以继续提供服务。网络闪断故障 指网络连接在短时间内频繁中断和恢复,造成网络连接不稳定的...

灾备方案

Tair 容灾架构演进 当 Tair 实例因不可预料的原因(例如设备故障、机房断电等)发生故障灾机制可用于保障数据的一致性和业务可用性。Tair 提供多种灾备方案供您选择,可满足不同的业务场景。图 1.Tair 容灾架构演进 灾备方案 灾备级别 ...

关键技术竞争力

TRaaS(Tech Riskdefend as a Service)技术风险防控平台,以蚂蚁内部 SRE 长期实践方法论和内部工具沉淀为依托,解决用户上云和分布式改造过程中所面临的可观测、故障应急、灾、混沌工程、资金安全、压测等运维问题。“人-事件-过程”...

灾备方案介绍

云数据库Redis容灾架构演进 当云数据库Redis实例因不可预料的原因(例如设备故障、机房断电等)发生故障灾机制可用于保障数据的一致性和业务可用性。云数据库Redis提供多种灾备方案供您选择,可满足不同的业务场景。图 1.Redis容灾架构...

分区和文件系统(Linux)

在ECS控制台上扩云盘容量后,对应分区和文件系统并未扩,您还需要进入ECS实例内部继续扩云盘的分区和文件系统,将扩部分的容量划分至已有分区及文件系统内,使云盘扩生效。本文为您介绍如何通过两个步骤完成Linux实例云盘的分区...

概述

为了最大化的提升小版本升级、扩缩容以及故障容灾等场景的实用价值,推出了热备无感秒切的技术。该技术也是 PolarDB 向Serverless演进的一个必要条件。PolarDB 的无感秒切技术从故障探测、切换速度和切换体验三个方面对切换场景进行了优化...

离线同步并发和流之间的关系

在一些数据同步场景,脏数据的出现会导致任务同步效率下降,以关系数据库写为例,默认是执行batch批量写模式,在遇到脏数据时会退化为单条写模式(以找batch批次数据具体哪一条是脏数据,保障正常数据正常写),但单条写效率会...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
号码认证服务 数据库自治服务 云备份 负载均衡 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用