步骤七:故障切换

保护组进入增量复制状态后,您就可以进行故障切换操作。本文介绍故障切换和恢复的基本操作。故障切换类型 数据同步后切换 该故障切换会先停止保护组中被保护的实例,并且等到所有被保护的实例停止后再进行最后一轮数据同步,等待数据同步...

步骤七:故障切换

保护组进入增量复制状态后,您就可以进行故障切换操作。本文介绍故障切换和恢复的基本操作。故障切换类型 数据同步后切换 该故障切换会先停止保护组中被保护的实例,并且等到所有被保护的实例停止后再进行最后一轮数据同步,等待数据同步...

变更发布策略

常见的做法包括基于HTTP Header和Cookie,将特定请求或用户灰度至新版本,降低故障影响范围。金丝雀发布:通过调整流量权重比例,逐步将流量从老版本切换至新版本。同时对老版本服务进行缩容,对新版本进行扩容,相比蓝绿发布资源利用率较...

步骤七:故障切换

保护组进入增量复制状态后,您就可以进行故障切换操作。本文介绍故障切换和恢复的基本操作。故障切换类型 数据同步后切换 该故障切换会先停止保护组中被保护的实例,并且等到所有被保护的实例停止后再进行最后一轮数据同步,等待数据同步...

接入DAS的实例状态概览

无法连接 网络连接异常或目标实例出现故障导致无法连接。监控异常 DAS数据库网关(DBGateway)出现异常,详情请参见 DBGateway常见问题。连接正常 目标实例已正确连接至DAS控制台,您可以使用集群管理、实例监控和告警服务等功能,详情请...

混沌工程缓存实战系列-Redis

因为服务端出现故障更加真实,所以可以从服务端层面去制造故障,但对于问题定位和排查的要求会更高。注入故障,观察指标的变化。缓存监控指标 目前支持的可监控的缓存指标如下:指标 说明 缓存QPS QPS是最通用也是最易观察的指标。缓存命中...

部署高可用及共享存储Web服务

1个公网负载均衡CLB:基于对流量按需分发的能力,可以将流量分发到不同的后端服务器,可消除系统中的单点故障,当某个服务器发生故障时,CLB会自动将请求分配到其他正常的服务器上,从而保证服务的连续性和稳定性。2个文件存储NAS:实现多...

使用云监控功能监控网站环境(部署于ECS实例)

设置进程监控 对于常见的Web应用,设置进程监控,不仅可以实时监控应用进程的运行情况,还有助于排查处理故障。具体操作,请参见 添加进程监控。设置站点监控 在云服务器外层的监控服务,站点监控主要用于模拟真实用户访问情况,实时测试...

诊断网页加载过慢的问题

定位、排查解决这类问题的难点如下:复现困难 假设您的一位用户是A,当A访问某网页时,该页面会加载在A本地的浏览器上。由于页面的加载耗时受地域、网络情况、浏览器或者运营商等因素影响,排查问题时无法复现A在访问页面时的具体情况。...

故障复盘

故障复盘规范 故障复盘作为故障体系中的重要一环,整体复盘流程包括故障处理过程、改进分析、故障定责,基于包含标准化的复盘SOP、对应预防action推荐、问责管理机制,全面地回溯线上故障的发生,产出故障复盘报告和改进措施,避免故障重复...

单节点架构

常见问题 问:单节点架构是否提供高可用?答:不提供。单节点架构只有一个副本,极端情况下如发生故障会造成30分钟左右服务不可用状态,建议您在生产环境中使用副本集架构或分片集群架构。问:单节点实例是否支持增量数据迁移与同步、按...

什么是消息演练

消息演练概述 目前市面上有RocketMQ、Kafka、RabbitMQ等流行的消息中间件服务,消息演练功能将这些常见的中间件进行了统一抽离,为消息服务安排分配了精选后的演练最佳实践。您无需分析每种消息服务需要什么演练场景,仅需选择演练方案即可...

FTP常见问题排查

概述 本文主要介绍使用阿里云ECS实例搭建FTP时,遇到的一些常见问题的处理方法。详细信息 说明 阿里云提醒您:如果您对实例或数据有修改、变更等风险操作,务必注意实例的容灾、容错能力,确保数据安全。如果您对实例(包括但不限于ECS、...

事件分析概述

微服务领域:微服务在现代开发架构中比较常见,该架构由小型、松耦合、可独立部署的服务集合而成,这导致微服务架构很难调试,系统中某一部分的小故障可能会导致大规模服务崩溃。很多时候不得不跳过某些正常服务来调试单个请求。事件总线...

常见问题概览

本文汇总了云数据库MongoDB的常见问题。说明 如果您遇到其他问题,也可查阅 MongoDB错误码汇总 匹配错误信息。兼容性与变配 热点问题 其他常见问题 云数据库MongoDB版和MongoDB有什么关系?云数据库MongoDB版支持哪些数据库版本?云数据库...

OSS文件上传和下载失败的排查方法

在使用OSS SDK上传或下载文件时,如发生报错,请参见 OSS SDK使用中常见问题。OSS文件上传失败 当上传文件失败时,请参见以下操作进行排查处理:检查本地与OSS的网络是否存在异常。若存在网络故障,请使用ping命令测试与OSS的网络连通性,...

AIOps套件概述

集群诊断 集群诊断提供一键故障诊断能力,辅助您定位集群中出现的问题,包括Pod诊断、节点诊断、Service诊断、Ingress诊断、内存诊断。诊断项 说明 Pod诊断 涵盖了常见的Pod问题,例如Pod启动失败、Pod镜像拉取失败、Pod运行异常等,并在...

主备方案介绍

灾备方案 说明 单可用区高可用方案 主备节点部署在同一可用区中的不同机器上,当任一节点发生故障时,由高可用HA(High Availability)系统监控主备节点的健康状态并自动执行故障切换,避免单点故障引起的服务中断。同城容灾方案 主备节点...

产品架构介绍

故障隔离:当局部Provider出现异常时,支持将异常的Provider进行故障隔离,保证所有机房内的Consumer均不会调用到异常的Provider,实现微服务流量的故障逃逸。单元化服务寻址:针对异地多活单元化架构,支持按照单元化规则寻址调用Provider...

常见问题

本文介绍Lindorm SQL使用时的常见问题和解决方案。说明 本文列举的常见问题 仅适用于宽表引擎。什么查询语句是低效查询语句?使用SELECT语句进行查询时,如果WHERE条件中 不包含第一个主键列或第一个索引列,则该查询语句将被认定为低效...

网络资源

网络闪断故障可能由多种原因引起,如网络设备故障、电力波动、通信线路故障等。网络闪断会导致数据传输中断,影响系统和应用程序之间的数据传输,频繁的网络闪断可能导致系统或应用程序无法正常运行。常使用的容错策略如下:设备冗余:使用...

服务发布策略

如果新版本上线后出现严重的问题,那么只需将流量全部切回至旧版本,大大缩短故障恢复的时间。待新版本完成问题修复并重新部署之后,再将旧版本的流量切换到新版本。蓝绿部署通过使用额外的实例资源来解决服务发布期间的不可用问题,当服务...

产品优势

内容安全支持对海量多媒体内容进行快速检测,接入便捷、成本低,且经历大规模实战检验,有效帮助您节省审核费用成本和时效。内容安全具备以下优势:性价比高 相较于人工审核,内容安全基于AI算法的机器审核可以节省90%以上的审核费用成本,...

应用场景

简单易用:最终用户可以在任何本地设备上通过⽆影客户端访问各类专业设计应⽤,无需担心应⽤和系统的适配以及故障问题。性能强劲:提供了多个高性能的GPU实例规格,可以⽀撑不同类型的设计类应⽤运⾏负载。企业办公数据安全 场景痛点 企业...

应用场景

简单易用:最终用户可以在任何本地设备上通过⽆影客户端访问各类专业设计应⽤,无需担心应⽤和系统的适配以及故障问题。性能强劲:提供了多个高性能的GPU实例规格,可以⽀撑不同类型的设计类应⽤运⾏负载。企业办公数据安全 场景痛点 企业...

产品优势

主要优势 多监控系统集成:支持10+常见监控系统集成,简单配置即可快速完成对接;灵活的报警降噪能力:支持横向抑制、纵向收敛,全面压制报警风暴,不再遗漏核心报警;大幅降低事务性操作:完善的事件分派、通知机制,避免重复事务性操作,...

计算资源

即使其中一个节点发生故障或异常中断,其他节点仍然可以继续执行剩余的子任务,提高任务的容错性和可靠性。任务重复执行 由于各种原因导致计算任务被多次执行的情况,如重复操作、消息重复、调度重复等原因。常见的容错策略如下:去重:...

查看监控信息

在进行数据库日常维护或处理数据库故障时,查看数据库相关的性能指标是必不可少的步骤。RDS MySQL的标准监控提供了丰富的性能监控指标,以及强大的诊断能力,能够及时发现数据库的异常并提供相应的治理方案。并且提供了常见数据库问题场景...

支持计划

4.9.2 帮助与文档 阿里云基于云产品及海量客户的支持和服务经验,在官网对客户免费开放产品文档、常见问题知识点及部分视频教程。具体内容,客户可以登录阿里云官网、支持与服务-文档与工具-文档中心频道进行查看。4.9.3 订阅支持 阿里云...

什么是Web应用防火墙

通过防护集群作用,避免单点故障和冗余。防护流量处理性能高。应用场景 WAF适用于阿里云以及阿里云外所有用户,主要用于金融、电商、O2O、互联网+、游戏、政府、保险等行业各类网站的Web应用安全防护。说明 WAF仅支持通过域名方式进行防护...

什么是Web应用防火墙

通过防护集群作用,避免单点故障和冗余。防护流量处理性能高。应用场景 适用于阿里云以及阿里云外所有用户,主要用于金融、电商、O2O、互联网+、游戏、政府、保险等行业各类网站的Web应用安全防护。说明 仅支持通过域名或实例方式接入WAF,...

常见问题

本文为您介绍CLB常见问题。健康检查 健康检查功能产生大量Web日志 四层(TCP/UDP)健康检查出现异常 七层(HTTP/HTTPS)健康检查异常 业务站点访问正常但是健康检查异常 业务日志中出现“Connection reset by peer”的错误 访问SLB实例 ...

跨地域容灾

容灾系统部署在阿里云的两个地域中,当生产站点发生故障(例如海啸、地震)时,业务系统切换到容灾站点。生产站点和容灾站点部署在不同的地域,提供容灾即服务,RPO低至1分钟、RTO低至15分钟的高可靠的业务持续性保障,有效避免了地域性...

DDH常见问题

本文介绍DDH相关的常见问题及解决方案。DDH相关的常见问题及解决方案如下:什么是专有宿主机DDH?DDH有什么优势?在什么场景下需要购买DDH?DDH是裸机产品吗?DDH与弹性裸金属服务器有什么区别?怎么创建和释放DDH?怎么查看每台DDH上有...

同城容灾演练产品概述

常见的名词解释 名词 说明 可用区 可用区(Availability Zone,简称AZ)是指在同一地域内,电力和网络互相独立的物理区域。同一可用区内实例之间的网络延时更小。在同一地域内可用区与可用区之间内网互通,可用区之间能做到故障隔离。是否...

常见问题-FAQ

重要 标准版最快可在4分钟左右准确发现故障并切换 故障发现时间:GTM可保障故障发现时间,目前默认的健康检查配置可以在故障的4分钟左右准确发现故障并切换;全网生效时间:GTM无法保障全网的最终生效时间,因受限于全国各地运营商的TTL...

公共云基础服务说明书

帮助与文档 阿里云基于云产品及海量客户的支持和服务经验,在官网对客户开放产品使用文档、常见问题知识点及部分视频教程。具体内容,客户可以登录阿里云官网、支持与服务-帮助中心 频道进行查看。订阅支持 阿里云针对购买云产品的客户,将...

如何管理故障

更新故障通知:在故障处理的过程中,当故障进展发生变化,包括进度更新、影响恶化、故障等级变化、原因明确、根因定位等场景下,可更新故障过程中的内容,并在 故障详情 页点击更新故障通知,选择需要的故障通告类型,并最终确认发出故障...

集群灰度切换

挂载前提是domain_2机房能扛住2个机房的流量,可以在服务挂载前给domain_2机房扩充查询节点数据副本数 新部署机房预热 假设已有机房domain_1已经正式接流并服务线上,这时需要再部署一个新的机房,那么为了线上查询流量的稳定性,可以做...

故障协同处理(基于钉钉)

2.故障应急场景群:事件升级故障后,群内推出 故障处理中 消息卡片,如果满足自动生成故障场景群的需求(下文详细介绍创建故障场景群逻辑),故障场景群内同时推出 故障处理中 消息卡片。本群故障消息卡片包含按钮:签到、签到记录、应急...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
云数据库 OceanBase 版 数据库自治服务 性能测试 负载均衡 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用