主备切换

常见问题 Q:实例故障触发主备切换的原理是什么?A:依赖高可用HA(High Availability)系统的探活机制实现故障检测,具体如下:主要事件 说明 健康检测 HA系统会探测确认主备节点健康状态。主节点异常 发现主节点不可用,会将备节点提升为...

主备切换

常见问题 Q:实例故障触发主备切换的原理是什么?A:依赖高可用HA(High Availability)系统的探活机制实现故障检测,具体如下:主要事件 说明 健康检测 HA系统会探测确认主备节点健康状态。主节点异常 发现主节点不可用,会将备节点提升为...

应用场景

能够解决 多源监控集成:支持常见监控系统集成,简单配置即可完成集成对接。报警统一处理:所有报警进行集中降噪处理,抑制收敛,避免报警风暴。事件闭环管理:对报警生成事件,进行全生命周期管理,不遗漏重大事件。体系化故障闭环...

故障排查

ACK集群异常 添加Kubernetes集群节点的常见问题 容器镜像仓库构建服务失败问题排查 容器镜像服务源码绑定失败问题排查 Kubernetes集群如何指定安全组 Kubernetes集群网络异常的排查方法 更关于容器服务ACK的常见问题,请参见 常见问题旧...

高性能版实例

以下内容为 AnalyticDB PostgreSQL版 实例常见故障场景中高性能版和高可用版的对比:恢复(Recovery)模式 根据以往 AnalyticDB PostgreSQL版 运行情况,故障最大的场景为恢复模式,故障概率远大于另外两种场景(计算节点故障和计算节点宿...

流量控制与配额管理

说明 常见案例说明:请求速率:200/60(s),指每1分钟,最允许请求接口200次。请求速率:5/1(s),指每1秒钟,最允许请求接口5次。申请配额 阿里云为云产品的 OpenAPI 均提供默认的流控额度(Quota),用户可根据自己实际业务场景对额度...

NVMe协议介绍

NVMe共享盘可以帮助应用实现高可用、高并发、可扩展的业务,可以帮助基于传统SAN的业务无缝上云,共享盘常见的应用场景包括数据共享、高可用故障转移、分布式缓存加速、机器模型训练等。数据共享 NVMe最简单的应用场景为数据共享,当数据被...

故障演练常见问题

欢迎您反馈在使用故障演练过程中遇到的问题,目前提供以下常见问题供您参考。单个演练活动成功状态怎么判断?因为一个活动可能会有很目标机器,当所有机器执行完毕之后,如果有机器没有执行成功,那么这个演练活动就会被系统判断为失败。...

什么是数据库备份DBS

常见问题和故障处理 使用DBS时遇到的各类问题,例如需要修改备份源数据库、数据库恢复失败、如何备份RDS只读实例等,您可以在 常见问题 或 常见报错 内查找,可以解决您的绝大部分问题。说明 若在文档中未找到您遇到的异常或报错,或按照...

常见问题

产品定价常见问题 挂载访问FAQ Linux挂载NFS文件系统常见问题 Windows挂载SMB文件系统常见问题 Linux挂载SMB文件系统常见问题 Windows挂载NFS文件系统常见问题 为什么卸载旧NAS并重新挂载新NAS后,容器Pod仍将数据写入旧NAS?更挂载...

功能优势

丰富的故障场景 丰富的故障场景也是 AHAS Chaos 的一大特色,包括了以下场景:常见的基础设施资源例如CPU、内存、磁盘等。应用级别的故障注入,目前只支持 Java 应用,后续将陆续推出对于 NodeJs 和 C++ 的应用故障注入。云原生领域的演练...

常见问题

本文介绍 PolarDB PostgreSQL版(兼容Oracle)的常见问题和解答。基本问题 Q:什么是 PolarDB?A:PolarDB 是一个关系型数据库云服务,目前已在全球十个地域(Region)的数据中心部署,向用户提供开箱即用的在线数据库服务。PolarDB 目前...

恢复MySQL

问题,请参见 数据库备份常见问题。费用说明 恢复功能不收费。注意事项 云备份 的备份速率和恢复速率是在实验室测试环境下的数据,仅供您参考。更信息,请参见 数据库备份及恢复速率。若恢复数据至新MySQL实例上,则需要您提前在 云...

恢复Oracle

问题,请参见 数据库备份常见问题。费用说明 恢复功能不收费。注意事项 云备份 的备份速率和恢复速率是在实验室测试环境下的数据,仅供您参考。更信息,请参见 数据库备份及恢复速率。若恢复数据至新Oracle实例上,则需要您提前在 云...

恢复SQL Server

问题,请参见 数据库备份常见问题。费用说明 恢复功能不收费。注意事项 云备份 的备份速率和恢复速率是在实验室测试环境下的数据,仅供您参考。更信息,请参见 数据库备份及恢复速率。若恢复数据至新SQL Server实例上,则需要您提前...

I-V曲线诊断

数据服务中提供光伏智能运维的IV曲线诊断算法,结合环境光强度、环境温度等影响因素,对组串式光伏发电阵列的电流-电压曲线(I-V曲线)进行分析,检测系统可能出现的故障,进而提高设备的运行效率,保障电站高效运行。本文介绍光伏智能运维...

故障隔离

故障隔离是在服务实例出现故障时,实现实例级别的精细化摘流隔离,使故障影响范围更小,提高服务的可用性。添加故障隔离规则 登录 SOFAStack 控制台。在左侧菜单栏选择 中间件>微服务平台>服务网格>服务治理,然后单击 故障隔离 页签。单击...

应用故障自动诊断

常见故障自动诊断场景 RT突增 下游业务导致的本应用的RT突增,您可以联系下游业务的负责人进行排查。应用变更导致的RT突增,您可以查看此次变更的具体变更进行排查。应用的某个服务导致RT突增,可以排查以下情况:服务是否在此时有发生...

故障排查

本文介绍微服务引擎MSE在使用过程中常见问题的故障分析和排查流程。微服务注册配置中心问题排查 在浏览器中输入 XXX:8848/nacos,访问MSE的Nacos注册中心时返回404错误。具体操作,请参见 通过“XXX:8848/nacos”访问MSE的Nacos注册中心时...

如何管理事件

故障状态:处理中(升级时故障还在处理中),输入发现故障的时间、已恢复(升级时故障已恢复),输入故障生成的时间和故障恢复的时间;所属服务:升级故障所属的 服务;影响服务:选择 影响服务(可选);进展摘要:处理人将事件升级为...

故障演练

常见故障类型都可以映射到这个故障模型中,模拟故障的演练系统及方案也可以基于该模型进行设计。在设计演练方案的过程中,可以考虑在模型中每个环节进行故障注入,验证故障应急方案。不同演练类型和目标 根据演练过程对线上业务的影响,...

GTM如何实现异地容灾

常见问题 故障切换时间是多少?在健康检查间隔设置为15秒,TTL10秒,连续失败次数3次的配置下,GTM能在1分钟左右准确发现故障并切换,故障切换后理论上10秒左右可以全网生效,但实际情况取决于全国各地运营商的缓存设置时间。DNS未使用云...

GTM如何实现同城容灾

概述 方案介绍 同城容灾指应用服务部署是机房、单地域时,当其中一机房出现故障时,全局流量管理(简称GTM)可实现业务7*24小时稳定运行,即使单机房故障也不影响业务的可持续性,保障用户访问连续不间断。本文将以同城双活的灾备架构为...

GTM实现跨网访问加速与故障切换

概述 方案介绍 大部分企业的应用服务都会使用个运营商的IP地址,因此可能会存在跨网延迟、丢包、故障不可用等问题,而全局流量管理产品方案可以根据用户请求源地址的运营商,解析就近的应用服务器IP地址,实现就近接入、访问加速、故障...

故障协同处理(基于钉钉)

2.故障应急场景群:事件升级故障后,群内推出 故障处理中 消息卡片,如果满足自动生成故障场景群的需求(下文详细介绍创建故障场景群逻辑),故障场景群内同时推出 故障处理中 消息卡片。本群故障消息卡片包含按钮:签到、签到记录、应急...

同城常见问题

本文介绍同城活的常见问题以及解决方案。假设数据库主备,ECS双可用区部署,是否就是同城活?和EDAS、MSE集群流量同可用区优先的差异和优势?消息是基于Shutdown机制实现活么?数据库是两个机房各一个主备,还是主机房一主一备,备...

网站耗资源(客户程序故障常见问题

本文汇总了使用云虚拟主机出现网站耗资源(客户程序故障)时的常见问题。什么是网站耗资源(客户程序故障)?网站程序占用CPU及内存过多,是对资源的一种浪费。当您使用普通版共享云虚拟主机建站后,可能会因为网站程序编写不合理、代码...

监控报警概述

实时监控提供终端用户登录云电脑的实时数据(例如用户在线数量、在线时长的前十用户、平均登录时间和云电脑网络延迟分布情况)以及相关故障预警信息,以便快速准确定位,迅速处理故障,避免因资源、网络问题或者外部操作原因造成不必要的...

单节点架构

常见问题 问:单节点架构是否提供高可用?答:不提供。单节点架构只有一个副本,极端情况下如发生故障会造成30分钟左右服务不可用状态,建议您在生产环境中使用副本集架构或分片集群架构。问:单节点实例是否支持增量数据迁移与同步、按...

ack-node-repairer

当Node Problem Detector(简称NPD)组件检测到节点上的故障并生成节点的事件(Event)或者Condition上报给集群时,ACK的自愈系统(ACK Node Repairer)会监听每个节点上的新故障事件,并根据配置对故障节点进行相应的修复操作。...

事件分析概述

微服务领域:微服务在现代开发架构中比较常见,该架构由小型、松耦合、可独立部署的服务集合而成,这导致微服务架构很难调试,系统中某一部分的小故障可能会导致大规模服务崩溃。很时候不得不跳过某些正常服务来调试单个请求。事件总线...

应用场景

简单易用:最终用户可以在任何本地设备上通过⽆影客户端访问各类专业设计应⽤,无需担心应⽤和系统的适配以及故障问题。性能强劲:提供了个高性能的GPU实例规格,可以⽀撑不同类型的设计类应⽤运⾏负载。企业办公数据安全 场景痛点 企业...

应用场景

简单易用:最终用户可以在任何本地设备上通过⽆影客户端访问各类专业设计应⽤,无需担心应⽤和系统的适配以及故障问题。性能强劲:提供了个高性能的GPU实例规格,可以⽀撑不同类型的设计类应⽤运⾏负载。企业办公数据安全 场景痛点 企业...

限流防护

全局限流的典型用例是当个请求端向较少数量的服务端发送请求时,在这种情况下,个客户请求端可能会压垮服务端,而全局限流可以帮助防止级联故障。例如,您可以在入口网关配置全局限流,并控制进入网格的请求总数。一旦这些请求在网格内...

故障管理

故障管理概述 故障管理是源于ITIL的一个概念,在IT企业或者互联网企业进行故障管理的目的是当生产环境出现重大宕机时尽快恢复正常的服务运营,将组件失败对业务所造成的负面影响降到最低,从而确保满足事先与业务客户之间所约定的服务级别...

使用OpenAPI诊断工具进行故障排查

阿里云OpenAPI平台提供使用诊断工具。本文介绍如何使用OpenAPI诊断工具进行故障排查。您可以登录 OpenAPI使用诊断,输入完整的RequestID或SDK报错信息,然后...如果诊断工具仍未能解决您的问题,您可以参考 故障排除、常见问题 获取解决方案。

产品架构介绍

活容灾致力于帮助客户构建活容灾架构。架构上通常将业务系统自上而下分为接入层、应用层和数据层三层。配合产品提供的管控和数据面组件,实现活架构的创建和管控。MSHA产品架构图 控制台 控制台是用户侧控制台入口,提供MSFE、HSF、...

AIOps套件概述

集群诊断 集群诊断提供一键故障诊断能力,辅助您定位集群中出现的问题,包括Pod诊断、节点诊断、Service诊断、Ingress诊断、内存诊断。诊断项 说明 Pod诊断 涵盖了常见的Pod问题,例如Pod启动失败、Pod镜像拉取失败、Pod运行异常等,并在...

计算资源

即使其中一个节点发生故障或异常中断,其他节点仍然可以继续执行剩余的子任务,提高任务的容错性和可靠性。任务重复执行 由于各种原因导致计算任务被次执行的情况,如重复操作、消息重复、调度重复等原因。常见的容错策略如下:去重:...

监控服务概览

OSS监控服务为您提供系统基本运行状态、性能以及计量...故障排除 提供常见的问题场景和故障排除方法。注意事项 OSS Bucket全局唯一,如果删除Bucket之后再创建同名的Bucket,那么被删除的Bucket的监控以及报警规则会应用在新的同名Bucket上。
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
数据库自治服务 边缘网络加速 负载均衡 应用高可用服务 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用