产品系列概述

高可用系列 一主一备的高可用架构,支持自动故障切换。备节点不可访问。支持增加 只读实例 扩展读能力。大中型企业的生产数据库。互联网、物联网、零售电商、物流、游戏等行业的数据库。集群系列 一主多备的高可用架构,支持自动故障切换。...

健康检查

2.需要对地址池里的IP地址配置健康检查,以获取应用服务的可用性,从而达到根据应用服务地址可用性的状态实现自动故障隔离以及故障自动切换。以下是每个设置项的名词定义。检查协议:支持 健康检查(ping)/健康检查(TCP)/HTTP(S)health ...

NAT网关故障排查指南

本文介绍NAT网关的常见故障及排查方案。流量不通类故障排查:ECS实例配置DNAT条目后无法被公网访问 VPC内新建交换机的ECS无法通过SNAT访问公网 VPC内存在多个NAT网关时,某交换机的ECS实例不能访问公网 访问流量异常类故障排查:客户端访问...

自动故障剔除

自动故障剔除功能会自动监控 RPC...com.alipay.sofa.rpc.aft.regulation.effective false 全局开关:如果应用打开了这个开关,则会开启整个单点故障自动剔除功能,否则该功能不启用。说明 每个参数都有默认值,您可以根据需要自行修改参数值。...

功能概述

访问策略 访问策略包括DNS智能解析、默认地址池/备用地址池、生效地址池切换策略等相关信息,一个GTM实例可以创建多个访问策略,可为不同网络或区域来源的访问用户设置不同的解析响应地址池,并最终实现用户就近访问接入和故障自动切换的...

自动故障转移和读写分离

使用PostgreSQL的libpq或JDBC,您可以通过简单的配置实现自动故障转移(failover)和读写分离。背景信息 从PostgreSQL 10开始,libpq驱动层开始支持简单的故障转移,JDBC驱动层则支持简单的故障转移和负载均衡。libpq是PostgreSQL的C应用...

容灾恢复

集群中通常一个服务有多个服务提供者,其中部分服务提供者可能由于网络、配置、长时间 fullgc、线程池满、硬件故障等导致长连接还存活但是程序已经无法正常响应。单机故障剔除功能会将这部分异常的服务提供者进行降级,使客户端的请求更多...

云解析DNS如何实现故障切换

本文介绍如何通过DNS实现故障隔离或故障切换。使用场景 企业的线上网站或应用,一般是使用公网权威解析产品设置智能解析,来提升用户跨运营商(或地区)的访问速度和访问质量。例如域名 dns-example.com 的智能解析配置如下:记录类型 主机...

高可用和容灾设计

可通过集群可读地址访问备节点,在发生故障切换时,RDS的高可用系统会自动执行以下三个步骤:将一个备节点提升为主节点,该备节点从集群可读地址中移除,同时清除该备节点上的可读连接,此时集群可读地址会发生闪断。故障主节点从集群读写...

搭建高可用架构

MySQL:RDS MySQL集群版实例采用计算与存储分离、一主多备的架构,支持自动故障切换、任意备节点可切换为主节点、备节点可读、按需增删节点、多可用区容灾、节点粒度的监控、集群节点拓扑管理等功能,同时还可启用MGR保障RPO=0,相比自建...

常见问题-FAQ

GTM是集成了DNS的智能解析功能、云监控的应用服务监控功能,为客户输出不同网络或地区用户访问实现就近接入、应用服务运行状态的健康检查、故障自动切换等能力。全局流量管理(GTM)的CNAME接入域名是否能直接通过URL访问?答:不可以使用 ...

FAQs

GTM是集成了DNS的智能解析功能、云监控的应用服务监控功能,为客户输出不同网络或地区用户访问实现就近接入、应用服务运行状态的健康检查、故障自动切换等能力。GTM 是现有云解析DNS中全局负载均衡(GSLB)的升级和替代产品,GTM比GSLB支持...

DT-MPC v3.1

DT-MPC是一款先进的控制组件,可以实现以下功能:多变量系统的自动控制 解决流程行业内多变量系统协同控制这一难题而开发的一款安全便捷高效的智能控制组件。其运用先进控制技术,通过系统操控变量(MV)和被控变量(CV)之间的模型关系,...

自动优化

Auto Optimize需要在创建表时,显式指定:优化表的写入过程:该特性由表属性 delta.autoOptimize.optimizeWrite 控制 自动执行小文件合并:该特性由表属性 delta.autoOptimize.autoCompact 控制 创建表时指定:%sql CREATE TABLE student...

ADP底座介绍

常见故障场景自动诊断:内置长期经验沉淀的运维知识库,自动识别常见故障问题,并提供故障处置建议。自动化巡检和告警通知:内置基础告警策略并可灵活配置,可对接多种告警通知方式,定期巡检,及时感知问题。业务数据的存储备份及还原:...

设计方案

基于稳定性支柱设计原则,整体稳定性设计方案可参考如下:架构设计原则 软件系统从...相比较计划演练,突袭演练涉及到的人员,场景,流程也会更加复杂,同时不但确保演练计划的私密性,还需要充分评估在红军未及时处理故障时的影响面控制

演练概述

基于阿里巴巴多年业务的真实线上故障库的积累,AHAS故障演练模块为您预定义了丰富的测试任务...当故障演练自动结束、您主动终止或者演练中的任何环节出现异常后,系统都会进入恢复阶段,自动清除相应的故障,使故障演练对象恢复演练前的状态。

新手指引

模块问题 计费常见问题 数据库常见问题 流量统计常见问题 网站管理常见问题 管理控制常见问题 网站耗资源(客户程序故障常见问题 更多常见问题,请参见 常见问题和故障排除汇总。反馈与建议 在使用阿里云云虚拟主机时,如果有任何疑问...

服务支持

NLP自然语言处理 常见问题 调用异常自助排查(错误码汇总)服务协议 NLP自学习平台 常见问题 实体抽取项目常见问题 故障排除 私有化部署 企业智能搜索 错误码对照表 常见问题

故障演练

ADP提供基于线下交付经验设计的丰富故障演练场景,对基础设施、底座、中间件的常见故障场景进行覆盖,涵盖了集群级别的大规模故障以及节点、pod级别的资源故障。部分演练场景为破坏性场景(如机器重启、网卡损坏),可能导致环境状态异常、...

服务支持

云消息系列 RocketMQ 版常见问题 产品功能常见问题 客户端连接常见问题 售卖、计费和实例升降配常见问题 控制常见问题 消息发送常见问题 消息消费常见问题 相关协议 阿里云产品服务协议(通用)云消息队列 RocketMQ 版服务等级协议

自动创建Topic

在迁移上云或测试场景下,您可以开启自动创建Topic功能,通过代码写入直接创建Topic,无需在控制台手动创建,帮助您简化操作,提升效率。前提条件 您已购买并部署 云消息队列 Kafka 版 实例,且该实例必须满足以下条件:项目 说明 状态 ...

停止演练

除了设置故障演练自动结束时间外,还可以手动停止演练。停止演练后,系统会进入恢复阶段,自动清除相应的故障,使故障演练对象恢复演练前的状态。背景信息 一次完整的故障演练包括以下四个阶段:安装故障演练探针 创建演练 执行演练 停止...

功能特性

高可用管理平台 HAS 定位于 IT 技术...故障演练平台支持触发 CPU 利用率升高、内存利用率升高、内存占用、网络丢包、容器宕机、物理机宕机等常见故障,并针对故障制定出详细的演练和恢复计划,保证用户能够有计划地测量和观测应用高可用能力。

处理CPU使用率高问题

自动性能扩展:帮助数据库实例快速弹性适配高峰流量,可有效保障线上业务稳定性,同时支持实时检测CPU使用率,在单位时间内CPU使用率下降的情况下,支持自动规格回缩。自动SQL限流:自动控制数据库请求访问量和SQL并发量,保障服务的可用性...

流水单据型业务场景多活实践

验证爆炸半径是否控制故障单元内:预期:UserID为2000的用户路由到杭州单元,不受北京单元故障的影响。结果:下单正常,符合预期。切流恢复 验证故障场景下的容灾恢复能力。在北京单元发生故障的情况下,可以使用MSHA切流功能将受影响的...

基于ack-lingjun-aiast组件实现集群自动化运维

组件介绍 安装灵骏AI助手开启PAI的作业监控和恢复功能后,当发生故障或异常时,灵骏AI助手的告警系统可以自动和PAI进行交互,并上报故障信息,并根据故障触发阶段和并行策略选择规避故障的方法,自动隔离故障节点,并通过checkpoint快速...

证书管理

说明 证书申请过程中 全站加速 DCDN 将自动完成域名控制验证,无需您手动确认,详情请参见 免费证书自动域名控制验证。全站加速 DCDN 将在免费证书过期前的15天对免费证书进行自动续签,如果未成功续签,我们将通过短信和邮件的方式通知您...

故障排查与常见问题

控制台访问集群异常问题排查 组件异常问题排查 ACK Serverless集群 故障排查 常见问题索引 集群类型 相关文档 托管版与专有版容器集群ACK 常见问题 ACK Serverless集群 常见问题 分布式云容器平台ACK One 常见问题 容器服务ACK发行版 常见...

执行演练

在执行故障演练过程中,您可以实时查看演练进度、每个演练活动的运行状态及结果,同时也能够随时结束演练,进行恢复阶段的活动,清除故障演练影响。背景信息 一次完整的故障演练包括以下四个阶段:安装故障演练探针 创建演练 执行演练 停止...

故障应急协同

故障通告及更新 基于7x24监控值班工作特性,对于业务异常达到故障等级时,以用户定制的(语音、短信、IM)的方式在约定时间内将故障影响信息以及处理进展通知给对应的接收人/组,并持续更新直至故障结束。故障应急协同群 故障发生后,可以...

混沌工程缓存实战系列-Redis

配置完毕之后,可以发起自动演练、自动探测,最终得出结论(故障演练支持演练节点自动推进,也支持手动一步步推进)。验证结果。从演练执行结果可以看出,最终的运行结果和假设一致,当延迟注入80 ms之后,购物车不可用。但当延迟注入20 ms...

虚拟机场景

本文列出了虚拟机常见故障演练场景。JvmCodeCache满 制造JVM CodeCache区域满的故障,CodeCache区域满会直接导致JIT编译关闭,从而引起业务系统性能下降。一般用于验证业务系统在高并发且系统性能下降的情况下,是否能够通过限流、快速扩...

实例的节点故障处理机制

本文档介绍云数据库MongoDB版实例的节点故障处理机制。...当使用Connection String URI进行连接时,如果某个Mongos节点出现故障,客户端能自动进行故障切换,将请求分散到状态正常的Mongos节点上,详情请参见 分片集群实例连接说明。

故障演练

常见故障类型都可以映射到这个故障模型中,模拟故障的演练系统及方案也可以基于该模型进行设计。在设计演练方案的过程中,可以考虑在模型中每个环节进行故障注入,验证故障应急方案。不同演练类型和目标 根据演练过程对线上业务的影响,...

应用场景

以下根据智联车管理云平台主要五点模块,来介绍对应的五种典型应用场景:无线升级 相比传统汽车,智联车在车辆售出后,厂商还可通过OTA无线升级的方式触达用户,解决以下问题:车机系统存在问题,需要修复,可通过系统升级的方式进行解决;...

自动快照概述

自动快照功能通过自动快照策略实现,可以为数据库文件系统周期性地创建快照备份数据,合理利用自动快照能提高数据安全和操作容错率。应用场景 自动快照策略可以在预设的时间点周期性地创建快照,保护文件系统数据,是系统安全性和容错率的...

灾备方案

图 1.Tair 容灾架构演进 灾备方案 灾备级别 说明 单可用区高可用方案★主备节点部署在同一可用区中的不同机器上,当任一节点发生故障时,由高可用HA(High Availability)系统自动执行故障切换,避免单点故障引起的服务中断。同城容灾方案...

灾备方案介绍

图 1.Redis容灾架构演进 灾备方案 灾备级别 说明 单可用区高可用方案★主备节点部署在同一可用区中的不同机器上,当任一节点发生故障时,由高可用HA(High Availability)系统自动执行故障切换,避免单点故障引起的服务中断。同城容灾方案...

管理MySQL集群

主机故障处理策略 主机故障时,系统的处理策略:自动替换主机:系统会自动替换故障主机。说明 如果故障主机是云盘主机,云盘会自动迁移计算资源以自动替换主机。如果故障主机是非云盘主机,则系统会先将故障主机上的实例迁移走,然后自动...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
检索分析服务 Elasticsearch版 数字证书管理服务(原SSL证书) 共享流量包 负载均衡 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用