在 云数据库 Redis 版 集群架构和读写分离架构中,代理服务器(Proxy)承担着路由转发、负载均衡和故障转移等职责,可以帮助您简化客户端的逻辑,同时支持多数据库(DB)、缓存热点数据等高级功能。通过了解Proxy的路由转发规则和特定命令...
概述 本文主要介绍使用阿里云服务器ECS时的系统类故障排查,包含CPU、磁盘I/O、内存、硬盘、带宽资源占用异常的问题排查与定位。详细信息 说明 阿里云提醒您:如果您对实例或数据有修改、变更等风险操作,务必注意实例的容灾、容错能力,...
警告 若您选择关闭本功能,请确保您有其他方式保证链路的冗余性,否则当物理专线链路故障后,会导致网络中断。描述 为健康检查添加描述信息。步骤五:配置本地IDC侧路由及健康检查 您需要在本地IDC侧完成配置路由、健康检查以及健康检查和...
当故障节点恢复后,加入集群,系统是否有业务中断情况出现。节点切换需要多长时间。在验证集群可靠性的同时,需根据具体情况使用压力工具模拟实际业务发生相关情况,对应用保持一定的性能压力,确保测试结果符合生产实际情况。备份和恢复 ...
问题描述 网站成功安装在云虚拟主机后,运行一段时间后,出现无法正常访问网站(无报错信息)的问题。说明 如果访问云虚拟主机网站时无法正常访问,但显示具体报错信息,具体操作,请参见 访问云虚拟主机网站时无法正常访问(显示报错信息...
集群维护 定义集群维护的计划时间,维护窗口时间内将进行集群自动化升级,例如运行时升级、K8s版本升级、可预期的节点故障的修复和关联Pod的腾挪等。(可选)单击 显示高级选项,配置集群的高级选项。配置项 说明 Ingress 设置是否安装...
显示高级过滤选项 默认关闭,开启后可设置 集群ID、关联应用ID、主机IP 和 POD名 的过滤选项。自定义过滤条件 自定义过滤条件一般用来指定事件体JSON的某个字段需要满足的条件,根节点是 data,以.的形式下钻事件体JSON的某个字段。请输入...
网络流量异常可能是由于某个城市机房故障造成的,也可能是由某个渠道的网页显示异常造成的,甚至是某个城市的某个渠道的网页没有及时更新造成的。功能介绍 下探分析作业接收如下两类时序数据,这两类时序数据都是通过SQL方式抽取或聚合得到...
方案二 直接使用 PolarDB分布式版 作为源实例配置同步或迁移至目标实例任务,当该实例下挂载的RDS MySQL实例数量超过2个后,可能会对DTS任务的稳定性、操作性产生较大影响,严重时甚至将影响业务。使用方案二时,如源 PolarDB分布式版 下...
方案二 直接使用 PolarDB分布式版 作为源实例配置同步或迁移至目标实例任务,当该实例下挂载的RDS MySQL实例数量超过2个后,可能会对DTS任务的稳定性、操作性产生较大影响,严重时甚至将影响业务。使用方案二时,如源 PolarDB分布式版 下...
云HBase通过master节点自动切换、数据两副本、快速自动failover等手段最大程度的保证了HBase实例服务和数据可用性,但是面对可用区级别的断电、断网及其他极端故障单个HBase集群无法满足用户的高可用要求,针对跨可用区灾备需求我们提供了...
进入验证身份环节,可以直接选择 手机号验证 方式也可以选择其他的方式(具体验证方式以页面显示为准)。身份验证通过后,这个页面是直接输入新的邮箱账号,单击免费获取校验码,输入您的邮箱中收到的阿里云验证码,再单击 确定 完成修改。...
在EDAS中的容器服务Kubernetes集群中创建应用后,可以为应用添加公网或私网负载均衡CLB来实现应用的公网或私网访问。本文介绍如何为容器服务Kubernetes集群中的应用添加公网CLB和私网CLB。背景信息 如果需要为应用关联负载均衡CLB,必须在...
(可选)单击 高级选项,配置如下信息:日志编码:编码为系统自动识别的,一般支持 GBK、UTF-8 等。当有编码不识别时,可以在此处配置填写。集群日志限制流量:集群日志流量限值,单位为 KB/Min。每分钟采集日志达到上限后会放弃剩余日志,...
本文介绍了数据库发生故障时的快速判断方法和解决办法。如何定位系统瓶颈是否在数据库上 通过Processlist来判断 执行以下语句,显示 PolarDB-X 上所有正在执行的SQL语句。SHOW PROCESSLIST WHERE INFO IS NOT NULL 一般情况下,语句堆积会...
通过CNAME接入方式将域名添加到 Web应用防火墙(Web Application Firewall,简称WAF)后,您需要将域名的DNS解析指向WAF提供的CNAME地址,才可以使域名的Web请求解析到WAF进行安全防护。本文介绍如何修改域名DNS解析设置。背景信息 WAF仅...
在 Web应用防火墙(Web Application Firewall,简称WAF)添加网站域名后,您必须使用WAF的CNAME地址修改域名的DNS解析设置,将网站的Web请求解析到WAF进行安全防护。本文介绍了修改域名DNS的相关内容。背景信息 WAF仅支持使用 CNAME记录,...
云数据库 MongoDB 版 分片集群实例支持了按Key闪回功能,您可以对指定的数据集合发起备份,便于后续因系统漏洞或故障而引起的小部分数据错乱或意外丢失时,根据数据的闪回Key(默认为_id)可对这部分数据进行回档,快速恢复数据。...
本文介绍Windows系统的ECS实例ping外网地址提示“一般故障”的错误原因和解决方案。问题现象 Windows系统的ECS实例ping外网地址时提示“一般故障”错误。问题原因 出现该问题可能有以下原因:可能原因 排查方案 ECS实例中安装了第三方杀毒...
更新故障通知:在故障处理的过程中,当故障进展发生变化,包括进度更新、影响恶化、故障等级变化、原因明确、根因定位等场景下,可更新故障过程中的内容,并在 故障详情 页点击更新故障通知,选择需要的故障通告类型,并最终确认发出故障...
创建应用分组后,您可以查看应用分组的组内资源、监控视图、故障列表、可用性监控等数据,并执行相关操作。通过应用分组集中管理资源,便于您及时接收故障资源的报警通知,并及时处理故障。操作步骤 登录 云监控控制台。在左侧导航栏,选择...
支持的容灾场景 容灾场景 支持类型 故障切换 数据同步后切换 该故障切换会先停止保护组中被保护的实例,并且等到所有被保护的实例停止后再进行最后一轮数据同步,等待数据同步完成后再启动切换。这样可以保证容灾端与生产端数据完全一致,...
支持的容灾场景 容灾场景 支持类型 故障切换 数据同步后切换 该故障切换会先停止保护组中被保护的实例,并且等到所有被保护的实例停止后再进行最后一轮数据同步,等待数据同步完成后再启动切换。这样可以保证容灾端与生产端数据完全一致,...
故障管理概述 故障管理是源于ITIL的一个概念,在IT企业或者互联网企业进行故障管理的目的是当生产环境出现重大宕机时尽快恢复正常的服务运营,将组件失败对业务所造成的负面影响降到最低,从而确保满足事先与业务客户之间所约定的服务级别...
说明 若受保护服务器表格未显示 故障切换/故障恢复信息 列,请单击 设置可见列 配置即可。如果检查后发现当前时间点应用运行正常,选择 更多>故障切换>确认故障切换,确认故障切换。说明 在故障切换或者切换恢复点完成,并且已经确认被容灾...
故障演练能力是ADP基于阿里云故障演练产品AHAS提供的一项能力,在线上集成环节即可对线下交付中常见的各类故障场景下产品编排的容错性、可靠性和可恢复性进行演练,保障编排稳定可靠。在进行故障演练之前,需要进行以下步骤:创建产品;...
说明 若受保护服务器表格未显示 故障切换/故障恢复信息 列,请单击 设置可见列 配置即可。如果检查后发现当前时间点应用运行正常,选择 更多>故障切换>确认故障切换,确认故障切换。说明 在故障切换或者切换恢复点完成,并且已经确认被容灾...
故障复盘规范 故障复盘作为故障体系中的重要一环,整体复盘流程包括故障处理过程、改进分析、故障定责,基于包含标准化的复盘SOP、对应预防action推荐、问责管理机制,全面地回溯线上故障的发生,产出故障复盘报告和改进措施,避免故障重复...
组件埋点接入后,即可查看相关 Tracer 日志。本文将介绍如下几种日志及其日志格式。说明 开源版的日志默认为 JSON 格式,企业版默认以逗号分隔。日志会不定期新增部分字段,新增字段会从日志尾部添加,不会影响原日志字段。若您实际打印的...
MyBase MySQL实例进行主从(备)切换后,会发送短信通知您,告知切换原因。本文介绍主从(备)切换的几种原因。MyBase MySQL实例主从(备)切换的原因有如下几种:风险隐患 阿里云检测到实例存在潜在风险,可能影响实例的正常使用,系统会...
故障改进:支持对故障制定明确的改进及验收措施、责任人及完成时间,确保每个深度复盘后的故障都能对业务连续性形成改进。其他应用场景 降低管理难度:同时维护多套监控系统,操作成本高,降低管理难度。规避报警风暴:单监控源的报警不能...
本文主要介绍什么是故障。定义 在日常运营中,无论什么原因导致业务服务中断、服务品质...故障改进:支持对故障制定明确的改进及验收措施、责任人及完成时间,确保每个深度复盘后的故障都能对业务连续性形成改进,避免历史同类故障重复发生。
接入探针后,Kubernetes中打标签为 app=的Pod将显示在AHAS控制台故障演练的治理应用中。单击 下一步,进入 依赖分析,注入流量。由于依赖关系的准确识别是需要流量的,如果在流量不足的测试环境中接入,则需要您手动提供流量。推荐使用PTS...
为了降低物理故障对业务的影响,阿里云为您提供专有宿主机DDH宕机自动迁移的功能。本章节介绍在创建DDH后如何开启或者关闭宕机自动迁移。背景信息 宕机自动迁移开启后,当DDH因故障停机时,会自动迁移至健康的DDH。若您未开启宕机自动迁移...
当被保护的服务器完成阿里云复制服务(AReS)安装并重启后,您就可以对受保护的服务器启动、停止容灾复制、故障切换、容灾演练等一系列的应用容灾操作。前提条件 已安装阿里云复制服务。更多信息,请参见 步骤四:安装阿里云复制服务。操作...
自动SQL优化 智能压测 确认数据库实例规格是否需要扩容,并验证在真实业务场景下的实际效果,降低上线后引发故障的风险。此外,在数据库实例发生故障且无法定位原因时,可以利用克隆库复现故障场景,以便更好地定位故障原因。智能压测 搜索...
Kubernetes集群中Node资源故障场景,包含CPU、网络和进程等基础资源类演练场景。每个Node场景下都包含通用的Node筛选参数,用于查找目标Node。通用参数说明 参数名称 参数说明 节点名称 节点资源名,选择多个节点资源时资源名之间使用逗号...
使用FTP工具连接云虚拟主机后,基于数据安全因素,一般情况下,默认在远程站点区域的文件列表中隐藏文件不显示。您需要通过更改FTP客户端的设置,来强制显示该隐藏文件。本文介绍这种情况的原因和解决方案。问题现象 通过FTP工具连接到 ...
畅捷通通过日志服务的异常预测函数,从海量指标中快速定位异常,将有问题的地方显示出来,快速发现系统故障。畅捷通通过日志服务将各块汇集过来的数据进行标记后,与应用的配置信息进行关联和整合,通过时序发现故障的根因,从而可以实现...
高可用负载均衡:MSE ZooKeeper提供的主备高可用的SLB,自动对用户请求做负载均衡,会把请求压力分散到后端节点,并且会自动摘除后端故障节点,保证请求到正常的节点上。节点故障自愈:依托于K8s的Liveness能力,在节点出现故障时,会自动...