产品架构

本文提供产品架构图,并...ECS的跨区域容灾策略保证应用和数据的万无一失,RDS的主备架构避免了核心数据的单风险,应用部署引入SLB消除单点故障,CDN结合OSS有效提高内容加载速度,轻松搞定网站图片、短视频的内容分发,有效提高网站性能。

集群架构

数据分片(data shards)每个数据分片均为双副本(分别部署在不同机器上)高可用架构,主节点发生故障后,系统会自动进行主备切换保证服务高可用。配置服务器(config server)采用双副本高可用架构,用于存储集群配置信息及分区策略。各...

云盒计算资源配置最佳实践

背景信息 云盒的硬件设计中,各类硬件设备的保障如下:网络设备:采用双机冗余双上连设计,确保云盒内网络的高连续性,且不存在单点故障。存储设备:可以 确保在两台存储服务器同时宕机的情况下,数据的安全可靠。计算设备:支持宕机迁移和...

同城高可用

同城高可用功能可有效避免单个可用区故障导致的服务中断,确保业务的稳定性。Flink支持对包年包月的工作空间开启跨可用区,以实现同城高可用。本文为您介绍如何开启并使用跨可用区,以及停止跨可用区计费等。功能介绍 包年包月工作空间...

Redis Proxy特性说明

在 云数据库 Redis 版 集群架构和读写分离架构中,代理服务器(Proxy)承担着路由转发、负载均衡和故障转移等职责,可以帮助您简化客户端的逻辑,同时支持多数据库(DB)、缓存热点数据等高级功能。通过了解Proxy的路由转发规则和特定命令...

Windows系统的ECS实例ping外网地址提示“一般故障”...

本文介绍Windows系统的ECS实例ping外网地址提示“一般故障”的错误原因和解决方案。问题现象 Windows系统的ECS实例ping外网地址时提示“一般故障”错误。问题原因 出现该问题可能有以下原因:可能原因 排查方案 ECS实例中安装了第三方杀毒...

Windows实例公网网络异常

问题描述 登录Windows实例,发现网络异常,使用 ping 命令无法连接公网或者无法telnet RDP端口,使用 ping 命令连接内网网卡的网关提示“一般故障”。问题原因 Windows实例启用了Routing and Remote Access服务,只配置远程访问时会导致...

日志说明

组件埋接入,即可查看相关 Tracer 日志。本文将介绍如下几种日志及其日志格式。说明 开源版的日志默认为 JSON 格式,企业版默认以逗号分隔。日志会不定期新增部分字段,新增字段会从日志尾部添加,不会影响原日志字段。若您实际打印的...

跨可用区容灾

当生产站点因为不可抗力因素(比如机房火灾、断电)或者设备故障(软、硬件破坏)导致应用在短时间内无法恢复时,ECS容灾服务支持业务的跨可用区(Availability Zone)的容灾能力,对整体的应用做容灾备份来应对单地区的故障,满足业务的...

步骤五:应用容灾

当被保护的服务器完成阿里云复制服务(AReS)安装并重启,您就可以对受保护的服务器启动、停止容灾复制、故障切换、容灾演练等一系列的应用容灾操作。前提条件 已安装阿里云复制服务。更多信息,请参见 步骤四:安装阿里云复制服务。操作...

跨地域容灾

如果检查发现当前时间应用状态不符合要求,例如数据库一致性问题,或者源端被污染的数据已经被同步到另一个地域,请在确认故障切换前,选择 更多>故障切换>更换恢复。说明 切换恢复操作与故障切换操作类似,仅需选择更早的恢复...

ECS服务器的外网地址ping不通的排查方法

Windows系统:具体操作请参见 Windows实例ping外网地址提示“一般故障”。运营商问题:检查运营商是否存在网络问题,如公网运营商链路中断,路由震荡等。具体操作请参见 使用ping命令丢包或不通时的链路测试方法。相关文档 ECS实例间ping...

无法连接Windows实例

故障现象 无法ping通ECS实例,在排除Iptables和网卡IP配置问题且回滚系统,仍然无法ping通。故障原因 可能是ECS实例安全组默认的公网规则被删除。解决方法 重新配置ECS实例的安全组公网规则,具体操作请参见 ECS实例安全组默认的公网规则...

故障复盘

故障复盘规范 故障复盘作为故障体系中的重要一环,整体复盘流程包括故障处理过程、改进分析、故障定责,基于包含标准化的复盘SOP、对应预防action推荐、问责管理机制,全面地回溯线上故障的发生,产出故障复盘报告和改进措施,避免故障重复...

混合云应用双活容灾最佳实践

说明 演练前,基于MSHA流量监控或其他监控产品,确定业务稳态的监控指标(如日常情况RT≤200ms,错误率),以便在故障发生时判断故障影响面以及在故障恢复判断业务的实际恢复情况。步骤二:应用故障注入 这里使用阿里云故障演练产品,对...

应用场景

正常情况下,用户访问IP地址 1.1.XX.XX、当IP地址 1.1.XX.XX 故障后,希望将用户访问流量切换到IP地址 2.2.XX.XX。通过GTM,创建两个地址池 Pool A 和 Pool B,将IP地址 1.1.XX.XX、2.2.XX.XX 分别添加进两个地址池,并配置健康检查。在...

配置算法实例

算法实例是根据算法模板创建的具体实例,可以根据您设置的检测参数结合算法模型,完成对相关数据中异常信息的检测及诊断,协助您更好地解读设备数据,监测设备运行状态,及时发现潜在故障。前提条件 已创建算法实例。具体操作,请参见 创建...

使用API终止和恢复VBR来确认冗余物理专线

本文介绍本地IDC(Internet Data Center)通过冗余专线接入阿里云,您如何使用白屏化的OpenAPI工具调用API来完成专线故障演练。背景信息 当本地IDC通过冗余物理专线正常接入阿里云,您需要通过单条专线故障演练来确认冗余物理专线。您...

macOS客户端通过VPN访问SMB协议文件系统

验证网络连通性 VPN网关连接,通过 ping 命令 ping VPC内SMB协议文件系统挂载,验证通信是否正常。说明 如果挂载无法ping通,则需要通过一台与SMB协议文件系统在同一VPC下的ECS云服务器 ping 挂载得到挂载IP,使用挂载IP在...

K8s应用运维管理最佳实践

在Java类型应用中,如果出现故障Pod实例,可以借助Arthas诊断,排查Pod故障点。相关文档,请参见 Arthas诊断。如果应用无法正常启动,可以将启动命令修改为 sleep,再通过 kubectl exec 手动启动进程,观察输出并分析原因。相关文档,请...

读多写少型业务场景多活实践

说明 基于MSHA流量监控或其他监控能力,确定业务稳态的监控指标,以便在故障发生时判断故障影响面以及在故障恢复判断业务的实际恢复情况。演练预期如下:导购链路对购物车应用是弱依赖(导购页会展示用户放入购物车的商品数量),弱依赖...

如何管理故障

本文档主要介绍如何管理故障故障发生条件 当事件重要程度上升、整体影响面恶化、持续长时间未解决,综合评估已达到故障时(P1-P4),处理人可手动将事件升级为故障。当报警来源的指标持续恶化,触发故障产生规则,系统自动产生故障故障...

高可用和容灾设计

在大多数场景下,您可以将7天内任意一个时间的数据恢复到RDS临时实例或克隆实例上,数据验证无误即可将数据迁回RDS主实例,从而完成数据回溯。更多信息请参见 备份恢复。除了默认的备份恢复功能,RDS MySQL还提供跨地域备份恢复功能,...

测试指标

故障节点恢复,加入集群,系统是否有业务中断情况出现。节点切换需要多长时间。在验证集群可靠性的同时,需根据具体情况使用压力工具模拟实际业务发生相关情况,对应用保持一定的性能压力,确保测试结果符合生产实际情况。备份和恢复 ...

查看智能洞察事件列表

智能洞察详情 应用服务整体平均响应时间突增 应用服务整体平均响应时间突增 类型的事件详情页面显示了事件发生时间、根因分析和故障传播链。在智能洞察详情页面,您可以执行以下操作:单击 根因分析 区域的疑似根因链接,在疑似根因面板...

功能说明

健康检查 针对地址池,可以配置健康检查,开启健康检查是指对地址池中的IP地址配置健康检查,开启可实现实时监测应用服务的可用性状态,并最终帮助企业实现自动故障隔离和自动故障切换的功效。健康检查支持的方式:ping、tcp、http(s)。...

高性能版实例

以下内容为 AnalyticDB PostgreSQL版 实例常见故障场景中高性能版和高可用版的对比:恢复(Recovery)模式 根据以往 AnalyticDB PostgreSQL版 运行情况,故障最大的场景为恢复模式,故障概率远大于另外两种场景(计算节点故障和计算节点宿...

主备方案介绍

灾备方案 说明 单可用区高可用方案 主备节点部署在同一可用区中的不同机器上,当任一节点发生故障时,由高可用HA(High Availability)系统监控主备节点的健康状态并自动执行故障切换,避免单点故障引起的服务中断。同城容灾方案 主备节点...

新功能发布记录

创建VBR跨账号加入VPC 2022年12月 功能名称 变更类型 功能描述 相关文档 高速通道支持接入地图模式 新增 高速通道支持物理端口接入地图模式,通过地图显示的方式透出阿里云接入资源的位置。创建和管理独享专线连接 高速通道VBR实例...

设置Pod故障处理策略

默认情况下,ECI Pod创建失败,系统会自动重试尝试创建。如果您希望尽快得到创建结果以便及时处理故障,可以修改Pod故障处理策略。配置说明 在虚拟节点上创建ECI Pod时,可能会因为库存不足等原因导致Pod创建失败,默认情况下,系统会...

概览

网络质量对比分析 通过使用站点监控功能配置定时ping拨测任务,根据需要选择发起拨测的不同国家地域的运营商探测节点,运行一段时间可以观察到不同国家地域的运营商线路到目标服务的网络时延情况。另外也可以配置多个ping拨测任务,进行...

SQL优化技术

在传统的优化处理中,这一过程一般完全依赖人力驱动,常常会暴露出两个方面的严重不足:T1过于偏,即异常发现不及时、响应不及时,即使发现时,问题可能已堆积多时,已处在故障的边缘。T2-T1所代表的处理时间过长,一方面严重影响用户...

在Windows实例无法访问外部网络如何处理?

或 Windows实例ping外网地址提示“一般故障”。检查Windows实例是否存在性能问题 Windows实例可能存在CPU资源占用高、内存耗尽、带宽占用满、网络动态端口耗尽等问题,您可以通过如下方式进行检查:使用工具进行分析,具体操作,请参见 ...

混沌工程缓存实战系列-Redis

此时若有大量并发请求,这些请求发现缓存过期一般都会从端数据库加载数据并回设到缓存,这个时候大并发的请求可能会瞬间把端数据库压垮。雪崩:当缓存服务器重启或者大量缓存集中在某一个时间段失效,这样在失效的时候,也会给端系统...

客户端离线排查

云安全中心控制台显示客户端离线时,表示该服务器已失去云安全中心的防护。此时,该服务器可能存在被黑客入侵的风险。建议您参考本文内容尽快排查离线原因,保障客户端在线。背景信息 云安全中心提供客户端问题一键排查功能,如果您发现...

本地IDC通过专线访问云服务器ECS

警告 若您选择关闭本功能,请确保您有其他方式保证链路的冗余性,否则当物理专线连接故障后,会导致网络中断。说明 健康检查会以您指定的发包时间间隔发送探测报文,当连续发送的所有探测报文(即您指定的探测报文个数)都丢包时,则判断...

基本概念

监控项 设备监控采集的基本配置项,包含信息有采集类型如PING/SNMP等、采集间隔、数据项、报警规则配置等。告警 网络设备等资源在运行中发出的告警消息,一般为主动和被动两种方式采集得到。故障管理 网络故障的发现、分析、定位等维护管理...

附录:SOFAStack 产品目录

快速定位不健康应用:在调用关系拓扑中,对不健康应用进行显示标识,便于快速发现有问题应用并进行分析。分析服务性能:调用拓扑中的应用都可以单独进行下钻分析,可以从吞吐、错误率、响应时间等指标对应用性能进行详细分析。应用性能和...

名词解释

RPO Recovery Point Object,即数据恢复目标,以时间为单位,即在灾难发生时,系统和数据必须恢复的时间要求。RPO标志系统能够容忍的最大数据丢失量。系统容忍丢失的数据量越小,RPO的值越小。RTO Recovery Time Object,即恢复时间...

MQ订阅消息

取值:新建:"New"处理中:"Processing"已取消:"Cancel"已完结:"Close"重新开启:"Reopen"消息内容 基站 离线 基站与云价签系统连接中断触发消息,例如:门店网络故障或基站故障 {"EventCatgory":"DEVICE","Event":"DEVICE_OFFLINE",...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
数据库自治服务 云数据库 MongoDB 版 应用高可用服务 负载均衡 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用