强弱依赖治理概述

强弱依赖治理的应用 强弱依赖治理主要可以被应用到以下场景:系统改造验收:对于分布式系统,至少在运行态中,不会因为依赖的系统后台出现故障,引起当前应用出现系统级可用性的故障,例如进程挂掉、频繁FullGC、负载飙高等,何时何地都应...

故障复盘改进详情

0c4840fd3812 幂等校验token 返回数据 名称 类型 示例值 描述 requestId String 4361a0e1-6747-4834-96ce-0c4840fd3811 Id of the request data Object data problemId String 231231 故障ID problemReason String 故障的原因 故障原因 ...

基本概念

故障管理 网络故障的发现、分析、定位等维护管理,包括告警信息的收集入库、规则匹配、关联分析以及告警清除等一系列流式处理过程。Netconf netconf协议一般用于网络业务配置,使用结构化可描述语言实现快速的网络设备下发。gRPC 高性能、...

什么是云网管

观测平台(Observation Platform)基础设施运行状态维护和管理,包含性能数据和告警数据,实现对各类监控对象的异常数据判定,网络故障的发现、分析、定位等维护管理。高效采集,分钟级故障定位发现。自定义采集方式和分析过程,兼容所有...

概览

可以结合业务场景进行网络故障的定界定位、网络质量的优化以及与其他云产品联动。应用场景 全局用户网络质量概览 通过网络质量分析器,您可以了解分布在全球不同地域及运营商的终端用户访问您服务端的网络质量情况;了解不同地域及运营商到...

光模块故障

本文介绍光模块发生故障的原因和处理方法。问题现象 光模块连接后,接口指示灯没有变为绿色。可能原因 光模块不兼容或损坏。智能接入网关设备支持的光模块型号请参见 光模块型号。说明 目前仅SAG-1000设备支持光模块插入。解决方案 通用多...

设备和交换机之间的链路故障

本文介绍SAG-1000设备发生设备和交换机之间链路故障的原因和处理方法。问题现象 设备和交换机接口之间ping不通。设备的Web端口配置页,端口前的状态灯为红色。动态路由OSPF接入时,Web端口配置页,端口前的状态灯为红色。设备的Web状态查询...

故障止损恢复

故障初因定位 集成企业内部可利用的所有稳定性相关数据(变更事件,数据库、MQ等中间件异常事件),以及集成各业务自建的定位工具能力,并在故障及风险预警的应急过程中进行可疑原因定位,帮助促进故障及风险预警初因定位的时长缩短。...

售前常见问题

首先需要明确您的网络部署情况,VPC边界防火墙是否支持防护分以下三种情况:第一种:如果您的网络中IPsec-VPN通过绑定 云企业网 转发路由器的方式部署,将IPsec-VPN与业务VPC的网络打通。这种情况下VPC边界防火墙支持防护。例如网络部署...

基于MSE云原生网关实现同城多活

云原生网关默认采用多可用区部署,提供了地域级的、跨可用区的全局流量管理能力。在同城多活的场景下,能够确保对跨可用区的多个业务集群的请求实现...可以看到MSE在I可用区的集群挂掉后,可实现秒级切流,切流过程中仅有不到1%的流量损失。

趋势分析

通过延时、丢包率、探测次数三个指标在不同维度、不同汇聚粒度的表现来判断网络趋势,可以用来定位网络故障发生的时间点以及业务的网络质量趋势。首页点击 详情分析 按钮,进入“趋势分析”页面。筛选条件:说明 筛选条件“统计时间段”,...

网络资源

网络闪断故障可能由多种原因引起,如网络设备故障、电力波动、通信线路故障等。网络闪断会导致数据传输中断,影响系统和应用程序之间的数据传输,频繁的网络闪断可能导致系统或应用程序无法正常运行。常使用的容错策略如下:设备冗余:使用...

智能负载均衡

能力 未启用智能负载均衡 启用智能负载均衡 容灾能力 多节点单活的接入防护能力 统一容灾切换 基于多节点负载均衡的接入防护能力 基于智能DNS的自动网络故障容灾切换 访问加速 无 就近接入防护及就近回源的最短链路 智能负载均衡的价值 ...

智能负载均衡

功能项 未启用智能负载均衡 启用智能负载均衡 容灾能力 多节点单活的接入防护能力 统一容灾切换 基于多节点负载均衡的接入防护能力 基于智能DNS的自动网络故障容灾切换 访问加速 无 就近接入防护及就近回源的最短链路 业务价值 对于各类...

如何排查Java场景下故障注入不生效的问题

为解决此类问题,在创建或编辑演练时,您可以在故障执行阶段选择开启Debug模式,并通过相关的日志信息来了解故障注入失败的原因。开启Debug模式 在查看目标演练的故障注入日志前,您需要先确认该演练的故障执行步骤是否已开启Debug模式。若...

强弱依赖治理最佳实践

在对业务分析进行依赖预判后,应通过故障注入的方式验证真实依赖关系是否与预判相符,例如注入依赖的服务间的网络延迟故障。强弱依赖的验证可以有多种指标,例如监控与日志的报警,请求的返回状态码等等。本文示例预期frontend与...

多可用区部署

如果可用区A的网络存在故障,由于同步延迟问题,在可用区A网络恢复之前的时间段内可用区B的数据会一直处于缺失的状态。备实例资源利用率不高。在主备容灾下,大部分时间备实例的资源不会被使用,只有在主备切换操作的时候才会被访问。主备...

AccessGatewayFailover

告警信息 事件名称 事件级别 状态码 状态描述 AccessGatewayFailover INFO agwfailover Access Gateway Failover 可能原因 IPsec链路网络故障。处理方法 无需处理。icmsDocProps={'productMethod':'created','language':'zh-CN',};

自建VPN无法连通

解决方案 当前的网络故障现象如下。VPN隧道建立正常。在网关的安全组对所有地址放行后,其他ECS实例能连通线下服务器。在网关的安全组只放行线下服务器所属的192.168.1.0/24网段则其他ECS实例无法连通线下服务器。整理当前的网络架构如下。...

流量回放和压测

此外,在数据库发生故障且无法定位原因时,可以利用克隆库复现故障场景,以便更好地定位故障原因。前提条件 源数据库支持:RDS MySQL PolarDB MySQL版 说明 不支持 PolarDB MySQL版 的 企业版 单节点 实例。PolarDB-X 2.0。目标数据库实例...

智能压测

此外,在数据库发生故障且无法定位原因时,可以利用克隆库复现故障场景,以便更好地定位故障原因。前提条件 源数据库支持:RDS MySQL PolarDB MySQL版 说明 不支持 PolarDB MySQL版 的 企业版 单节点 实例。PolarDB-X 2.0。目标数据库实例...

故障演练常见问题

故障不生效的原因较多,可能是参数配置不正确或无对应的请求命中,但故障规则已成功下发,故需要计费。刚刚购买的资源包为什么会被扣减次数?因为购买前已产生欠费,购买资源包后会先扣减所欠的次数。子账号的消费是否独立计费?不是,与主...

基本概念

用户可以选择多个Mongos作为请求的入口,防止其中一个挂掉所有的MongoDB请求都无法操作。Shard MongoDB分片集群中的分片。单个Shard是由三节点的副本集组成,保证单个分片的高可用性,用户可以根据自己的应用性能及存储要求,购买多个Shard...

监控报警概述

实时监控提供终端用户登录云电脑的实时数据(例如用户在线数量、在线时长的前十用户、平均登录时间和云电脑网络延迟分布情况)以及相关故障预警信息,以便快速准确定位,迅速处理故障,避免因资源、网络问题或者外部操作原因造成不必要的...

监控、诊断和故障排除

网络故障引起丢包重试。例如客户端发起一个删除操作删除某个Object,此时请求达到服务端,执行删除成功,但是响应在网络环境中丢包,然后客户端发起重试,第二次的删除操作可能就会遇到404错误。这种由于网络问题引起的404错误可以通过客户...

故障协同处理(基于钉钉)

2.故障应急场景群:事件升级故障后,群内推出 故障处理中 消息卡片,如果满足自动生成故障场景群的需求(下文详细介绍创建故障场景群逻辑),故障场景群内同时推出 故障处理中 消息卡片。本群故障消息卡片包含按钮:签到、签到记录、应急...

组复制简介

当一个事务在所有节点上都被执行之后,任何其他事务都不会跟它冲突了,此事务修改的所有行都可以从认证信息数组中清理。在组复制中每60秒会清理一次已执行的事务的数据。AliSQL对组复制稳定性的优化 组复制的稳定性在引入单主模式后有了...

无法连接到同一个云连接网内的本地客户端

目标PC环境的网络故障。运营商网络故障。解决方案 登录 智能接入网关控制台。单击智能接入网关实例ID,查看当前设备状态是否为 可用。如果离线,请参见 设备显示离线 处理。如果在线,请跳转至 步骤3。登录交换机控制台,查看设备和交换机...

如何解决MSE Nacos实例域名无法解析的问题?

MSG SIZE rcvd:73 如果 dig 命令无法正常解析域名,采用以下方式修复:如果您的环境是通过ECS部署,请记录 SERVER 字段中的DNS服务器和NameServer地址信息,并 提工单 联系ECS或网络技术支持协助排查域名解析失败的原因。如果您的环境是...

网络类场景

网络延迟 网络延迟场景可以指定网络延迟因素(例如网卡、本地端口、远程端口、目标IP等)和延迟时间,对应用或服务注入网络调用延迟故障。验证网络延迟情况下系统的容错能力。表 1.参数说明 参数名称 参数说明 网卡名称 具体的网卡设备,为...

主备切换

若您收到短信、邮件、控制台站内信等通知,告知您 Redis 实例已完成主备切换,您可以参考本文了解主备切换的原因、影响和处理建议等。为什么会触发主备切换?实例底层主机故障 阿里云检测到实例底层主机发生故障,例如进程异常中断、实例...

主备切换

若您收到短信、邮件、控制台站内信等通知,告知您 Tair 实例已完成主备切换,您可以参考本文了解主备切换的原因、影响和处理建议等。为什么会触发主备切换?实例底层主机故障 阿里云检测到实例底层主机发生故障,例如进程异常中断、实例...

监控指标说明

如果Checkpoint耗时过长或者超时,可能由于状态过大、临时网络原因、Barrier未对齐或者数据存在反压等原因造成。毫秒(ms)lastCheckpointSize 最近一个Checkpoint的大小。最近一次实际上传的Checkpoint大小,可以在Checkpoint有瓶颈时协助...

混合云应用双活容灾最佳实践

同时基于MSHA-Agent的切面能力,在Dubbo/SpringCloud服务调用时,Consumer优先调用同单元内的Provider,从而避免跨机房调用带来的网络延迟,减小业务请求RT。数据同步及数据库连接切换:数据库异地主备部署,云上云下应用日常态均读写云上...

Tair选型指南

3 选择容灾方案 云原生内存数据库Tair 实例若因不可预料的原因(例如设备故障、机房断电等)发生故障,容灾机制保障数据的一致性和业务可用性。云原生内存数据库Tair 提供多种灾备方案供您选择,可满足不同的业务场景。4 预估内存规格 提前...

云数据库Redis版产品选型必读

选择容灾方案 当云数据库Redis实例因不可预料的原因(例如设备故障、机房断电等)发生故障,容灾机制可用于保障数据的一致性和业务可用性。云数据库Redis提供多种灾备方案供您选择,可满足不同的业务场景。选择大版本 推荐使用更新的大版本...

常见报错及解决方案

Q:谐云组件故障排查思路 A:elasticsearch《故障排查思路》mysql《故障排查思路》redis《故障排查思路》harbor《故障排查思路》通用排查《中间件通用故障排查思路》ingress《故障排查思路》rocketmq《故障排查思路》kafka《故障排查思路》...

存储资源

可能原因包含数据库服务进程异常退出、数据库节点宕机、数据库网络异常等,常见的容错策略如下:自动重启:当数据库实例异常终止或崩溃时,可以设置自动重启和恢复机制,自动重新启动数据库服务,并进行必要的数据恢复操作,以确保数据库的...

附录:SOFAStack 产品目录

产品架构 产品优势 跨云/跨域互通 支持对混合云和多业务域之间的网络互通,实现 API 的统一管理。弱网优化 针对移动端的特性,优化弱网下的数据传输通信协议,提高网络通信质量和效率。异构集成 支持不同语言和不同技术栈实现的业务系统...

访问OSS出现网络异常如何处理?

背景信息 如果您请求OSS时收到了OSS的响应,即使这个响应的HttpCode不是200,也说明您当前的网络跟OSS服务之间是连通的。这类问题您只需获取OSS响应中的Request ID,打开 OSS自助诊断工具 进行问题诊断检测即可。关于如何获取Request ID,...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
NAT网关 共享流量包 弹性公网IP 负载均衡 短信服务 人工智能平台 PAI
新人特惠 爆款特惠 最新活动 免费试用