短信发送状态回执错误

解决方案:如果使用SDK调用接口,请注意AccessKey ID和AccessKey Secret字符串赋值正确。如果自行加密签名(Signature),请参见 请求签名 检查加密逻辑。InvalidTimeStamp.Expired 时间戳或日期已过期 原因:一般由于时区差异造成时间戳...

Windows系统的ECS实例ping外网地址提示“一般故障”...

本文介绍Windows系统的ECS实例ping外网地址提示“一般故障”的错误原因和解决方案。问题现象 Windows系统的ECS实例ping外网地址时提示“一般故障错误。问题原因 出现该问题可能有以下原因:可能原因 排查方案 ECS实例中安装了第三方杀毒...

概述

分布式系统将计算任务和数据分布在多个节点上以实现更高的性能、可靠性和可扩展性,当一个节点发生故障错误时,其他节点可以继续工作,相比于单机系统,架构本身就有较高的节点容错性。但随着服务拆分,更多组件的引入,分布式系统的复杂...

主备方案介绍

灾备方案 说明 单可用区高可用方案 主备节点部署在同一可用区中的不同机器上,当任一节点发生故障时,由高可用HA(High Availability)系统监控主备节点的健康状态并自动执行故障切换,避免单点故障引起的服务中断。同城容灾方案 主备节点...

EMR Kafka磁盘故障运维

原Broker数据恢复方式 方案描述 当磁盘故障时,如果磁盘IO性能已经明显下降,则需要快速隔离故障磁盘避免因单点故障影响集群性能。磁盘隔离之后,对应kafka日志目录处于offline状态。此时,如果分区存在ISR副本或者允许分区数据丢失,可以...

业务连续性

该系统的主服务是部署在瑞士的 ENS 节点,主服务采用了多实例加负载均衡的架构,以规避 ENS 实例单点故障引起的业务中断。备服务部署在就近的德国 ENS 节点(备服务也可以选择就近的公有云地域中),备服务同样采用了多实例加负载均衡的...

自动故障剔除

自动故障剔除功能会自动监控 RPC 调用的情况,当某个节点出现故障时,可对故障节点进行权重降级,并在节点恢复健康时进行权重恢复。目前支持 Bolt 协议。配置方式 将自动故障剔除的参数配置到 SOFABoot 中的 application.properties 即可。...

应用场景

消除单点故障 您可以在 CLB 实例下添加多台ECS实例。当其中一部分ECS实例发生故障后,CLB 会自动屏蔽故障的ECS实例,将请求分发给正常运行的ECS实例,保证应用系统仍能正常工作。同城容灾(多可用区容灾)为了提供更加稳定可靠的 CLB 服务...

常见问题FAQ

7.弹窗错误 故障示意图如下:见下遥控器按键说明,按电源键启动广告机或者魔盒。8.平台添加设备确认 故障示意图如下:见下遥控器按键说明,按确定键。其余问题请提交工单或者拨打400电话。售后服务热线 400-0099998转1号键,进入报单,报单...

云盒计算资源配置最佳实践

背景信息 云盒的硬件设计中,各类硬件设备的保障如下:网络设备:采用双机冗余双上连设计,确保云盒内网络的高连续性,且不存在单点故障。存储设备:可以 确保在两台存储服务器同时宕机的情况下,数据的安全可靠。计算设备:支持宕机迁移和...

监控报警概述

使用场景 在日常业务运行的过程中,监控大盘帮助您及时了解账号下全部云电脑资源的全局情况,实时监控提供更详细的数据指标和故障预警信息,帮助您了解终端用户使用云电脑的情况,及时解决故障。同时,报警功能可以帮助您了解核心资源的...

ECS整机恢复

当ECS整机发生系统故障或者错误操作时,您可以通过备份的克隆和恢复功能,实现ECS整机回退和创建新的ECS整机。本文介绍整机恢复的相关操作。前提条件 已创建ECS整机备份。具体操作,请参见 备份ECS整机。重要 当源ECS存在时,支持直接...

应用场景

故障关联分析:以应用为中心,覆盖组件、实例、主机、云资源等多维度关联分析,迅速找到异常故障点。问题分析与快速定位 在分布式场景下,服务调用错综复杂,问题分析与定位非常困难,分布式链路跟踪系统能迅速定位到有问题的服务,协助...

实时分析链路数据

如果大量请求突然集中在一台或少量机器,很可能是流量不均导致的热点问题,然后再结合问题发生的变更事件,快速定位造成故障错误变更,及时回滚。在 调用链分析 页面设置按IP聚合,如下图所示,可以发现大部分流量集中在opentelemetry-...

监控、诊断和故障排除

相对于传统应用程序,开发云端应用虽然降低了用户在基础设施搭建、运维等方面的成本,但却增大了监控、诊断和故障排查的难度。OSS存储服务为您提供了丰富的监控和日志信息,帮助您深刻洞察程序行为,及时发现并快速定位问题。本文主要描述...

防勒索客户端和备份任务异常状态排查

备份异常的原因及解决方案 客户端错误错误详情提示 产生异常的原因 解决方案 EXPIRED 备份超时。服务器网络问题。备份客户端在执行任务时服务器重启导致备份任务停止。云服务器ECS已停止运行。备份文件过多导致超时。客户端版本低,需要...

读写访问文件类问题

解决方案 稍等重试即可。如果还出现类似报错,请联系 NAS技术支持 进行咨询。为什么SMB协议文件系统挂载有时候连接不上?问题现象 当您混用NFS和SMB协议文件系统,导致第一次通过 net use 命令挂载NFS协议文件系统连接失败后,挂载正确的...

公共云基础服务说明书

旨在主动帮助客户优化性能、降低成本并更快地进行创新,帮助客户基于阿里云提供的产品和功能在其云之旅中取得成功,并满足从回答最佳实践问题、提供配置指导到修复故障解决问题的各种要求。1.2.阿里云基础服务范围 服务范围 包含:阿里...

挂载文件系统失败故障排查

解决方案 使用正确的挂载命令挂载NAS NFS协议文件系统。关于Linux挂载NFS协议文件系统的挂载命令参数说明,请参见 挂载命令参数说明。通用型NAS,请执行以下命令。使用NFS v3协议挂载文件系统:sudo mount-t nfs-o vers=3,nolock,proto=tcp...

附录:SOFAStack 产品目录

分布式链路跟踪 分布式链路跟踪(Distributed System Tracing,简称 DST)是一款面向分布式架构、微服务架构和云原生架构的应用可观察性的金融级解决方案,帮助用户厘清应用间复杂的调用关系,迅速定位故障或者缓慢节点。产品架构 产品优势...

CLB健康检查FAQ

负载均衡健康检查服务也是集群方式的,这样可以避免单点故障。负载均衡的代理分布到很多节点上,因此看到的健康检查日志访问频率和控制台设置的频率不一致,这是正常现象。负载均衡因后端数据库故障导致健康检查失败,如何处理?问题现象 ...

告警通知错误

配置错误 故障级别 故障类型 故障详情 故障说明 解决方案 error AlertPolicyNotConfigured Alert xxx has no alert policy configured 未在告警监控规则中设置告警策略,告警无法被路由分组合并,导致对应的告警被忽略。修改告警监控规则,...

挂载访问FAQ

挂载路径已挂载在其他挂载上 挂载路径的父目录已挂载在其他挂载上 挂载命令错误 挂载参数配置错误 建议您使用默认挂载配置再次尝试挂载操作。其他挂载失败原因 请执行错误排查脚本定位具体问题。具体操作,请参见 挂载失败的排查方法与...

设计方案

例如,利用容器技术,系统可以自动迁移容器来解决故障。故障复盘:故障复盘是指对故障进行分析和总结,以便更好地避免故障的再次发生。在故障复盘过程中,需要对故障的起因、影响、处理过程等进行详细的记录和分析,并制定相关的措施。故障...

故障排查

本文介绍您在使用 ACK Serverless集群 时可能遇到的故障以及解决方案。如果您在使用 ACK Serverless集群 时出现故障,可根据以下故障分类匹配故障场景和解决方案,帮助您快速排查问题,提升运维效率。分类 相关文档 集群资源和集群组件异常...

什么是应用实时监控服务ARMS?

产品计费 用户体验监控 专注于对Web场景、App移动应用场景和小程序场景的监控,以用户体验为切入,完整再现用户操作过程,从页面打开速度(测速)、请求服务调用(API)和故障分析(JS错误、网络错误等)稳定性(JS错误、崩溃、ANR 等)...

云市场常见问题

(该体验计划为自愿参与,下单时若未勾选该计划不会进行数据保存)故障排查相关问题 远程服务器返回错误码460,应该如何解决?通常是您的请求body部分参数不符合JSON规范。可以通过检查body参数来解决,或者把body参数尝试转换成JSON格式,...

云盘恢复

当ECS挂载的云盘发生系统故障或者错误操作时,您可以通过云盘在源地域的备份或者复制到目标地域后的备份,进行原盘恢复或者创建新盘操作来实现数据恢复。前提条件 已创建ECS整机备份。具体操作,请参见 备份ECS整机。背景信息 云盘恢复...

产品高可用

CLB系统的高可用 负载均衡实例采用集群部署,可实现会话同步,以消除服务器单点故障,提升冗余,保证服务的稳定性。其中四层负载均衡通过LVS(Linux Virtual Server)+keepalived的方式实现,七层负载均衡通过Tengine(淘宝网发起的Web...

错误

本文档列出了 PolarDB-X 返回的常见错误码及解决方法。PXC-1305 ERR_UNKNOWN_SAVEPOINT PXC-1094 ERR_UNKNOWN_THREAD_ID PXC-4006 ERR_TABLE_NOT_EXIST PXC-4007 ERR_CANNOT_FETCH_TABLE_META PXC-4018 ERR_INVALID_DDL_PARAMS PXC-4100 ...

集群巡检项及解决方案

解决方案:为了避免Ingress故障导致业务流量受损,您需要尽快升级Ingress。更多信息,请参见 Nginx Ingress FAQ。节点Systemd版本过低 异常影响:Systemd版本过低存在已知的稳定性风险,会导致Docker和Containerd等组件无法正常运行。解决...

常见报错及解决方案

Q:谐云组件故障排查思路 A:elasticsearch《故障排查思路》mysql《故障排查思路》redis《故障排查思路》harbor《故障排查思路》通用排查《中间件通用故障排查思路》ingress《故障排查思路》rocketmq《故障排查思路》kafka《故障排查思路》...

节点异常问题排查

本文目录 类别 内容 诊断流程 诊断流程 常见排查方法 节点故障诊断 检查节点的详情 检查节点的状态 检查节点的事件 检查节点的诊断日志 检查节点的关键组件 检查节点的监控 检查节点的安全组 常见问题及解决方案 节点关键组件异常处理 ...

节点异常问题排查

本文目录 类别 内容 诊断流程 诊断流程 常见排查方法 节点故障诊断 检查节点的详情 检查节点的状态 检查节点的事件 检查节点的诊断日志 检查节点的关键组件 检查节点的监控 检查节点的安全组 常见问题及解决方案 节点关键组件异常处理 ...

自主排查IPsec-VPN连接问题

背景信息 本文汇总了IPsec-VPN连接常见错误及排查方法,您可以通过VPN网关管理控制台提示的错误码和IPsec连接的日志信息,对照本文的 汇总表 自主排查,帮助您快速解决问题。如何查看IPsec-VPN连接错误码,请参见 查看错误码。如何查看...

App端性能体验功能说明

术语表 基础字段 名词 名词解释 错误数 该类错误在一定时间范围内产生的次数,也就是SDK上报的日志数量 错误错误率=错误次数/应用启动次数,对于自定义异常类的错误错误率可能大于100%,对于崩溃类的错误由于数据挤压和延时上报的原因...

关键技术竞争力

生产运维智能化:技术风险体系保障业务连续性 TRaaS(Tech Riskdefend as a Service)技术风险防控平台,以蚂蚁内部 SRE 长期实践方法论和内部工具沉淀为依托,解决用户上云和分布式改造过程中所面临的可观测、故障应急、容灾、混沌工程、...

网络架构容灾

例如当网络攻击或配置错误等情况导致负载均衡实例不可用时,由于未出现可用区级故障,不会触发负载均衡实例的可用区切换。此时,建议创建多个CLB实例,通过云解析DNS对访问进行调度,或通过全球负载均衡解决方案实现跨地域容灾备份。可以在...

围绕混沌工程的平台实践

本文主要介绍AHAS Chaos是如何围绕混沌工程来打造故障演练服务,您可以了解到混沌工程的基本知识和AHAS Chaos的优势。混沌工程和故障演练 首先您需要了解混沌工程和故障演练的关系。以下是混沌工程官方定义:混沌工程是在分布式系统上进行...

什么是云工作流(CloudFlow)

方便您快速识别故障位置,并快速排除故障问题。支持长时间运行流程 云工作流 可以跟踪整个流程,持续长时间执行确保流程执行完成。有些流程可能要执行几个小时、几天、甚至几个月。例如运维相关的Pipeline和邮件推广流程。流程状态管理 云...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
数据库自治服务 负载均衡 商标服务 云数据库 OceanBase 版 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用