网关结果码说明

4002 远程调用业务系统异常 MGS 调用业务系统服务出现异常。专有云用户可以在服务端日志 gateway-error.log 中查看详细信息。4003 API 分组 HOST 异常 MGS 调用 HTTP 业务系统服务出现 UnknownHostException 异常。请检查 API 分组配置的...

诊断项与诊断结果说明

实例操作系统异常 实例操作系统出现了内核Panic、OOM异常或内部宕机等故障。检查该实例的操作系统(Guest OS)内部是否存在内核Panic、OOM异常或内部宕机等故障。此类故障可能是由于实例配置不当或用户空间的程序配置不当导致的,您可以...

为数据加工任务开启监控告警

当数据加工出现异常报错时触发告警。关联仪表盘 数据加工诊断>异常详情 消除方法 请按照如下对应报错信息进行处理:错误信息中包含Unauthorized、InvalidAccessKeyId或SignatureNotMatch,则说明数据加工任务读取源Logstore数据、或者写入...

诊断项与诊断结果说明

实例操作系统异常 实例系统出现了内核错误(kernel panic)、OOM(Out of Memory)异常或内部宕机等故障。检查该实例的操作系统(Guest OS)内部是否存在内核panic、OOM异常或内部宕机等故障。这些故障可能是由于实例配置不当或用户空间的...

读写访问文件类问题

如何处理多个ECS实例挂载同一NFS协议文件系统出现数据不同步的情况?为什么卸载旧NAS并重新挂载新NAS后,容器Pod仍将数据写入旧NAS?服务器重启或停机后,为什么NAS里的文件看不到了?为什么Linux挂载SMB协议文件系统迁移和复制文件时速度...

自助救治损伤的ECS实例Linux系统

适用的症状和原因 在某些情况下,Linux操作系统出现启动异常,此时,在阿里云ECS控制台显示的实例状态可能是运行中,但实例内的应用不可访问,实例内的网络不可达,既无法ping通,也无法通过workbench或者ssh建立连接。如果您在阿里云ECS...

版本选型

离群实例摘除 当应用实例出现异常时,该功能可将异常实例按照规则从负载均衡池中移除,保障客户端请求到正常实例上,提升业务的稳定性和服务质量。服务治理可观测 支持查询近五分钟内的实时QPS、RT、CPU、Load等监控数据。企业版 面向全...

消息堆积和延迟问题

例如:某业务消费逻辑中需要写一条数据到数据库,单次消费耗时为1 ms,平时消息量小未出现异常。业务侧进行大促活动时,写数据库TPS爆发式增长,并很快达到数据库容量限制,导致消费单条消息的耗时增加到100 ms,业务侧可以明显感受到消费...

如何使用Prometheus监控Cassandra

mcac_client_request_failures_total Critical 出现异常的客户端请求 该指标过高,说明系统负载较高,会严重影响用户体验。mcac_dropped_message_dropped_total Critical 丢弃的消息 该指标过高,说明系统负载较高,会严重影响用户体验。...

如何使用Prometheus监控Cassandra

mcac_client_request_failures_total Critical 出现异常的客户端请求 该指标过高,说明系统负载较高,会严重影响用户体验。mcac_dropped_message_dropped_total Critical 丢弃的消息 该指标过高,说明系统负载较高,会严重影响用户体验。...

产品优势

通常,DBS可以将增量备份的延迟控制在秒级别以内,根据实际网络环境不同,延迟时长也会不同。并行备份:全程无锁备份、多线程并行备份、数据拉取自适应分片。任意时间点恢复:提供可恢复日历及时间轴选择。在进行数据恢复时,通过全量备份...

事务与Read/Write Concern

在MongoDB中,对于对单个文档的操作,系统始终保证其原子性。由于MongoDB文档结构的灵活性,业务侧总是可以使用嵌入式文档和数组结构来构造联系更紧密的单个文档结构,而不是像传统关系型数据库那样创建多个符合范式规则的集合并进行交互...

监控报警概述

同时基于告警信息、终端用户登录数据、登录失败记录和网络数据趋势图,分析并发现出现异常的高峰时段,便于及时应对与防范。运维监控权限 权限是指在某种条件下允许或拒绝对某些资源执行某些操作,您可以通过权限管控避免不必要的麻烦或...

概览

(ECS)所有磁盘读取BPS(ECS)所有磁盘写入BPS(ECS)所有磁盘每秒读取次数(ECS)所有磁盘每秒写入次数 边界以外 连接数过高、连接数波动较大或连接数持续峰值 系统负载过高、TCP连接池不足、应用程序或者服务出现异常,某些应用程序或者服务在...

云监控

创建并配置报警规则 您可以根据业务的实际情况,创建并配置监控指标的阈值报警,当监控指标超过设定阈值后,系统自动发送报警通知,帮助您及时发现监控数据的异常并快速处理。创建并配置报警规则的步骤如下:登录 云监控控制台。在左侧导航...

调用链分析

例如错/慢调用都来自同一个主机、同一个接口,可以分别筛选对应的主机、接口下的Trace,或通过组合维度(例如 serviceName="arms-demo"AND ip="192.168.1.1")筛选Trace,快速定位系统异常。错/慢Trace分析也可以用于梳理慢接口,对系统...

通过消费组读取文本日志进行模板匹配

例如系统异常时输出Error日志,系统恢复后不再出现该日志,等下次系统异常(超过最大静默时间),再次输出Error日志时,作业会提示出现新的日志类别。默认值为672,表示1天内的最大静默窗口数为672个。采样率 通过采样率调整文本分析作业...

诊断指标与诊断结果条目说明

实例健康诊断功能是一种自助诊断方式,可以对实例的系统状态、网络状态、磁盘状态等进行全方位的诊断,帮助您了解实例健康情况,及时发现并解决常见的问题。本文介绍该功能支持的诊断指标,并提供了详细的诊断范围及建议操作供您参考。基本...

V5.1.x系列实例版本说明

开启读写分离时,支持根据Slave延迟控制是否走只读实例。建表时自动为分库键创建索引。按时间和ID做双字段分区时,优化针对分库键的GROUP BY语句。针对Top N的ORDER BY LIMIT使用内存堆排。针对DML类型优化为单库下推模式。...

云端运行日志

物联网平台控制台提供云端运行日志,包含物联网平台、设备、您的应用程序三者之间的交互通信记录。通过日志记录的消息内容、业务类型、操作类型和状态码等信息,可以了解设备状态、通信情况,并定位操作失败的原因,帮助您监控和管理设备,...

无损上线

方案二:服务小流量预热 在较大流量下,刚启动的系统直接处理大量请求时,可能由于应用内部资源初始化不彻底从而出现请求阻塞、报错等问题。此时通过服务预热功能,在应用刚启动阶段通过小流量帮助应用在处理大量请求前完成初始化,可有效...

跨可用区容灾(Beta)

跨可用区(AZ)容灾,即在同Region不同可用区部署同构的Hologres容灾实例,如果生产实例所处的地理位置发生自然灾害,或者实例内部出现了故障导致生产实例无法正常对外提供读写服务,那么容灾实例可以切换为生产实例,从而保障业务连续性。...

一对一专家服务工作说明书

1个自然日(客户提供前置条件后)软件基础问题排查/自建数据库进阶服务 服务承接时间 每日9:00-18:00 服务完成时间 3个自然日(客户提供前置条件后)注:服务操作前需要客户侧配合提供必要的操作条件,如操作过程中出现异常情况需以实际...

热线接入环境要求

A:这种问题基本是网络质量导致,首先按照上面的文档基础环境要求、通话质量检测、网络丢包/延迟检测检查现场网络环境是否存在丢包、延迟等问题,如果检查过网络质量没有问题且是批量大面积多次出现,则联系技术人员协助排查。Q:接听电话...

消息发送重试和流控机制

若由于系统异常触发了SDK内置的重试逻辑,则服务端需要等待最终重试结果,可能会导致消息发送请求链路被阻塞。对于某些实时调用类场景,您需要合理评估每次调用请求的超时时间以及最大重试次数,避免影响全链路的耗时。最终异常兜底:云...

异地双活切流

此过程中,业务系统中依赖的MSHA-SDK会开启数据库禁写控制,以此进行单元保护,避免更新规则推送到业务系统的时间不一致、机器时钟不一致,导致各机器规则生效时间不一致出现的数据脏写问题。各层切流。同时进行接入层和数据层切流。接入层...

管理报警

打开一键告警后,系统将自动监控如下监控项:规则名 监控项 统计周期 报警规则 SystemDefault_acs_rds_dashboard_PG_RO_ReadLag 只读同步延迟 60秒 当只读同步延迟出现5次平均值大于等于7200秒时,通知云账号报警联系人。SystemDefault_acs...

为MaxCompute投递任务(新版)设置告警

当MaxCompute投递任务出现异常报错后,触发告警。参数配置 监控的投递任务名称:需要监控的MaxCompute投递任务的名称。默认值为.*,表示监控您当前阿里云账号下所有的MaxCompute投递任务。多个投递任务之间可以使用竖线(|)分隔。您还可以...

异地应用双活切流

场景四:故障>数据库故障 说明 部分数据库出现异常,将发生故障的主数据库切换到另一单元(地域)。a.选中想要切换的数据库,在展示框里,同一行代表同一数据库的主备。b.单击 下一步,进入 容灾切换预览,在预览页,可以看到数据库前后主...

常见问题

若用户访问对应的Bucket也出现延迟的情况,需通过抓包获取访问数据分析。您也可以通过日志分析对应时间内的访问数据,确认是否有访问延迟的情况。案例:某公司自己的监控系统发现OSS请求数据有延迟 某公司因业务需求搭建了一套监控系统监控...

操作指导

如果作业出现异常现象,将无法定位初始异常时间,并且无法上报监控告警,请谨慎操作。如果您不再需要对实时计算Flink版进行监控,您可以按照如下步骤卸载Prometheus监控服务:登录 Prometheus控制台。在左侧导航栏单击 监控列表,进入可...

告警规则指标说明

异常接口调用响应时间 毫秒 是 该应用异常调用的响应时间,其中,异常调用指调用中出现异常抛错的调用。可以根据该指标判断调用堆栈抛错对应用调用响应时间的影响大小,从而判断是否存在应用调用异常。指标维度 接口名称,筛选条件如下:遍...

为OSS投递任务(新版)设置告警

当OSS投递任务出现异常报错后,触发告警。参数配置 监控的投递任务名称:需要监控的OSS投递任务的名称。默认值为.*,表示监控您当前阿里云账号下所有的OSS投递任务。多个投递任务之间可以使用竖线(|)分隔。您还可以使用正则表达式.*进行...

流量防护

需设置异常的类名和异常文本,表示Rpc接口访问触发规则后系统会返回指定的异常信息。自定义返回/自定义异常 Rpc 限流处理策略 为 自定义返回 自定义返回类名 填写类名称路径。说明 自定义返回目前不支持对象类型中包含未确定类型的泛型,如...

离线核对

是否误报:误报:例如 SQL 错误、数据错误或系统异常等,导致与核对预期不符的情况。非误报:判定后确定是异常现象。是否资损:有资损:根据异常数据排查问题并分析原因,确定发生资金损失。无资损:未出现资金损失。异常原因描述:长度不...

内核功能与接口概述

说明 内核统一异常框架(UKFEF)Alibaba Cloud Linux 3内核版本 5.10.60-9.al8 及以上 Alibaba Cloud Linux 3在内核版本 5.10.60-9.al8 增加了UKFEF(Unified Kernel Fault Event Framework),用于统计可能导致风险的系统异常事件,并统一...

挂载访问FAQ

现象描述 假设在Linux操作系统中通过挂载点A挂载文件系统,在未卸载的情况下,通过NAS控制台上删除了挂载点A,导致Linux系统出现执行命令卡顿、无响应等异常情况。解决方案 在服务器(如ECS Linux)中,按 Ctrl+C,中断命令的执行。执行 ...

高级管理FAQ

通过RAM授权后,请勿删除或编辑RAM中的AliyunNASDefaultRole角色,否则可能遇到无法挂载或文件系统操作异常。RAM用户拥有对文件系统完全控制权限后,进入文件系统列表为什么还报错误提示?问题现象:RAM用户在拥有对文件系统完全控制权限后...

使用ACK Net Exporter定位网络问题

在启动过程中,依赖于与操作系统内核关联的BTF文件(操作系统内核的调试信息元数据的文件)进行加载。如果没有适配的BTF文件,这部分功能将不可用。在高版本的操作系统中,一般都会内置BTF文件的支持。关于操作系统的更多信息,请参见 BPF ...

文件核对

是否误报:误报:例如 SQL 错误、数据错误或系统异常等,导致与核对预期不符的情况。非误报:判定后确定是异常现象。是否资损:有资损:根据异常数据排查问题并分析原因,确定发生资金损失。无资损:未出现资金损失。异常原因描述:长度不...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
云安全中心 视频直播 负载均衡 Web应用防火墙 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用