基于日志关键字设置告警

设置 标注 中的 描述 为 过去4小时内ERROR错误数异常次数超过5次,内容模板 为 SLS内置内容模板,则告警通知中将显示当前4小时内出现异常点的次数。告警通知 创建上述告警监控规则后,只要当前4小时内出现异常的次数超过5次,您就可以在...

版本功能对比

日志分析(日志服务SLS)当应用出现业务异常问题时,您可以通过分析业务日志,精准定位业务异常。Arthas诊断 Arthas是诊断Java领域线上问题的利器,利用字节码增强技术,可以在不重启JVM进程的情况下,查看程序的运行情况。应用设置 Agent...

使用创建反向任务功能

业务数据库出现异常无法连接时,执行如下操作来恢复您的业务。暂停原实例。在 同步任务 列表页面,找到原实例。在目标实例右侧,选择>暂停任务。在弹出的 提示 对话框,单击 确定。在弹出的 暂停任务成功对话框,单击 确定。将业务切换至...

配置消息监控告警实现风险预警

告警处理:收到限流次数告警后,建议按照如下步骤处理:进入 消息队列RocketMQ版控制台 的仪表盘页面,查看指定实例、Topic或Group的消息收发TPS曲线,分析限流出现的时间和规律。根据仪表盘的统计数据,排查消息收发Top级数据的Topic或...

CLB常见问题

健康检查 健康检查功能产生大量Web日志 四层(TCP/UDP)健康检查出现异常 七层(HTTP/HTTPS)健康检查异常 业务站点访问正常但是健康检查异常 业务日志中出现“Connection reset by peer”的错误 访问SLB实例 客户端无法访问负载均衡SLB ...

常见问题

健康检查 健康检查功能产生大量Web日志 四层(TCP/UDP)健康检查出现异常 七层(HTTP/HTTPS)健康检查异常 业务站点访问正常但是健康检查异常 业务日志中出现“Connection reset by peer”的错误 访问SLB实例 客户端无法访问负载均衡SLB ...

配置消息监控告警实现风险预警

告警处理:收到限流次数告警后,建议按照如下步骤处理:进入 消息队列RocketMQ版控制台 的仪表盘页面,查看指定实例、Topic或Group的消息收发TPS曲线,分析限流出现的时间和规律。根据仪表盘的统计数据,排查消息收发Top级数据的Topic或...

网关结果码说明

4002 远程调用业务系统异常 MGS 调用业务系统服务出现异常。专有云用户可以在服务端日志 gateway-error.log 中查看详细信息。4003 API 分组 HOST 异常 MGS 调用 HTTP 业务系统服务出现 UnknownHostException 异常。请检查 API 分组配置的...

日志分析

当应用出现业务异常问题时,您可以在 可观测链路 OpenTelemetry 版 控制台查看日志分析,精准定位业务异常。前提条件 已接入 可观测链路 OpenTelemetry 版。具体操作,请参见 准备工作概述。已开通日志服务SLS。登录 日志服务控制台,根据...

日志分析

当应用出现业务异常问题时,您可以在 可观测链路 OpenTelemetry 版 控制台查看日志分析,精准定位业务异常。前提条件 已接入 可观测链路 OpenTelemetry 版。具体操作,请参见 准备工作概述。已开通日志服务SLS。登录 日志服务控制台,根据...

CLB健康检查FAQ

重要 如果关闭健康检查,当后端某个服务器健康检查出现异常时,负载均衡还是会把请求转发到该异常的ECS实例上,造成部分业务不可访问。如果您的业务对负载敏感性高,高频率的健康检查探测可能会对正常业务访问造成影响。您可以结合业务情况...

恢复数据库

如果所选恢复时间的备份数据不符合业务要求,必要时,您可以在 全量数据备份 页面右上角,单击 发起全量备份 进行手动备份。等待备份完成后,重新执行恢复任务,恢复时选择最新全量备份集所在的时间。如果恢复任务出现异常或报错,请...

HTTP(S)健康检查

当监控IP地址出现异常时,自动屏蔽异常IP地址,当IP地址恢复正常时,自动取消屏蔽设置。配置参数说明 检查协议 检查协议请选择HTTP(S),它是指对目标IP地址进行HTTP(S)监控,监控IP地址的Web服务器网络可达性、服务可用性、首包延时等...

迁移上云操作

注意事项 执行切流操作时,每切换一次Topic状态,请及时观察消息收发是否符合预期,若无异常再执行下一步切换操作,若消息收发出现异常可直接回滚操作,待异常原因排查后继续进行切流操作。请确保此次迁移任务范围内的Topic均完成切流操作...

通过调用链路和日志分析定位业务异常问题

当应用出现业务异常问题时,应用指标统计图会出现明显波动,您可据此粗略地分析异常问题;通过完整的调用链路和业务日志分析,可以精准定位业务异常问题。关联业务日志与TraceId 登录 ARMS控制台,在左侧导航栏选择 应用监控>应用列表。在 ...

添加订阅配置

任务异常通知:监控任务出现异常(任务状态符合告警级别)时的实时告警通知。定期巡检报告:周期性对业务分组下所有任务的巡检报告输出(统计分析指标输出)。标准协议:按照标准化的参数结构要求输出消息订阅内容,由第三方应用依照自身...

添加订阅配置

任务异常通知:监控任务出现异常(任务状态符合告警级别)时的实时告警通知。定期巡检报告:周期性对业务分组下所有任务的巡检报告输出(统计分析指标输出)。标准协议:按照标准化的参数结构要求输出消息订阅内容,由第三方应用依照自身...

业务切换流程

此步骤创建的反向迁移任务的作用是为业务提供回退方案,业务恢复运行后,一旦出现异常可将业务切换至原有的数据库中。例如原先是将自建MySQL迁移至RDS MySQL,反向数据迁移任务配置案例请参见 从RDS MySQL迁移至自建MySQL(仅选择 增量数据...

业务切换流程

此步骤创建的反向迁移任务的作用是为业务提供回退方案,业务恢复运行后,一旦出现异常可将业务切换至原有的数据库中。例如原先是将自建MySQL迁移至RDS MySQL,反向数据迁移任务配置案例请参见 从RDS MySQL迁移至自建MySQL(仅选择 增量数据...

语音通知实现告警功能

当您的系统检测到服务器出现异常,或者物联网等设备出现异常时,可以通过语音通知功能,以语音电话的形式,给告警处理人拨打电话,电话将播报您预先申请的语音通知模板中的内容,在语音通知模板中,您也可以添加变量,从而在实际使用时替换...

消息堆积和延迟问题

例如:某业务消费逻辑中需要写一条数据到数据库,单次消费耗时为1 ms,平时消息量小未出现异常业务侧进行大促活动时,写数据库TPS爆发式增长,并很快达到数据库容量限制,导致消费单条消息的耗时增加到100 ms,业务侧可以明显感受到消费...

使用PTS监测日常业务

根据业务要求设置SLA监控指标和规则,该示例中将设置请求成功率低于100%时即停止压测,出现异常就需要人为介入排查问题。该示例中的SLA比较严格,适用于核心业务。具体操作步骤,请参见 步骤三:设置SLA。设置定时任务。该示例中将设置每天...

什么是云拨测

实时告警与通知:云拨测提供实时告警功能,当业务出现异常时,会主动发送告警通知,快速响应并处理问题。数据可视化:通过直观的数据展示和报表,您可以轻松了解网络状况、性能以及故障分析。应用场景 网络性能监控:云拨测可以帮助企业和...

部署与运维

也可以基于某些指标定制实时的监测与告警,当关键业务出现异常时可通过多种途径通知告警。控制台上可以查看当前实例会话,也可以选择终止会话。会话统计页面可查看按客户端统计、按namespace统计等的聚合统计信息。10秒SQL分析功能可以在10...

作业引擎版本升级

升级前请先手动生成一个作业快照,以便升级出现异常时可以快速回滚业务。具体操作请参见 手动创建作业快照。重要 原则上同一大版本下的小版本间升级兼容,大版本间升级不保证兼容。如果兼容,则新版本的引擎可以读取旧版本引擎生成的作业...

升级Nginx Ingress Controller组件

第四部分:回滚(可选)在验证阶段或者发布阶段后的暂停过程中,如果发现组件或业务出现异常,可以通过回滚来将组件恢复到升级前的初始状态。升级前须知 在组件升级前,请确保拥有对业务流量的监控手段,以便及时发现问题。您可以通过SLS...

配置备份计划

备份计划状态显示异常,表示该DBS备份计划下至少存在一个异常任务,通常可能是全量备份任务异常或增量备份任务异常,也可能是其他类型任务出现异常。修复方法,请参见 如何修复异常DBS备份计划。若备份计划到期不续费,存储在 用户OSS 中的...

产品架构介绍

故障隔离:当局部Provider出现异常时,支持将异常的Provider进行故障隔离,保证所有机房内的Consumer均不会调用到异常的Provider,实现微服务流量的故障逃逸。单元化服务寻址:针对异地多活单元化架构,支持按照单元化规则寻址调用Provider...

节点诊断

ECS实例网卡链路层状态 检查ECS实例网卡链路层是否出现异常。ECS实例未正常启动或网络配置有问题,您可以尝试通过重启实例进行恢复。ECS实例启动状态 检查ECS实例的boot操作是否能正常执行加载。ECS实例无法正常启动,您需要创建一个新的...

Pod诊断

检查项则按不同的类别对可能引起异常进行检查,覆盖根因未包括的部分,并对异常原因进一步补充。说明 根据集群配置,具体检查项可能稍有不同。实际结果请以诊断页面结果为准。Pod诊断对应的检查项 诊断项分组 说明 Pod 检查Pod常见问题...

区间检测

当某个服务出现异常,可以迅速定位问题,确保整个系统的稳定运行。示例:某工作网站的访问量在白天(例如10:00~18:00)访问量低于1000是异常的,但在夜间(例如22:00~06:00)访问量超过1000可能是被攻击了。在这种场景下,指标的正常水位会...

区间检测

当某个服务出现异常,可以迅速定位问题,确保整个系统的稳定运行。示例:某工作网站的访问量在白天(例如10:00~18:00)访问量低于1000是异常的,但在夜间(例如22:00~06:00)访问量超过1000可能是被攻击了。在这种场景下,指标的正常水位会...

区间检测

当某个服务出现异常,可以迅速定位问题,确保整个系统的稳定运行。示例:某工作网站的访问量在白天(例如10:00~18:00)访问量低于1000是异常的,但在夜间(例如22:00~06:00)访问量超过1000可能是被攻击了。在这种场景下,指标的正常水位会...

沙箱说明

接入该实例的防护对象将随时可能出现业务访问异常,包括但不限于丢包、限速、限连、防护失效、日志或报表数据异常、访问超时、进入DDoS清洗或黑洞等情况。实例进入沙箱后,开启弹性后付费,实例进入沙箱当天到解除沙箱当天的时间段不产生...

Hive服务异常排查及处理

可继续对HiveMetaStore或者HiveServer2的日志进行排查,日志路径一般位于/mnt/disk1/log/hive/中,可逐步检查组件的.log、.err、.out 及GC等日志,判断HiveMetastore或者HiveServer2出现异常的真实原因。HiveMetaStore后端数据库问题 常见...

如何处理消息堆积

使用 阿里云ARMS 等其他监控产品做业务采集消息的消费耗时。查看客户端堆栈信息。只需要关注线程名为ConsumeMessageThread的线程,这些都是业务消费消息的逻辑。可参见 Java官方文档 判断线程的状态并根据具体问题修改业务逻辑。客户端...

发现和处理异常告警

异常事件类型 异常事件可分为以下类型:流转异常:数据在流转过程中出现异常情况。例如:下载非常用Bucket内敏感文件、初次下载敏感数据等。行为异常:非正常的数据操作行为。例如:登录密码连续错误、短时间内大量删除数据等。自定义...

应用防护规则适用场景

自动重试规则 场景说明 分布式系统中调用关系通常会比较复杂,服务之间的调用可能会偶尔出现异常。这些异常有的是不可恢复的(如业务错误),有的则是可以恢复的(如偶发的超时)。当系统遇到一些非致命性的错误(如偶现的超时等)时,可以...

Operator

Service Mesh 是蚂蚁集团下一代技术架构的核心,也是蚂蚁集团内部双十一应用云化的重要一环,本文主要...设计更完善的灰度机制,在 Operator 出现异常后,快速熔断,避免故障范围扩大。持续思考:整个 Sidecar 的运维方式能否更加“云原生”。

配置App防爬场景化规则

防爬策略测试常见问题 若在 防护动作验证 时出现异常情况,可参考表格解决对应问题。报错 原因 解决方法 未查询到任何有效测试请求,您可以查看帮助文档或咨询我们以分析可能的原因。实际测试请求没有发送成功,或者没有发送到WAF。确认...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
物联网无线连接服务 云数据库 Redis 版 云服务器 ECS Web应用防火墙 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用