业务控制点出现异常怎么办-业务控制点出现异常怎么办文档介绍内容-阿里云

基于日志关键字设置告警

设置标注中的描述为过去4小时内ERROR错误数异常次数超过5次，内容模板为 SLS内置内容模板，则告警通知中将显示当前4小时内出现异常点的次数。告警通知创建上述告警监控规则后，只要当前4小时内出现异常的次数超过5次，您就可以在...

版本功能对比

日志分析（日志服务SLS）当应用出现业务异常问题时，您可以通过分析业务日志，精准定位业务异常。Arthas诊断 Arthas是诊断Java领域线上问题的利器，利用字节码增强技术，可以在不重启JVM进程的情况下，查看程序的运行情况。应用设置 Agent...

使用创建反向任务功能

当业务数据库出现异常无法连接时，执行如下操作来恢复您的业务。暂停原实例。在同步任务列表页面，找到原实例。在目标实例右侧，选择>暂停任务。在弹出的提示对话框，单击确定。在弹出的暂停任务成功对话框，单击确定。将业务切换至...

配置消息监控告警实现风险预警

告警处理：收到限流次数告警后，建议按照如下步骤处理：进入消息队列RocketMQ版控制台的仪表盘页面，查看指定实例、Topic或Group的消息收发TPS曲线，分析限流出现的时间点和规律。根据仪表盘的统计数据，排查消息收发Top级数据的Topic或...

CLB常见问题

健康检查健康检查功能产生大量Web日志四层（TCP/UDP）健康检查出现异常 七层（HTTP/HTTPS）健康检查异常业务站点访问正常但是健康检查异常业务日志中出现“Connection reset by peer”的错误访问SLB实例客户端无法访问负载均衡SLB ...

常见问题

健康检查健康检查功能产生大量Web日志四层（TCP/UDP）健康检查出现异常 七层（HTTP/HTTPS）健康检查异常业务站点访问正常但是健康检查异常业务日志中出现“Connection reset by peer”的错误访问SLB实例客户端无法访问负载均衡SLB ...

配置消息监控告警实现风险预警

告警处理：收到限流次数告警后，建议按照如下步骤处理：进入消息队列RocketMQ版控制台的仪表盘页面，查看指定实例、Topic或Group的消息收发TPS曲线，分析限流出现的时间点和规律。根据仪表盘的统计数据，排查消息收发Top级数据的Topic或...

网关结果码说明

4002 远程调用业务系统异常 MGS 调用业务系统服务出现异常。专有云用户可以在服务端日志 gateway-error.log 中查看详细信息。4003 API 分组 HOST 异常 MGS 调用 HTTP 业务系统服务出现 UnknownHostException 异常。请检查 API 分组配置的...

日志分析

当应用出现业务异常问题时，您可以在可观测链路 OpenTelemetry 版控制台查看日志分析，精准定位业务异常。前提条件已接入可观测链路 OpenTelemetry 版。具体操作，请参见准备工作概述。已开通日志服务SLS。登录日志服务控制台，根据...

日志分析

当应用出现业务异常问题时，您可以在可观测链路 OpenTelemetry 版控制台查看日志分析，精准定位业务异常。前提条件已接入可观测链路 OpenTelemetry 版。具体操作，请参见准备工作概述。已开通日志服务SLS。登录日志服务控制台，根据...

CLB健康检查FAQ

重要如果关闭健康检查，当后端某个服务器健康检查出现异常时，负载均衡还是会把请求转发到该异常的ECS实例上，造成部分业务不可访问。如果您的业务对负载敏感性高，高频率的健康检查探测可能会对正常业务访问造成影响。您可以结合业务情况...

恢复数据库

如果所选恢复时间点的备份数据不符合业务要求，必要时，您可以在全量数据备份页面右上角，单击发起全量备份进行手动备份。等待备份完成后，重新执行恢复任务，恢复时选择最新全量备份集所在的时间点。如果恢复任务出现异常或报错，请...

HTTP(S）健康检查

当监控IP地址出现异常时，自动屏蔽异常IP地址，当IP地址恢复正常时，自动取消屏蔽设置。配置参数说明检查协议检查协议请选择HTTP（S），它是指对目标IP地址进行HTTP（S）监控，监控IP地址的Web服务器网络可达性、服务可用性、首包延时等...

迁移上云操作

注意事项执行切流操作时，每切换一次Topic状态，请及时观察消息收发是否符合预期，若无异常再执行下一步切换操作，若消息收发出现异常可直接回滚操作，待异常原因排查后继续进行切流操作。请确保此次迁移任务范围内的Topic均完成切流操作...

通过调用链路和日志分析定位业务异常问题

当应用出现业务异常问题时，应用指标统计图会出现明显波动，您可据此粗略地分析异常问题；通过完整的调用链路和业务日志分析，可以精准定位业务异常问题。关联业务日志与TraceId 登录 ARMS控制台，在左侧导航栏选择应用监控>应用列表。在 ...

添加订阅配置

任务异常通知：监控任务出现异常（任务状态符合告警级别）时的实时告警通知。定期巡检报告：周期性对业务分组下所有任务的巡检报告输出（统计分析指标输出）。标准协议：按照标准化的参数结构要求输出消息订阅内容，由第三方应用依照自身...

添加订阅配置

任务异常通知：监控任务出现异常（任务状态符合告警级别）时的实时告警通知。定期巡检报告：周期性对业务分组下所有任务的巡检报告输出（统计分析指标输出）。标准协议：按照标准化的参数结构要求输出消息订阅内容，由第三方应用依照自身...

业务切换流程

此步骤创建的反向迁移任务的作用是为业务提供回退方案，业务恢复运行后，一旦出现异常可将业务切换至原有的数据库中。例如原先是将自建MySQL迁移至RDS MySQL，反向数据迁移任务配置案例请参见从RDS MySQL迁移至自建MySQL（仅选择增量数据...

业务切换流程

此步骤创建的反向迁移任务的作用是为业务提供回退方案，业务恢复运行后，一旦出现异常可将业务切换至原有的数据库中。例如原先是将自建MySQL迁移至RDS MySQL，反向数据迁移任务配置案例请参见从RDS MySQL迁移至自建MySQL（仅选择增量数据...

语音通知实现告警功能

当您的系统检测到服务器出现异常，或者物联网等设备出现异常时，可以通过语音通知功能，以语音电话的形式，给告警处理人拨打电话，电话将播报您预先申请的语音通知模板中的内容，在语音通知模板中，您也可以添加变量，从而在实际使用时替换...

消息堆积和延迟问题

例如：某业务消费逻辑中需要写一条数据到数据库，单次消费耗时为1 ms，平时消息量小未出现异常。业务侧进行大促活动时，写数据库TPS爆发式增长，并很快达到数据库容量限制，导致消费单条消息的耗时增加到100 ms，业务侧可以明显感受到消费...

使用PTS监测日常业务

根据业务要求设置SLA监控指标和规则，该示例中将设置请求成功率低于100%时即停止压测，出现异常就需要人为介入排查问题。该示例中的SLA比较严格，适用于核心业务。具体操作步骤，请参见步骤三：设置SLA。设置定时任务。该示例中将设置每天...

什么是云拨测

实时告警与通知：云拨测提供实时告警功能，当业务出现异常时，会主动发送告警通知，快速响应并处理问题。数据可视化：通过直观的数据展示和报表，您可以轻松了解网络状况、性能以及故障分析。应用场景网络性能监控：云拨测可以帮助企业和...

部署与运维

也可以基于某些指标定制实时的监测与告警，当关键业务出现异常时可通过多种途径通知告警。控制台上可以查看当前实例会话，也可以选择终止会话。会话统计页面可查看按客户端统计、按namespace统计等的聚合统计信息。10秒SQL分析功能可以在10...

作业引擎版本升级

升级前请先手动生成一个作业快照，以便升级出现异常时可以快速回滚业务。具体操作请参见手动创建作业快照。重要原则上同一大版本下的小版本间升级兼容，大版本间升级不保证兼容。如果兼容，则新版本的引擎可以读取旧版本引擎生成的作业...

升级Nginx Ingress Controller组件

第四部分：回滚（可选）在验证阶段或者发布阶段后的暂停过程中，如果发现组件或业务出现异常，可以通过回滚来将组件恢复到升级前的初始状态。升级前须知在组件升级前，请确保拥有对业务流量的监控手段，以便及时发现问题。您可以通过SLS...

配置备份计划

备份计划状态显示异常，表示该DBS备份计划下至少存在一个异常任务，通常可能是全量备份任务异常或增量备份任务异常，也可能是其他类型任务出现异常。修复方法，请参见如何修复异常DBS备份计划。若备份计划到期不续费，存储在用户OSS 中的...

产品架构介绍

故障隔离：当局部Provider出现异常时，支持将异常的Provider进行故障隔离，保证所有机房内的Consumer均不会调用到异常的Provider，实现微服务流量的故障逃逸。单元化服务寻址：针对异地多活单元化架构，支持按照单元化规则寻址调用Provider...

节点诊断

ECS实例网卡链路层状态检查ECS实例网卡链路层是否出现异常。ECS实例未正常启动或网络配置有问题，您可以尝试通过重启实例进行恢复。ECS实例启动状态检查ECS实例的boot操作是否能正常执行加载。ECS实例无法正常启动，您需要创建一个新的...

Pod诊断

检查项则按不同的类别对可能引起异常的点进行检查，覆盖根因未包括的部分，并对异常原因进一步补充。说明根据集群配置，具体检查项可能稍有不同。实际结果请以诊断页面结果为准。Pod诊断对应的检查项诊断项分组说明 Pod 检查Pod常见问题...

区间检测

当某个服务出现异常，可以迅速定位问题，确保整个系统的稳定运行。示例：某工作网站的访问量在白天（例如10:00~18:00）访问量低于1000是异常的，但在夜间（例如22:00~06:00）访问量超过1000可能是被攻击了。在这种场景下，指标的正常水位会...

区间检测

当某个服务出现异常，可以迅速定位问题，确保整个系统的稳定运行。示例：某工作网站的访问量在白天（例如10:00~18:00）访问量低于1000是异常的，但在夜间（例如22:00~06:00）访问量超过1000可能是被攻击了。在这种场景下，指标的正常水位会...

区间检测

当某个服务出现异常，可以迅速定位问题，确保整个系统的稳定运行。示例：某工作网站的访问量在白天（例如10:00~18:00）访问量低于1000是异常的，但在夜间（例如22:00~06:00）访问量超过1000可能是被攻击了。在这种场景下，指标的正常水位会...

沙箱说明

接入该实例的防护对象将随时可能出现业务访问异常，包括但不限于丢包、限速、限连、防护失效、日志或报表数据异常、访问超时、进入DDoS清洗或黑洞等情况。实例进入沙箱后，开启弹性后付费，实例进入沙箱当天到解除沙箱当天的时间段不产生...

Hive服务异常排查及处理

可继续对HiveMetaStore或者HiveServer2的日志进行排查，日志路径一般位于/mnt/disk1/log/hive/中，可逐步检查组件的.log、.err、.out 及GC等日志，判断HiveMetastore或者HiveServer2出现异常的真实原因。HiveMetaStore后端数据库问题常见...

如何处理消息堆积

使用阿里云ARMS 等其他监控产品做业务埋点采集消息的消费耗时。查看客户端堆栈信息。只需要关注线程名为ConsumeMessageThread的线程，这些都是业务消费消息的逻辑。可参见 Java官方文档判断线程的状态并根据具体问题修改业务逻辑。客户端...

发现和处理异常告警

异常事件类型异常事件可分为以下类型：流转异常：数据在流转过程中出现的异常情况。例如：下载非常用Bucket内敏感文件、初次下载敏感数据等。行为异常：非正常的数据操作行为。例如：登录密码连续错误、短时间内大量删除数据等。自定义...

应用防护规则适用场景

自动重试规则场景说明分布式系统中调用关系通常会比较复杂，服务之间的调用可能会偶尔出现异常。这些异常有的是不可恢复的（如业务错误），有的则是可以恢复的（如偶发的超时）。当系统遇到一些非致命性的错误（如偶现的超时等）时，可以...

Operator

Service Mesh 是蚂蚁集团下一代技术架构的核心，也是蚂蚁集团内部双十一应用云化的重要一环，本文主要...设计更完善的灰度机制，在 Operator 出现异常后，快速熔断，避免故障范围扩大。持续思考：整个 Sidecar 的运维方式能否更加“云原生”。

配置App防爬场景化规则

防爬策略测试常见问题若在防护动作验证时出现异常情况，可参考表格解决对应问题。报错原因解决方法未查询到任何有效测试请求，您可以查看帮助文档或咨询我们以分析可能的原因。实际测试请求没有发送成功，或者没有发送到WAF。确认...

业务控制点出现异常怎么办

新品推荐