服务支持

NLP自然语言处理 常见问题 调用异常自助排查(错误码汇总)服务协议 NLP自学习平台 常见问题 实体抽取项目常见问题 故障排除 私有化部署 企业智能搜索 错误码对照表 常见问题

使用OpenAPI诊断工具进行故障排查

阿里云OpenAPI平台提供使用诊断工具。本文介绍如何使用OpenAPI诊断工具进行故障排查。您可以登录 OpenAPI使用诊断,输入完整的RequestID或SDK报错信息,然后...如果诊断工具仍未能解决您的问题,您可以参考 故障排除、常见问题 获取解决方案。

监控服务概览

OpenAPI访问监控数据 OSS服务的相关监控指标数据可以通过云监控提供的OpenAPI访问,使用方法请参见:云监控SDK参考 访问监控数据 监控、诊断和故障排除 监控诊断和故障排除 通过详细介绍以下各个方面的内容帮助您更好地了解OSS服务的运行...

可观测性的设计原则

通过在系统中实现分布式跟踪,可以快速定位问题并进行有效的故障排除。链路跟踪可以通过在系统中添加跟踪标识符来实现。当请求进入系统时,标识符将被添加到请求中,并在整个系统中传递。每个组件都可以将标识符添加到它们的日志中,以便在...

支持计划

配置指导以及故障排除 配置指导以及故障排除 配置指导以及故障排除 专属技术服务经理 不支持 不支持 专属技术服务经理(TAM)健康检查 可免费使用智能顾问Advisor 可免费使用智能顾问Advisor 可免费使用智能顾问Advisor。专属技术服务经理...

故障排除

CC API在调用时可能会遇到一些错误,遇到错误时以错误码为依据进行故障排除,本文为您介绍 常见错误码的解决方案。云产品运行时错误码 云产品API运行时返回的错误码。以下两个错误码为云产品运行时错误,如想获取云产品详细错误信息,需...

常见问题FAQ

4.HDMI无信号 故障示意图如下:故障排除方案如下:1.见下遥控器说明,按电源键,重启魔盒。2.重复插拔HDMI线 3.重启屏幕 屏幕操作指南由屏幕供应商给出。4.屏幕的信号源切换到HDMI输入。屏幕操作指南由屏幕供应商给出。如无法排除故障:...

诊断网页加载过慢的问题

针对这类问题,ARMS前端监控的慢会话追踪功能提供页面静态资源加载的性能瀑布图,可深入定位页面资源加载情况,全方位地诊断故障根源,从而快速排除故障。问题描述 网页加载较慢是经常出现且前端非常关注的问题之一。定位、排查解决这类...

设备显示离线

如果是静态路由接入,尝试通过交换机,能否 ping 通设备的每个接口IP,如果其中有无法 ping 通的接口,请参见 设备和交换机之间的链路故障排除接口互联问题。如果是单机设备,观察设备机身的状态指示灯,确认右侧第二个和第三个灯是否为...

ping不通云服务ECS(SAG-1000)

如果是静态路由接入,尝试通过交换机,能否ping通设备的每个接口IP,如果其中有无法ping通的接口,请参见 设备和交换机之间的链路故障排除接口互联问题。如果是单机设备,观察设备机身的状态指示灯,确认右侧第2和第3个灯是否有红色的。...

监控、诊断和故障排除

故障排除:提供常见的问题场景和故障排除方法。服务监控 监视总体运行状况 可用性和有效请求率 可用性和有效请求率是有关系统稳定性和用户是否正确使用系统的最重要指标,指标小于100%说明某些请求失败。可能因为一些系统优化因素出现暂时...

查看节点健康状态

节点健康状态展示了当前节点的运行状态是否正常,它是由多个健康检查项结果汇总而成的。本文将介绍如何查看节点的健康状态和相关的健康检查项。前提条件 已创建集群,详情请参见 创建集群。...无阈值,有故障补偿发生即为异常。

电源故障定位

您可以参考以下方法定位电源故障并进行处理流程。诊断流程 电源故障详细处理流程,如下图所示。处理步骤 测量输入电压。使用万用表测量输入电压,根据电源适配器的工作电压范围判断输入电压是否异常。插拔电源适配器。把电源适配器以及电源...

概览

智能阈值报警是针对云监控中的云资源实例的监控指标推出的智能报警功能,它自动适配并拟合监控指标的历史数据,展示报警阈值边界,发现监控指标突增或突降的异常行为,为您业务的稳定性提供保障。什么是智能阈值 智能阈值基于机器学习算法...

服务等级目标SLO概述

多窗口能够在计算一段时间的故障率时同时设置一个短时间窗口,当短时间窗口内的故障率低于阈值时结束告警。设置短时间窗口可以保障故障处理后,及时解除告警。以设置30天的SLO为例:当1小时内错误预算消耗2%(即该小时内错误率高于阈值的14...

服务等级目标SLO概述

多窗口能够在计算一段时间的故障率时同时设置一个短时间窗口,当短时间窗口内的故障率低于阈值时结束告警。设置短时间窗口可以保障故障处理后,及时解除告警。以设置30天的SLO为例:当1小时内错误预算消耗2%(即该小时内错误率高于阈值的14...

实时分析链路数据

如果异常请求分散在多台机器,那么大概率可以排除单机故障因素,可以重点分析下游依赖服务或程序逻辑是否异常。在 调用链分析 页面筛选错误调用或慢调用,并设置按IP进行分组统计,如果异常调用集中出现在特定机器,则有较大概率是机器故障...

使用报警服务

查看目标报警规则的报警历史 您可以查看指定报警规则中的所有故障资源的报警详情和报警图表,及时定位并处理资源故障。使用阈值报警回调 云监控除了 电话、短信、邮件和WebHook的报警通知方式外,还可以使用报警回调方式,实现将云监控发送...

边缘应用告警规则对接

alarmType Integer 非必填 告警类型,1运行告警,2故障告警 alarmMode Integer 非必填 告警模式,1阈值告警,2限值告警,默认阈值告警 runEnv String 非必填 运行环境,cloud云端,edge边缘端 pageNo Integer 非必填 当前页码,默认1 ...

评分卡训练

否 选择全部,自动排除Label列。labelColName 目标列。是 无 outputTableName 输出模型表。是 无 inputConstraintTableName 输入的JSON格式约束条件,存储在表的一个单元中。否 无 optimization 优化类型,支持的类型包括:lbfgs newton ...

故障复盘

故障复盘规范 故障复盘作为故障体系中的重要一环,整体复盘流程包括故障处理过程、改进分析、故障定责,基于包含标准化的复盘SOP、对应预防action推荐、问责管理机制,全面地回溯线上故障的发生,产出故障复盘报告和改进措施,避免故障重复...

故障隔离

故障隔离是在服务实例出现故障时,实现实例级别的精细化摘流隔离,使故障影响范围更小,提高服务的可用性。添加故障隔离规则 登录 SOFAStack 控制台。在左侧菜单栏选择 中间件>微服务平台>服务网格>服务治理,然后单击 故障隔离 页签。单击...

MSE注册配置中心高可用最佳实践

故障节点数达到保护阈值,流量平摊给所有实例。最终保障50%节点能够提供服务。开启容灾保护 支持的实例范围 持久化实例:完全支持。非持久化实例:nacos-java-client 1.x版本:默认30秒会删除不健康的实例,被删除的实例将不会参与阈值的...

阈值检测

应用场景 当您发现经常收到某条告警,但是系统又没有发生任何故障时,可能是因为当前的阈值设置得不够合理,或者是该阈值不适合某些应用或接口。这种场景下,您可以使用 建议阈值 功能,对告警规则的阈值进行调整,或对部分应用、接口的...

阈值检测

应用场景 当您发现经常收到某条告警,但是系统又没有发生任何故障时,可能是因为当前的阈值设置得不够合理,或者是该阈值不适合某些应用或接口。这种场景下,您可以使用 建议阈值 功能,对告警规则的阈值进行调整,或对部分应用、接口的...

阈值检测

应用场景 当您发现经常收到某条告警,但是系统又没有发生任何故障时,可能是因为当前的阈值设置得不够合理,或者是该阈值不适合某些应用或接口。这种场景下,您可以使用 建议阈值 功能,对告警规则的阈值进行调整,或对部分应用、接口的...

网络类场景

排除端口 无需注入网络延迟调用故障的端口,与本地服务端口和远程服务端口功能互斥。可以指定多个,使用逗号分隔,使用连接符表示范围。例如80,8000-8080。远端服务IP 指定演练对象访问的远端服务IP。可以通过子网掩码来指定一个网段的IP...

无法连接Windows实例

故障现象 无法ping通ECS实例,在排除Iptables和网卡IP配置问题且回滚系统后,仍然无法ping通。故障原因 可能是ECS实例安全组默认的公网规则被删除。解决方法 重新配置ECS实例的安全组公网规则,具体操作请参见 ECS实例安全组默认的公网规则...

什么是故障演练

验证监控告警的时效性 通过对系统注入故障,验证监控指标是否准确,监控维度是否完善,告警阈值是否合理,告警是否快速,告警接收人是否正确,通知渠道是否可用等,提升监控告警的准确性和时效性。定位与解决问题的应急能力 通过故障突袭,...

递归管理

(递归DNS服务涉及到与外部第三方DNS系统交互,由于外部网络问题、外部第三方DNS故障等导致的DNS不可用问题,不承诺SLA)使用限制 限制项 限制阈值 说明 VPC内单台ECS外部递归解析请求量 600次/秒 VPC内每台ECS机器外部递归解析请求阈值为...

I-V曲线诊断

数据服务中提供光伏智能运维的IV曲线诊断算法,结合环境光强度、环境温度等影响因素,对组串式光伏发电阵列的电流-电压曲线(I-V曲线)进行分析,检测系统可能出现的故障,进而提高设备的运行效率,保障电站高效运行。本文介绍光伏智能运维...

单笔数据 Top

六、配置报警 Top 报警配置 指设置一定的报警规则,可通过手机短信方式接收故障报警。实时监控提供可视化报警配置,支持大于排序值阈值的统计项数量的报警统计规则、支持多条件多套报警配置、并可按不同时间段设置预警。为不同的报警方式...

窃电用户自动识别概述

根据报警事件发生前后,客户计量点有关的电流、电压和负荷等数据情况,构建基于指标的用电异常分析模型,检查是否存在窃电、违章用电及计量装置故障等情况。虽然上述防窃电漏电的查询方法可以获得用电异常信息,但由于终端误报或漏报过多,...

设计方案

容错 容错是指在分布式系统中,系统出现故障时,通过设计和实现可靠的机制和策略,使系统能够自动检测、排除或者纠正错误,保证系统能够正常运行,从而提高系统的可靠性和稳定性。容量 容量是在一定时间内,系统能够处理的最大工作量或数据...

什么是读写分离

读写分离模块将自动对主实例和只读实例进行健康检查,当发现某个实例出现宕机或者延迟超过阈值时,将不再分配读请求给该实例,读写请求在剩余的健康实例间进行分配。以此确保单个只读实例发生故障时,不会影响应用的正常访问。当实例被修复...

配置消息监控告警实现风险预警

配置消息堆积量告警最佳实践 说明 消息堆积量统计存在一定的波动性和误差,几十条规模的消息堆积不建议配置为监控阈值,如果业务对少量堆积也非常敏感,建议使用消费堆积延迟时间阈值来监控。背景:消息队列RocketMQ支持按照ConsumerGroup...

配置消息监控告警实现风险预警

配置消息堆积量告警最佳实践 说明 消息堆积量统计存在一定的波动性和误差,几十条规模的消息堆积不建议配置为监控阈值,如果业务对少量堆积也非常敏感,建议使用消费堆积延迟时间阈值来监控。背景:消息队列RocketMQ支持按照ConsumerGroup...

核心自治技术案例解析

7x24实时异常检测 DAS的7x24实时异常检测通过机器学习算法,实时对数据库的Workload进行异常检测,相比传统基于阈值的告警方式,能够更及时的发现数据库的异常,而不是靠故障驱动。您可以采集各种数据,比如从链路上采集数百个数据库性能...

硬件功能说明

智能接入网关提供两种型号的网关设备,设备功能如下表...阈值报警 实现监控项超过设定阈值后自动发送报警通知的功能。健康检查 说明 健康检查功能默认不开放,您可以向客户经理申请开通健康检查功能。支持通过配置健康检查探测链路的连通性。

网关一体机告警介绍

监控项 报警阈值 报警通道 恢复是否通知 疲劳度 是否实时 CPU使用率 一分钟内平均使用率超过95%客户邮箱 是 每日最多5封 是 内存使用率 一分钟内平均空闲内存小于20%客户邮箱 是 每日最多3封 是 硬盘故障 磁盘状态出现异常,立即报警 短信 ...
共有179条 < 1 2 3 4 ... 179 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
数据库自治服务 负载均衡 应用高可用服务 云数据库 OceanBase 版 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用