AIMaster:弹性自动容错引擎

除了对任务容错信息通知外,当您判断任务训练出现异常时,比如loss出现Nan,也可以在代码中使用AIMaster SDK发送自定义通知消息,如下所示 说明 本功能需要安装AIMaster whl包,详情请参见 常见问题解答。from aimaster import job_monitor...

内核统一异常框架(UKFEF)

Normal:当前应用进程可能会出现异常。建议对当前应用采取措施,例如 kill、重启或迁移。Fatal:可能会对系统产生致命影响。建议立即进行业务迁移。事件报告 UKFEF将通过以下方式输出事件报告:通过内核日志输出单次事件的详细信息。信息...

概览

实例消息堆积量 消息堆积量 Topic消息堆积量 高于上边界 连接数过高、连接数波动较大或连接数持续峰值 系统负载过高、TCP连接池不足、应用程序或服务出现异常、某些应用程序或服务在某些时候进行了大量的TCP连接操作。实例公网TCP连接的...

调试场景

若断言出现异常,请在右侧 响应详情 页签的 检查点信息 区域查看断言信息。若当前值为空,则表示未获取到出参值。图示中③为响应的错误信息,可显示异常响应详情,例如超时、参数错误、连接拒绝等。图示中④为请求在核心的生命周期内的耗时...

常见问题

在4.x的手机系统上可能出现的崩溃问题的解决方法 在7.0以上版本的手机系统上出现异常的解决方法 IOException异常,找不到补丁怎么办?线上拉取补丁时,找不到补丁怎么办?应用在多个市场发布,是否有问题?签名信息不匹配或没有签名如何...

网关结果码说明

4002 远程调用业务系统异常 MGS 调用业务系统服务出现异常。专有云用户可以在服务端日志 gateway-error.log 中查看详细信息。4003 API 分组 HOST 异常 MGS 调用 HTTP 业务系统服务出现 UnknownHostException 异常。请检查 API 分组配置的...

CLB实例诊断

健康检查异常监测:检查CLB监听的健康检查是否出现异常。闲置实例检测 监听为空:检查监听是否为空。后端服务器为空:检查后端服务器是否为空。容量超限诊断 带宽限速丢包:检查CLB实例是否因带宽超限而导致限速丢包(15分钟内)。部分场景...

版本选型

离群实例摘除 当应用实例出现异常时,该功能可将异常实例按照规则从负载均衡池中移除,保障客户端请求到正常实例上,提升业务的稳定性和服务质量。服务治理可观测 支持查询近五分钟内的实时QPS、RT、CPU、Load等监控数据。企业版 面向全...

调试场景

若断言出现异常,请在右侧 响应详情 页签的 检查点信息 区域查看断言信息。若当前值为空,则表示未获取到出参值。图示中③为响应的错误信息,可显示异常响应详情,例如超时、参数错误、连接拒绝等。图示中④为请求在核心的生命周期内的耗时...

主备切换

此类触发方式会以 短信或 站内信、邮件等形式通知到您,通知示例如下:【阿里云】尊敬的*:您的 云数据库Redis版 实例:r-bp1zxszhcgatnx*(名称:*)出现异常,高可用系统已经触发切换,确保实例稳定运行。请检查程序连接是否正常,建议...

主备切换

此类触发方式会以 短信或 站内信、邮件等形式通知到您,通知示例如下:【阿里云】尊敬的*:您的 云原生内存数据库Tair 实例:r-bp1zxszhcgatnx*(名称:*)出现异常,高可用系统已经触发切换,确保实例稳定运行。请检查程序连接是否正常,...

错误码

AutoPlayFailed 17040928 自动播放失败 BrowserNotSupported 16974101 浏览器特性不支持 CameraAuthFail 17039680 摄像头设备未授权,建议去系统设置中,打开麦克风授权,并且重新加入频道 CameraInterrupt 17039622 采集过程中出现异常,...

Hive服务异常排查及处理

可继续对HiveMetaStore或者HiveServer2的日志进行排查,日志路径一般位于/mnt/disk1/log/hive/中,可逐步检查组件的.log、.err、.out 及GC等日志,判断HiveMetastore或者HiveServer2出现异常的真实原因。HiveMetaStore后端数据库问题 常见...

审批负责人治理(Beta)

当审批负责人的云账号出现异常时,您需要及时对这些异常的审批负责人账号进行治理,减少审批流阻塞、规范审批流程。本文为您介绍如何在数据地图中查看及治理表的异常审批负责人。试用限制 审批负责人治理为Beta版功能,欢迎试用及反馈。...

java_lang_RuntimeException

ArithmeticException当出现异常的运算条件时,抛出此异常。例如,一个整数“除以零”时,抛出此类的一个实例。BufferUnderflowException当相关get操作达到源缓冲区限制时,抛出此未经检查的异常。IndexOutOfBoundsException指示某排序索引...

工作原理

下探分析用于多维时序数据的根因定位,当监控的时序指标出现异常时,分析这个时序指标的各个维度,检测是哪个维度或者哪些维度的组合导致了指标异常。通过指标的各个维度进行根因定位,便于运维人员在服务异常时快速定位异常根因。例如网站...

设备网络状态

以下两种情况下,设备立即上报网络状态数据:当网络出现异常时,设备采集到异常指标,会立即上报数据到云端。您设置了定时采集,设备会在指定时间采集数据,并立即上报数据。假设当前时间是2019-08-22 08:10:29,设备检测到网络问题,立即...

无法连接Linux实例的排查方法

登录Linux实例失败并报“login:Module is unknown”错误如何处理 Linux实例系统环境配置 Linux内的系统环境,例如中毒、账户配置、环境变量配置等,如果出现异常,也可能会导致SSH登录失败。根据不同报错信息,可参见如下常见案例进行解决...

iOS SDK集成

功能时序图 功能实现 初始化RTC引擎及回调注册 说明 SDK出现异常时内部会优先进行重试恢复,需要业务处理的异常SDK会通过明确的回调API通知。异常发生原因 回调及参数 解决方案 备注 鉴权失败 onJoinChannelResult回调result返回...

作业智能诊断

作业运行环境分析 作业所在机器出现异常导致作业Failover,平台会自动修复,您无需手动处理。作业所在机器升级过程,可能存在分钟级的Failover,Failover成功后会自动恢复,您也可以在升级前手动重启(停止后再启动)作业,来提前规避。...

Android SDK集成

功能时序图 功能实现 初始化RTC引擎及回调注册 说明 SDK出现异常时内部会优先进行重试恢复,需要业务处理的异常SDK会通过明确的回调API通知。异常发生原因 回调及参数 解决方案 备注 鉴权失败 onJoinChannelResult回调result返回...

DNS解析异常问题排查

升级CoreDNS后Headless类型域名无法解析 StatefulSets Pod域名无法解析 容器网络连通性异常 异常仅出现在业务高峰时期 CoreDNS Pod负载高 CoreDNS Pod负载不均 异常出现频次非常高 IPVS缺陷导致解析异常 NodeLocal DNSCache未生效 异常出现...

DNS解析异常问题排查

升级CoreDNS后Headless类型域名无法解析 StatefulSets Pod域名无法解析 容器网络连通性异常 异常仅出现在业务高峰时期 CoreDNS Pod负载高 CoreDNS Pod负载不均 异常出现频次非常高 IPVS缺陷导致解析异常 NodeLocal DNSCache未生效 异常出现...

事件中心

应用场景 NIS 事件由阿里云定义,用于记录和通知云网络资源的信息,例如运维任务执行情况、资源是否出现异常、资源状态变化等。通知风险和异常 如果发生了实例资源可用性或性能受损的事件,例如因实例超规格使用造成性能受损、因运营商链路...

区间检测

当某个服务出现异常,可以迅速定位问题,确保整个系统的稳定运行。示例:某工作网站的访问量在白天(例如10:00~18:00)访问量低于1000是异常的,但在夜间(例如22:00~06:00)访问量超过1000可能是被攻击了。在这种场景下,指标的正常水位会...

区间检测

当某个服务出现异常,可以迅速定位问题,确保整个系统的稳定运行。示例:某工作网站的访问量在白天(例如10:00~18:00)访问量低于1000是异常的,但在夜间(例如22:00~06:00)访问量超过1000可能是被攻击了。在这种场景下,指标的正常水位会...

卡片短信错误码

MissingParameter param fileSize must be not empty 文件大小不能为空 InnerError can not find any vendor 无法找到有效的供应商 InnerError save vendor resource fail 获取媒体资源服务出现异常 创建模板 错误码 错误描述 说明 ...

区间检测

当某个服务出现异常,可以迅速定位问题,确保整个系统的稳定运行。示例:某工作网站的访问量在白天(例如10:00~18:00)访问量低于1000是异常的,但在夜间(例如22:00~06:00)访问量超过1000可能是被攻击了。在这种场景下,指标的正常水位会...

错误和消息

您无法预见所有可能的异常,但您可以编写异常处理程序,让您的程序在出现异常时继续运行。任何PL/SQL块都可以有一个异常处理部分,该部分可以有一个或多个异常处理程序。例如,异常处理部分可以使用以下语法,其中ex_name_n是异常的名称,...

诊断服务端报错问题

步骤三:诊断异常出现的原因 掌握应用异常的统计信息还不足以诊断异常出现的原因。虽然日志中异常堆栈包含调用的代码片段,但并不包含这次调用的完整上下游信息和请求参数。ARMS探针采用了字节码增强技术,让您能够以很小的性能消耗捕获...

子文档(sub_doc)配置

sub_doc:flat 与 sub_doc:group 相似,会在 sub doc 上做查询,而返回的结果是按 sub doc 展平的,doc 的结果会被合并到其所属的每个 sub doc 上,也就是说所有的 sub doc 会包含其 doc 的属性,出现在结果中,插件以及结果中出现的实际上...

Saga 状态机配置

出现异常时,状态引擎反向执行已成功节点对应的补偿节点将事务回滚。说明 异常发生时,您也可自定义决定是否进行补偿。可以实现服务编排需求,支持单项选择、并发、子流程、参数转换、参数映射、服务执行状态判断、异常捕获等功能。本文...

时序引擎版本说明

功能优化 修复TSQL条件中出现BOOLEAN数据类型的数据时可能出现异常的问题。3.4.17(稳定版本)发布日期 类型 说明 2022年06月17日 新特性 支持设置写入的最大时间(即当前时间和偏移时间),超过偏移时间后写入的数据会被丢掉。功能优化 ...

Cava 异常处理

建议用户在除法、数组访问和对象访问之前都进行合法性检测,从而避免异常出现。除0异常 代码示例:int b=0;int a=1/b;除0异常-double c=0;double b=1/c;浮点数除0不抛异常 int a=1/c;浮点数除0不抛异常 最佳实践:int b=0;int a=0;if(b!0)...

Cava 异常处理

建议用户在除法、数组访问和对象访问之前都进行合法性检测,从而避免异常出现。除0异常 代码示例:int b=0;int a=1/b;除0异常-double c=0;double b=1/c;浮点数除0不抛异常 int a=1/c;浮点数除0不抛异常 最佳实践:int b=0;int a=0;if(b!0)...

DAS Auto Scaling弹性能力

从上图可以看出,该实例在07:10突然出现异常流量,导致CPU利用率和活跃会话飙升,CPU利用率上升至80%以上,资源相对紧张。经过对实例上的读写流量进行分析发现,当前流量中以读流量为主,DAS Auto Scaling算法判断通过增加2个只读节点缓解...

调优集群性能

当您发现监控指标存在异常时,可以参考本文排查出现异常的原因。查看集群监控指标的方法,请参见 查看监控信息。集群资源指标 CPU使用率指标 云原生数据仓库 AnalyticDB MySQL 版 的CPU使用率会展示各节点的CPU最大使用率和CPU平均使用率。...

告警规则指标说明

异常接口调用响应时间 毫秒 是 该应用异常调用的响应时间,其中,异常调用指调用中出现异常抛错的调用。可以根据该指标判断调用堆栈抛错对应用调用响应时间的影响大小,从而判断是否存在应用调用异常。指标维度 接口名称,筛选条件如下:遍...

网络架构容灾

开启健康检查功能后,当后端某个ECS实例健康检查出现异常时,负载均衡会自动将新的请求分发到其他健康检查正常的ECS实例上,而当该ECS实例恢复正常运行时,负载均衡会将其自动恢复到负载均衡服务中。为了使健康检查功能正常运作,需要开启...

一对一专家服务工作说明书

1个自然日(客户提供前置条件后)软件基础问题排查/自建数据库进阶服务 服务承接时间 每日9:00-18:00 服务完成时间 3个自然日(客户提供前置条件后)注:服务操作前需要客户侧配合提供必要的操作条件,如操作过程中出现异常情况需以实际...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
威胁情报服务 Web应用防火墙 云监控 数据安全中心 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用