AIMaster:弹性自动容错引擎

除了对任务容错信息通知外,当您判断任务训练出现异常时,比如loss出现Nan,也可以在代码中使用AIMaster SDK发送自定义通知消息,如下所示 说明 本功能需要安装AIMaster whl包,详情请参见 常见问题解答。from aimaster import job_monitor...

内核统一异常框架(UKFEF)

Normal:当前应用进程可能会出现异常。建议对当前应用采取措施,例如 kill、重启或迁移。Fatal:可能会对系统产生致命影响。建议立即进行业务迁移。事件报告 UKFEF将通过以下方式输出事件报告:通过内核日志输出单次事件的详细信息。信息...

概览

实例消息堆积量 消息堆积量 Topic消息堆积量 高于上边界 连接数过高、连接数波动较大或连接数持续峰值 系统负载过高、TCP连接池不足、应用程序或服务出现异常、某些应用程序或服务在某些时候进行了大量的TCP连接操作。实例公网TCP连接的...

CLB实例诊断

健康检查异常监测:检查CLB监听的健康检查是否出现异常。闲置实例检测 监听为空:检查监听是否为空。后端服务器为空:检查后端服务器是否为空。容量超限诊断 带宽限速丢包:检查CLB实例是否因带宽超限而导致限速丢包(15分钟内)。部分场景...

Quick BI用关联表创建数据集出现计数异常

问题描述 本文主要介绍Quick BI用关联表创建数据集出现计数异常。问题原因 客户在关联表时,使用重复的字段作为关联字段导致数据膨胀,在计数时导致数据比实际的数据多。使用SQL的关联字段是item_id,该值存在重复。解决方案 在创建数据集...

工作原理

下探分析用于多维时序数据的根因定位,当监控的时序指标出现异常时,分析这个时序指标的各个维度,检测是哪个维度或者哪些维度的组合导致了指标异常。通过指标的各个维度进行根因定位,便于运维人员在服务异常时快速定位异常根因。例如网站...

摘除离群实例

在微服务架构中,当服务提供者的应用实例出现异常,而服务消费者无法感知时会影响服务的正常调用,并影响消费者的服务性能甚至可用性。离群实例摘除功能会检测应用实例的可用性并进行动态调整,以保证服务成功调用,从而提升业务的稳定性和...

使用离群实例摘除保障Dubbo应用的可用性

在微服务架构中,当服务提供者的应用实例出现异常,而服务消费者无法感知时会影响服务的正常调用,并影响消费者的服务性能甚至可用性。离群实例摘除功能会检测应用实例的可用性并进行动态调整,以保证服务成功调用,从而提升业务的稳定性和...

通过消费组读取文本日志进行模板匹配

展示所选时间范围内所有的异常事件,包括异常事件所涉及的日志类别、日志等级、异常类型、异常分数和异常出现的时间窗口等信息。关于异常类型的更多信息,请参见 异常类型说明。相似度匹配度算法或者哈希聚类算法 在匹配作业仪表盘中查看...

网关一体告警介绍

监控项 报警阈值 报警通道 恢复是否通知 疲劳度 是否实时 CPU使用率 一分钟内平均使用率超过95%客户邮箱 是 每日最多5封 是 内存使用率 一分钟内平均空闲内存小于20%客户邮箱 是 每日最多3封 是 硬盘故障 磁盘状态出现异常,立即报警 短信 ...

客户端首次接入云消息队列 Kafka 版时出现异常的排查...

概述 本文主要介绍客户端首次接入云消息队列 Kafka 版时,出现异常的排查方法。详细信息 客户端首次接入云消息队列 Kafka 版时如果出现异常,您可以通过以下三个方面进行排查:网络连通问题:通常有如下几种情况可能会导致网络不通,客户端...

网站耗资源(客户程序故障)常见问题

本文汇总了使用云虚拟主机出现网站耗资源(客户程序故障)时的常见问题。什么是网站耗资源(客户程序故障)?网站程序占用CPU及内存过多,是对资源的一种浪费。当您使用普通版共享云虚拟主机建站后,可能会因为网站程序编写不合理、代码...

真机预览与调试

小程序 IDE 支持真预览与调试,您可在手机客户端上预览当前代码的实际效果或进行调试。操作步骤 点击 IDE 右上方的 预览 或 调试。IDE 会将当前代码生成.zip 包并上传至控制台。控制台自动创建发布任务,生成二维码并返回至 IDE。说明 在...

诊断服务端报错问题

步骤三:诊断异常出现的原因 掌握应用异常的统计信息还不足以诊断异常出现的原因。虽然日志中异常堆栈包含调用的代码片段,但并不包含这次调用的完整上下游信息和请求参数。ARMS探针采用了字节码增强技术,让您能够以很小的性能消耗捕获...

使用邮件客户端收信时出现重复收取邮件的情况

问题描述 使用邮件客户端收信时出现重复...当客户机与服务器建立联系时,一旦客户端提供了自己身份并成功确认,即由认可状态转入处理状态,在完成相应的操作后客户机发出quit命令,则进入更新状态,更新之后最后重返认可状态。适用于 阿里邮箱

Cava 异常处理

建议用户在除法、数组访问和对象访问之前都进行合法性检测,从而避免异常出现。除0异常 代码示例:int b=0;int a=1/b;除0异常-double c=0;double b=1/c;浮点数除0不抛异常 int a=1/c;浮点数除0不抛异常 最佳实践:int b=0;int a=0;if(b!0)...

Cava 异常处理

建议用户在除法、数组访问和对象访问之前都进行合法性检测,从而避免异常出现。除0异常 代码示例:int b=0;int a=1/b;除0异常-double c=0;double b=1/c;浮点数除0不抛异常 int a=1/c;浮点数除0不抛异常 最佳实践:int b=0;int a=0;if(b!0)...

使用手机(iOS系统)自带的VPN软件建立远程连接

说明 客户端网段不能与VPC内交换网段冲突。本示例输入 10.0.0.0/16。预共享密钥:用于IPsec服务端与手机客户端之间的身份认证,建立IPsec要求两端密钥必须一致。默认情况下会随机生成,您也可以手动指定密钥。本示例输入 123456。立即...

清除主机指纹

当原主机指纹不适用时,比如经过系统重装操作导致主机指纹发生变化,您需要在堡垒中清除主机指纹,否则将无法通过堡垒进行正常运维。本文介绍清除主机指纹的具体操作。背景信息 堡垒通过主机指纹可以唯一识别一台Linux主机。清空主机...

异常状态码

由于ER是流式透传的默认行为,出现异常行为后客户端会收到一个截断的请求。具体说明如下:您的ER代码逻辑Bug,导致请求回复生成的过程中出现JS异常。受资源限制,您可以 提交工单 解决。说明 如果您经常看到ER在回复过程中被截断,需要检查...

异常状态码

由于ER是流式透传的默认行为,出现异常行为后客户端会收到一个截断的请求。具体说明如下:您的ER代码逻辑Bug,导致请求回复生成的过程中出现JS异常。受资源限制,您可以 提交工单 解决。说明 如果您经常看到ER在回复过程中被截断,需要检查...

使用Prometheus配置报警规则的最佳实践

宿主机水位异常 说明 宿主机资源指标和节点资源指标的区别如下:此指标为宿主机资源的指标,是对节点所在的物理或虚拟等宿主机资源的统计。水位计算公式中,分子为宿主机上所有进程使用的资源(Usage),分母为宿主机的最大规格...

真机预览与调试

小程序 IDE 支持真预览与调试,您可以在手机客户端上预览当前代码的实际效果或进行调试。本文对真预览与调试的操作步骤,以及过程中使用的接口进行了说明。前置条件 使用小程序 IDE 真预览与调试功能之前,请确保您的 Android 小程序...

配置DDoS高防后访问网站提示502错误

源站本身出现异常 源站本身出现异常,将导致响应高防的请求超时,源站异常包括以下几种情况:源站IP暴露,被恶意攻击导致瘫痪。源站服务器机房物理故障。源站服务器中Apache、Nginx等Web服务出现问题。服务器内存、CPU占用过高,导致性能...

什么是 IDaaS 聚石塔版本

IP 黑名单拦截 管理员可以在 安全设置-IP准入 中配置客户端 IP 黑名单,黑名单内 IP 的访问将被拦截,以实现对异常客户端 IP 进行控制。​ IP 白名单拦截 管理员可以在 应用-应用列表-详情-IP白名单配置 中配置服务端 IP 白名单,对调用 ...

设备轨迹查询

当设备的状态出现异常时,您可以使用设备查询功能查询设备的连接历史,快速排查设备离线问题,定位异常原因。操作步骤 登录 云消息队列 MQTT 版 控制台,并在左侧导航栏单击 实例列表。在顶部菜单栏选择目标地域,然后在实例列表中单击实例...

应用运维

完成新版本部署之后,进入应用,确认应用运行情况,如图所示:应用部署与升级中出现异常或需要对应用进行日常运维,您可以点击 实例管理>管理 在此页面进行操作,如图所示:新版本发布后原有版本将继续保留,同时客户可以自行选择升级到...

如何处理备份失败问题

在使用 云备份 服务备份ECS、文件存储NAS、对象存储OSS或自建机房内的文件、数据库、虚拟、或NAS等数据源时,可能会出现备份失败的问题。本文介绍备份失败处理操作指导。步骤一:判断是否有安装客户端 无需安装客户端的数据源 对于阿里云...

防勒索客户端和备份任务异常状态排查

ACTIVATE_COMMAND_FAILED 客户出现异常错误,您可以重新安装客户端,恢复业务正常运行,若仍失败,请您 通过 智能在线 咨询相关问题,获取在线人工帮助。客户端异常。重新安装防勒索客户端。操作步骤如下:登录 云安全中心控制台,在 ...

使用ping命令丢包或不通时的链路测试方法

如果该区域出现异常,如果是客户端本地网络相关节点出现异常,则需要对本地网络进行相应排查分析。否则,如果是本地网络提供商网络相关节点出现异常,则需要向当地运营商反馈问题。运营商网络 运营商网络,如前文链路测试结果示例图中的...

安装备份客户端

在使用 云备份 备份本地数据中心的服务器或虚拟中的文件目录前,您需要在本地服务器安装备份客户端。客户部包括Windows版本和Linux版本,按照您服务器的操作系统选择即可。(推荐)使用RAM用户AccessKey RAM是阿里云提供的用户身份管理与...

云备份客户端问题诊断工具

出现类似如下 i/o timeout 信息时,表示云备份客户端安装的环境存在问题,需要处理异常。如何解决诊断存在的问题,请参见 常见网络问题。客户端日志路径为/root/hbr-install-2.11.0-linux-amd64/logs 在2022-11-16,检测到如下问题:本...

客户端进程说明

服务端检测到和客户端的通信异常,包括但不限于网络异常客户端进程(AliYunDun)被异常结束、客户端被卸载等,会将客户端的状态更改为离线。如果服务端在10个小时内没有收到客户端登录、采集到的数据等信息,会将客户端状态更改为离线。...

2022-01-27

数据模型存储管控通知 平台将会对数据模型功能进行...支持人行版数据冷备能力 一体运行阶段,可能会出现各种异常情况,导致一体无法正常运行,这时就需要有冷备的高可靠方案,将一体数据迅速迁移到另一台冷备,实现业务的迅速恢复。

常用监控指标

检查服务器是否出现异常,如大量的5xx状态码、4xx状态码。status:200 and block_action:antifraud 被数据风控规则拦截。测试可用后再上线,如弹出率过高,说明场景可能有问题,建议联系阿里云研发团队进行确认。status:404 服务器找不到...

常用监控指标

检查服务器是否出现异常,如大量的5xx状态码、4xx状态码。status:200 and block_action:antifraud 被数据风控规则拦截。测试可用后再上线,如弹出率过高,说明场景可能有问题,建议联系阿里云研发团队进行确认。status:404 服务器找不到...

常见错误处理方法

连接异常 连接异常即应用程序或者客户端与数据库的连接出现异常,例如已经创建的连接,提示连接不存在或连接超时,无法与数据库实例建立连接等。连接异常经常发生在网络闪断,或者数据库服务重启时,您需要在应用程序中就此类异常,添加重...

错误码查询

错误码 错误信息 原因 解决方案 10009999 系统异常,请稍后重试 平台内部系统出现异常 记录请求的RequestId,通过钉钉群联系工程师解决 10009008 启动数字人失败,请稍后重试 平台内部系统出现异常 记录请求的RequestId,通过钉钉群联系...

基于TairString实现高性能分布式锁

不死锁 分布式锁本质上是一个基于租约(Lease)的租借锁,如果客户端获得锁后自身出现异常,锁能够在一段时间后自动释放,资源不会被锁死。一致性 硬件故障或网络异常等外部问题,以及慢查询、自身缺陷等内部因素都可能导致Redis发生高可用...

访问OSS出现网络异常如何处理?

发生网络异常有可能是您使用的OSS域名不合适,但多数网络异常都是客户端网络不稳定导致的,本文将针对不同情况给出网络异常的解决办法。背景信息 如果您请求OSS时收到了OSS的响应,即使这个响应的HttpCode不是200,也说明您当前的网络跟OSS...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
运维安全中心(堡垒机) 短信服务 Web应用防火墙 云虚拟主机 云数据库 Redis 版 弹性公网IP
新人特惠 爆款特惠 最新活动 免费试用