AIMaster:弹性自动容错引擎

除了对任务容错信息通知外,当您判断任务训练出现异常时,比如loss出现Nan,也可以在代码中使用AIMaster SDK发送自定义通知消息,如下所示 说明 本功能需要安装AIMaster whl包,详情请参见 常见问题解答。from aimaster import job_monitor...

OSS被攻击恶意刷流量出现异常流量的排查方法

概述 OSS被攻击恶意刷流量,出现大量的异常流量时,可能是由于恶意Referer盗链或者恶意IP请求访问OSS资源...相关文档 当您的OSS Bucket遭受攻击出现异常流量时,请参见 如何防止OSS被攻击恶意刷流量导致Bucket切入沙箱,添加安全防护措施。

车场心跳数据缺失

反之判断为车场业务出现异常 车场心跳数据在项目里面有2种方案:边缘车行应用每30秒写边缘数据模型库,实时同步到云端 边缘车行应用每30秒写云端的输数据模型库 1.1 方案 一:边缘写数据实时同步到云端 1.2 方案:边缘应用直接写云端 1.3 ...

Hive服务异常排查及处理

可继续对HiveMetaStore或者HiveServer2的日志进行排查,日志路径一般位于/mnt/disk1/log/hive/中,可逐步检查组件的.log、.err、.out 及GC等日志,判断HiveMetastore或者HiveServer2出现异常的真实原因。HiveMetaStore后端数据库问题 常见...

内核统一异常框架(UKFEF)

Normal:当前应用进程可能会出现异常。建议对当前应用采取措施,例如 kill、重启或迁移。Fatal:可能会对系统产生致命影响。建议立即进行业务迁移。事件报告 UKFEF将通过以下方式输出事件报告:通过内核日志输出单次事件的详细信息。信息...

组件异常问题排查

在组件安装、升级、更改配置等过程中出现异常问题时,控制台通常会提示相应的操作异常码。您可以根据操作异常码查找对应的问题,查看问题原因和解决方案。本文介绍操作异常码及其问题原因和解决方案。AddonOperationFailed.ResourceExists ...

使用快照创建自定义镜像

更多信息,请参见 使用自定义镜像创建VPC网络实例后网络出现异常。操作步骤 本操作以在快照页面创建自定义镜像为例,您也可以通过镜像页面(实例与镜像>镜像)和实例详情页面(实例与镜像>实例)的快照页签两个入口,使用系统盘快照来创建...

使用快照创建自定义镜像

更多信息,请参见 使用自定义镜像创建VPC网络实例后网络出现异常。操作步骤 本操作以在快照页面创建自定义镜像为例,您也可以通过镜像页面(实例与镜像>镜像)和实例详情页面(实例与镜像>实例)的快照页签两个入口,使用系统盘快照来创建...

订阅事件通知

步骤:调试事件通知 创建事件报警规则后,您可以使用系统事件的调试功能,验证系统事件报警规则中设置的消息服务队列、函数计算、URL回调和日志服务是否能正常被触发。操作步骤请参见 使用系统事件报警回调(旧版)。相关API 云监控产品...

通过消费组读取文本日志进行模板匹配

展示所选时间范围内所有的异常事件,包括异常事件所涉及的日志类别、日志等级、异常类型、异常分数和异常出现的时间窗口等信息。关于异常类型的更多信息,请参见 异常类型说明。相似度匹配度算法或者哈希聚类算法 在匹配作业仪表盘中查看...

工作原理

在分布式环境和微服务架构中,Warning或者Error日志并不一定意味着系统异常,有可能是由系统正常的扩缩容或者更新迭代产生。因此,在人工分析时需要一定的专业知识,才能高效地定位到日志中的异常情况。针对以上日志分析的困难情况,...

解决Windows实例中无法查看数据盘问题

Windows 2012服务器新增数据盘异常报错 Windows 2012操作系统的ECS实例新增一块数据盘后,在磁盘管理页面中无法查看到该数据盘,并出现异常报错。该问题是系统枚举异常导致,对其进行修复即可。请参考如下操作步骤修复磁盘。重要 操作前请...

使用参考

} 、错误信息说明 错误码 错误内容 错误可能原因 501 SYS_INVALID_PARAMS 关键参数缺失 10000 SERVER_ERROR 内部系统异常 10001 IDP_SERVER_ERROR 三方账号服务异常 10002 IDP_NULL ipd参数为空 10003 IDP_INVALID idp参数无效 10004 ...

Windows系统异常重启以及蓝屏的处理方法

方案:如果之前有正常配置过蓝屏收集,在系统日志中可以发现 事件 ID 为 41 的Kernel-Power的关键错误日志,提示系统从意外的关闭中回复以及 事件 ID 为 1001,来源为Bugcheck的日志提示系统出现崩溃。由于蓝屏日志的分析非常耗时,可能...

实例告警

及时发现数据库异常是数据库日常运维的重要...当数据库出现异常情况或达到预设的告警阈值时,系统会立即通知设定的告警联系人,以帮助您及时发现数据库异常并维护数据库的稳定性。操作步骤 为实例配置警规则和告警模板,详情请参见 配置告警。

产品架构

日志拉取模块及下游消费SDK的高可用:DTS容灾系统一旦检测到日志拉取模块出现异常,就会在健康服务节点上断点重启日志拉取模块,保证日志拉取模块的高可用。DTS支持在服务端实现下游SDK消费进程的高可用。用户同时对一个数据订阅链路,启动...

ECS实例操作系统内部(GuestOS)常见问题与修复方案

具体操作,请参见 Linux系统内核配置问题导致NAT环境访问实例出现异常。检查进程是否启动以及常见业务端口是否处于监听状态 如果您无法访问Linux实例中的服务,可能的原因之一是该服务对应的进程未处于运行中。具体操作,请参见 Linux实例...

混访混挂迁移示例

可将新加入的ECS的权重设置小一些,这样可以在健康检查状态正常但出现其它异常时,减少对系统的影响。同时,仔细观察系统状态、流量监控、健康检查日志等信息。将经典网络ECS从公网SLB实例中移除。如下图所示,当系统运行正常后,将经典...

无法远程连接Windows实例的排查方法

步骤十:Windows注册表配置异常 步骤十三:Windows RDP自签证书到期 步骤一:使用阿里云Workbench工具测试远程登录 通过阿里云提供的Workbench工具进行远程登录,Workbench工具在远程登录出现异常时会返回具体的错误信息及解决方案。...

2023年

修复使用gptransfer工具时出现异常的问题。修复pg_resqueue系统表的active_statements参数设置不合理的问题。修复多Groupingsets(分组设置)场景下可能出现Agg异常落盘的问题。修复rds_superuser权限账号无法创建、修改和删除Resource ...

使用实例时镜像相关问题

为解决该问题,您可以在RedHat 8.1/8.2系统的/boot/grub2/grubenv 文件中,将内核启动参数 console=ttyS0 console=ttyS0,115200n8 修改为 console=tty0 console=ttyS0,115200n8,然后重启服务器使配置生效。SUSE镜像问题 SLES for SAP常见...

自动监控和响应ECS系统事件

说明 ECS系统事件是由阿里云定义的,用于记录和通知云资源的信息,例如运维任务执行情况、资源是否出现异常、资源状态变化等。系统事件类型和详细说明,请参见 ECS系统事件概述。云助手插件是集成在云助手里的插件能力,使用简单的命令就...

Windows实例系统异常如何解决?

当磁盘异常时,检测结果将会出现错误提示,以系统盘文件损坏为例,检测结果如下:解决方案 您可以执行以下操作,手动修复系统异常。远程连接ECS实例。具体操作,请参见 连接方式概述。以管理员身份,打开CMD命令行窗口。执行如下命令,...

诊断VPN网关实例

对于IPsec-VPN连接第一阶段协商失败以及第二阶段协商失败的问题,系统均会在 IPsec连接 页面提供相应的错误码帮助您排查问题。更多信息,请参见 自主排查IPsec-VPN连接问题。如上图所示,导致IPsec-VPN连接两端提议不匹配的原因是两端的预...

实例告警

当数据库出现异常情况或达到预设的告警阈值时,系统会立即通知设定的告警联系人,以帮助您及时发现数据库异常并维护数据库的稳定性。操作步骤 登录 DAS控制台。在左侧导航栏中,单击 实例监控。找到目标实例,单击实例ID,进入目标实例详情...

数据库代理发布记录

问题修复 修复会话级连接池初始化系统环境变量异常的问题。1.9.23(发布日期:20200221)类别 说明 新增功能&性能优化 支持通过root账号连接集群。支持SSL证书加密。问题修复 修复change user失败的问题。修复load file失败的问题。修复...

区间检测

当某个服务出现异常,可以迅速定位问题,确保整个系统的稳定运行。示例:某工作网站的访问量在白天(例如10:00~18:00)访问量低于1000是异常的,但在夜间(例如22:00~06:00)访问量超过1000可能是被攻击了。在这种场景下,指标的正常水位会...

区间检测

当某个服务出现异常,可以迅速定位问题,确保整个系统的稳定运行。示例:某工作网站的访问量在白天(例如10:00~18:00)访问量低于1000是异常的,但在夜间(例如22:00~06:00)访问量超过1000可能是被攻击了。在这种场景下,指标的正常水位会...

区间检测

当某个服务出现异常,可以迅速定位问题,确保整个系统的稳定运行。示例:某工作网站的访问量在白天(例如10:00~18:00)访问量低于1000是异常的,但在夜间(例如22:00~06:00)访问量超过1000可能是被攻击了。在这种场景下,指标的正常水位会...

进入数据质量概览(新版)

质量问题表数 当日质量检测实例运行完成并出现非「通过」状态的表数,包含质量阈值校验不通过及系统校验异常情况。已检测表数:当日存在质量检测实例且实例运行已完成的表数量。运行完成包含质量校验通过、校验不通过和系统校验异常状态。...

SmartMetrics Holiday功能

出现Holiday效应的部分场景如下:某公司每天凌晨2点左右进行缩容,第二天上午6点左右进行扩容,这两种操作都会导致相应的指标出现突增或突降。某电商平台在双十一、618、春节期间进行促销活动,在这期间,应用、服务的访问量会迅速上升,...

ECS实例使用的Windows系统激活失败如何解决?

网络异常导致激活失败 服务器时钟不同步导致激活失败 磁盘空间满了导致激活失败 激活码不正确导致激活失败 Software Protection异常导致激活失败 问题现象 使用 slmgr-ato 命令激活Windows系统时,系统出现以下错误。运行“slui.exe 0x2a 0...

为什么无法访问负载均衡

如果只有本地网络访问时出现异常,则判定是网络异常导致的问题,此时可以继续通过持续进行ping测试或MTR路由跟踪等手段做进一步排查分析。客户端IP被云盾拦截。获取客户端网络环境对应的公网IP。将获取的公网IP配置为白名单,该操作将会对...

无法连接Linux实例的排查方法

登录Linux实例失败并报“login:Module is unknown”错误如何处理 Linux实例系统环境配置 Linux内的系统环境,例如中毒、账户配置、环境变量配置等,如果出现异常,也可能会导致SSH登录失败。根据不同报错信息,可参见如下常见案例进行解决...

Smart Metrics Holiday功能

出现Holiday效应的部分场景如下:某公司每天凌晨2点左右进行缩容,第二天上午6点左右进行扩容,这两种操作都会导致相应的指标出现突增或突降。某电商平台在双十一、618、春节期间进行促销活动,在这期间,应用、服务的访问量会迅速上升,...

ECS实例系统启动失败时报“UNEXPECTED INCONSISTENCY;...

问题描述 ECS实例系统启动失败,通过管理终端登录后发现系统提示如下错误。UNEXPECTED INCONSISTENCY;RUN fsck MANUALLY.系统显示类似如下。问题原因 可能是由于断电等情况导致ECS实例迁移到其他的后端物理机上,内存数据丢失引发文件系统...

RPC 请求异常

如果通过 RPC 请求进行资源调用的过程中出现异常,请参考 无线保镖结果码说明 进行排查。

RPC 请求异常

如果通过 RPC 请求进行资源调用的过程中出现异常,请参考 无线保镖结果码说明 进行排查。

RPC 请求异常

如果通过 RPC 请求进行资源调用的过程中出现异常,请参考 无线保镖结果码说明 进行排查。

RPC 请求异常

如果通过 RPC 请求进行资源调用的过程中出现异常,请参见 无线保镖结果码说明 或 网关结果码说明 进行排查。
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
云安全中心 威胁情报服务 Web应用防火墙 负载均衡 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用