告警日志

615 内容不匹配 DNS 610 DNS解析失败 613 DNS query通信出现异常 615 内容不匹配 健康检查恢复 当健康检查发现地址池集合中的异常地址在健康检查恢复正常时,会记录在日志信息里。记录内容包括:恢复时间、具体地址。地址池集合不可用 当...

概览

单指标报警规则会在定时任务执行时触发误报,更改为智能阈值报警规则后不再出现定时误报情况。除了云数据库RDS的MySQL的QPS指标,还有其他指标也适用于定时任务的误报收敛,现推荐以下监控指标配置智能阈值报警规则。典型异常 异常可能原因...

配置熔断规则

常用场景2:异常熔断示例 例如第三方内容展示时,系统会出现异常,当异常比例较高时,可以对其进行熔断操作,以保证更好的用户体验。在 新增熔断规则 或 新增规则 对话框中配置以下示例规则信息。参数 示例值 描述 接口名称 test 接口名称...

资源伸缩和系统扩展

大型单体应用 适用于无法水平扩展的应用,通常是在Pod出现异常恢复时生效。容器垂直伸缩(VPA)CronHPA ACK开源的组件,主要面向应用资源使用率存在周期性变化的场景。周期性负载业务 适用于Deployment、StatefulSet等,实现了scale接口的...

自动快照概述

当您的数据库出现异常时,您可能来不及手动创建快照。这时您可以通过最近的自动快照来恢复数据库文件系统,降低损失。您也可以将自动快照策略设置在系统定期维护之前,免去了您手动创建快照,也能避免因人为疏忽忘记创建快照。使用限制 ...

配置熔断规则

常用场景2:异常熔断示例 例如第三方内容展示时,系统会出现异常,当异常比例较高时,可以对其进行熔断操作,以保证更好的用户体验。在 新增熔断防护规则 对话框中配置以下示例规则信息。参数 示例值 描述 接口名称 test 接口名称。统计...

日志信息

UDP 550 无法打开socket(通常是因为系统资源耗尽)UDP 611 连接失败(host无法解析)UDP 610 发送或接收失败 UDP 615 内容不匹配 DNS 610 DNS解析失败 DNS 613 DNS query通信出现异常 DNS 615 内容不匹配 健康检查恢复 当健康检查发现地址...

SDK新增功能介绍

离线恢复出厂设置 此功能支持对离线的设备进行恢复出厂设置操作,设备重新上线后能获得离线时的恢复出厂设置操作。SDK V1.4.0新增功能 网关与子设备支持统一激活中心 V1.4.0版本对网关参考应用做了重构,支持中国内地之外地区的子设备可以...

设备端SDK更新记录

离线恢复出厂设置 此功能支持对离线的设备进行恢复出厂设置操作,设备重新上线后能获得离线时的恢复出厂设置操作。SDK V1.4.0新增功能 网关与子设备支持统一激活中心 V1.4.0版本对网关参考应用做了重构,支持中国内地之外地区的子设备可以...

诊断项与诊断结果说明

出现此类异常可能会导致实例崩溃或出现异常暂停,您可以尝试通过重启实例进行恢复。实例操作系统异常 实例系统出现了内核错误(kernel panic)、OOM(Out of Memory)异常或内部宕机等故障。检查该实例的操作系统(Guest OS)内部是否存在...

修复单台JournalNode异常

当您的集群中只有一个节点上的JournalNode服务出现异常时,可以尝试从其他节点恢复。本文介绍如何从其他节点恢复异常的JournalNode服务。操作步骤 找到健康状态的JournalNode。您可以通过HDFS WebUI查看JournalNode的状态,详细信息请参见 ...

恢复.kibana_1索引

在复杂的业务场景下,例如,.kibana_1 索引结构发生损坏或Kibana访问异常,需要删除.kibana_1 索引重置Kibana集群,或因定时任务配置异常导致.kibana_1 索引被删除,集群重启后Kibana相关数据被重置,.kibana_task_manager_1 会自动生成...

备份和恢复

当ECS实例用途为 仅恢复 时,ECS列表会出现 仅用于恢复 标签,表示该ECS实例不需要绑定预付费实例也可以作为恢复目的地。备份成功 当达到备份每天执行时间时,云备份 就会启动执行备份任务。当 备份状态 为成功时,表示当天备份完成。您...

Node应用内存泄漏分析方法论与实战

如若出现异常,通过node-heapdump对v8堆内存抓取快照,并通过chrome开发者工具profiles来导入快照进行分析。线上 通过alimonitor、eagleeye等监控平台监控应用健康度。如若出现异常,通过 Node.js 性能平台堆快照排查问题。如若异常难以复现...

工作原理

下探分析用于多维时序数据的根因定位,当监控的时序指标出现异常时,分析这个时序指标的各个维度,检测是哪个维度或者哪些维度的组合导致了指标异常。通过指标的各个维度进行根因定位,便于运维人员在服务异常时快速定位异常根因。例如网站...

安全告警概述

告警名称 告警说明 网页防篡改 实时监控网站目录并通过备份恢复被篡改的文件或目录,保障重要系统的网站信息不被恶意篡改,防止出现挂马、黑链、非法植入恐怖威胁、色情等内容。可检测以下子项:异常文件添加 异常文件修改 异常文件删除 ...

功能概览

恢复NAS NAS异常时,您可以根据已备份的NAS创建恢复任务,进行NAS恢复。费用 云备份的阿里云NAS文件备份主要产生以下费用:存储容量费用:云备份提供本地冗余与同城冗余两种备份存储。按照您的备份数据实际消耗的云备份库的容量进行计算,...

Alibaba Cloud Linux 2系统中systemd服务异常问题说明

如果您的Alibaba Cloud Linux 2操作系统中systemd服务运行异常,可参考文本提供的方案解决问题。...reboot 如果systemd版本高于 systemd-219-78.4.al7.3.x86_64,并仍然出现异常,请运行以下命令恢复systemd服务至正常状态。kill-15 1

基础资源监控

配置报警规则时,选择 资源范围 为 容器组Pod,选择命 名空间 为对应应用所在命名空间,选择 容器组Pod 为 全部,则当该命名空间下的任一Pod出现规则描述中的指标异常时,则触发报警。应用指标水位状况预警,针对对应集群下指定命名空间的...

Java SDK

对可用Worker监控定时器偶而出现的ERROR日志信息内容进行优化。second_delay任务支持日志采集。无 1.5.1.1,2022-04-19 变更类型 功能描述 相关文档 新增 支持开启或关闭日志服务动态生效。无 优化 修复1.5.0.x版本不兼容Spring Boot 2.0.3...

配置降级规则

熔断降级功能会在调用链路中某个资源出现不稳定时(例如某资源出现超时或异常比例升高),对这个资源的调用进行限制,让请求快速失败,避免影响到其它的资源而导致级联错误。降级规则配置通常用于弱依赖降级场景,更多信息,请参见 弱依赖...

轻量应用服务器网速较慢与预期带宽不符

服务器被入侵对外发包攻击:如果是异常流量,建议清理异常进程和异常定时任务。查看本地网络是否存在不稳定的情况,具体步骤请参见 MTR工具使用说明与结果分析。若服务器已欠费,会影响服务器的访问,请参见 续费服务器,为服务器续交...

Pod异常问题排查

本文介绍关于Pod异常问题的诊断流程、排查方法、常见问题及解决方案。本文目录 类别 内容 诊断流程 诊断流程 常见排查方法 检查Pod的状态 检查Pod的详情 检查Pod的配置 检查Pod的事件 检查Pod的日志 检查Pod的监控 使用终端进入容器 Pod...

iOS SDK集成

功能时序图 功能实现 初始化RTC引擎及回调注册 说明 SDK出现异常时内部会优先进行重试恢复,需要业务处理的异常SDK会通过明确的回调API通知。异常发生原因 回调及参数 解决方案 备注 鉴权失败 onJoinChannelResult回调result返回...

常见报错

本文介绍DBS配置备份计划、备份恢复预检查以及恢复任务运行时系统返回的报错信息(如异常信息或错误码)以及解决方法。说明 若在本文中未找到您遇到的异常或报错,或按照文中修复建议仍未解决您的问题,请到 DBS客户咨询群(钉钉群号:...

2021年

使用COPY ON CONFLICT覆盖导入数据 定时任务 pg_cron插件升级至1.4版本,新增如下功能:支持跨库执行定时任务。支持变更已有定时任务。支持设置定时任务名称。新增cron.job_run_details表用于记录定时任务的执行情况。设置定时任务(pg_...

定时备份redis实例并转储到OSS

监控及告警能力不足:缺乏有效的监控和告警机制,使得备份任务的执行状态难以实时掌握,一旦出现失败或异常问题,及时响应和处理的能力受限。针对上述不足,结合OOS的编排能力,OOS推出了定时备份Redis实例并自动转储至OSS的功能,为用户...

备份中心FAQ

备份、恢复或快照转换任务长期处于Inprogress状态 原因1及解决方案:csdr命名空间中组件运行异常 确认组件运行状态,并查询组件异常原因。执行以下命令,查询csdr命名空间中的组件是否出现重启或无法启动的情况。kubectl get pod-n csdr ...

诊断项与诊断结果说明

出现此类异常可能会导致实例崩溃或出现异常暂停,您可以尝试通过重启实例进行恢复。实例所在宿主机告警 实例所在的物理设备出现故障告警。检查该实例所在的底层物理机是否有故障。如果底层物理机存在故障,则可能会影响实例的运行状态或...

Android SDK集成

功能时序图 功能实现 初始化RTC引擎及回调注册 说明 SDK出现异常时内部会优先进行重试恢复,需要业务处理的异常SDK会通过明确的回调API通知。异常发生原因 回调及参数 解决方案 备注 鉴权失败 onJoinChannelResult回调result返回...

安全白皮书

这些都会导致作业出现延迟或阻塞,一段时间内无法正常消费数据等问题,恢复正常运行所需的时间会更长。Task快速重启配置可以有效缓解上述问题,详情请参见 Task快速重启配置。操作审计 操作审计(ActionTrail)可以帮助您监控并记录阿里云...

高可用性

阿里云Elasticsearch提供数据备份与恢复、负载均衡、跨可用区部署,以及保障集群稳定的各类内核优化策略,全方位保障集群数据的可靠性和服务的可用性。数据备份与恢复 备份与恢复方式 说明 自动备份与恢复 阿里云Elasticsearch支持自动数据...

检测响应常见问题

出现ECS登录后执行异常指令序列(SSH)告警时,该操作是否已经被执行?该命令已经被执行,请您及时更新服务器登录密码,并检查服务器是否有其他异常行为,例如启动了未知进程。发生异常登录告警时,对应服务器应该查看什么日志?您可以查看...

实例生成方式:发布后即时生成实例

即时生成实例存在时间差 为避免实例变更导致任务运行异常,发布后即时生成实例存在10分钟的时间差,即任务定时时间在发布时间点十分钟后(即实时转实例生效时间点),任务才会真实执行或根据最新的调度配置重新生成实例并调度。功能概要 ...

预案管理

手动应急:对于通过巡检、诊断、监控上报的异常事件,通过风险管理模块进行展示,然后人工操作执行。对象类型 必填 选择预案的对象类型。用户应用:全部用户应用、指定用户应用。蚂蚁产品:全部蚂蚁产品、指定蚂蚁产品。基础资源:OB、ALB...

2022-09-19版本

复杂事件处理(CEP)语句 提供作业失败切换时的快速恢复能力 启动快速重启后,当某个Task发生异常时,可以只重启失败的任务,减少作业失败切换对作业的影响。警告 此功能为实验性功能,在使用前,请确保您的业务容忍结果数据出现丢失和重复...

状态不一致

Group ID msg delay time more than 40 day 定时消息延时不能超过 40 天 解决方案:请确认客户端对应参数没有以上不合法情况,并根据异常提示进行解决。重启应用。客户端状态异常 可能的原因:创建 Consumer、Producer 之后未调用 start()...

定时/延时消息

若存储系统异常重启,可能会导致定时消息投递出现一定延迟。使用示例 和普通消息相比,定时消费发送时,必须设置定时触发的目标时间戳。以Java语言为例,使用定时消息示例参考如下:完整的消息收发示例代码请参见 RocketMQ 5.x系列SDK...

SQL优化技术

问题风险 考虑两个重要的时间点,如下图所示,一个简单的慢SQL趋势,T1代表我们发现数据库实例性能异常的时间点,从此刻开始着手慢SQL的优化,T2是优化过程完毕时间点,实例恢复常态。在传统的优化处理中,这一过程一般完全依赖人力驱动,...

性能优化与诊断简介

定时自动弹性伸缩 根据您预设的策略定时扩容数据库实例的规格,并且在设置的扩容持续时间结束后会自动恢复到原规格。通过该功能您可以应对可预期的数据库负载地周期性变化,在满足业务需求的同时控制成本。授权说明 RAM用户使用自治服务DAS...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
威胁情报服务 Web应用防火墙 云数据库Cassandra版 云监控 数据安全中心 弹性公网IP
新人特惠 爆款特惠 最新活动 免费试用