节点异常问题排查

本文介绍关于节点异常问题的诊断流程、排查思路、常见问题及解决方案。本文目录 类别 内容 诊断流程 诊断流程 常见...解决方案 通过节点的监控查看CPU增长曲线,确认异常出现时间点,检查节点上的进程是否存在CPU占用过高的现象。具体操作,...

节点异常问题排查

本文介绍关于节点异常问题的诊断流程、排查思路、常见问题及解决方案。本文目录 类别 内容 诊断流程 诊断流程 常见排查...解决方案 通过节点的监控查看CPU增长曲线,确认异常出现时间点,检查节点上的进程是否存在CPU占用过高的现象。具体操作...

自治中心

自治服务开启后,DAS会在数据库出现异常时,自动进行根因分析,给出优化或止损建议,并自动进行优化或止损操作(需经您授权后才会开启优化操作)。注意事项 仅 商品类型 为 按量付费 的 PolarDB MySQL版 集群才支持自动扩容和自动回缩,...

分批发布应用

分批间隔时间 当 发布批次 大于1,且 分批间处理方式 选择 自动 时需要配置。单位为分钟,取值范围为[0,30]。批次内部署间隔 每一批内,如果应用实例数大于1,应用实例间的部署时间间隔。单位为秒。最小存活实例数 每次滚动升级最小存活的...

配置自动调优

调整间隔时间(分钟)作业调优重启生效一次之后,下一次再进行调优的时间间隔。最大CPU限制 作业自动调整资源可以扩容的最大CPU上限,不同的调优策略的默认值不同。最大内存限制 作业自动调整资源可以扩容的最大内存上限,不同的调优策略的...

核心优势

高可用超性价比 HBase增强版对MTTR(平均故障恢复时间)做了深度的优化和改进,故障恢复速度可以达到HBase的10倍以上。并且其基于日志即存储思想和PACELC理论构建的分区多副本复制架构,可以提供多种数据一致性等级,方便应用在一致性、...

App端性能体验功能说明

性能监控产品通过轻量级的集成接入即可拥有实时、可靠、全面的应用崩溃、ANR、自定义异常等捕获能力,及卡顿、启动分析等性能能力,支持多场景、多通道智能告警监控,帮助开发者高效还原异常、卡顿用户的访问路径和业务现场...

Windows实例网络访问丢包延时高的排查方法

Interval(sec):每次探测的间隔(过期)时间,默认为1秒。Ping size(bytes):ping 探测所使用的数据包大小,默认为64字节。Max hosts in LRU list:LRU列表支持的最大主机数,默认值为128。Resolve names:通过反查IP以域名显示相关...

消费重试

消费者出现异常,云消息队列 RocketMQ 版 会根据消费重试策略重新投递该消息进行故障恢复。本文介绍消费重试的应用场景、原理机制、版本兼容性和使用建议。应用场景 云消息队列 RocketMQ 版 的消费重试主要解决的是业务处理逻辑失败导致的...

视频截图

截图间隔时间(秒)多张截图时必选 在文本框中输入截图间隔时间,单位为秒。截图数量 平均截图时必选 在文本框中输入截图数量。说明 不设置截图数量时,表示按照间隔时间,一直截取到视频结尾。截图数量大于1时,表示按照间隔时间,截取到...

教育实训

并且整体设备运维缺乏高效易用的解决方案,运维效率低,出现故障恢复时间长,影响教学的进度。客户痛点 学习门槛高,线下准备环境浪费时间,复杂软件安装繁琐,远程指导人力消耗大 学习效果差,教与练脱节,互动性差,缺少老师临场指导 线...

消息模板

数据服务 数据服务 包括 平均响应时间异常、调用次数异常、错误率异常。修改告警消息模板 在不同模块的页签下,单击 操作 列下的 图标,进入 编辑消息模板 对话框。参数 描述 当前使用模板 如上图①区域,为您展示当前告警原因的配置模板的...

监控告警

当查询成功率发生异常下降时,考虑是否出现了集群、节点的故障。查询平均耗时 集群每分钟所有查询生命周期结束的平均时间。ms 99th 查询耗时 展示给定时间内,统计升序排列排在第99%位置的请求的响应时间,可以反映集群慢查询的速度。ms ...

推送记录

数据服务 包括 平均响应时间异常、调用次数异常、错误率异常 和 Offline百分比异常。实时计算 包括 业务延迟过高、TPS超过范围、失败超过配置比例、数据滞留超过配置 和 反压持续时间超过配置。不同的计算引擎,支持的告警类型不同。租户内...

网关一体机告警介绍

监控项 报警阈值 报警通道 恢复是否通知 疲劳度 是否实时 CPU使用率 一分钟内平均使用率超过95%客户邮箱 是 每日最多5封 是 内存使用率 一分钟内平均空闲内存小于20%客户邮箱 是 每日最多3封 是 硬盘故障 磁盘状态出现异常,立即报警 短信 ...

推送记录

数据服务 包括 平均响应时间异常、调用次数异常、错误率异常 和 Offline百分比异常。实时计算 包括 业务延迟过高、TPS超过范围、失败超过配置比例、数据滞留超过配置 和 反压持续时间超过配置。不同的计算引擎,支持的告警类型不同。租户内...

消息模板

数据服务 数据服务 包括 平均响应时间异常、调用次数异常、错误率异常。修改告警消息模板 在不同模块的页签下,单击 操作 列下的 图标,进入 编辑消息模板 对话框。参数 描述 当前使用模板 如上图①区域,为您展示当前告警原因的配置模板的...

监控指标说明

该值表示一个时间间隔内的平均值,而不是瞬时值。较高的值表示Tensor Cores的利用率较高。该值为1(100%)表示在整个时间间隔内每隔一个指令周期发出一个Tensor指令(两个周期完成一条指令)。假设该值为0.2(20%),可能有如下情况:在...

DNS解析异常问题排查

升级CoreDNS后Headless类型域名无法解析 StatefulSets Pod域名无法解析 容器网络连通性异常 异常仅出现在业务高峰时期 CoreDNS Pod负载高 CoreDNS Pod负载不均 异常出现频次非常高 IPVS缺陷导致解析异常 NodeLocal DNSCache未生效 异常出现...

DNS解析异常问题排查

升级CoreDNS后Headless类型域名无法解析 StatefulSets Pod域名无法解析 容器网络连通性异常 异常仅出现在业务高峰时期 CoreDNS Pod负载高 CoreDNS Pod负载不均 异常出现频次非常高 IPVS缺陷导致解析异常 NodeLocal DNSCache未生效 异常出现...

自定义消息渠道支持的元数据

reason String 告警原因:OS_AVG_RESPONSE:平均响应时间异常。OS_CALL_TIMES:调用次数异常。OS_ERROR_RATE:错误率异常。OS_OFFLINE:Offline百分比异常。api_id String API ID。api_name String API名称 statisticall_period String ...

指标监控及报警的使用方法

平均每秒钟Item上传失败的个数(所有上传命令都计数)Behavior推送失败速率 Count/Second 1分钟 平均每秒钟Behavior上传失败的个数(所有上传命令都计数)行为数据平均延迟 秒 1分钟 行为数据的bhv_time和上传时间间隔平均值;...

异常类型说明

在预测某条时间序列时出现异常。您可以通过 result.error_type 和 result.error_msg 字段查看异常信息。tag_:_data_type_字段值为job_error_message。result.entity 和 result.metric 字段都为空。预测ID对应的那次预测出现异常。您可以...

TCP健康检查

主要是监控IP地址的网络可达性、端口可用性、延时等指标,当监控IP地址或者端口出现异常时,自动屏蔽异常IP地址,当IP地址恢复正常时,自动取消屏蔽设置。设置方法 登录 云解析DNS控制台。左侧导航栏点击 全局流量管理,再点击目标实例 ...

如何处理健康检查导致的大量日志

方案风险说明 延长健康检查的间隔时间后,后端ECS实例出现故障时,负载均衡发现故障ECS实例的时间也会变长。操作步骤 登录 传统型负载均衡CLB控制台。在 实例管理 页面中找到相应的CLB实例,单击实例ID。在 监听 页签下,找到目标监听,在 ...

HTTP(S)健康检查

当监控IP地址出现异常时,自动屏蔽异常IP地址,当IP地址恢复正常时,自动取消屏蔽设置。配置参数说明 检查协议 检查协议请选择HTTP(S),它是指对目标IP地址进行HTTP(S)监控,监控IP地址的Web服务器网络可达性、服务可用性、首包延时等...

查看监控信息

当查询成功率发生异常下降时,考虑是否出现了集群、节点的故障。查询平均耗时 所选中集群每分钟内所有查询的平均耗时。ms 99th 查询耗时 所选中集群 给定时间内升序排列排在第99%位置的请求的响应时间;用于反映集群慢查询的速度。ms 导入...

HTTP(S)健康检查

当监控IP地址出现异常时,自动屏蔽异常IP地址,当IP地址恢复正常时,自动取消屏蔽设置。配置参数说明 模板名称:健康检查探测模板的名称,一般为了方便配置人员区分和记忆,建议名称可以区分健康检查协议。探测类型:探测节点IP地址的类型...

Ping健康检查

检查间隔 选择每次Ping监控的时间间隔,默认每间隔1分钟执行Ping监控,健康检查间隔最小支持15秒(面向旗舰版用户开放)。Ping包数目 每次Ping监控,同时发出多少个PING数据包,用以计算PING的网络丢包率。可选值为:20、50、100。丢包率 ...

设置告警

包括预检查、结构迁移、全量迁移和增量迁移或增量同步项目启动和运行过程中,出现的全部异常。告警频率 设置发送一次告警的间隔时间,不得低于 60 秒。接收人 设置告警监控信息的接收人,最多可以选择 3 个人。如果下拉列表中没有目标接收...

TCP健康检查

检查间隔 选择每次TCP监控的时间间隔,默认每间隔1分钟执行一次检查,健康检查间隔最小支持15秒(面向旗舰版用户开放)。超时时间 每次TCP健康检查,对发出的TCP数据包,计算返回时间,大于超时时间未返回的数据包即判断为健康检查超时。...

投递CDN实时日志到SLS来分析用户访问数据

CDN访问错误 该数据可以帮助您在应用访问出现异常时,快速定位到CDN服务问题的源头,例如:部分URI问题、源站出现故障、部分节点不可用、部分省份网络问题、部分运营商网络问题等。CDN热门资源 该数据可以帮助您更好地了解热门资源情况,...

投递CDN实时日志到SLS来分析用户访问数据

CDN访问错误 该数据可以帮助您在应用访问出现异常时,快速定位到CDN服务问题的源头,例如:部分URI问题、源站出现故障、部分节点不可用、部分省份网络问题、部分运营商网络问题等。CDN热门资源 该数据可以帮助您更好地了解热门资源情况,...

投递CDN实时日志到SLS来分析用户访问数据最佳实践

CDN访问错误 该数据可以帮助您在应用访问出现异常时,快速定位到CDN服务问题的源头,例如:部分URI问题、源站出现故障、部分节点不可用、部分省份网络问题、部分运营商网络问题等。CDN热门资源 该数据可以帮助您更好地了解热门资源情况,...

系统检查点或作业快照

配置间隔时间为3,最小间隔时间为5,这种情况下,间隔时间会调整为5。以两个场景进行说明,两个场景Checkpoint间隔时间为3分钟,超时时间为10分钟,最小间隔时间为5分钟。场景一:作业正常运行(Checkpoint每次都成功)12:00第一次开始执行...

健康检查

当某台后端服务器健康检查出现异常时,ALB 会自动将新的请求分发到其他健康检查正常的后端服务器。当该服务器恢复正常运行时,ALB 会将其自动恢复到负载均衡服务中。健康检查为短连接,完成健康检查后连接将关闭。说明 如果后端服务器权重...

Ping健康检查

检查间隔 选择每次Ping监控的时间间隔,默认每间隔1分钟执行ping监控,健康检查间隔最小支持15秒(面向旗舰版实例开放)。超时时间 每次Ping监控,对发出的ICMP数据包,计算返回时间,大于超时时间未返回的数据包即判断为健康检查超时。...

CLB健康检查FAQ

重要 如果关闭健康检查,当后端某个服务器健康检查出现异常时,负载均衡还是会把请求转发到该异常的ECS实例上,造成部分业务不可访问。如果您的业务对负载敏感性高,高频率的健康检查探测可能会对正常业务访问造成影响。您可以结合业务情况...

监控报警概述

实时监控提供终端用户登录云电脑的实时数据(例如用户在线数量、在线时长的前十用户、平均登录时间和云电脑网络延迟分布情况)以及相关故障预警信息,以便快速准确定位,迅速处理故障,避免因资源、网络问题或者外部操作原因造成不必要的...

设计方案

过长的灰度间隔时间可能导致下游应用出现数据不一致等问题。灰度发布方式:合理选择灰度发布方式,可按用户、按区域、按渠道等方式进行灰度,避免出现灰度过程中用户体验不一致的问题。灰度发布批次:建议先小范围的进行灰度验证,再逐步...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
文件存储NAS Web应用防火墙 数据库自治服务 负载均衡 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用