使用云监控功能监控网站环境(部署于ECS实例)

设置合理的监控可以让您实时了解系统业务的运行情况,并能帮助您提前发现问题,避免可能会出现的业务故障。同时,告警机制能让您在故障发生后第一时间发现问题,缩短故障处理时间,以便尽快恢复业务。前提条件 在开始设置云监控前,您需要...

主机CPU或内存使用过高导致网站无法访问

云虚拟主机的CPU或内存使用率过高时...当云虚拟主机的CPU或内存使用率出现超过报警阈值的情况时,您可以在收到监控报警提示时根据本文解决方案进行操作。关于设置自定义监控报警功能的更多信息,请参见 获取云虚拟主机的主机信息和站点信息

监控、诊断和故障排除

OSS存储服务为您提供了丰富的监控和日志信息,帮助您深刻洞察程序行为,及时发现并快速定位问题。本文主要描述如何使用OSS监控服务、日志记录功能以及其他第三方工具来监控、诊断和排查应用业务使用OSS存储服务时遇到的相关问题,帮助您...

调用链采样配置最佳实践

基于重保角度考虑,特定时间段全采样 运维过程中也经常面临重大事件保障的场景,比如大促、新版本压测等,需要针对某一类标签的数据甚至全部应用开启全量数据采集和存储,以便出现问题或者故障时,可以快速定位,甚至影响审计和定责。...

指标含义与异常处理建议

否则默认数据节点的磁盘使用可能会出现以下情况,影响集群服务。节点磁盘使用 说明>85%新的shard无法分配。90%集群会尝试将节点中的shard,迁移到其他磁盘使用较低的数据节点中。95%Elasticsearch会为集群中的每个索引强制设置 read...

数据看板

原声 日期 对话流名称 节点名称 用户原声:用户询问问题原声 对话流是否跳失:该session是否走到叶子节点或业务完结节点 服务能力 下图中的各项指标的解释如下:无答案出现无答案的session量/总session量,衡量机器人对用户问题的覆盖...

Fast Query Cache

当缓存命中较低时,性能无提升甚至会出现严重降低。由于以上问题,MySQL原生Query Cache没有得到广泛应用,在最新版的MySQL 8.0中,取消此功能。阿里云数据库团队对Query Cache进行重新设计和全新实现,解决了以上几个主要问题:优化并发...

查看JMeter压测报告

子请求详情 若JMeter脚本中配置了从HTML文件嵌入资源(Embedded Resources from HTML Files ),日志详情 页面会出现 子请求详情 页签。可通过选择特定的子请求,可筛选出对应的请求日志。此时 Timing 页签下也将显示总请求耗时和每一个子...

TCP协议客户端大版本发布

该策略可能会出现以下问题:消费者数量比和Queue数量多时,部分消费者获取不到消息的现象。部分消费者异常或者处理缓慢,其他消费者空闲却无法共同分担堆积压力的情况。以消息为粒度进行负载,负载策略更加均衡。避免了队列级负载策略可能...

快速入门Java GC日志分析

然后再看一下【内存统计】视图,发现每次Old gc后内存使用都较低,对象创建和晋升速度都较低,不需要做额外的堆分析来排查内存问题。3.结论 根据以上收集到的信息,我们可以大致确认应用出现超时的原因是CMS Final Remark,需要优化其...

如何使用Linux系统的atop监控工具

当ECS实例出现问题后,您可以获取相应的atop日志文件进行分析。本文介绍如何在Linux实例中 安装、配置并使用atop监控工具。安装atop Alibaba Cloud Linux操作系统 本步骤以Alibaba Cloud Linux 3.2104 LTS 64位操作系统的ECS实例为例,介绍...

摘除离群实例

Ribbon负载均衡刷新默认间隔是30秒,如果配置的恢复检测单位时间小于30秒,会出现恢复不及时的问题。为了保护应用A的服务性能和可用性,可以为应用A配置离群实例摘除。配置后,即可监控B、C、D应用的实例状态并进行动态调整(摘除或添加)...

RDS SQL Server CPU使用问题

说明 共享型 实例复用CPU,因此即使实例本身的CPU使用不高,也可能因为复用CPU导致性能出现瓶颈,如果对数据库性能的稳定性要求较高,建议使用独享型规格的实例。分析性能指标 原因 对于突发的CPU使用明显增高情况,常见原因有如下...

查看和管理实例连接地址和端口

从集群只读地址中移除节点,被移除节点上的连接会出现30~120秒的服务不可用,其他节点连接无影响。集群只读地址的节点配置对内网连接和外网连接同时生效。删除集群只读地址中的节点时,至少保留一个节点。操作步骤 访问 RDS实例列表,在...

集群负载不均问题的分析方法及解决方案

从结果可以看到查询请求都是普通的term查询,且主日志正常,可以排除ES集群本身出现问题以及存在消耗CPU的查询语句的情况。总结 通过以上分析,可以判断CPU负载不均主要是由于shard分布不均导致的。重新分配分片,确保主shard数与副shard数...

重启实例或节点

但在某些场景下,重启过程中可能会出现访问超时,例如强制重启并发度高、集群负载很高并且已经存在集群访问不可用的情况、没有副本分片、在重启或强制重启过程中存在大量的写入和查询等场景,建议重启前先在客户端设计好重试机制并且在业务...

OOM常见问题排查指南

识别OOM报错 当计算内存超出上限时(大于等于20GB),就会出现OOM的情况。常见的报错如下。Total memory used by all existing queries exceeded memory limitation.memory usage for existing queries=(2031xxxx,184yy)(2021yyyy,85yy)...

缩容集群数据节点

如果集群负载过高且索引没有副本,同时在缩容过程中存在大量写入或查询等情况,在缩容过程中可能会出现访问超时的问题。建议在缩容前,在客户端中配置好重试机制,减小对业务的影响。缩容数据节点 登录 阿里云Elasticsearch控制台。在左侧...

连接保持

当Proxy在新旧主节点中进行切换时,需要保留这个状态,否则会出现字符集乱码问题。所以连接保持的核心在于保证连接切换前后的会话状态一致。说明 当Proxy将连接从旧主节点切换到新主节点的过程中,会存在短暂的新老数据库同时不可写不可读...

自动性能扩展

影响 对于 RDS MySQL 高可用系列云盘版和 PolarDB MySQL版 的集群版实例,在变更配置生效期间,可能会出现一次约30秒的闪断,请确保应用具有重连机制。对于 PolarDB MySQL版 的集群版实例,只能对整个集群进行规格升降级,无法对集群中的...

Pod诊断

容器智能运维平台 提供Pod诊断功能,帮助您诊断异常的Pod信息。本文介绍Pod诊断的检查项以及对应的修复方案。容器智能运维平台 构建了基于专家经验的故障诊断系统,并基于海量数据训练了AI智能故障诊断模型。Pod诊断融合了基于专家经验和AI...

节点异常问题排查

问题现象 当集群中的节点调度资源不足时,导致Pod调度失败,出现以下常见错误信息:集群CPU资源不足:0/2 nodes are available:2 Insufficient cpu 集群内存资源不足:0/2 nodes are available:2 Insufficient memory 集群临时存储不足:...

节点异常问题排查

问题现象 当集群中的节点调度资源不足时,导致Pod调度失败,出现以下常见错误信息:集群CPU资源不足:0/2 nodes are available:2 Insufficient cpu 集群内存资源不足:0/2 nodes are available:2 Insufficient memory 集群临时存储不足:...

数据看板

无答案出现无答案的对话轮次的session量/总体session量(注意:此处无答案率为session粒度的,即一次会话中只要有一个chat命中了无答案,这个session就是记为无答案的)。终端用户评价 点评率:点评对话轮次/总对话轮次(配置相应接口...

DescribeVerifyResult

认证过程中如果有身份证正面和反面信息,实人认证服务也不一定保证返回身份证上所有的信息,因身份证拍摄问题引起的OCR无法识别时,OCR信息不全,建议您的接入方业务上不强依赖身份证OCR信息。Address String 浙江省杭州市余杭区文一...

DescribeVerifyResult

认证过程中如果有身份证正面和反面信息,实人认证服务也不一定保证返回身份证上所有的信息,因身份证拍摄问题引起的OCR无法识别时,OCR信息不全,建议您的接入方业务上不强依赖身份证OCR信息。Address String 浙江省杭州市余杭区文一...

节点诊断

节点诊断收集部分集群和节点信息并识别其中的异常,然后根据识别到的异常,进行深入的异常诊断。重要 使用故障诊断功能时,系统将在您的集群节点上执行数据采集程序并收集检查结果。采集的信息包括系统版本,以及负载、Docker、Kubelet等...

诊断项与诊断结果说明

实例健康诊断功能是一种自助诊断方式,可以对实例的计算服务状态、存储服务状态、网络服务状态、实例配置管理和实例操作系统内相关配置进行全方位的诊断,帮助您了解实例的健康情况,及时发现并解决常见的问题。本文介绍轻量应用服务器支持...

创建JMeter场景

如果JMeter脚本中配置了 从HTML文件嵌入资源(Embedded Resources from HTML Files ),日志详情中会出现 子请求详情 页签。通过选择特定的子请求,可筛选出对应的请求日志。Timing瀑布流 页签,显示总请求和每一个子请求的耗时情况。调用...

借助云效实现发版周期缩短一半,自动化提升60%

此外,原有的研发工具方面还会出现版本不一致、功能重复等问题,缺乏有效集成,自动化测试能力弱。之所以引入阿里云效平台,主要是因为云效具有明确的研发流程,包括职责定义和管理活动内容。同时其管理活动均可在平台上落地,也覆盖了整个...

降配集群

如果集群负载高且索引没有副本,同时在降配过程中存在大量的写入或查询等情况,业务可能会出现偶发的访问超时现象,无法保证高可用机制,业务稳定性无法保证。GET_cat/indices?v 使用限制 节点磁盘空间和Kibana节点规格,不支持降配操作。...

常见问题

为什么Redis内存报警与监控的内存使用不一致 如何解决Redis内存使用突然升高 如何搜索大Key 查看Redis集群实例的架构图和监控数据 查看Redis集群子实例内存 查看当前账号所有实例内存的使用信息 使用memtier-benchmark测试Redis集群版...

创建JMeter场景

如果JMeter脚本中配置了 从HTML文件嵌入资源(Embedded Resources from HTML Files ),日志详情中会出现 子请求详情 页签。通过选择特定的子请求,可筛选出对应的请求日志。Timing瀑布流 页签,显示总请求和每一个子请求的耗时情况。调用...

使用负载热点打散重调度

节点的利用率会随着时间、集群环境变化、工作负载的流量或请求等动态变化,继而导致集群内节点间原本负载均衡的情况被打破,甚至有可能出现极端负载不均衡的情况,影响到工作负载运行时质量。ack-koordinator组件提供重调度能力,防止负载...

导入与导出

通过创建MaxCompute外表导入数据时,为什么会出现ErrorCode=ServiceUnavailable,ErrorMessage=Service is temporarily unavailable,Please try again later报错?通过创建MaxCompute外表导入数据时,为什么会出现ErrorCode=Local Error,...

配置自动调优

调优模式 适用场景 使用优势 相关文档 智能调优 某作业使用资源30 CU,上线平稳运行一段后,发现在Source无延迟、无反压的情况下,作业的CPU和内存使用有时很低。此时如果您不想人工调节资源,需要 系统自动完成 资源调节,可以使用...

为什么Redis内存报警与监控的内存使用不一致

如果Redis内存使用告警显示内存占用较高,或您的应用程序出现OOM异常,但性能监控显示的内存使用并不高,可参考本文排查原因并解决问题问题现象 现象一:您收到 Redis 内存告警,显示 内存使用超过阈值(例如,连续满足3次平均值>=...

启动实时检测与分析

EMR Doctor实时检测按5分钟为粒度对集群的实时状态进行检查,您可以通过实时检测了解集群当前的状态、出现问题,以及发生问题的原因,并对相关问题进行修复,保证集群运行的稳定性。注意信息 如果未开通EMR Doctor,则缺失实时检测的...

诊断项与诊断结果说明

实例健康诊断功能是一种自助诊断方式,可以对实例的系统状态、网络状态、磁盘状态等进行全方位的诊断,帮助您了解实例健康情况,及时发现并解决常见的问题。本文介绍该功能支持的诊断项,并提供了详细的诊断范围及建议操作供您参考。诊断项...

RDS MySQL慢SQL问题

在相同业务场景下,架构设计和库表索引设计会影响查询性能,良好的设计可以提高查询性能,反之会出现很多慢SQL(执行时间很长的SQL语句)。本文介绍导致慢SQL的原因和解决方案。SQL异常 原因及现象 SQL异常的原因很多,例如库表结构设计不...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
短信服务 商标服务 DataV数据可视化 CDN 邮件推送 弹性公网IP
新人特惠 爆款特惠 最新活动 免费试用