应用监控概述

JVM监控可以直观展示指定时间段内的多项内存指标,然而虽然图表能体现出内存使用量过大的情况,但无法显示具体信息,因此不能帮助您排查问题的原因。此时您可以创建内存快照,通过详细的日志查看内存占用的详细信息。主机监控功能用于监控...

DNS最佳实践

CoreDNS所运行的集群节点应避免CPU、内存用满的情况,否则会影响域名解析的QPS和响应延迟。当集群节点条件允许时,可以考虑使用自定义参数将CoreDNS调度至独立的集群节点上,以提供稳定的域名解析服务。关于CoreDNS调度至独立的集群节点的...

DNS最佳实践

CoreDNS所运行的集群节点应避免CPU、内存用满的情况,否则会影响域名解析的QPS和响应延迟。当集群节点条件允许时,可以考虑使用自定义参数将CoreDNS调度至独立的集群节点上,以提供稳定的域名解析服务。关于CoreDNS调度至独立的集群节点的...

Windows系统异常重启以及蓝屏的处理方法

定期对系统盘、数据盘进行快照,以便问题情况下恢复数据。请在修改系统注册表前备份注册表文件,避免修改系统文件。跟进方案 如果Windows实例在使用过程中突然断开、无法远程,查看日志发现异常重启的情况,怀疑可能出现过系统蓝屏,请采用...

Arthas诊断

Arthas是诊断Java领域线上问题的利器,利用字节码增强技术,可以在不重启JVM进程的情况下,查看程序的运行情况。ARMS 100%集成Arthas的所有能力,且相比自行挂载使用有如下优势:不依赖JDK环境,您无需下载安装Arthas,可按需批量一键开启/...

节点诊断

节点内存交换区开启情况 检查节点内存交换区(Memory Swap)功能是否开启。当前节点内存交换区(Memory Swap)功能不支持开启,请登录节点关闭该功能。节点网络设备驱动加载情况 检查节点的网络设备virtio驱动加载情况。节点的网络设备出现...

Arthas诊断

Arthas是诊断Java领域线上问题的利器,利用字节码增强技术,可以在不重启JVM进程的情况下,查看程序的运行情况。ARMS 100%集成Arthas的所有能力,且相比自行挂载使用有如下优势:不依赖JDK环境,您无需下载安装Arthas,可按需批量一键开启/...

解读实例诊断报告

内存使用率 80%内存使用率持续升高可能导致Key频繁被逐出、响应时间上升、QPS(每秒访问次数)不稳定等问题,进而影响业务运行。可能的原因:内存被数据占满。大Key较多。排查方法,请参见 排查内存使用率高的问题。连接数使用率(数据节点...

如何使用Linux系统的atop监控工具

其以一定的频率记录系统和进程活动,采集的数据包含CPU、内存、磁盘、网络的资源使用情况和进程运行情况,并能以日志文件的方式保存在磁盘中。对于每个进程,会显示CPU使用率、内存增长、磁盘使用率、优先级、用户名、状态和退出码等。当...

Arthas诊断(新版)

Arthas是诊断Java领域线上问题的利器,利用字节码增强技术,可以在不重启JVM进程的情况下,查看程序的运行情况。前提条件 说明 仅应用监控专家版支持Arthas诊断功能。新开通 EDAS 的账号或15天内未使用旧版Arthas诊断功能的账号仅支持使用...

Tair配置参数列表

您可以根据业务场景对 云原生内存数据库Tair 实例的参数进行调优与自定义配置,已提升 Tair 实例的性能与安全性。本文介绍各参数的详细说明。注意事项 若设置参数时报错 Parameter is not supported for current version,请升级小版本后重...

依赖关系

本文为您介绍依赖关系的相关问题。配置调度依赖前您需先了解以下内容 什么是调度依赖 为什么要设置调度依赖 DataWorks上如何设置调度依赖?哪些场景不支持设置调度依赖?不需要依赖的表如何删除?调度依赖配置常见问题 提交节点报错:当前...

Pod诊断

节点内存交换区开启情况 检查节点内存交换区(Memory Swap)功能是否开启。当前节点内存交换区(Memory Swap)功能不支持开启,请登录节点关闭该功能。节点网络设备驱动加载情况 检查节点的网络设备virtio驱动加载情况。节点的网络设备出现...

Tair开发运维规范

云原生内存数据库Tair 拥有极强的性能,阿里云结合多年的运维经验,从业务部署、Key的设计、SDK、命令、运维管理等维度展示 Tair 开发运维规范,为您设计高效的业务系统提供参考,帮助您充分发挥Tair的能力。了解 Tair 性能边界 图 1.Tair ...

配置集群巡检

您可以在以下场景中使用集群巡检功能:定位问题运行作业过程中碰到问题时,可以执行一次巡检,检查当前集群运行环境是否正常,协助定位问题。定期检查:在日常运维中定时检查集群运行环境,以便及时发现集群异常并进行处理,避免影响作业...

构建CSV机密计算环境

背景信息 海光安全加密虚拟化CSV是一项基于国产海光CPU硬件的云服务器ECS保护技术,CSV实例的运行时状态如内存数据均受到CPU硬件的加密保护,云厂商和外部攻击者均无法监控或定向篡改CSV实例的内部运行状态(如运行的进程、计算中的敏感...

常见问题

磁盘/CPU/内存/带宽问题 Windows实例负载的查询及分析 Linux实例CPU负载的查询和案例分析 如何配置Windows实例的虚拟内存 入网带宽和网带宽 Linux实例网络流量负载情况的查询和案例分析 Linux实例中如何查看物理CPU和内存信息 Linux实例...

排查CPU使用率高的问题

Tair 实例的CPU使用率升高会影响整体的吞吐量和应用的响应速度,极端情况下甚至会导致应用不可用。当平均CPU使用率高于50%、连续5分钟内的CPU平均峰值使用率高于90%时,您需要及时关注并排查该问题,以保障应用的稳定运行。查找并禁用高...

告警规则指标说明

通常情况下,JVM堆内存使用率应该尽量控制在70%以下,这样可以避免出现内存溢出等问题。指标维度 节点机IP,筛选条件如下:遍历:遍历每个节点机IP,针对每台节点机的指标数据单独进行监控告警。指定筛选固定的几台节点机进行监控告警。...

如何使用Prometheus监控Windows

进程内存使用率(%):展示进程使用内存情况。进程句柄数。进程I/O字节数:展示进程I/O读写量。为了方便运维人员快速查看所管理Windows集群的整体运行情况,这里还建议服务配置TopN(包括CPU使用率、磁盘空间使用率、磁盘空闲率、网络流量...

变更实例配置

常见问题 什么原因会导致变配失败?若实例中存在大Key,可能会导致变配失败。建议在变配前,排查并删除大Key,再执行变配操作。关于排查大Key的方法请参见 离线全量Key分析。为避免数据丢失,降配时存在如下限制:新实例内存规格的80%需...

如何使用Prometheus监控Windows

进程内存使用率(%):展示进程使用内存情况。进程句柄数。进程I/O字节数:展示进程I/O读写量。为了方便运维人员快速查看所管理Windows集群的整体运行情况,这里还建议服务配置TopN(包括CPU使用率、磁盘空间使用率、磁盘空闲率、网络流量...

列存索引中TopK算子的实现

在海量数据上求TopK是一个很经典的问题,特别是衍生的深翻页查询,给分析型数据库带来了很大的挑战。本文将介绍 PolarDB MySQL版 的列存索引(In Memory Column Index,IMCI)特性如何应对这样的挑战。背景 业务系统中普遍存在这样一种...

主机健康诊断

物联网边缘计算的主机管理页面为您提供了主机健康诊断功能,可以对主机的系统配置、系统运行状态、系统软件运行状态、主机网络状态、主机历史运行状态进行全方位的诊断,帮助您了解主机的健康状态,及时发现并解决常见的问题。使用限制 仅...

指标说明

nginx_ingress_controller_success-process_resident_memory_bytes 即RSS(Resident Set Size),指的是常驻内存集,是进程实际使用的内存,他不包括分配但未使用的内存,也不包括换内存页面,但包含共享内存。process_open_fds 通过...

指标说明

nginx_ingress_controller_success-process_resident_memory_bytes 即RSS(Resident Set Size),指的是常驻内存集,是进程实际使用的内存,他不包括分配但未使用的内存,也不包括换内存页面,但包含共享内存。process_open_fds 通过...

开启带宽弹性伸缩

优化:根据数据库运行情况的优化建议。通知:数据库性能快照和基础通知信息。说明 如需订阅带宽弹性伸缩的相关事件通知,请选择至 通知 级别。选择联系人(组)选择 已有的联系人(组)并单击 图标,将其移动至 已选联系人(组)区域框...

如何将一棵LSM-Tree塞进NVM

Halloc内存分配器 Halloc是针对LSM-tree专用的PM内存分配器,通过三个关键技术以解决传统通用PM内存分配器存在的效率低、碎片化等问题,基于对象池的内存预留方案、应用亲和的内存管理以及统一化地址空间管理。其主要架构如下图所示,...

时间属性配置说明

重跑说明 用于定义节点生成的实例是否可以重跑,即从数据幂等性考虑,任务是否可以重跑,或者在什么情况下可以重跑。生效日期 用于定义节点正常自动调度运行的时间范围,该时间范围外,节点将不再自动调度。使用说明 调度任务的时间属性...

云数据库 Memcache 版 SDK for NodeJS 介绍

就像访问本地运行内存中的对象一样简单,这体现了 NodeJS 开发便捷性和 Memcache 的易用性。但是不仅仅如此,本文将为大家介绍 NodeJS 以及如何使用 NodeJS 和 OCS SDK 构建高效、可靠、可扩展的 Web 应用后台。NodeJS 介绍 Node.js 是...

监控报警概述

无影云电脑(专业版)的监控报警功能可以全方面地监控云电脑的分布情况、云电脑资源使用情况、会话连接情况以及网络运行状况等,帮助您全盘了解资源健康状况,及时发现并解决问题,以保证业务顺畅运行。功能介绍 监控大盘展示云电脑相关的...

实例启动异常常见错误与对应解决方案

针对实例启动过程中因操作系统内配置异常、异常关机等问题导致操作系统无法正常启动的情况,您可以通过VNC登录实例发现的启动异常或者实例健康诊断工具返回的异常字段,在本文查看此类问题的解决方案。Windows 1662001135:Windows系统因...

禁用高风险命令

您可以在控制台上通过设置#no_loose_disabled-commands 参数来禁用一些可能影响 云原生内存数据库Tair 服务性能、危害数据安全的命令。背景信息 在业务场景中,无限制地允许命令使用可能带来诸多问题。一些命令会直接清空大量甚至全部数据...

流水线的运行

待到日常环境测试阶段运行结束后,空闲下来,开始再次运行,此时是接续持续集成阶段第三次运行的版本继续运行,而不是接续持续集成阶段第二次运行的版本继续运行。亦支持在前一阶段运行完成时,若后一阶段正在运行,强制中止后一阶段当前...

Logview诊断实践

用户UDF出错,调查步骤 Result>DAG 确定出问题的UDF,查看 StdOut 或 StdError 等报错信息。其他报错,可以参见 文档错误码以及解决方案。分析运行慢作业 编译阶段 作业处于编译阶段的特征是有Logview,但还未执行计划。根据Logview的子...

数据开发常见问题

组件相关问题:Hive常见问题 Spark常见问题 Sqoop常见问题 作业问题:环境变量过多或者参数值过长时,为什么提交作业失败?为什么Shell作业状态和相关的YARN Application状态不一致?创建作业和执行计划的区别是什么?多个ConsumerID消费同...

计费概述

函数计算 提供了试用额度、按量付费和资源包三种计费方式,计费项由函数调用次数、资源使用量和公网流量组成。您可以通过购买资源包及调整函数实例并发度降低成本。计费方式 函数计算 支持以下计费方式。试用额度 函数计算 为首次开通...

计费概述

函数计算 提供了试用额度、按量付费和资源包三种计费方式,计费项由函数调用次数、资源使用量和公网流量组成。您可以通过购买资源包及调整函数实例并发度降低成本。计费方式 函数计算 支持以下计费方式。试用额度 函数计算 为首次开通...

健康检查服务内容说明

针对隐患与问题,给专业的解决方案,让客户全面掌握系统运行情况,并提前做好预防和加固,避免因产品架构问题影响业务的持续性。2.服务范围 2.1 健康检查服务范围 服务范围包含:阿里云基于客户业务系统和应用的架构现状和预期目标,通过...

排查Redis实例CPU使用率高的问题

Redis CPU使用率升高...内存使用率高、内存使用率倾斜,请参见 排查Redis实例内存使用率高的问题。流量使用率高的问题,请参见 排查Redis实例流量使用率高的问题。查找优化大Key和热Key的详细方法,请参见 发现并处理Redis的大Key和热Key。
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
云防火墙 云监控 DDoS防护 函数计算(旧版) 数据传输服务 弹性公网IP
新人特惠 爆款特惠 最新活动 免费试用