查看和管理实例连接地址和端口

常见问题 Q:为什么在节点权重相同的情况下,CPU或内存使用率有差异?A:SLB负载均衡是连接数负载均衡,但每个连接消耗的CPU或内存资源不同,所以在节点权重相同的情况下,CPU或内存使用率也可能出现差异。Q:调整节点权重,对已经建立的...

RDS SQL Server CPU使用率高问题

本文介绍如何查看CPU使用情况以及排查CPU问题。查看CPU使用情况 RDS管理控制台 提供多种查看CPU使用情况的方法:监控与报警 在控制台的 监控与报警 页面,单击 旧版监控 页签,在 资源监控 内,可以查看CPU使用率信息。自治服务 实例不能是...

DAS Auto Scaling弹性能力

然而随着用户业务的变化,在09:00时CPU再一次打高出现资源紧张的情况,此时的流量分析发现以写流量为主,DAS Auto Scaling算法判断通过提升计算资源规格缓解CPU资源,且实例的CPU利用率下降到50%,解决了第二次CPU紧张的问题。从这个实例的...

测试分析及调优

接着看关键指标是否满足要求,如果不满足,需要确定是哪个地方有问题,一般情况下,服务器端问题可能性比较大,也有可能是客户端问题(这种情况非常小)。对于服务器端问题,需要定位的是硬件相关指标,例如CPU,Memory,Disk I/O,Network...

使用云监控对MSFE进行监控和报警实践

监控内容 推荐配置报警规则的监控项名称 说明 CPU使用率(Agent)cpu.total 一台ECS只运行一个Tengine进程服务,Tengine对资源的消耗主要体现在CPU使用率上,通常情况下,若CPU使用率达到60%,就需要考虑扩容。Load(Agent)load.5m....

系统类故障排查

概述 本文主要介绍使用阿里云服务器ECS时的系统类故障排查,包含CPU、磁盘I/O、内存、硬盘、带宽资源占用异常的问题排查与定位。详细信息 说明 阿里云提醒您:如果您对实例或数据有修改、变更等风险操作,务必注意实例的容灾、容错能力,...

诊断项与诊断结果说明

实例健康诊断功能是一种自助诊断方式,可以对实例的计算服务状态、存储服务状态、网络服务状态、实例配置管理和实例操作系统内相关配置进行全方位的诊断,帮助您了解实例的健康情况,及时发现并解决常见的问题。本文介绍轻量应用服务器支持...

监控指标常见问题

CPU使用率高不是问题CPU使用率高了之后,查询慢写入慢才是问题,需要综合分析。写入慢如何解决?执行 insert、insert on conflict 或 update 命令时,耗时比较长即写入性能较差,通常原因是因为SQL没有走Fixed Plan,没有走Fixed Plan的...

处理挖矿程序最佳实践

背景信息 挖矿程序的特征 挖矿程序会占用CPU进行超频运算,导致CPU严重损耗,并且影响服务器上的其他应用。挖矿程序还具备蠕虫化特点,当安全边界被突破时,挖矿病毒会向内网渗透,并在被入侵的服务器上持久化驻留,以获取最大收益。挖矿...

混合负载HTAP的实践和优化

路由 智能路由 PolarDB-X 优化器会基于代价分析查询物理扫描行数、CPU、内存、IO、网络等核心资源消耗量,将请求区分为TP与AP负载。当您在集群地址上开启了智能路由,会主动识别SQL的工作负载类型来做路由,比如将识别为AP负载的流量路由...

诊断项与诊断结果说明

实例健康诊断功能是一种自助诊断方式,可以对实例的系统状态、网络状态、磁盘状态等进行全方位的诊断,帮助您了解实例健康情况,及时发现并解决常见的问题。本文介绍该功能支持的诊断项,并提供了详细的诊断范围及建议操作供您参考。诊断项...

PolarDB处理TPC-H查询的挑战和机遇

Detecting Correlation cardinality estimation存在以下问题:如何捕获2列之间的相关性->目标列是什么?如何量化衡量2列间的相关性->如何描述相关性?针对第一个问题,一般会采用查询反馈的方案。也就是在初始时,并不假定其相关性,然后在...

在Prometheus告警通知中配置指标走势图

常见问题什么不使用告警的PromQL来获取指标走势图,还需要人为配置?用于告警的PromQL和用户展示图表的PromQL不完全相同(包含阈值判断,与、或逻辑等),在指标展示的PromQL中需要删除这部分内容。为什么配置了_aliyun_display_promql ...

集群成本分析与优化-容器服务ACK

功能 序号 描述 通过CPU、内存指标判断命名空间资源浪费情况CPU Request 为当前该命名空间已被分配的CPU核数,CPU Usage 为真实消耗的CPU核数,Actual CPU Utilization 为实际的CPU使用率。Memory Request 为当前该命名空间已被分配的...

常见问题

本文汇总了YARN使用时的常见问题。集群问题汇总 集群有状态重启包括哪些内容?如何启用RM HA?如何检查ResourceManager服务是否正常?如何了解应用运行状况?应用问题排查流程 单任务/容器(Container)最大可用资源由哪些配置项决定?资源...

成本洞察功能说明

费用概览 功能 序号 描述 命名空间的资源统计、成本估算和费用分摊 ① 您可以通过CPU、内存指标判断命名空间资源浪费情况。指标含义如下:CPU资源 CPU资源使用量:当前该命名空间真实消耗的CPU核数。CPU资源请求量:当前该命名空间已被分配...

弹性伸缩FAQ

spec:containers:name:nginx image:nginx:1.7.9#Replace it with your exactly<image_name:tags>.ports:containerPort:80 常见问题什么节点自动伸缩组件无法弹节点?请检查是否存在如下几种场景:配置伸缩组的实例类型无法满足Pod的...

集群成本洞察

索引 前提条件 开启成本洞察功能 注意事项 集群维度成本分析 使用成本洞察分析云下IDC节点及应用的成本 常见问题 前提条件 确保Kubernetes集群的版本为1.18.8及以上,否则请升级集群。具体操作,请参见 升级ACK集群。已开启 阿里云...

RPC

它的管控性和可观测性不好,问题比较难排查。Service Mesh 从初期就把蚂蚁集团线上系统全量切换 Mesh 作为目标,对性能和运维的要求非常高,不能接受业务有损或者资源消耗率大幅度上升。容器替换方案 框架升级方案,只是解决了可以做,...

弹性伸缩FAQ

本文介绍容器服务ACK弹性伸缩的常见问题及解决办法。类型 问题 节点自动伸缩常见问题 如何升级cluster-autoscaler至最新版本?cluster-autoscaler可模拟判断的资源有哪些?cluster-autoscaler是否支持自定义资源?如何指定节点不被cluster-...

关闭IPVS的estimation功能

Alibaba Cloud Linux镜像提供了关闭IPVS的estimation功能的能力,若您不依赖estimation统计数据包数、连接数等信息,建议关闭IPVS的estimation功能,以消除由于统计带来的额外开销和抖动问题。背景信息 什么是IPVS?IPVS(IP Virtual ...

动态资源超卖

节点的Batch容量根据实际的资源利用率情况动态计算得到,CPU和内存维度默认的计算过程可以按如下公式简单推导:nodeBatchAllocatable=nodeAllocatable*thresholdPercent-podUsage(non-BE)-systemUsage 计算公式中各因子的含义如下:...

如何处理Tair集群数据倾斜

在 Tair 集群中,若个别数据分片节点(Data Node)的内存使用率或CPU使用率、带宽使用率、延时等性能指标远远高于其他数据分片,该 Tair 集群可能已产生数据倾斜。数据倾斜严重时,会导致实例在整体内存使用率不高的情况下,发生内存逐出...

如何处理Redis集群数据倾斜

在 Redis 集群中,若个别数据分片节点(Data Node)的内存使用率或CPU使用率、带宽使用率、延时等性能指标远远高于其他数据分片,该 Redis 集群可能已产生数据倾斜。数据倾斜严重时,会导致实例在整体内存使用率不高的情况下,发生内存逐出...

资源画像

apiVersion:apps/v1 kind:Deployment metadata:name:cpu-load-gen labels:app:cpu-load-gen spec:replicas:2 selector:matchLabels:app:cpu-load-gen-selector template:metadata:labels:app:cpu-load-gen-selector spec:containers:name:...

弹性并行查询(Elastic Parallel Query)常见问题

本文档介绍了弹性并行查询(Elastic Parallel Query)的常见问题。PolarDB读写集群地址是否可以通过hint开启并行查询?优先推荐您在 PolarDB 控制台的 集群地址配置 页面开启并行查询。如果您希望在SQL语句级别生效,可以通过/*+PARALLEL(n...

作业运维(新版)

如果您是数据开发人员,作业运维功能方便您日常查看作业详情,及时发现作业的异常情况问题,对有问题的作业及时进行处理,例如终止或批量终止作业。如果您是管理员,作业运维功能方便您日常结合配额组查看某时刻的资源负载,合理分配和...

视频流接入常见问题

视频流接入问题分析 问题现象 视频流接入是一个涉及浏览器、视频流、播放器多方的综合问题,DataV产品作为可视化页面搭建工具,只是将视频播放器以组件的形式进行集成,由于定位手段比较有限,无法直接深入浏览器、视频流、播放器本身进行...

视频流接入常见问题

视频流接入问题分析 问题现象 视频流接入是一个涉及浏览器、视频流、播放器多方的综合问题,DataV产品作为可视化页面搭建工具,只是将视频播放器以组件的形式进行集成,由于定位手段比较有限,无法直接深入浏览器、视频流、播放器本身进行...

使用负载感知调度

常见问题 对于一批新创建的Pod,为什么没有全部调度到负载最低的节点?如果调度器将一批新创建的Pod全部调度到当前负载最低的节点,那么这个节点反而可能很快就会成为负载热点,这是因为新Pod在启动后会增加节点的负载。因此,负载感知调度...

监控、诊断和故障排除

例如,在某些情况下,用户请求可能会报告一个错误,而服务器端日志中却看不到任何该请求的访问情况,这时就可以使用OSS的日志服务功能记录的日志来调查该问题的原因是否在客户端上,或者使用网络监视工具来调查网络问题。最常用的网络...

统计信息

常见问题与解决方案 ANALYZE命令为什么会被诊断为慢查询 系统在运维时间自动发起的 ANALYZE 命令会低优先级执行(IO限流+CPU低优先级),因此执行缓慢,耗时很长,会被诊断为慢查询,一般不会影响业务。如果CPU负载不高,或者CPU负载高与运...

任务管理

包括前任务的CPU指令地址(PC指针),当前任务的栈空间,当前任务的CPU寄存器状态等),在任务相继执行过程中,将切任务的信息保存在任务上下文中,将切入任务的上下文信息恢复,使其得以执行。为维护任务上下文、状态、栈等相关信息,...

常见问题

本文汇总了StarRocks使用时的常见问题。业务测试评估 硬件资源有什么要求?软件配置有什么要求?数据模型和表定义 生产环境下的副本数应该设置为多少?如何分区?如何分桶?如何设计排序键?如何合理的选择数据类型?数据导入常见问题 业务...

使用负载热点打散重调度

ack-koordinator组件提供负载热点打散重调度能力,可以感知集群内节点负载的变化,自动地优化超过负载水位安全阈值的节点,防止出现负载极端不均衡的情况。本文介绍如何使用负载热点打散重调度及其高级配置参数。使用限制 仅支持ACK Pro版...

概览

什么是智能阈值 智能阈值基于机器学习算法动态识别历史数据模式特征(例如:监控指标的周期性、整体趋势和波动大小等),并融合具体的云产品的监控指标信息,自动针对每个实例计算上下阈值的报警边界。应用场景 在不同业务场景下,云资源...

ECS选型最佳实践

y:表示采用阿里云自研倚天710 ARM架构CPU(Yitian)a:表示采用AMD CPU ae:表示AMD增强型(AMD enhanced)i:表示采用intel CPU h:表示采用海光处理器 re:表示RDMA增强型(RDMA enhanced)se:表示存储增强型(storage enhanced)ne:...

无法ping通ECS实例公网IP的排查方法

本地客户端无法ping通目标ECS实例公网IP,例如:本地客户端为Linux系统,ping目标ECS实例公网IP时无响应,如下所示:本地客户端为Windows系统,ping目标ECS实例公网IP时提示 请求超时 错误,如下所示:问题原因 在确保本地网络正常的情况下...

Linux系统的ECS实例CPU使用率或CPU负载较高问题的排查...

操作场景 在您使用ECS实例过程中,可能会遇到实例CPU使用率或CPU负载持续较高的情况,您可以按照以下步骤排查定位具体问题。找到影响CPU使用率或CPU负载过高的具体进程。排查影响CPU使用率或CPU负载过高的进程是否正常,并分类进行处理。...

处理CPU使用率高问题

CPU作为数据库最核心的资源,是日常运维中重点关注的对象。当实例CPU使用率持续较高时,很容易导致数据库访问响应慢,从而导致业务受损。操作视频 异常检测 异常检测:基于机器学习和细粒度的监控数据,DAS实现7 X 24小时的异常检测,相比...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
DDoS防护 云监控 云防火墙 弹性公网IP 短信服务 人工智能平台 PAI
新人特惠 爆款特惠 最新活动 免费试用