启动ACCL容器

PyTorch多进程处理、多线程Dataloader等会大量使用共享内存通信,故而建议为容器分配足够的共享内存空间。其他可行选项包括:shm-size=8g-v/dev/shm:/dev/shm-device=dev/infiniband-ulimit memlock=-1:1 挂载RDMA网卡设备并移除内存页锁定...

共享内存通信(SMC)使用说明

Alibaba Cloud Linux 3提供的共享内存通信SMC(Shared Memory Communication)是一种兼容socket层、使用共享内存技术实现的高性能内核网络协议栈。根据共享内存技术的不同,SMC又可以细分为基于Internal Shared Memory(ISM)技术的SMC ...

共享内存通信(SMC)使用说明

Alibaba Cloud Linux 3提供的共享内存通信SMC(Shared Memory Communication)是一种兼容socket层、使用共享内存技术实现的高性能内核网络协议栈。根据共享内存技术的不同,SMC又可以细分为基于Internal Shared Memory(ISM)技术的SMC ...

ECS资源复用版

共享内存使用 实际被使用的内存数量。说明 ECS共享资源可用值小于计划上限值,可能是由于ECS资源预定容量不足或ECS库存不足,请前往 ECS资源预定 查看。查看os_EcsQuota关联的项目列表。查看账单详情 费用介绍 使用MaxCompute-ECS资源复用...

查看增强监控

平均值:os.mem_size.mapped_file.avg 最大值:os.mem_size.mapped_file.max 最小值:os.mem_size.mapped_file.min 共享内存使用量 MB ✔️ ✔️ 平均值:os.mem_size.rss.avg 最大值:os.mem_size.rss.max 最小值:os.mem_size.rss.min ...

pg_shmem_allocations

pg_shmem_allocations 视图显示从服务器的主共享内存段的分配模式。简介 pg_shmem_allocations 视图显示从服务器的主共享内存段的分配模式。说明 此视图不包括使用动态共享内存基础架构分配的内存。列名称 列类型 描述 name text 共享内存...

pg_shmem_allocations

简介 说明 pg_shmem_allocations 视图不包括使用动态共享内存基础架构分配的内存。匿名分配是直接使用 ShmemAlloc()分配,而不是通过 ShmemInitStruct()或 ShmemInitHash()。默认情况下,pg_shmem_allocations 视图只能被超级用户读取。pg_...

参数说明

资源消耗参数 参数名 参数说明 shared_buffers 数据库使用共享内存大小,越大的缓存区可以缓存的数据更多,PolarDB中该值与规格相关。work_mem 指定在写到临时磁盘文件之前被内部排序操作和哈希表使用的内存量。注意对于一个复杂查询,...

服务网格落地

SOFAMosn 的 Metric 迁移:蚂蚁团队使用共享内存来共享新老进程的 Metric 数据,保证在迁移的过程中 Metric 数据也是正确的。内存复用机制 内存复用机制主要特征如下:基于 sync.Pool。Slice 复用使用 Slab 细粒度,提高复用率。常用结构...

Shared Server

用户连接不再使用新的SS共享内存,而是使用本地进程内存。用户连接与后端进程之间的数据传输依旧经过Dispatcher转发。以下场景中会触发兜底机制,执行模式会由Shared转变为Dedicated:更新了SS黑名单内的GUC参数。使用了SS黑名单内的插件。...

Shared Server

用户连接不再使用新的SS共享内存,而是使用本地进程内存。用户连接与后端进程之间的数据传输依旧经过Dispatcher转发。以下场景中会触发兜底机制,执行模式会由Shared转变为Dedicated:更新了SS黑名单内的GUC参数。使用了SS黑名单内的插件。...

共享自定义镜像

创建自定义镜像后,您可以将镜像共享给其他阿里云账号或者基于资源目录在企业组织内共享使用共享对象就可以使用共享的自定义镜像快速创建运行同一镜像环境的ECS实例。本文介绍共享自定义镜像的注意事项及操作流程。操作场景 场景一:您...

java_lang_OutOfMemoryError

是否List、Map等集合对象使用后未清除,而集合对象有对对象的引用导致对象不能被GC回收,是否有内存泄露等。建议使用深度性能测试检测内存泄漏等问题。代码示例/在循环外初始化大对象list并在循环内重复使用,并清空集合类、置null List ...

共享加密自定义镜像

共享对象 注意项 说明 共享费用 共享镜像不会占用共享对象的自定义镜像额度,阿里云也不会向共享对象收取镜像共享费用。如果共享镜像的最终来源为付费镜像且共享对象使用共享镜像创建ECS实例,则会向共享对象收取镜像费用。例如:源镜像A...

如何选择公网类产品?

支持使用共享流量包,将公网IP转换为EIP后也可以使用共享带宽。更多信息,请参见 什么是共享带宽 和 什么是共享流量包。弹性公网IP(EIP)能够动态和VPC ECS实例绑定和解绑,支持VPC ECS实例访问公网(SNAT)和被公网访问(DNAT)。EIP可以...

查看监控信息

相关文档 常见性能问题:RDS MySQL慢SQL问题 RDS MySQL内存使用问题 RDS MySQL空间不足问题 RDS MySQL I/O高问题 RDS MySQL活跃线程数高问题 使用自治服务对数据库进行性能优化和诊断,详情请参见 性能优化与诊断。常见问题 MySQL CPU使用...

MongoDB实例内存使用率高问题

云数据库 MongoDB 版 的内存使用率是一个非常重要的监控指标。本文介绍查看 云数据库 MongoDB 版 实例内存使用率的方法,以及导致内存使用率高的原因和优化策略。背景信息 云数据库 MongoDB 版 进程启动后,不仅会加载二进制文件和依赖的...

告警规则指标说明

通常情况下,Young GC次数越多,表示应用程序中创建的对象越多,同时也可能意味着应用程序可能存在一些内存泄漏或者不合理的内存使用方式。JVM YoungGC耗时(瞬时值)毫秒 不是 最近N分钟JVM执行Young GC(Young Generation Garbage ...

Lua脚本规范与常见报错

现象:由于Lua脚本缓存将计入 Tair 的内存使用量中,并会导致used_memory升高,当 Tair 的内存使用量接近甚至超过maxmemory时,可能引发内存溢出(Out Of Memory),报错示例如下。OOM command not allowed when used memory>'maxmemory'....

通过OOS定期删除Tair或Redis过期Key

相关文档 您也可以在OOS中配置 告警与事件运维,例如当内存使用率(平均值)达到90%时,调用 FlushExpireKeys API删除已过期的Key。配置方式与本方案类似,配置入口为 自动化任务>告警与事件运维,更多信息请参见 创建告警运维任务。关于...

内存诊断

内存诊断有普通内存诊断和共享内存诊断两种方式,具体内存诊断方式根据需求而定。普通内存 可以通过观察 polar_stat_activity_rt 视图,如下所示:SELECT pid,rss FROM polar_stat_activity_rt ORDER BY rss DESC;\watch 1 进而可通过 ...

内存诊断

内存诊断有普通内存诊断和共享内存诊断两种方式,具体内存诊断方式根据需求而定。普通内存 可以通过观察 polar_stat_activity_rt 视图,如下所示:SELECT pid,rss FROM polar_stat_activity_rt ORDER BY rss DESC;\watch 1 进而可通过 ...

成本洞察功能说明

内存资源使用率:当前该命名空间的内存使用量占请求量的比例。GPU资源:GPU显存资源使用量:当前该命名空间真实消耗的GPU显存量。GPU显存资源分配量:当前该命名空间已被分配的GPU显存量。GPU显存资源总容量:集群总GPU显存量。GPU显存资源...

Tair配置参数列表

在集群架构中,当单个数据节点达到 Maxmemory 时(即使此时的总内存使用率未到达上限),该数据节点也会触发数据逐出。您需要处理数据倾斜的问题,更多信息请参见 如何处理Tair集群数据倾斜。LRU表示最近最少使用的。LFU表示最不常用的。...

Hive服务异常排查及处理

例如GC指标提示内存使用率过高,则需要调整内存。具体操作,请参见 Hive服务内存参数调整。如果服务正常则可查看HiveMetaStore或者HiveServer2在集群监控页Hive组件 HiveMetaStore 和 HiveServer2 关键指标监控项,根据指标项判断服务参数...

调优集群性能

当包含这些算子的SQL并发较高,或者单算子占用较高的内存,那么计算内存使用率指标就会增高,影响集群的稳定性,并且导致查询报错,常见报错如下:Query exceeded reserved memory limit:某个查询在单个节点上使用内存超过限制。...

Lua脚本规范与常见报错

现象:由于Lua脚本缓存将计入Redis的内存使用量中,并会导致used_memory升高,当Redis的内存使用量接近甚至超过maxmemory时,可能引发内存溢出(Out Of Memory),报错示例如下。OOM command not allowed when used memory>'maxmemory'....

指标说明

nginx_ingress_controller_success-process_resident_memory_bytes 即RSS(Resident Set Size),指的是常驻内存集,是进程实际使用的内存,他不包括分配但未使用的内存,也不包括换出的内存页面,但包含共享内存。process_open_fds 通过...

指标说明

nginx_ingress_controller_success-process_resident_memory_bytes 即RSS(Resident Set Size),指的是常驻内存集,是进程实际使用的内存,他不包括分配但未使用的内存,也不包括换出的内存页面,但包含共享内存。process_open_fds 通过...

ResourceConfig

名称 类型 描述 示例值 object 资源配置 CPU string CPU 核心数 10 GPU string GPU 核心数 3 Memory string 内存容量 10Gi SharedMemory string 共享内存容量 5Gi GPUType string GPU 类型 Tesla-V100-16G

资源组管理

如果MEMORY_SHARED_QUOTA参数设置为100%,那么资源组内部的所有内存都将被视为共享内存,所有任务都可以使用这块内存;如果MEMORY_SHARED_QUOTA参数值小于100%,系统将根据设定的比例将内存划分为固定部分和共享部分,固定部分是每个任务...

ECS实例使用指定账号共享的镜像

应用场景 使用指定共享的镜像可以提高系统的稳定性、安全性和可靠性,同时简化了系统管理、降低了成本,是一种推荐的最佳实践。风险等级 默认风险等级:中风险。当您使用该规则时,可以按照实际需求变更风险等级。检测逻辑 ECS实例使用指定...

资源监控指标

服务器明细 指标名称 说明 单位 数据源 Cpu Util(%)CPU 使用率%tsar Mem Util(%)内存使用率%tsar IO Util(%)IO 使用率%tsar Disk Util(%)磁盘使用率%tsar Load1 CPU 1 分钟负载-tsar Load5 CPU 5 分钟负载-tsar IFIN 网络流入量 Byte/s ...

将快照共享给其他阿里云账号

共享者接收并使用共享快照 快照所有者发起共享后,资源使用者需接受共享邀请,才能使用共享快照。资源使用者登录 资源共享控制台,选择 资源共享>共享给我,接受共享快照。具体操作,请参见 接受或拒绝资源共享邀请。资源使用者登录 ...

文件存储

pg_dynshmem 用于动态共享内存的文件。所有节点存储一份 pg_snapshots 导出的快照(snapshot)。pg_replslot replication slot数据。pg_stat_tmp 统计子系统的临时文件。pg_stat 统计子系统的持久化文件。pg_serial 已提交的Serializable...

内存管理

本文为您介绍StarRocks BE(Backend)中内存使用分类、内存配置以及如何查看内存使用。内存分类 您可以在E-MapReduce控制台目标集群的 集群服务 页面,STARROCKS 服务的 配置 页面的 be.conf 页签,新增或修改BE相关配置,具体操作请参见 ...

使用共享镜像

使用共享镜像前,请仔细阅读以下注意事项:注意项 说明 共享费用 共享镜像不会占用共享对象的自定义镜像额度,阿里云也不会向共享对象收取镜像共享费用。如果共享镜像的最终来源为付费镜像且共享对象使用共享镜像创建ECS实例,则会向共享...

查看仪表盘

单机指标-详 用于实时可视化展示主机的CPU、内存等资源处于不同状态的使用趋势,包括CPU(处于Total、System、User、IOWait状态的CPU使用趋势)、内存(处于Total、Availableused、Used状态的内存使用趋势)等。Kubernetes监控 仪表盘 说明...

云监控

内存使用率:智能召回引擎的内存使用率。cpu使用量:具体的cpu使用量,其中1个cpu为100个单位。内存使用量:具体的内存使用量,单位为byte。服务相关监控 服务相关需要选择对应服务名,仅有流量的服务有相关监控数据。服务qps:服务的查询...

表指标

可通过下拉框选择表,右方选择时间可查看具体时间段内详细指标...指标项 含义 处理后的文档大小 处理后的文档大小 数据处理端到端耗时 数据处理端到端所耗费的时间 实时内存使用量 实时内存使用量 实时内存使用率 实时内存使用占总内存的比率
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
共享带宽 共享流量包 云数据库 RDS NAT网关 负载均衡 弹性公网IP
新人特惠 爆款特惠 最新活动 免费试用