增强容器资源可见性

从Alibaba Cloud Linux 2(内核版本 4.19.91-22.2.al7)和Alibaba Cloud Linux 3(内核版本 5.10.46-7.al8)开始,在内核层面提供了容器资源视图功能的相关接口,实现对容器资源的可见性增强。本文将对该功能的接口进行说明,并提供示例...

RetinaNet优化案例2:结合Blade和Custom C++ Operator...

使用限制 本文使用的环境需要满足以下版本限制:系统环境:Linux系统中使用Python 3.6及其以上版本、GCC 5.4及其以上版本、Nvidia Tesla T4、CUDA 10.2、CuDNN 8.0.5.39。框架:PyTorch 1.8.1及其以上版本、Detectron2 0.4.1及其以上版本。...

如何排查slab_unreclaimable内存占用高的原因?

slab_unreclaimable是指在Linux内存管理中由slab分配器分配的且被标记为不可回收(unreclaimable)的内存。当不可回收内存占用总内存的比例过高时,将会影响可用内存与系统性能。本文介绍如何排查Alibaba Cloud Linux系统slab_...

Alibaba Cloud Linux 2系统的ECS实例执行ss命令时返回...

本文为您介绍Alibaba Cloud Linux 2系统的ECS实例执行ss命令时返回的Send-Q字段值为0的原因及解决方案。问题描述 在符合如下条件的ECS实例中执行 ss-lnt 命令时,返回的Send-Q字段值为0。镜像:aliyun-2.1903-x64-20G-alibase-20190507.vhd...

开启或关闭IPv6

本文主要介绍如何开启或关闭Alibaba Cloud Linux 2操作系统中的IPv6。前提条件 选用的实例规格必须支持IPv6。更多信息,请参见 实例规格族。创建的实例必须在支持开通IPv6网段的地域下,并搭建了IPv6专有网络。具体操作,请参见 搭建IPv6...

配置blk-iocost权重限速

blk-iocost权重限速功能是Alibaba Cloud Linux对cgroup I/O子系统(blkcg)基于权重的磁盘限速功能的改进。它是一种I/O控制器,可以根据应用程序或进程的优先级为块设备上的I/O操作分配带宽,并且可以通过设置权重值来限制特定应用程序或...

Alibaba Cloud Linux 2系统的ECS实例中ext4文件系统的...

本文介绍Alibaba Cloud Linux 2系统的ECS实例中ext4文件系统的Buffer I/O写性能不符合预期问题的原因及解决方案。问题描述 在ext4文件系统中执行常规的缓存异步I/O(Buffer I/O)写操作时,可能会观察到性能表现不符合预期的情形。存在该...

Alibaba Cloud Linux 2系统的CVE-2021-22555安全漏洞...

本文为您介绍Alibaba Cloud Linux 2系统的CVE-2021-22555安全漏洞内核热补丁修复方案。问题描述 在符合如下条件的Alibaba Cloud Linux 2实例中,存在CVE-2021-22555安全漏洞,系统运行时出现系统宕机问题,且出现如下调用栈信息。镜像:...

修改TCP TIME-WAIT超时时间

Linux的内核中,TCP/IP协议的TIME-WAIT状态持续60秒且无法修改。但在某些场景下,例如TCP负载过高时,适当调小该值有助于提升网络性能。因此Alibaba Cloud Linux 2(内核版本 4.19.43-13.al7 开始)和Alibaba Cloud Linux 3新增内核接口...

指定GPU规格创建Pod

规格类型 GPU规格族 驱动和CUDA版本 GPU虚拟化型实例规格族 sgn7i-vws NVIDIA 470.141.03,CUDA 11.4 vgn7i-vws vgn6i-vws GPU计算型实例规格族 gn7e NVIDIA 470.82.01,CUDA 11.4(默认安装)NVIDIA 525.85.12,CUDA 12.0 gn7i gn7s gn7 ...

指定GPU规格创建Pod

规格类型 GPU规格族 驱动和CUDA版本 GPU虚拟化型实例规格族 sgn7i-vws NVIDIA 470.141.03,CUDA 11.4 vgn7i-vws vgn6i-vws GPU计算型实例规格族 gn7e NVIDIA 470.82.01,CUDA 11.4(默认安装)NVIDIA 525.85.12,CUDA 12.0 gn7i gn7s gn7 ...

从0快速搭建个人版“对话大模型”

重要 系统自动安装驱动以及CUDA库时,请不要手动操作或者重启实例,否则可能会导致驱动或者CUDA库安装失败。等到安装驱动以及CUDA库完成以后,系统会自动重启。如果创建完ECS实例后,没有立即远程登录ECS实例,可能看不到类似下图的回显...

关闭IPVS的estimation功能

使用Linux的IPVS模块时,IPVS会默认启用其estimation功能,当服务器规格较大且Service数量多时(例如,容器Kubernetes大规模集群场景),该功能可能导致服务端的网络请求出现几十到上百毫秒的延时或引起网络抖动。Alibaba Cloud Linux镜像...

使用Inclavare Containers实现远程证明

linux_x64_sdk_$SGX_SDK_RELEASE_NUMBER.bin&\ echo-e 'no/opt/intel '|sudo./sgx_linux_x64_sdk_$SGX_SDK_RELEASE_NUMBER.bin&\ sudo rm-f sgx_linux_x64_sdk_$SGX_SDK_RELEASE_NUMBER.bin 运行以下命令,使用sgx_sign工具dump Enclave的...

Alibaba Cloud Linux 2系统的ECS实例OverlayFS的...

问题描述 在符合如下条件的Alibaba Cloud Linux 2实例中,系统运行时出现系统宕机问题。镜像:Alibaba Cloud Linux 2.1903 LTS 64位 内核:kernel-4.19.91-22.2.al7及之前的内核版本 系统宕机,且出现如下调用栈信息:[49.804600]RDX:...

如何避免因cgroup引起的应用性能抖动?

控制群组(control group)简称为cgroup,是Linux的内核功能。系统通过cgroup可以对系统内的资源进行分配、管理、监控等操作。不合理的cgroup层级或数量可能引起系统中应用性能的不稳定。本文主要介绍问题现象以及如何避免该类问题的出现。...

Block IO限流增强监控接口

为了更方便地监控Linux block IO限流,Alibaba Cloud Linux 2(内核版本 4.19.81-17.al7 开始)和Alibaba Cloud Linux 3增加相关接口,用于增强block IO限流的监控统计能力。本文主要介绍新增接口及使用示例。背景信息 很多场景中您会用到...

RetinaNet优化案例3:结合Blade和TensorRT Plugin优化...

使用限制 本文使用的环境需要满足以下版本限制:系统环境:Linux系统中使用Python 3.6及其以上版本、GCC 5.4及其以上版本、Nvidia Tesla T4、CUDA 10.2、CuDNN 8.0.5.39、TensorRT 7.2.2.3。框架:PyTorch 1.8.1及其以上版本、Detectron2 0...

基于YUM的安全更新操作

背景信息 关于Alibaba Cloud Linux安全更新记录,请参见 Alibaba Cloud Linux 3安全公告 和 Alibaba Cloud Linux 2安全公告。Alibaba Cloud Linux安全更新根据CVE的通用漏洞评估方法(CVSS3)的评分,将安全更新分为以下四个等级:Critical...

Alibaba Cloud Linux 2系统的ECS实例中使用已释放的...

本文介绍如何解决Alibaba Cloud Linux 2系统的ECS实例中使用已释放的文件系统inode导致系统宕机问题。问题描述 在符合如下条件的Alibaba Cloud Linux 2实例中,系统运行时出现系统宕机问题。镜像:Alibaba Cloud Linux 2.1903 LTS 64位 ...

指定GPU规格创建实例

规格类型 GPU规格族 驱动和CUDA版本 GPU虚拟化型实例规格族 sgn7i-vws NVIDIA 470.141.03,CUDA 11.4 vgn7i-vws vgn6i-vws GPU计算型实例规格族 gn7e NVIDIA 470.82.01,CUDA 11.4(默认安装)NVIDIA 525.85.12,CUDA 12.0 gn7i gn7s gn7 ...

SysAK 2.2.0版本导致运行DNF命令发生段错误,如何处理...

本文为您介绍Alibaba Cloud Linux 2/3系统的SysAK 2.2.0版本导致运行DNF(Dandified Yum)命令发生段错误的问题。说明 段错误(Segmentation Fault)是指在程序运行过程中,当尝试访问内存时违反了系统的内存访问规则而引发的一种错误。...

OctreeOption

名称 类型 描述 示例值 object Octree 选项对象。PointResolution double 点云分辨率,该变量决定了点的坐标在编码时可以精确的程度,默认值为 0.01。...false LibraryName string 目前 octree 只支持“pcl”,默认值为“pcl”。pcl

在cgroup v1接口开启CPU Burst功能

Alibaba Cloud Linux 2(内核版本 4.19.91-22.al7 开始)和Alibaba Cloud Linux 3为cgroup v1接口提供了CPU Burst功能。CPU Burst功能允许容器被CPU限流时,突发使用CPU资源,进而提升容器性能、降低系统的延迟指标。本文介绍如何在cgroup ...

Memcg OOM优先级策略功能

Alibaba Cloud Linux 2(内核版本 4.19.91-18.al7 开始)和Alibaba Cloud Linux 3(内核版本 5.10.60-9.al8 开始)新增内存子系统(memcg)内存溢出OOM(Out Of Memory)优先级策略功能。本文主要介绍实现memcg OOM优先级策略功能的接口,...

Alibaba Cloud Linux 3系统的ECS实例中rq->nr_running...

问题描述 在符合如下条件的Alibaba Cloud Linux 3实例中,系统运行时出现rq->nr_running统计异常的问题。镜像:Alibaba Cloud Linux 3.2104 64位 内核:5.10.60-9.al8.x86_64 两层cgroup同时throttle时会导致rq->nr_running低于正常值,...

Alibaba Cloud Linux 2系统的ECS实例中打开Ftrace的...

问题描述 在符合如下条件的Alibaba Cloud Linux 2实例中,系统运行时出现系统宕机问题。镜像:Alibaba Cloud Linux 2.1903 LTS 64位 内核:kernel-4.19.91-23.al7及之前的内核版本 系统宕机,且出现如下调用栈信息:[4017090.993301]...

Group Identity功能说明

Alibaba Cloud Linux 2(内核版本 4.19.91-24.al7 开始)和Alibaba Cloud Linux 3(内核版本 5.10.46-7.al8 开始)支持Group Identity功能,您可以通过该功能为每一个CPU cgroup设置不同的身份标识,以区分不同CPU cgroup中进程任务的优先...

Alibaba Cloud Linux 2系统的ECS实例中断处理释放内存...

问题描述 在符合如下条件的Alibaba Cloud Linux 2实例中,系统运行时出现系统宕机问题。镜像:Alibaba Cloud Linux 2.1903 LTS 64位。内核:4.19.91-21.al7.x86_64及之前的内核版本。系统宕机,且出现如下调用栈信息。[7674143.032169]...

安装和使用Deepytorch Inference

inference.compile(mod_jit)#进行编译 in_t=torch.randn([1,3,224,224]).float().cuda()in_2t=torch.randn([1,3,448,448]).float().cuda()in_3t=torch.randn([16,3,640,640]).float().cuda()#Warming up for_in range(10):mod_jit(in_t)mod...

GPU实例FAQ

函数计算GPU实例的CUDA版本是什么?构建镜像时报错CUDA GPG Error如何解决?为什么我的GPU实例规格显示的是g1?为什么我的预留GPU实例预留不成功?GPU镜像大小限制是多少?GPU镜像加速转换失败怎么办?模型应该打在镜像里,还是与镜像分离?...

Memcg后台异步回收

Alibaba Cloud Linux 2(内核版本 4.19.81-17.al7 开始)和Alibaba Cloud Linux 3内核版本增加了内存子系统(memcg)后台异步回收功能。本文介绍实现memcg后台异步回收功能的接口。背景信息 在社区内核系统中,系统分配内存并在相应memcg中...

Alibaba Cloud Linux 2系统的ECS实例中Page Fault异常...

问题描述 在符合如下条件的Alibaba Cloud Linux 2实例中,系统运行时出现系统宕机问题。镜像:Alibaba Cloud Linux 2.1903 LTS 64位。内核:kernel-4.19.91-23.al7及之前的内核版本。系统宕机,且出现如下调用栈信息。[332.057218]watchdog...

Memcg全局最低水位线分级

本文介绍Alibaba Cloud Linux 2(内核版本 4.19.91-18.al7 开始)和Alibaba Cloud Linux 3新增的memcg全局最低水位线分级功能。背景信息 在Linux内核中,全局内存回收对系统性能影响很大。当时延敏感型业务和资源消耗型任务共同部署时,...

GPU实例FAQ

函数计算GPU实例的CUDA版本是什么?构建镜像时报错CUDA GPG Error如何解决?为什么我的GPU实例规格显示的是g1?为什么我的预留GPU实例预留不成功?GPU镜像大小限制是多少?GPU镜像加速转换失败怎么办?模型应该打在镜像里,还是与镜像分离?...

代码大页

使用限制 仅以下内核版本的Alibaba Cloud Linux镜像支持使用代码大页功能:Alibaba Cloud Linux 2:4.19.91-25 及以上内核版本。Alibaba Cloud Linux 3:5.10.112-11 及以上内核版本。说明 您可以通过 uname-r 命令查询镜像的内核版本。...

基于Docker使用Inclavare Containers机密容器

Inclavare Containers是工业界首个面向...不同发行版的Alibaba Cloud Linux安装命令也不同,具体说明如下:如果您使用的是Alibaba Cloud Linux 2.1903 LTS 64位 UEFI版操作系统,需运行以下命令安装rune:sudo yum-config-manager-add-repo ...

ADP底座支持GPU能力介绍

版本依赖情况 NVIDIA Linux drivers>=418.81.07 Docker>=19.03 Kubernetes>=1.18.0 3.CUDA支持情况 支持CUDA 10.0 11.0 二、GPU驱动 ADP底座不自带nvidia GPU驱动。主要原因是:nvidia GPU 驱动的授权license,不允许第三方通过预集成的...

软件概述

E-HPC提供了业界主流的科学计算应用、编译器运行时...无 运行时库 MPI通信库 GPU加速库 Intel高性能库 Intel-MPI OpenMPI MPICH MVAPICH CUDA-Toolkit cuDNN Intel-ICC-RUNTIME Intel-IFORT-RUNTIME Intel-MKL Intel-DAAL Intel-IPPIntel-TBB

Alibaba Cloud Linux 2系统的ECS实例中SGX驱动在特定...

本文为您介绍Alibaba Cloud Linux 2系统的ECS实例中SGX驱动在特定情况下存在内存泄露问题的原因及解决方案。问题描述 在符合如下条件的Alibaba Cloud Linux 2实例中,SGX驱动在特定情况下存在内存泄露问题,最终导致系统内存耗尽,绝大部分...
共有113条 < 1 2 3 4 ... 113 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
云数据库 RDS 弹性公网IP 短信服务 人工智能平台 PAI 金融分布式架构 对象存储
新人特惠 爆款特惠 最新活动 免费试用