任务管理

为维护任务上下文、状态、栈等相关信息,操作系统内核为每个任务定义了一组数据结构,即任务控制块(Task Control Block),来存放这些信息。任务调度负责将处理器资源分配给关键任务,让其优先运行。所以系统中的每个任务需要根据关键程度...

安装virtio驱动

自定义镜像的操作系统内核需支持virtio驱动,镜像才能被导入阿里云云平台,正常启动云服务器。制作或导入自定义镜像时,请确保自定义镜像已安装virtio驱动且已将virtio驱动添加到临时文件系统,否则请手动操作。您可以按照以下步骤,检查...

公共镜像已知问题

Windows操作系统已知问题 Windows Server 2022安装KB5034439补丁失败问题 2022年06月补丁导致Windows服务器网卡NAT、RRAS异常等问题 2022年01月补丁导致Windows域控服务器异常问题 经典网络中Windows Server 2022镜像的实例无法自动激活...

实例启动异常常见错误与对应解决方案

针对实例启动过程中因操作系统内配置异常、异常关机等问题导致操作系统无法正常启动的情况,您可以通过VNC登录实例发现的启动异常或者实例健康诊断工具返回的异常字段,在本文查看此类问题的解决方案。Windows 1662001135:Windows系统因...

使用ACK Net Exporter定位网络问题

在启动过程中,依赖于与操作系统内核关联的BTF文件(操作系统内核的调试信息元数据的文件)进行加载。如果没有适配的BTF文件,这部分功能将不可用。在高版本的操作系统中,一般都会内置BTF文件的支持。关于操作系统的更多信息,请参见 BPF ...

在企业级实例上配置eRDMA

创建新实例时配置eRDMA 重要 当支持eRDMA能力的实例的操作系统为Alibaba Cloud Linux、Ubuntu和Anolis OS时,支持在创建实例时自动安装eRDMA驱动并开启弹性RDMA接口,使能eRDMA,免去手动安装的麻烦。针对不支持安装eRDMA驱动的操作系统...

使用自定义镜像创建ACK集群

使用自定义操作系统内核 ACK要求自定义操作系统内核版本不小于 3.10,请仅更新您需要自定义安装的相关rpm包,并设置正确的内核引导项。示例如下。cat scripts/updateOSKernel.sh#!bin/bash VERSION_KERNEL="3.10.0-1062.4.3.el7"yum ...

在容器(Docker)中配置eRDMA

eRDMA(Elastic Remote Direct Memory Access)是一种高性能网络通信技术,将eRDMA功能引入容器(Docker)环境可以实现容器应用程序绕过操作系统内核直接访问主机的物理eRDMA设备,从而提供更快的数据传输和通信效率,适用于在容器中需要大...

升级Linux ECS实例内核

当Linux ECS实例的操作系统内核版本遇到了稳定性或性能问题(如系统崩溃、卡顿、内存泄漏等),或需要使用新的内核功能时,可通过升级实例的操作系统内核解决。升级须知 升级操作系统内核是一个比较复杂和风险较高的操作,可能会导致系统不...

内核热补丁概述

Alibaba Cloud Linux为内核的高危安全漏洞(CVE)以及重要的错误修复(Bugfix)提供了热补丁支持,您无需重启服务器即可对操作系统内核更新补丁,以获取内核的稳定与安全。本文主要介绍内核热补丁以及内核热补丁的优势与限制。功能简介 您...

概述

操作系统内核只包含用来控制系统资源和处理器对资源的使用的基础功能,来支持系统服务和上层应用的构建和开发。AliOS Things操作系统内核特性如下:可抢占式/协作式任务调度 多任务管理 软件定时器 任务间通信机制包括信号量、互斥量、队列...

如何收集操作系统宕机后的内核转储信息?

本文为您介绍如何收集操作系统宕机后的内核转储信息。背景信息 阿里云技术支持人员可以通过在转储文件中找到对应的信息,从而分析操作系统宕机的原因,并同步给用户。说明 您也可以通过Windows平台的 WinDbg 工具和Linux平台的 crash 工具...

2023年

阿里云会定期更新和发布公共镜像版本,这些版本可能包含最新的操作系统特性、性能优化、基础软件包的更新以及安全补丁的应用。您可以通过本文查看ECS公共镜像最新的可用版本及更新内容。背景信息 您在ECS购买页面选中某个公共镜像时,默认...

ack-sysom-monitor

ack-sysom-monitor是 容器服务 Kubernetes 版 提供的ACK集群操作系统内核层的容器监控组件。本文介绍ack-sysom-monitor组件的基本信息、使用说明和变更记录。组件介绍 SysOM(System Operation&Maintenance)是由 龙蜥社区 系统运维SIG ...

2022年

针对各个操作系统的新特性、安全补丁等,阿里云会定期更新公共镜像的版本,本章节介绍2022年ECS公共镜像更新的动态。背景信息 您在ECS购买页面选中某个公共镜像时,默认为最近更新的版本。如果您希望购买到较旧的版本,可以通过调用OpenAPI...

集群防御规则可拦截状态异常排查

支持安装AliNet插件的集群节点的操作系统内核版本,请参见 支持的操作系统版本。您也可以登录集群执行以下命令,查看AliNet插件的安装日志。如果集群节点操作系统内核不支持安装AliNet插件,则安装日志中会有 install,driver file not ...

使用限制

操作系统类型 发行版 内核版本 Alibaba Cloud Linux Alibaba Cloud Linux 2.1903 64位 4.19.91-27.4.al7.x86_64及以下版本 RHEL或CentOS 8.4 4.18.0-305.19.1.el8_4 8.3 4.18.0-240.22.1.el8_3 8.2 4.18.0-193.28.1.el8_2 8.1 4.18.0-147.8...

2021年

根据不同操作系统和实例规格族限制,镜像发布分类如下表所示。Linux镜像 指定实例规格族使用的Linux镜像 Windows Server镜像 Anolis OS AlmaLinux CentOS Debian Fedora CoreOS Fedora FreeBSD OpenSUSE Rocky Linux Ubuntu ARM镜像 UEFI...

使用SysOM定位容器内存问题

为解决因容器引擎层的不透明性而导致的故障排查困难问题,阿里云 容器服务 Kubernetes 版 ACK(Container Service for Kubernetes)团队推出操作系统内核层的容器监控可观测能力,为您提供更可靠、透明的容器引擎层,助力您更顺利地进行...

内核统一异常框架(UKFEF)

基于以上问题,Alibaba Cloud Linux 3在操作系统内核层面提供了内核统一异常框架(UKFEF)。UKFEF针对各类可能导致风险的系统异常事件进行统计,并自动判断事件的严重程度,然后统一格式输出事件报告,报告包括了问题产生的场景以及建议的...

ImportImage-导入本地镜像文件

为了使导入后的镜像支持扩容云盘与扩容文件系统,镜像必须满足以下条件:操作系统内核版本需要高于 3.6 版本。支持 growpart 命令。支持该命令需要安装 cloud-utils-growpart 包,不同操作系统安装方式有所不同。具体操作,请参见 扩展...

内存诊断

内核内存(kernel):操作系统内核内存总使用量。应用内存(app):用户态程序内存总使用量。空闲内存(free):系统空闲内存。相关概念 名词 解释 内存泄露 指程序动态分配的内存由于某种原因未释放,造成系统内存利用率升高,导致程序...

管理Alibaba Cloud Linux 2内核热补丁

Alibaba Cloud Linux 2为内核的高危安全漏洞(CVE)以及重要的错误修复(Bugfix)提供了热补丁支持,您无需重启服务器即可更新操作系统内核补丁,以保障内核的稳定与安全,详情请参考:内核热补丁概述。当实例开启内核热补丁后,补丁管理...

SysOM内核层容器监控

SysOM(System Observer Monitoring)是一种在操作系统内核层进行容器监控的方法。基于SysOM操作系统层的容器监控功能,容器服务 Kubernetes 版 ACK(Container Service for Kubernetes)提供独特的操作系统内核层的容器监控可观测能力。该...

【组件升级】NPD升级公告

背景信息 低于v1.2.8版本的ack-node-problem-detector组件会默认开启文件系统句柄巡检项(check_fd),check_fd的进程在读取大内核数据时,会触发部分操作系统内核版本缺陷,可能会造成僵尸进程堆积、甚至宕机的风险。升级组件 为避免低...

重要组件

传统的文件系统,由于嵌入在操作系统内核中,每次系统文件读写操作都需要先陷入内核态,完成后再返回用户态,造成效率低下。PolarFS以函数库形式编译在PolarDB中,因此都运行在用户态,从而减少了操作系统切换的开销。Data Router&Cache 即...

GetAssetDetailByUuid-查询服务器资产详情和扩展信息

1603863599000 Kernel string 操作系统内核版本。4.18.0-80.11.2.el8_0.x86_64 Bind boolean 资产是否已绑定授权。取值:true:已绑定授权 false:未绑定授权 true OsName string 服务器的操作系统名称。CentOS 7.4 64bit Tag string ...

NAT网关故障排查指南

如果您存在多台Linux操作系统的ECS实例通过NAT网关并发访问基于Linux操作系统服务端的场景,由于Linux操作系统内核实现的原因,可能存在TCP连接请求被Linux操作系统内核丢弃而导致连接超时或失败的情况。更多信息,请参见 Linux内核协议栈...

使用可信实例

联系系统管理人员,确认近期是否进行过系统升级与维护操作,例如升级操作系统内核、改变操作系统启动参数以及修改初始文件系统(initramfs)等,然后根据不同情况采取不同方式来修复可信异常。场景一:近期没有进行系统升级或维护操作,...

Linux系统实例的宕机问题排查

当Linux操作系统的ECS实例在运行过程中出现内核panic、内存溢出OOM(Out Of Memory)、蓝屏卡死等问题或收到系统事件通知实例出现操作系统崩溃时,说明该ECS实例发生宕机,您可以通过自助诊断工具或系统内核日志来定位问题并解决。...

CPU Burst性能优化策略

例如对于CPU Limit=2的容器,操作系统内核会限制容器在每100 ms周期内最多使用200 ms的CPU时间片。CPU使用率是衡量容器运行状态的关键指标,管理员通常会参考该指标来设置容器CPU Limit。相较于常用的秒级别指标,百毫秒级别下容器的CPU...

ECS实例宕机并报错“Out of memory and no killable ...

[]do_execveat_common.isra.37+0x250/0x780[28663.759839][]do_execve+0x2c/0x30[28663.764864][]call_usermodehelper_exec_async+0xfb/0x150[28663.777246][]ret_from_fork+0x39/0x50 问题原因 操作系统内核分配内存失败后,尝试通过 kill...

Group Identity功能说明

如果您不熟悉操作系统内核的相关操作,不建议使用 cpu.identity 接口。接口说明如下:接口 说明 cpu.identity 默认取值为0,表示身份标识为 ID_NORMAL。该接口是一个位段,一共有5个比特位,该接口各个比特位的取值说明如下:空值:表示...

软件定时器

更正文档 概述 AliOS Things操作系统内核使用tick作为时间片轮转调度以及延迟操作的时间度量单位,tick是实现定时触发功能的基础。tick计数发生在每次时钟中断处理的过程,时钟中断是定时产生的,系统在默认情况下为1ms触发一次,即一个...

在离线混部概述

例如对于 CPU Limit=2 的容器,操作系统内核会限制容器在每100ms周期内最多使用200ms的CPU时间片。下图展示了一台4核节点、CPU Limit=2 的Web服务类容器,在收到请求(Req)后各线程(Thread)的CPU资源分配情况。可以看出,即使容器在最近...

ECS系统事件概述

说明 非预期运维事件一般指的是因底层宿主机发生了无法预测的故障,或者ECS实例的操作系统发生了内核错误等问题,导致ECS实例突然出现宕机或重启。因宿主机故障导致ECS实例宕机或重启事件(SystemFailure.Reboot)属于偶发现象,无法避免。...

内存管理

更正文档 概述 AliOS Things操作系统内核通过内存管理实现应用程序可以调用标准C库的malloc和free接口来动态的分配和释放内存。内存管理函数 函数名 描述 aos_malloc()从系统heap分配内存给用户 aos_zalloc()从系统heap分配内存给用户,...

什么是微服务引擎MSE

服务引擎MSE(Microservices Engine)是一个面向业界主流开源服务生态的一站式服务平台,提供注册配置中心(原生支持Nacos、ZooKeeper、Eureka)、云原生网关(原生支持Ingress、Envoy)、服务治理(原生支持Spring Cloud、Dubbo、...

查看增强监控

操作系统指标 指标分类 指标名称 指标含义 指标单位 本地盘实例 云盘版实例 网络流量 平均值:os.network.rx.avg 最大值:os.network.rx.max 最小值:os.network.rx.min 网络输入流量 MB/s ❌ ✔️ 平均值:os.network.tx.avg 最大值:os....

无损上线

对于任何一个线上应用来说,发布、扩容、缩容、重启等操作不可避免。在应用启动各阶段,无损上线能提供相应的保护能力,具体功能包含服务延迟注册、服务就绪检查和服务小流量预热。本文介绍MSE提供的无损上线功能。为什么需要无损上线 延迟...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
运维安全中心(堡垒机) 微服务引擎 云安全中心 负载均衡 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用