Windows系统实例的宕机问题排查

定位宕机原因 您可以通过以下方式,定位ECS实例发生宕机的具体原因。方式一:(推荐)通过自助诊断工具定位 登录 ECS管理控制台,左侧导航栏单击 自助问题排查。单击 实例问题排查 页签。选择 实例无法连接或启动异常>实例出现宕机,然后...

多NUMA机型的容器内存就近访问加速

ack-koordinator以数据安全的方式将绑核应用远端NUMA上的内存迁移至本地,提高本地访存命中率,为内存密集型的工作负载提供更好的访存性能。本文介绍如何使用内存就近访问加速功能,并验证其对密集型应用性能的提升。索引 前提条件 内存...

语雀

解决方案 引入函数计算之后,语雀将CPU密集型、存在不稳定因素的操作放到函数计算服务中执行,而语雀的主服务再次回归到了I/O密集型应用模型,又可以体验Node给语雀带来的高效研发。以语雀中遇到的一个实际场景来举例,您上传了一些HTML...

语雀

解决方案 引入函数计算之后,语雀将CPU密集型、存在不稳定因素的操作放到函数计算服务中执行,而语雀的主服务再次回归到了I/O密集型应用模型,又可以体验Node给语雀带来的高效研发。以语雀中遇到的一个实际场景来举例,您上传了一些HTML...

CPU拓扑感知调度

在以下场景中,建议使用CPU拓扑感知调度:工作负载为计算密集型。应用程序对CPU敏感。运行在神龙裸金属等多核机器上。使用CPU拓扑感知调度 激活CPU拓扑感知调度前,需要在提交Pod时设置 annotations 和 Containers 的值。满足以下条件:在 ...

使用硬件DSA进行数据流加速

验证DSA加速功能 内存就近访问加速功能以数据安全的方式将绑核应用远端NUMA上的内存迁移至本地,提高本地访存命中率,为内存密集型的工作负载提供更好的访存性能。测试环境 DSA加速功能测试需要多NUMA架构机型,例如ecs.ebmc8i.48xlarge、...

利用JIT加速计算

背景信息 对于OLAP数据库来说,JIT即时编译是提高CPU密集型查询能力的有效手段。在 AnalyticDB PostgreSQL版 7.0版本支持JIT即时编译后,可以加速表达式计算(包括WHERE子句、目标列表、聚集以及投影等)以及元组拆解。在大数据集时,对于...

主机选项说明

开启会话备注 登录主机时需要写明登录主机的原因或目的才可登录,便于事后审计。开启历史会话审计 表示允许堡垒对运维会话内容进行审计,关闭后会产生会话记录,但没有具体内容。开启实时会话监控 表示管理员可以对主机进行实时监控,...

PolarDB PostgreSQL版架构介绍

页面回放:读取和Buffer修改慢(IO密集型+CPU密集型)。DDL回放:修改文件时需要对修改的文件加锁,而加锁的过程容易被阻塞,导致DDL慢。快照更新:RO高并发引起事务快照更新慢。流程如下:主节点写入WAL日志到本地文件系统中。WAL Sender...

集群巡检项及解决方案

当节点宕机或重启时,CoreDNS无法提供服务,影响业务正常运行。解决方案:请您更新到最新版本的CoreDNS。最新版本的CoreDNS中强制约束两个副本不能部署在同一个节点上。具体操作,请参见 CoreDNS自动升级。CoreDNS部署在Master节点上 异常...

共享内存通信(SMC)常见问题

例如应用是倾向于CPU密集型,网络通信在应用中占比较低。应用的网络通信模型不适用SMC。例如:频繁建立、销毁连接(短连接)的场景。SMC创建连接涉及到RDMA资源创建和申请等慢速路径,根据不同应用短连接的占比,性能对比TCP可能没有收益。...

列存索引技术架构介绍

表达式的求值是一个计算密集型的任务,因此,表达式的计算效率是影响整体性能的一个关键的因素。传统MySQL的表达式计算体系以一行为一个单位的逐行运算,一般称其为迭代器模型实现。由于迭代器对整张表进行了抽象,整个表达式实现为一个...

PolarDB HTAP实时数据分析技术解密

表达式的求值是一个计算密集型的任务。因此,表达式的计算效率是影响整体性能的一个关键因素。传统MySQL表达式计算体系,是以一行为单位的逐行运算,一般称其为迭代器模型实现。由于迭代器对整张表进行了抽象,整个表达式实现为一个树形...

CPU拓扑感知调度

原理介绍 Kubernetes的节点会运行多个Pod,其中部分Pod属于CPU密集型工作负载。在这种情况下,Pod之间会争抢节点的CPU资源。当争抢剧烈时,Pod会在不同的CPU Core之间进行频繁的切换,更糟糕的是在NUMA Node之间切换。这种大量的上下文切换...

本地SSD盘FAQ

本地是相对于普通云盘而言,不同于普通云盘的三份数据副本机制,本地SSD盘采用RAID技术,无法避免单台物理机宕机导致的数据丢失风险。如果您对数据可靠性要求高,则建议在应用层做数据冗余以保证数据的可靠性。本地表示没有像普通云磁盘...

2024年

2024年02月28日-MaxCompute单机宕机演练 尊敬的MaxCompute用户:MaxCompute将于北京时间 2024年02月28日(周三)15:00~16:00,在中国华北3(张家口)、西南1(成都)地域进行接入服务可靠性演练,预计不会对用户作业运行产生影响。...

为什么选择安全沙箱?

Kubernetes使得我们很容易在一个节点上混合部署不同的应用容器,由于Cgroups并不能很好解决资源争抢问题,导致同一节点上相同资源密集型(如CPU密集型、IO密集型等)的不同应用相互争抢资源,导致应用的响应时间出现了严重的波动,总体响应...

2024年

imgsmlr 2024年3月 PolarDB PostgreSQL版 新增pg_profile插件,支持统计目标数据库中的资源密集型活动并进行定期采集和监控。pg_profile 2024年3月 PolarDB PostgreSQL版 新增pg_similarity插件,支持相似性运算查询。pg_similarity 2024年...

内存大页支持

例如像PolarO这样的计算密集型应用,需要开启大页内存管理。使用说明 在kubernetes中开启大页内存管理的方法如下 需要在工作负载中加入启动参数:apiVersion:apps/v1 kind:DaemonSet metadata:name:privileged spec:selector:matchLabels:...

功能特性

极速型NAS CPFS 100MB/s基线 CPFS的细分存储类型,适用HPC高性能计算、AI训练、自动驾驶、基因计算、影视渲染、EDA仿真、油气勘探、气象分析等高吞吐、高IOPS、海量文件的IO密集型业务。CPFS存储规格 200MB/s基线 CPFS的细分存储类型,适用...

设置宕机自动迁移

为了降低物理故障对业务的影响,阿里云为您提供专有宿主机DDH宕机自动迁移的功能。本章节介绍在创建DDH后如何开启或者关闭宕机自动迁移。背景信息 宕机自动迁移开启后,当DDH因故障停机时,会自动迁移至健康的DDH。若您未开启宕机自动迁移...

ECS资源复用

为避免因作业占满资源导致实例异常甚至宕机,MaxCompute在ECS实例上部署服务时会为操作系统以及组件预留一定资源。使用说明 开通MaxCompute-ECS资源复用版。登录 阿里云MaxCompute按量付费开通页面。商品类型 选择 按量付费,规格类型 选择...

入门概述

文件系统适用场景 CPFS:HPC高性能计算、AI训练、自动驾驶、基因计算、影视渲染、EDA仿真、油气勘探、气象分析等高吞吐、高IOPS、海量文件的IO密集型业务。CPFS智算版:适用AIGC、自动驾驶等智算场景。目前,仅支持搭配PAI灵骏智算服务使用...

大数据

推荐 大数据存储密集型实例规格族d3s 大数据计算密集型实例规格族d3c 大数据计算密集型实例规格族d2c 大数据存储密集型实例规格族d2s 大数据网络增强型实例规格族d1ne 其他在售(如果售罄,建议使用推荐规格族)大数据型实例规格族d1 大...

使用限制

没有例外 自动宕机迁移 本地SSDDDH不支持自动宕机迁移。没有例外 ECS实例使用的镜像限制 在中国内地以外的地域,ddh.c6s、ddh.g6s或ddh.r6s规格的DDH不支持使用Windows镜像创建ECS实例。没有例外 ECS实例数量限制 以下DDH规格单台DDH上最...

如何选择合适的文件系统?

CPFS:HPC高性能计算、AI训练、自动驾驶、基因计算、影视渲染、EDA仿真、油气勘探、气象分析等高吞吐、高IOPS、海量文件的IO密集型业务。CPFS智算版:适用AIGC、自动驾驶等智算场景。目前,仅支持搭配PAI灵骏智算服务使用。重要 不同存储...

驱逐及防护

当某节点因宕机或其他原因处于NotReady异常状态时,ACS将启动节点自愈流程,此时节点上的Pod将会被驱逐。节点升级:升级节点内核或其他模块时,可能需要触发节点重启操作,在节点重启前,ACS会先将节点上的所有Pod进行驱逐。资源调度运营:...

高性能计算优化实例概述

高吞吐、低延迟、稳定的eRDMA网络,提供节点间高速通信的能力,提升网络密集型应用的性能。HPC优化实例主要用于高性能计算、人工智能、机器学习、科学计算、工程计算、数据分析、音视频处理等场景,可以满足超高性能、网络和存储能力的要求...

网络优化

ECS网络性能优化 在用户业务的网络密集型应用场景中,例如 NFV/SD-WAN、转发网元业务、视频弹幕等,ECS 单实例的性能容量至关重要,随着阿里云软硬件一体的虚拟交换技术的研发和深化,在ECS第7代网络增强型实例中,依托第四代神龙架构,...

存储资源

可能原因包含数据库服务进程异常退出、数据库节点宕机、数据库网络异常等,常见的容错策略如下:自动重启:当数据库实例异常终止或崩溃时,可以设置自动重启和恢复机制,自动重新启动数据库服务,并进行必要的数据恢复操作,以确保数据库的...

本地SSD

使用本地SSD实例时请注意:不支持变配和宕机迁移。本地盘与特定规格的实例相绑定,本地盘的数量和容量由您选择的实例规格决定。不支持单独购买本地盘,不支持将本地盘卸载并挂载到另一台实例上使用。本地盘不支持快照功能。如果您需要为...

ack-fluid

ack-fluid组件是云原生AI套件提供的分布式数据集编排和加速引擎,主要提供云原生数据密集型应用场景下的数据集抽象、数据访问接入和加速、数据编排调度等能力,帮助您简化AI生产过程中的数据管理过程,并提升AI模型训练和模型推理场景的...

内存

推荐 内存实例规格族r8a 内存实例规格族r8i 内存平衡增强实例规格族r8ae 内存实例规格族r8y 内存增强实例规格族re7p 内存实例规格族r7p 存储增强内存实例规格族r7se 内存实例规格族r7a 内存实例规格族r7 安全增强内存...

新功能发布记录

2022-09-22 全部 跨可用区更改实例规格 实例规格族 发布大数据计算密集型实例规格族d3s。2022-09-21 部分 实例规格族 实例规格族 发布存储增强型弹性裸金属服务器实例规格族ebmg7se。2022-09-20 部分 实例规格族 实例规格族 发布FPGA计算型...

创建实例

高效云盘:应用在I/O密集型场景。Log单节点容量即为实际可用的Log存储容量。暂不支持选购容量型存储。说明 如后续存储空间不足或有较多闲置,可以通过扩容磁盘的方式,增加或减少 core单节点容量 和 Log单节点容量。存储类型为 本地SSD盘 ...

ECS主机状态变化事件的自动化运维

这种变化包括您通过控制台、OpenAPI或SDK操作导致的变化,也包括弹性伸缩或欠费等原因而自动触发的变化,还包括因为系统异常而触发的变化。云监控提供四种事件报警处理方式,包括:消息服务队列、函数计算、URL回调和日志服务。本文以消息...

ECS主机状态变化事件的自动化运维

这种变化包括您通过控制台、OpenAPI或SDK操作导致的变化,也包括弹性伸缩或欠费等原因而自动触发的变化,还包括因为系统异常而触发的变化。云监控提供四种事件报警处理方式,包括:消息服务队列、函数计算、URL回调和日志服务。本文以消息...

Persistent Buffer Pool

因此,在宕机和重启之后需要把Buffer Pool的所有页遍历一遍,剔除掉不能被复用的页。另外,Buffer Pool的回收依赖于K8s。使用该优化之后,可以使重启前后的性能更加平稳。重启前后性能对比如图所示:使用指南 打开如下参数即可使用。polar_...

Persistent Buffer Pool

因此,在宕机和重启之后需要把Buffer Pool的所有页遍历一遍,剔除掉不能被复用的页。另外,Buffer Pool的回收依赖于K8s。使用该优化之后,可以使重启前后的性能更加平稳。重启前后性能对比如图所示:使用指南 打开如下参数即可使用。polar_...

在线服务与视频转码应用混部

在离线混部过程中主要使用的相关特性:资源复用:通过 动态资源超卖,允许离线应用复用在线应用已申请但未使用的物理资源,提升集群的资源利用率。资源隔离:通过 容器CPU QoS、弹性资源限制、容器L3 Cache及内存带宽隔离 等手段,约束离线...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
运维安全中心(堡垒机) 云数据库 Redis 版 云虚拟主机 短信服务 云安全中心 弹性公网IP
新人特惠 爆款特惠 最新活动 免费试用