AMD实例规格与操作系统兼容性说明

AMD Zen架构发布于2017年,处理器的部分新特性在旧版操作系统会出现部分功能支持上的缺陷。下文列出了各操作系统对于不同代系AMD实例的兼容性说明,并提供了官方兼容性说明文档以供您参考。购买AMD实例规格时,建议您使用表中列出的官方...

如何排查Java场景下故障注入不生效的问题

在对Java进程注入故障时,可能会出现故障注入失败的情况。为解决此类问题,在创建或编辑演练时,您可以在故障执行阶段选择开启Debug模式,并通过相关的日志信息来了解故障注入失败的原因。开启Debug模式 在查看目标演练的故障注入日志前,...

主从(备)切换

注意事项 实例切换过程中会出现闪断,请确保您的应用程序具有自动重连机制。实例切换后,只读实例的数据会有几分钟的延迟,因为需要重建复制链路、同步增量数据等。手动切换主备实例 说明 仅 MyBase MySQL 高可用版实例支持主备切换。登录 ...

内核统一异常框架(UKFEF)

背景信息 操作系统出现严重问题前,可能输出一些特征或提示信息。在运维过程中,您可以利用这些信息进行故障预测和实施运维操作,但由于这些信息分散在系统中的不同模块,且输出格式各异。因此,您在收集系统异常事件时可能面临以下...

启动加速-模块并行启动

SOFABoot 加快应用启动速度的方式主要有 2 种:模块并行启动 异步初始化方法 本文介绍如何通过模块并行启动以提高应用启动速度。模块并行启动规则 SOFABoot 根据 模块 properties 配置 中的 Require-Module 属性,计算模块依赖树,并根据...

参考:性能基准评测

batch-size 1 global-batch-size 4 使用Pytorch原生的分布式数据并行会导致出现OOM,导致OOM的关键原因是模型无法放在32G的显卡上,因为Adam优化器的状态参数就消耗16G显存。方案 吞吐(samples/s)Peak Memory(MB)无加速技术 OOM OOM ...

技术原理

当优化器判断对于某一个特定的查询,并行查询是最快的执行策略时,优化器将创建一个查询计划。该计划包括一个 Gather 或者 Gather Merge 节点。下面是一个简单的例子:EXPLAIN SELECT*FROM pgbench_accounts WHERE filler LIKE '%x%';QUERY...

访问云虚拟主机上的网站提示“Internal Server Error...

说明 如果Linux操作系统云虚拟主机上安装了WordPress网站后,修改WordPress网站中主题的某些变量时,也会出现上述报错信息。Windows操作系统云虚拟主机:访问该主机上的网站时提示“Internal Server Error”相关报错,具体信息如下所示:...

通过可观测性能力进行故障处理最佳实践

具体使用时可将这些指标大致分为以下三类:一级指标:建议将没有歧义的、可衡量业务正常运行的指标作为一级指标,这些指标出现异常则一定是业务链路出现问题一般可用做监控报警项。例如,消息收发TPS超过规格限制可触发实例流控,您可以...

ECS实例操作系统内部(GuestOS)常见问题与修复方案

本文介绍ECS实例操作系统内部(GuestOS)的常见问题,以及对应的修复方案。Linux操作系统(GuestOS)常见问题与解决方案 无法正常启动 检查fstab文件中的块设备信息是否存在 如果实例中存在有块设备,但块设备信息在fstab文件中不存在,...

概述

容错是指系统能够在部分组件出现故障或错误的情况下,依然能够继续正常运行,并提供正确的输出结果。这意味着系统具有自动检测、纠正和恢复错误的能力,以保证系统的可靠性和可用性。系统容错的目标是使系统能够在面对硬件故障、软件错误、...

如何管理故障

当报警来源的指标持续恶化,触发故障产生规则,系统自动产生故障故障过程 故障过程用于记录管理故障处理的全过程。当故障处于处理中/已恢复状态时,故障详情默认进入故障过程tab页;可以对故障的最新进展、故障影响面(影响服务)、舆情...

解决Windows实例中无法查看数据盘问题

本文介绍在Windows实例中无法查看数据盘问题的原因以及解决方案。问题描述 Windows实例中无法查看数据盘。问题原因 无法查看数据盘通常是如下几种原因:磁盘显示为外部或脱机 新增的驱动被禁用 新购买磁盘未进行分区和格式化 磁盘未分配...

故障排查

如果您在使用 ACK Serverless集群 时出现故障,可根据以下故障分类匹配故障场景和解决方案,帮助您快速排查问题,提升运维效率。分类 相关文档 集群资源和集群组件异常问题排查 集群检查项及修复方案(包括升级集群、迁移集群、安装组件、...

参数说明

max_parallel_workers 设置系统并行操作所支持的工作者的最大数量。要注意将这个值设置得大于max_worker_processes将不会产生效果。注意并行查询可能消耗比非并行查询更多的资源,因为每一个工作者进程时一个完全独立的进程,它对系统...

如何处理系统内存使用率过高问题

问题现象 使用Linux系统的ECS实例时,出现系统卡顿、内部服务响应速度变慢等问题。通过实例健康诊断显示:该实例当前内存的使用率已超过80%。可能原因 ECS实例中存在异常的进程或服务,占用大量内存,导致内存使用率过高。一般来说,当内存...

ack-node-repairer

当节点出现故障时,自愈系统会自动对故障所在节点触发相应的修复操作。当故障被修复后,NPD修改故障状态,达到故障检测以及修复的闭环。运维人员也可以自定义需要采取修复操作的故障以及具体的修复操作。NPD是Kubernetes节点诊断的工具,...

出错提示“Anolis OS does not provide i686 packages...

问题描述 在操作系统迁移时,出错提示“Anolis OS does not provide i686 packages,please remove them before migration”。问题原因 Anolis或Alibaba Linux及其衍生版本不再提供i686的软件包,如果待迁移的操作系统存在i686的软件包,...

概述

说明 主备实例切换耗时约 5 分钟,切换过程中,可能会出现链接闪断。建议在业务低谷期执行主备切换,同时建议使用链接池等技术手段确保业务具备自动重连机制。主备实例操作列表 您可以根据业务需要创建备实例,并可对主备实例分别进行以下...

Linux系统的ECS实例运行卡顿,在/var/log/messages...

系统内核问题:当系统内核存在漏洞或者其他问题时,可能会出现hung task故障系统资源紧张:ECS实例中应用或进程占用系统资源使用率(如CPU、内存等)过高时,可能会出现hung task故障。解决方案 出现hung task的原因比较复杂,您可以参考...

Linux系统的ECS实例系统无响应,系统日志中出现“BUG:...

soft lockup-CPU#0 stuck for 61s 问题原因 该问题通常是由于ECS实例中,系统内核长时间占用CPU资源导致出现软死锁(soft lockup)故障,内核长时间占用CPU资源可能有以下原因:系统负载过高 内核死循环或死锁 内核调度问题 内核出现故障 ...

如何优化Batch Insert

重要 单条SQL语句过大时,分布式下单个计算节点的压力会偏重,首先会带来一定的内存消耗风险,其次可能会出现多个节点之间的压力不均衡。Batch的批量导入,消耗更多的是IOPS的资源,CPU和内存不是主要瓶颈。因此,如果需要做资源升配来提升...

回切至本地VMware

本文主要介绍如何利用阿里云连续复制型容灾(CDR)服务,在本地虚拟机出现问题后把云上恢复出来的ECS回切到云下VMware环境中。前提条件 已部署CDR网关。更多信息,请参见 步骤三:部署CDR网关。已在被保护的Windows服务器上安装阿里云复制...

升级Linux ECS实例内核

升级须知 升级操作系统内核是一个比较复杂和风险较高的操作,可能导致系统不稳定或出现兼容性问题。在进行升级前,建议备份重要数据,了解升级过程和可能出现问题,并谨慎操作。操作步骤 以CentOS和Debian系列操作系统为例,指导您如何...

云盒故障服务器维修流程

本文介绍当云盒内的服务器出现故障时,阿里云如何进行更换和维修,保证数据安全。背景信息 当云盒内的服务器出现故障,需要更换和维修时,出于客户成本考虑,云盒内没有部署数据擦除服务,阿里云不在客户现场进行数据擦除。重要 在您购买...

自助诊断系统

由于存在未支付订单时不能升级配置,因此会出现 错误提示,您可以利用自主诊断系统排查错误原因。有关如何正确升级实例配置,请参见 包年包月实例升级配置。步骤一:提交自动诊断 完成以下操作,提交自动诊断:登录 ECS管理控制台。在左侧...

查询流程和执行计划

Stage的数据来源可以是底层存储系统中的数据或者网络中传输的数据,一个Stage由分布在不同Executor节点上相同类型的Task组成,多个Task会并行处理数据。说明 AnalyticDB MySQL版 SQL诊断功能支持对Stage级别进行结果诊断。更多详情,请参见...

公共云基础服务说明书

附录:第三方软件问题与说明 阿里云将尽最大努力为客户提供以下第三方软件在阿里云ECS服务器/操作系统环境中安装、配置和疑难排解的建议,确保其在阿里云ECS服务器/操作系统环境中正常运行。阿里云售后团队向客户提供的关于第三方软件的...

历史记录

修复“SchedulerX客户端与Spring Cloud集成时会出现任务运行锁死超时”的兼容问题。修复“广播任务在并发情况下出现执行中断”的问题。修复“秒级别任务在执行过程中未能定时刷新Worker实例列表”的问题。修复“秒级别广播任务执行停止指令...

节点异常问题排查

本文介绍关于节点异常问题的诊断流程、排查思路、常见问题及解决方案。本文目录 类别 内容 诊断流程 诊断流程 常见排查方法 节点故障诊断 检查节点的详情 检查节点的状态 检查节点的事件 检查节点的诊断日志 检查节点的关键组件 检查节点的...

节点异常问题排查

本文介绍关于节点异常问题的诊断流程、排查思路、常见问题及解决方案。本文目录 类别 内容 诊断流程 诊断流程 常见排查方法 节点故障诊断 检查节点的详情 检查节点的状态 检查节点的事件 检查节点的诊断日志 检查节点的关键组件 检查节点的...

两地三中心

在金融行业,为了保证系统的高可用性和容灾能力,采用两个机房作为主中心,一个机房作为备份中心的架构模式,简称为“两地三中心架构”。两地三中心架构广泛应用于金融行业中的核心业务系统,如支付结算、证券交易、贷款管理。本文介绍两地...

【产品变更】基于CIS的加固功能下线公告

如您的节点操作系统安全加固类型为CIS加固,或集群使用了CIS Kubernetes加固功能,后续您可以使用ACK提供的 OS安全加固 和 K8s安全加固 功能作为替代措施。针对2024年04月24日前已经启用CIS加固功能的集群或节点,您仍然可以正常使用,集群...

出错提示M101源系统迁移环境不满足

本文主要介绍在Linux操作系统迁移时,迁移任务出错提示“M101”信息时的问题描述、问题原因及其解决方案。问题描述 在SMC操作系统迁移到AliOS时,迁移任务出错提示“M101”信息。问题原因 源系统迁移环境不满足。解决方案 您可以根据出错...

流程配置

任务编排 添加并行任务 在流水线编辑页面,鼠标移动到一个阶段会出现“+并行任务”按钮,点击打开 选择任务组 面板,选择合适的任务组模板,即可完成并行任务的添加。添加串行任务 在流水线编辑页面,鼠标移动到一个任务会出现“+”,可以...

并行查询使用限制和兼容性问题

精度问题 并行查询的执行过程中,可能会出现比串行执行多出中间结果的存储,如果中间结果是浮点型,可能会导致浮点部分精度差别,导致最终结果有细微的差别。网络包或者中间结果长度超出 max_allowed_packet 允许的最大长度 并行查询的执行...

数据导入优化建议

导入并发和资源说明 单张表的导入系统内部串行,不同表之间的导入任务会并行,默认并行度是2。以MaxCompute表导入HybridDB for MySQL为例,同一张表的不同分区导入实际上排队串行执行。不同表的导入,同时提交,有并行度的n个任务...

时间窗口MR脚本

在普通的MaxCompute MR(MapReduce)组件上增加了 多日期循环执行 功能,用于并行执行某段时间内 天级别 MR任务。例如在推荐算法定制场景中,并行执行过去30天的EasyRecFGMapper任务。使用限制 仅支持天级别的补数据循环。在使用时按照需要...

诊断实例的健康状态

操作系统:如果您选择的问题场景中同时检测实例操作系统内的配置,需要确保实例操作系统符合下表所述的条件。操作系统架构 操作系统版本 操作系统内配置 x86_64位 Windows Server 2008及更高版本 Alibaba Cloud Linux 2/3 AlmaLinux 8.x ...

ganos.parallel.degree

并行操作时,若未指定并行度,Ganos将按照默认并行度执行并行操作。您可以通过ganos.parallel.degree变量来设置默认并行度。数据类型 Integer 取值 取值范围:1~64。默认值为1。示例 SET ganos.parallel.degree=4;
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
商标服务 负载均衡 云安全中心 弹性公网IP 短信服务 人工智能平台 PAI
新人特惠 爆款特惠 最新活动 免费试用