节点诊断

节点文件系统只读状态 节点出现文件系统只读,通常是因为磁盘故障导致节点无法写入数据,可能造成业务异常。请尝试在节点上使用fsck命令修复文件系统,然后重启节点。节点硬件时间 检查节点硬件时钟与系统时间是否一致,时间相差超过2...

无法连接Linux实例的排查方法

如果您没有收到系统返回的报错信息,并且ECS实例是 运行中 状态,然后再根据以下步骤进行排查:步骤一:使用阿里云Workbench工具测试远程登录 通过阿里云提供的Workbench工具进行远程登录,Workbench工具在远程登录出现异常时返回具体的...

Windows系统内存分析工具的介绍

如果已提交虚拟内存非常接近上限,那么系统会出现性能问题。Windows 2008 R2 打开任务管理器,单击 性能,通过任务管理器查看内存使用情况。您还可以添加各类内存指标进行检查,打开任务管理器,依次选择 查看>选择列,添加各类内存指标,...

什么Linux系统的ECS实例中出现大量“TCP:time wait ...

tcp_max_tw_buckets:表示系统同时保持TIME_WAIT状态的Sockets最大数量,如果超过这个数字,TIME_WAIT状态的Socket被结束并且提示告警信息。net.ipv4.tcp_max_tw_buckets:设置该参数,是为了抵御简单的DDoS攻击。若非业务需要,请不要...

快速使用专属集群MyBase

主机故障处理策略 主机故障时,系统的处理策略:自动替换主机:系统会自动替换故障主机。说明 如果故障主机是云盘主机,云盘会自动迁移计算资源以自动替换主机。如果故障主机是非云盘主机,则系统会先将故障主机上的实例迁移走,然后再替换...

设置Pod故障处理策略

默认情况下,ECI Pod创建失败后,系统会自动重试尝试创建。如果您希望尽快得到创建结果以便及时处理故障,可以修改Pod故障处理策略。配置说明 在虚拟节点上创建ECI Pod时,可能会因为库存不足等原因导致Pod创建失败,默认情况下,系统会...

主备切换

实例底层主机故障 阿里云检测到实例底层主机发生故障,例如进程异常中断、实例负载过高导致内存异常等无法正常使用时,系统会立即触发主备切换,及时恢复实例,降低故障影响时长。此类触发方式会以 短信或 站内信、邮件等形式通知到您,...

故障演练常见问题

欢迎您反馈在使用故障演练过程中遇到的问题,目前提供以下常见问题供您参考。单个演练活动成功状态怎么判断?因为一个活动可能有很多目标机器,当所有机器执行完毕之后,如果有机器没有执行成功,那么这个演练活动就系统判断为失败。...

主备切换

实例底层主机故障 阿里云检测到实例底层主机发生故障,例如进程异常中断、实例负载过高导致内存异常等无法正常使用时,系统会立即触发主备切换,及时恢复实例,降低故障影响时长。此类触发方式会以 短信或 站内信、邮件等形式通知到您,...

ECS实例使用的Windows系统激活失败如何解决?

问题原因 出现这个报错一般都是由于服务器到KMS之间的网络存在问题,导致服务器无法跟KMS进行通讯。网络存在问题可能是由于Windows系统的ECS实例中系统防火墙、IP安全策略或者其他网络安全管理软件阻断了服务器与ECS激活服务器之间的通信...

更换操作系统相关问题

更换操作系统的本质是...所以会出现更换操作系统时选不到目标镜像并且提示“该实例为非IO优化实例”,建议您选择其他可选的操作系统。说明 您可以通过 DescribeInstances 接口查询实例的IO属性,通过 DescribeImages 接口查询镜像的IO属性。

添加IPC设备

更多设备信息 单击 更多设备信息系统跳转到 物联网平台控制台 上的 设备详情 页面,您可以查看该设备在云端的详细信息。更多说明,请参见 查看具体设备信息。移除设备 可从边缘一体机中移除该设备。重要 从边缘一体机中移除设备,可能...

读写访问文件类问题

问题现象 文件存储NAS为多客户端提供了统一名字空间的文件共享读写能力,但在多进程或多客户端并发写同一个文件的场景中(典型的例如并发写同一个日志文件),各进程分别维护了独立的文件描述符及写入位置等上下文信息,而NFS协议本身并...

PolarDB MySQL版8.0.1版本发布日志

修复RO节点的物理机出现故障时,RW节点在特殊情况下未将其复制关系中断,而引发RW节点刷脏受阻的问题。修复HA后,因表数量过多而引发table cache淘汰导致Autoinc回退的问题。修复多主集群缓存中心重启情况下,读写节点可能无法启动的问题。...

可观测性的设计原则

监控系统的指标可以让组织了解系统的健康状况和性能情况,以便在系统出现异常时快速发现问题。监控指标可以通过监控工具来实现,并允许在发生异常时发送警报。有很多监控工具可以使用,例如Prometheus、Grafana、Zabbix等,以及阿里云提供...

常见问题以及改进措施

由于数据分布和查询复杂度等因素,可能出现查询性能不符合预期的情况,检查查询的执行计划是重要的问题排查方式之一。常见计划问题 Join Method以及Inner和Outer表 根据Join Method选择Inner和Outer表,一般情况下 AnalyticDB MySQL版 自动...

功能概述

容灾预案 容灾预案可帮助用户实现日常做容灾演练,或在应用服务出现故障时实现一键快速切换流量。① 使用容灾预案,需要配置一个 故障地址池。② 配置完成后,如果用户操作 执行 功能,系统将故障地址池中的地址工作模式改为“永远离线...

ECS系统事件概述

系统事件由阿里云定义,用于记录和通知云资源的信息,例如运维任务执行情况、资源是否出现异常、资源状态变化等。说明 阿里云有众多产品支持系统事件,例如ECS、RDS、SLB等。本文仅说明云服务器ECS支持的系统事件,如需了解其他产品的系统...

GetTicket-查询工单

查询工单。调试 您可以在OpenAPI Explorer中直接运行该接口,免去您计算签名的困扰。运行成功后,OpenAPI Explorer可以自动生成SDK代码示例。调试 授权信息 当前API暂无授权信息透...系统出现未知错误,请重试 访问 错误中心 查看更多错误码。

部署和使用跨可用区实例

同时,您可以通过控制台的切流操作,将出现故障的可用区隔离,这时系统会自动在剩余的可用区中补充计算资源,满足业务对资源的需求。本文介绍如何部署和使用(切流和恢复)跨可用区实例。应用场景 跨可用区部署支持单可用区、跨2个可用区、...

使用实例时镜像相关问题

在使用ECS实例过程中,可能遇到一些与镜像有关的问题或咨询,比如实例启动慢、系统负载高、如何编译内核等。本文介绍在使用ECS实例过程中遇到的镜像相关问题及解决方案。Windows镜像问题 如何手动更新Windows实例的virtio驱动?Windows ...

Windows操作系统云虚拟主机上的网站访问缓慢

本文主要介绍访问Windows操作系统云虚拟主机上的网站时,出现网站访问缓慢问题的可能原因和解决方案。问题描述 使用Windows操作系统云虚拟主机过程中,访问该主机上的网站时,出现网站访问缓慢的问题问题原因 出现上述问题的可能原因如下...

步骤五:应用容灾

故障恢复 本机出现故障后在云上拉起本地业务,待本地环境恢复后再将其恢复到本地。具体步骤如下:在 主站点管理 页签,单击+添加。在 添加计算平台 页面,填写计算平台 名称,选择 类型,填写 IP地址、用户名 和 密码。单击 创建。在连续...

使用Windows实例的日志

Windows日志记录了系统中硬件、软件和系统问题信息,同时还监视着系统中发生的事件。当ECS实例受到入侵或者系统(应用)出现问题时,您可以借助日志迅速定位问题的关键,从而极大地提高工作效率和服务器的安全性。本文以Windows Server ...

概述

分布式链路跟踪具备以下特点:全链追踪:能够深入应用,服务,数据库,消息,捕获性能异常,识别出现故障的组件及服务。易于使用:可以与 SOFAStack 上的应用进行无缝对接,用户的业务代码无需任何修改即可轻松接入,实现性能可视化与问题...

ECS实例操作系统内部(GuestOS)常见问题与修复方案

Linux操作系统(GuestOS)常见问题与解决方案 无法正常启动 检查fstab文件中的块设备信息是否存在 如果实例中存在有块设备,但块设备信息在fstab文件中不存在,重启系统时可能导致系统无法正常启动。您必须移除/etc/fstab 文件中不存在的块...

传统国企:SAE助力传统大型国企云原生转型

因此,在上线时会出现新上线的组件在线上真实环境中出现预期之外的异常,但因为原有系统缺失版本管理,无法快速恢复指定版本,导致无法保障代码资产。SAE支持通过VPC和命名空间为应用提供逻辑隔离的网络环境。应用创建成功后,可以通过灰度...

Windows系统ECS实例激活失败

免责声明:本文档可能包含第三方产品信息,该信息仅供参考。阿里云对第三方产品的性能、可靠性以及操作可能带来的潜在影响,不做任何暗示或其他形式的承诺。概述 本文主要介绍Windows系统ECS实例激活失败的处理方法。详细信息 阿里云提醒您...

PolarDB MySQL版CPU使用率高

此类问题一般可以通过开启集群的thread_pool特性进行流控缓解,具体请参见 Thread Pool。如果活跃线程有所缓解,同时还要注意应用侧是否已经产生了业务堆积,如果CPU负载较高同时活跃线程依然高居不下,此时则同样要考虑是不是对集群进行扩...

灾备方案

集群版-双副本高可用架构 集群架构(双副本)实例中的数据分片用于承载数据,每个数据分片均为双副本(分别部署在不同机器上)高可用架构,主节点发生故障后,系统会自动进行主备切换保证服务高可用。关于各组件的详细介绍,请参见 集群...

GxP欧盟附录11标准合规包

16.1 为了提供支持关键过程的计算机化系统,应作出规定,确保在系统出现故障(例如手动或替代系统)时继续为这些流程提供支持。采用替代安排所需的时间应视风险而定,并适合特定系统及其所支持的业务流程。应充分记录和测试这些安排。17.1 ...

访问解析到ECS实例上的域名出现跳转

概述 本文主要介绍访问解析到ECS实例上的域名出现跳转的问题排查思路。问题描述 解析到ECS实例的IP地址,访问解析的域名跳转到另外一个域名,而服务器内部并没有做任何的跳转配置。问题原因 域名跳转的原因可能有以下几个。主机内部设置...

故障管理

故障管理概述 故障管理是源于ITIL的一个概念,在IT企业或者互联网企业进行故障管理的目的是当生产环境出现重大宕机时尽快恢复正常的服务运营,将组件失败对业务所造成的负面影响降到最低,从而确保满足事先与业务客户之间所约定的服务级别...

监控VPN网关系统事件

在您开始使用VPN网关产品后,云监控 CMS(Cloud Monitor)服务自动帮您监控使用VPN网关过程中产生的产品故障、运维事件以及用户业务异常事件。您可以在云监控管理控制台查看VPN网关产生的系统事件以及为VPN网关系统事件配置报警通知,...

Windows实例事件日志异常检查

问题现象 当Windows系统的事件日志中出现了报错信息时,表示Windows实例可能出现过蓝屏、操作系统崩溃等问题。解决方案 您可以查看Windows系统事件日志,找到报错信息对应的事件,再根据事件详情找到事件原因。操作步骤如下:说明 以下操作...

集群管理FAQ

收集Linux节点诊断信息 不同节点所使用的操作系统有所限制,Worker节点可以使用Linux系统和Windows系统,Master节点只能使用Linux系统,以下方法同时适用于Linux系统的Master和Worker节点,该操作以Master节点为例。登录Kubernetes集群的...

通过可观测性能力进行故障处理最佳实践

具体使用时可将这些指标大致分为以下三类:一级指标:建议将没有歧义的、可衡量业务正常运行的指标作为一级指标,这些指标出现异常则一定是业务链路出现问题一般可用做监控报警项。例如,消息收发TPS超过规格限制可触发实例流控,您可以...

灾备方案介绍

集群版-双副本高可用架构 集群架构(双副本)实例中的数据分片用于承载数据,每个数据分片均为双副本(分别部署在不同机器上)高可用架构,主节点发生故障后,系统会自动进行主备切换保证服务高可用。关于各组件的详细介绍,请参见 集群...

回切至本地物理机

如果扩充的是包含系统分区的磁盘,那么扩充的这部分空间会被ECS自动填充给系统分区,这样在恢复到本地的物理机时可能会出现分区越界的问题。如果系统分区相对源端机器被扩容,将会收缩相应的空间,确保和源端机器保持一致。反向注册。确认...

连接保持

背景信息 PolarDB 已通过高可用组件实现了主节点出现故障时快速进行主备切换,来提供高可用的集群服务。但此类切换过程对应用程序服务造成影响,导致连接闪断、新建连接短暂失败等问题。引起应用程序服务短暂不可用的场景通常分为如下两...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
云安全中心 商标服务 负载均衡 弹性公网IP 短信服务 人工智能平台 PAI
新人特惠 爆款特惠 最新活动 免费试用