Tair 容灾架构演进 当 Tair 实例因不可预料的原因(例如设备故障、机房断电等)发生故障,容灾机制可用于保障数据的一致性和业务可用性。Tair 提供多种灾备方案供您选择,可满足不同的业务场景。图 1.Tair 容灾架构演进 灾备方案 灾备级别 ...
云数据库Redis容灾架构演进 当云数据库Redis实例因不可预料的原因(例如设备故障、机房断电等)发生故障,容灾机制可用于保障数据的一致性和业务可用性。云数据库Redis提供多种灾备方案供您选择,可满足不同的业务场景。图 1.Redis容灾架构...
因客户自身原因导致的问题故障,不属于阿里云运维服务范围。如客户有不定期现场服务需求,可按天购买运维专家现场服务。运维服务专家可帮助客户进行疑难问题现场处理,故障现场救援,变更现场保障、现场运维培训等服务。运维专家现场服务需...
3 选择容灾方案 云原生内存数据库Tair 实例若因不可预料的原因(例如设备故障、机房断电等)发生故障,容灾机制保障数据的一致性和业务可用性。云原生内存数据库Tair 提供多种灾备方案供您选择,可满足不同的业务场景。4 预估内存规格 提前...
对于有效请求率低于100%的情况,您需要根据自己的使用情况进行分析,可以通过请求分布统计或者请求状态详情确定错误请求的具体类型、原因,并排除故障。对于某些业务场景,出现有效请求率低于100%是符合预期的。例如,用户需要先检查访问的...
选择容灾方案 当云数据库Redis实例因不可预料的原因(例如设备故障、机房断电等)发生故障,容灾机制可用于保障数据的一致性和业务可用性。云数据库Redis提供多种灾备方案供您选择,可满足不同的业务场景。选择大版本 推荐使用更新的大版本...
遇到该错误的通常原因是数据节点故障,请联系技术支持。PXC-4108 ERR_VARIABLE_CAN_NOT_SET_TO_NULL_FOR_NOW 描述:变量(variable)不允许被设置为NULL。示例:ERR-CODE:[PXC-4108][ERR_VARIABLE_CAN_NOT_SET_TO_NULL_FOR_NOW]System ...
当出现1分钟容器响应超时(可能是内存溢出、硬件故障、软件Bug等原因导致),Resource Manager会自动拉起新的计算节点,并迁移数据分片(Shard)职责到新的节点上(例如Worker Node3响应超时,Resource Manager拉起Worker Node4取代Worker ...
随着功能迭代、新卡型推出、BUG修复、驱动生命周期到期等原因,GPU实例所使用的驱动版本未来可能变化,请避免在容器镜像中添加驱动特定相关内容,更多内容,请参见 镜像使用说明。函数计算GPU实例的CUDA版本是什么?CUDA版本由您在构建容器...
随着功能迭代、新卡型推出、BUG修复、驱动生命周期到期等原因,GPU实例所使用的驱动版本未来可能变化。若您已经在使用NVIDIA Container Runtime等GPU容器虚拟化技术,请您避免使用 docker commit 命令创建镜像,此类镜像中会包含已注入的...
当出现1分钟容器响应超时(可能是内存溢出、硬件故障、软件Bug等原因导致),Resource Manager会自动拉起新的计算节点,并迁移Shard职责到新的节点上(例如Worker Node3响应超时,Resource Manager拉起Worker Node4取代Worker Node3),...
cancelReason Long Body 否 取消原因 取消原因 problemNotifyType Long Body 否 PROBLEM_NOTIFY PROBLEM_NOTIFY 通告类型 PROBLEM_NOTIFY:故障通告 PROBLEM_UPDATE:故障更新 PROBLEM_UPGRADE:故障升级 PROBLEM_DEGRADE:故障降级 ...
排查故障的经典步骤与常见原因 如何通过查看日志排查故障?ACK集群异常 添加Kubernetes集群节点的常见问题 容器镜像仓库构建服务失败问题排查 容器镜像服务源码绑定失败问题排查 Kubernetes集群如何指定安全组 Kubernetes集群网络异常的...
告警信息 事件名称 事件级别 状态码 状态描述 DeviceLinkDown CRITICAL linkdown Device Link State Change 可能原因 用户侧交换机设备故障。用户侧交换机配置故障。用户侧交换机和设备的连线问题。处理方法 检查用户侧交换机。...
可能原因 终端到设备的链路故障。设备到阿里云的VPN链路故障。目标ECS故障。运营商网络故障。解决方案 登录 智能接入网关控制台。单击智能接入网关实例ID,查看设备状态是否为 可用。如果离线,请参见 设备显示离线 处理。如果在线,请跳转...
可能原因 终端到设备的链路故障。设备到阿里云的VPN链路故障。目标PC环境的网络故障。运营商网络故障。解决方案 登录 智能接入网关控制台。单击智能接入网关实例ID,查看当前设备状态是否为 可用。如果离线,请参见 设备显示离线 处理。...
可能原因 终端到设备的链路故障。设备到阿里云的VPN链路故障。目标ECS故障。运营商网络故障。解决方案 登录 智能接入网关控制台。单击智能接入网关实例ID,查看设备状态是否为 可用。如果离线,请参见 设备显示离线 处理。如果在线,请参见...
排查故障的经典步骤与常见原因 如何通过查看日志排查故障?产品FAQ 授权管理FAQ 集群管理FAQ 节点与节点池FAQ 容器网络FAQ Service FAQ Ingress FAQ DNS FAQ 应用FAQ 存储FAQ-CSI 存储FAQ-Flexvolume 容器安全FAQ 为什么可观测监控 ...
告警信息 事件名称 事件级别 状态码 状态描述 DeviceSwitched CRITICAL switched Device Role Changed 可能原因 智能接入网关主设备故障。智能接入网关主设备动态路由邻居故障。处理方法 无需处理。icmsDocProps={'productMethod':'created...
问题现象 在执行MySQL命令进行查询时,提示如下错误:1055(42000):SELECT list is not in GROUP BY clause and contains nonaggregated column 可能原因 该报错可能由以下两种原因引入:原因一:用户修改了sql_mode参数,加上了ONLY_FULL_...
问题现象 在执行MySQL命令进行查询时,提示如下错误:1055(42000):SELECT list is not in GROUP BY clause and contains nonaggregated column 可能原因 该报错可能由以下两种原因引入:原因一:用户修改了sql_mode参数,加上了ONLY_FULL_...
可能原因 Windows实例系统内存在Xen驱动残留,导致操作系统无法启动。解决方案 您可以在挂载了修复盘的问题实例中,清理系统中的Xen驱动残留以解决该问题。具体操作如下:远程连接有问题的实例。您可以在诊断结果界面单击 VNC远程连接,...
BUG:soft lockup-CPU#0 stuck for 61s 问题原因 该问题通常是由于ECS实例中,系统内核长时间占用CPU资源导致出现软死锁(soft lockup)故障,内核长时间占用CPU资源可能有以下原因:系统负载过高 内核死循环或死锁 内核调度问题 内核出现...
告警信息 事件名称 事件级别 状态码 状态描述 DeviceWanLinkSwitched WARN up Device Wan Link Switched 可能原因 WAN链路原有链路发生了故障,切换到备用链路。处理方法 提醒用户WAN链路发生了切换,用户查看原有WAN链路并决定是否主动切...
更多请查看 什么是事件 故障 在日常运营中,无论什么原因导致业务服务中断、服务品质下降或用户服务体验下降的现象,称为故障,但不包括用户侧环境或用户自身操作引起的问题。故障比事件优先级更高,事件在处理过程中出现影响扩大或恶化时...
由于网络隔离的原因,直接选择网络连接可能无法正常探测到打印机,此处请选中 确定是否希望在不连接打印机的情况下安装软件。说明 若对应厂家的驱动程序无此选项,请检查是否有 自定义安装 等类似功能,如果没有,可采取Windows的 INF驱动...
可能有以下原因:Linux系统未安装配置virtio驱动 Windows ISO阶段驱动安装失败 Windows系统注册表损坏 Windows安装有360软件等安全软件限制 解决方案 安装virtio驱动 如果检查Linux系统是内核损坏,请下载安装官方内核再次尝试 Windows请...
如果Windows实例的注册表中配置了 DeviceInstallDisabled,安装驱动程序可能会失败。本文介绍该场景下的问题排查方法和解决方案。问题现象 Windows实例中安装驱动程序失败,提示如下:可能原因 Windows实例的注册表中...重新安装驱动程序。
告警信息 事件名称 事件级别 状态码 状态描述 ConnectionDisconnect CRITICAL disconnect Connection Disconnected 可能原因 主备IPsec链路均出现网络故障。处理方法 检查用户侧运营商网络接入是否正常。icmsDocProps={'productMethod':'...
问题原因 新版本的镜像默认安装KVM驱动,Xen虚拟化需要Xen驱动包支持,但是新版本镜像默认没有集成,导致创建后网卡无法识别,即使用 Get-NetAdapter 命令无法查看网卡驱动。解决方法 说明 如果您对实例或数据有修改、变更等风险操作,务必...
当Windows实例中存在磁盘驱动残留项时,可能会导致新挂载的云盘无法被识别或磁盘设备无法被访问。本文主要介绍该场景下如何检查注册表中的磁盘驱动残留项并提供解决方案。问题现象 在ECS控制台挂载云盘到Windows实例后,在Windows实例中...
容器智能运维平台 提供一键故障诊断能力,包括Pod诊断、Service诊断、Ingress诊断,可以辅助您定位集群中出现的问题。本文介绍如何在ACS集群中使用集群诊断功能。前提条件 已创建ACS集群。具体操作,请参见 创建ACS集群。确保ACS集群运行...
容器智能运维平台 提供一键故障诊断能力,包括节点诊断、Pod诊断、Service诊断、Ingress诊断、内存诊断、网络诊断,可以辅助您定位集群中出现的问题。本文介绍如何在ACK集群中使用集群诊断功能。前提条件 已创建Kubernetes托管版集群。具体...
本文介绍Windows Server 2008 R2系统因无法验证驱动的数字签名导致系统启动失败问题的原因和解决方案。问题现象 Windows Server 2008 R2系统无法启动,如下图所示,提示无法验证此文件的数字签名。问题原因 该问题是由于系统不支持SHA256...
问题原因 无法查看数据盘通常是如下几种原因:磁盘显示为外部或脱机 新增的驱动被禁用 新购买磁盘未进行分区和格式化 磁盘未分配盘符 Windows 2012服务器新增数据盘异常报错 实例处于安全模式 解决方案 请根据不同的问题原因,通过以下方式...
故障通告及更新 基于7x24监控值班工作特性,对于业务异常达到故障等级时,以用户定制的(语音、短信、IM)的方式在约定时间内将故障影响信息以及处理进展通知给对应的接收人/组,并持续更新直至故障结束。故障应急协同群 故障发生后,可以...
原则3在生产环境中运行实验 混沌工程推荐故障演练是在生产环境中进行,主要的原因有以下两点:系统的行为会根据环境和流量模式的变化,例如系统依赖的组件在测试环境和生产环境会有比较大的差异。系统的监控和人员的应急响应在测试环境和...
本文介绍事件驱动架构EDA(Event Driven Architecture)的概念、优势、架构图和使用场景。什么是事件驱动架构 事件驱动架构是一种松耦合、分布式的驱动架构,收集到某应用产生的事件后实时对事件采取必要的处理后路由至下游系统,无需等待...
原因:当Windows操作系统的GPU实例安装了GRID驱动后,VM的显示输出被GRID驱动接管,VNC无法再获取到集成显卡的画面,因此,VNC显示会变成黑屏状态,属于正常现象。解决办法:使用Workbench连接GPU实例。具体操作,请参见 通过密码或密钥...
16.1 为了提供支持关键过程的计算机化系统,应作出规定,确保在系统出现故障(例如手动或替代系统)时继续为这些流程提供支持。采用替代安排所需的时间应视风险而定,并适合特定系统及其所支持的业务流程。应充分记录和测试这些安排。17.1 ...