集群高可用

如果Utility节点宕机或者Utility节点上的MariaDB Master出现故障,仅需要简单的操作就可以将元数据库切换到cdp-master-1节点上的备库,具体操作如下:在cdp-master-1上运行命令:mysql 进入mysql终端 停止MariaDB Slave的IO线程:stop ...

发现并处理大Key和热Key

热Key的请求压力数量超出 Tair 的承受能力易造成缓存击穿,即大量请求将被直接指向后端的存储层,导致存储访问量激增甚至宕机,从而影响其他业务。大Key和热Key产生的原因 未正确使用 Tair 命令、业务规划不足、无效数据的堆积、访问量突增...

存储资源

可能原因包含数据库服务进程异常退出、数据库节点宕机、数据库网络异常等,常见的容错策略如下:自动重启:当数据库实例异常终止或崩溃时,可以设置自动重启和恢复机制,自动重新启动数据库服务,并进行必要的数据恢复操作,以确保数据库的...

监控报警概述

实时监控提供终端用户登录云电脑的实时数据(例如用户在线数量、在线时长的前十用户、平均登录时间和云电脑网络延迟分布情况)以及相关故障预警信息,以便快速准确定位,迅速处理故障,避免因资源、网络问题或者外部操作原因造成不必要的...

发现并处理Redis的大Key和热Key

热Key的请求压力数量超出Redis的承受能力易造成缓存击穿,即大量请求将被直接指向后端的存储层,导致存储访问量激增甚至宕机,从而影响其他业务。大Key和热Key产生的原因 未正确使用Redis、业务规划不足、无效数据的堆积、访问量突增等都会...

本地盘最佳实践

如果本地盘发生故障、物理服务器发生宕机,或者人为误操作,本地盘会丢失数据。请勿在本地盘上存储需要长期保存的业务数据。但云盘采用分布式三副本机制,能防止意外硬件故障导致的数据不可用。如果应用没有多节点数据冗余架构,强烈建议您...

压测Spring Cloud服务

背景信息 在大促活动中,应该准备多少实例资源才能满足大促吞吐量的要求,降低因大促活动带来的访问量暴增进而引发系统宕机的风险。此时需要合理地评估服务性能,避免流量冲击引发的故障,并降低运营使用成本。创建压测场景 登录 EDAS控制...

设备和交换机之间的链路故障

本文介绍SAG-1000设备发生设备和交换之间链路故障的原因和处理方法。问题现象 设备和交换接口之间ping不通。设备的Web端口配置页,端口前的状态灯为红色。动态路由OSPF接入时,Web端口配置页,端口前的状态灯为红色。设备的Web状态查询...

压测Dubbo服务

背景信息 在大促活动中,应该准备多少实例资源才能满足大促吞吐量的要求,降低因大促活动带来的访问量暴增进而引发系统宕机的风险。此时需要合理地评估服务性能,避免流量冲击引发的故障,并降低运营使用成本。创建压测场景 登录 EDAS控制...

节点诊断

容器智能运维平台 构建了基于专家经验的故障诊断系统,并基于海量数据训练了AI智能故障诊断模型。基于专家经验和AI智能诊断两种诊断模式,节点诊断可以深入定位问题根因。节点诊断包括诊断检查项和诊断根因。诊断检查项:包括Node检查、...

蓝牙mesh智能家居产品规范

事件名 事件ID 事件参数 说明 故障上报 0x00 uint16 Error_Code_Type uint8 Error_code_Value 低电量 0x01 uint16 power_percent_Type uint8 power_percent_Value 设备宕机 0x02 NULL 设备上电 0x03 NULL 按键单击 0x05 uint8 key code ...

AI助手使用说明

当发生故障或异常时,通过AI助手底层的告警系统可以自动和PAI进行交互,上报故障信息,并根据故障触发阶段和并行策略选择规避故障方法,对故障机自动进行隔离,并从Checkpoint快速恢复任务。AI助手提供的具体功能如下:异常采集和上报:...

创建DDH

您也可以在创建DDH后修改该配置,具体操作,请参见 设置宕机自动迁移。重要 本地SSD型DDH不支持宿主机故障时自动迁移服务。CPU超分比:仅超分型规格支持CPU超分比,CPU超分比影响DDH的可用vCPU数,一台DDH的可用vCPU数=物理CPU核数*2*CPU超...

集群高可用架构推荐配置

启用部署集 部署集是控制ECS实例分布的策略,该策略将ECS实例分散部署在不同的物理服务器上,避免由于一台物理机失效导致多台ECS实例宕机。通过为节点池指定部署集,能够保证节点池扩容出的ECS实例不会分布于同一物理机上,并通过亲和性...

大数据型

使用大数据实例时请注意:不支持变配和宕机迁移。本地盘与特定规格的实例相绑定,本地盘的数量和容量由您选择的实例规格决定。不支持单独购买本地盘,不支持将本地盘卸载并挂载到另一台实例上使用。本地盘不支持快照功能。如果您需要为本地...

创建专有宿主机

您也可以在创建DDH后修改该配置,具体操作,请参见 设置宕机自动迁移。重要 本地SSD型DDH不支持宿主机故障时自动迁移服务。CPU超分比:仅超分型规格支持CPU超分比,CPU超分比影响DDH的可用vCPU数,一台DDH的可用vCPU数=物理CPU核数*2*CPU超...

服务协议

此外,您自行升级操作系统可能会造成宕机等不良影响,请把握风险并谨慎操作。5.5.您了解阿里云无法保证其所提供的服务毫无瑕疵(如阿里云安全产品并不能保证您的硬件或软件的绝对安全),但阿里云承诺不断提升服务质量及服务水平。所以您...

无法连接Windows实例

检查CPU负载是否过高 尝试重启实例 步骤一:使用管理终端登录实例 无论何种原因导致无法远程连接实例,请先尝试用阿里云提供的远程连接功能进行连接,确认实例还有响应,没有完全宕机,然后再按原因分类进行故障排查。登录 云服务器管理...

DeviceLinkDown

DeviceLinkDown事件提示您线下机构侧动态路由邻居发生故障或者静态接入链路发生故障。告警信息 事件名称 事件级别 状态码 状态描述 ...处理方法 检查用户侧交换。icmsDocProps={'productMethod':'created','language':'zh-CN',};

主备双活

宕机测试 单机宕机吞吐对比 单机宕机平均响应对比 集群宕机吞吐对比 集群宕机平均响应对比 使用方法 准备 使用云HBase主备容灾方案参见 主备容灾。在高可用管理页面获取高可用链接地址和高可用实例ID。客户端依赖版本。hbase1.X版本使用...

故障处理流程

本文为您介绍智能接入网关设备故障处理流程。SAG-100WM故障处理流程说明 通过SAG-100WM访问阿里云,发现故障,请参见以下流程排查故障:用户收到告警信息或者发现应用不可用。登录智能接入网关控制台,查看设备状态。访问其他公共网站,...

多账号操作日志统一归集与审计

场景二:企业内部运维 场景描述 企业面对内部的运维问题,如疑似AK泄露、异常的停机宕机、计划外的资源增删、违法员工操作盘查、故障排查、资源生命周期追溯、异地登录、异常操作、高危操作等,需要依赖审计日志进行排查和分析。...

AccessGatewayFailover

AccessGatewayFailover事件提示您智能接入网关设备主IPsec链路发生故障。告警信息 事件名称 事件级别 状态码 状态描述 AccessGatewayFailover INFO ...处理方法 无需处理。icmsDocProps={'productMethod':'created','language':'zh-CN',};

主备切换

实例底层主机故障 阿里云检测到实例底层主机发生故障,例如进程异常中断、实例负载过高导致内存异常等无法正常使用时,系统会立即触发主备切换,及时恢复实例,降低故障影响时长。此类触发方式会以 短信或 站内信、邮件等形式通知到您,...

主备切换

实例底层主机故障 阿里云检测到实例底层主机发生故障,例如进程异常中断、实例负载过高导致内存异常等无法正常使用时,系统会立即触发主备切换,及时恢复实例,降低故障影响时长。此类触发方式会以 短信或 站内信、邮件等形式通知到您,...

电源故障定位

您可以参考以下方法定位电源故障并进行处理流程。诊断流程 电源故障详细处理流程,如下图所示。处理步骤 测量输入电压。使用万用表测量输入电压,根据电源适配器的工作电压范围判断输入电压是否异常。插拔电源适配器。把电源适配器以及电源...

可用性与可靠性

异常时自动切换节点,宕机时自恢复来保证极致的可用性,还可以通过备份恢复来进行数据恢复。主备多副本与云盘三副本 AnalyticDB PostgreSQL版 是基于MPP架构的分布式数据库,对于所有的分布式系统来说,在通过分布式来增强性能的同时,也...

DeviceWanLinkDown

DeviceWanLinkDown事件提示您设备WAN链路发生故障。告警信息 事件名称 事件级别 状态码 状态描述 DeviceWanLinkDown CRITICAL down...处理方法 请提交工单,联系阿里云工程师。icmsDocProps={'productMethod':'created','language':'zh-CN',};

概述

稳定可靠,保障业务稳定运行 云解析DNS提供100%SLA服务,全球DNS集群互相备份,服务永不宕机。全球节点,提升域名解析效率 节点遍布全球,持续扩展的数据中心让跨域体验更流程 负责均衡,流量均摊降低负载 当辅助DNS与主DNS同时对外提供...

ConnectionDisconnect

ConnectionDisconnect事件提示您智能接入网关的主备IPsec链路都出现故障。告警信息 事件名称 事件级别 状态码 状态描述 ...处理方法 检查用户侧运营商网络接入是否正常。icmsDocProps={'productMethod':'created','language':'zh-CN',};

Quick BI登录提示The MySQL server is running with ...

问题描述 Quick BI登录提示“The MySQL server is running with the LOCK_WRITE_GROWTH option so it cannot execute this statement”,表现形式如下:问题原因 提供给Quick BI使用的元仓数据源由于磁盘配额不足导致的禁止写入故障。...

通过配置VMware无代理连接器导入迁移源

7.0 待迁移虚拟所在的ESXi版本:7.0 待迁移虚拟的硬件版本:13/14/15/16/17/18/19 ESXi版本:7.0 待迁移虚拟的硬件版本:13/14/15/16/17/18/19 角色权限要求 若使用vCenter用户,其在ESXi和VM上的角色需要分配以下权限:Datastore>...

如何管理事件

故障状态:处理中(升级时故障还在处理中),输入发现故障的时间、已恢复(升级时故障已恢复),输入故障生成的时间和故障恢复的时间;所属服务:升级故障所属的 服务;影响服务:选择 影响服务(可多选);进展摘要:处理人将事件升级为...

Windows操作系统云虚拟主机耗资源(客户程序故障)...

本文主要介绍Windows操作系统云虚拟主机耗资源(客户程序故障)问题的原因分析及处理意见。调用Access程序问题(最常见)原因:Access数据库大小超过30M,频繁调用时耗用系统资源。解决方法:将数据库大小压缩到30M以内,或者升级到SQL ...

演练场景说明

Java 场景名称 特性 虚拟场景 故障演练支持的虚拟场景。代码逻辑场景 故障演练支持的代码逻辑场景。JVM注入动态脚本 向指定的Java方法注入一段动态代码,您可通过代码方式实施任意故障场景,例如篡改方法入参、篡改方法返回值等。K8s类...

Persistent Buffer Pool

因此,在宕机和重启之后需要把Buffer Pool的所有页遍历一遍,剔除掉不能被复用的页。另外,Buffer Pool的回收依赖于K8s。使用该优化之后,可以使重启前后的性能更加平稳。重启前后性能对比如图所示:使用指南 打开如下参数即可使用。polar_...

恢复VMware虚拟机

背景信息 完成VMware虚拟备份任务后,您可以在VMware虚拟出现故障时,在Cloud Backup控制台将其备份时的状态迅速恢复至本地或者阿里云VMware服务,以保证业务连续性。虚机备份服务从1.0.13开始支持在Cloud Backup控制台上统一管控备份...

Persistent Buffer Pool

因此,在宕机和重启之后需要把Buffer Pool的所有页遍历一遍,剔除掉不能被复用的页。另外,Buffer Pool的回收依赖于K8s。使用该优化之后,可以使重启前后的性能更加平稳。重启前后性能对比如图所示:使用指南 打开如下参数即可使用。polar_...

API概览

专有宿主机是单租户独享的物理资源,您可以在专有宿主上自行创建ECS实例和获取物理服务器属性等信息。DescribeDedicatedHosts 查询专有宿主机详细信息 调用DescribeDedicatedHosts查询一台或多台专有宿主机的详细信息,包括物理性能...

RedeployDedicatedHost-执行专有宿主机的故障迁移

调用RedeployDedicatedHost执行专有宿主机的故障迁移。接口说明 DDH 状态为报警状态(UnderAssessment),即故障潜伏期时,建议您调用该接口执行 DDH 的故障迁移,避免 DDH 产生永久性故障。您可以调用 API DescribeDedicatedHosts 查询...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
云数据库 Redis 版 云虚拟主机 运维安全中心(堡垒机) 负载均衡 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用