功能特性

查看同域流量分析 网络监测与诊断 帮助用户在云上运维阶段更高效地监测网络业务变化和故障诊断排查。功能集 功能 功能描述 参考文档 事件中心 问题事件 展示已经造成业务受损,并且7天内状态一直处于进行中的异常事件列表。查看问题事件 ...

云盒计算资源配置最佳实践

由于这些冗余资源对于用户来说是可见资源,随时可以被用来创建ECS实例或其他云产品实例,因此该方式对于日常业务使用有一定的灵活性,但无法保证在硬件设备故障期间,一定存在可用的备机资源。购买 SLA增值服务包,为计算资源通过SLA保证。...

更新故障复盘改进详情

problemReason":"故障原因A","recentActivity":"2","injectionMode":"1","recoveryMode":"2","discoverSource":1,"userReport":10,"monitorSourceName":"Zabbix","relationChanges":"关联变更","dutyUserId":1231,"replayDutyUserId":1213...

安全隧道概述

访问端与设备端均成功连接安全隧道后,您可在访问端基于安全隧道远程登录设备(例如通过SSH服务),进行设备的远程诊断故障排查、运维操作、配置更新和其他操作任务等。名词解释 名词 说明 安全隧道 设备端和访问端与物联网平台之间建立...

版本说明

本地运维控制台新版首页大盘,完善统计信息,便于更及时发现异常 故障诊断,支持导出离线诊断数据,便于远程运维分析 Harbor组件增加垂直扩缩容、水平扩缩容能力 节点白屏扩容,在节点管理界面可进行添加节点的操作 提供基于备份的还原操作...

诊断项与诊断结果说明

实例健康诊断功能是一种自助诊断方式,可以对实例的计算服务状态、存储服务状态、网络服务状态、实例配置管理和实例操作系统内相关配置进行全方位的诊断,帮助您了解实例的健康情况,及时发现并解决常见的问题。本文介绍轻量应用服务器支持...

诊断项与诊断结果说明

实例健康诊断功能是一种自助诊断方式,可以对实例的系统状态、网络状态、磁盘状态等进行全方位的诊断,帮助您了解实例健康情况,及时发现并解决常见的问题。本文介绍该功能支持的诊断项,并提供了详细的诊断范围及建议操作供您参考。诊断项...

故障止损恢复

故障初因定位 集成企业内部可利用的所有稳定性相关数据(变更事件,...通用垂直专项快恢能力:通过集成包括DB侧慢SQL限流、变更极速回滚、多活容灾切流快恢等通用的快恢能力,结合监控、日志等数据自动定位的故障原因进行对应的快恢方式推荐。

共享内存通信(SMC)常见问题

解决方案1:执行 smcr d 命令,检查当前系统中是否有可用的 SMC-R(RDMA)设备,如果所需的RDMA设备为阿里云eRDMA设备,请确保该ERI设备已经在ECS控制台中添加并正确安装和配置ERI驱动。原因2:在多以太网卡环境中,连接所用的以太网卡不...

诊断指标与诊断结果条目说明

实例健康诊断功能是一种自助诊断方式,可以对实例的系统状态、网络状态、磁盘状态等进行全方位的诊断,帮助您了解实例健康情况,及时发现并解决常见的问题。本文介绍该功能支持的诊断指标,并提供了详细的诊断范围及建议操作供您参考。基本...

故障复盘改进详情

0c4840fd3812 幂等校验token 返回数据 名称 类型 示例值 描述 requestId String 4361a0e1-6747-4834-96ce-0c4840fd3811 Id of the request data Object data problemId String 231231 故障ID problemReason String 故障的原因 故障原因 ...

源为PolarDB-X的功能规范和约束说明

在出现故障(如网络中断、机房批量设备故障或互联网数据中心IDC故障),且DTS任务存在延迟的情况下,此时如更新至目标库的最后一条数据的时间与故障发生时的时间之差小于RPO(如5分钟),则可以业务优先恢复为准则切流。切流后可能有5分钟...

源为PolarDB-X的功能规范和约束说明

在出现故障(如网络中断、机房批量设备故障或互联网数据中心IDC故障),且DTS任务存在延迟的情况下,此时如更新至目标库的最后一条数据的时间与故障发生时的时间之差小于RPO(如5分钟),则可以业务优先恢复为准则切流。切流后可能有5分钟...

当实例无法启动时扩容云盘

fdisk-lu 在查询结果中找到/dev/vd*(例如/dev/vda、/vdb和/vdc),这些块存储设备故障实例的云盘。示例以系统盘(/dev/vda1)和数据盘(/dev/vdb1、/dev/vdc1)的三个分区为例,执行结果如下所示。序号 分区 说明 ①/dev/vda1 系统盘,...

系统运维工具集SysAK使用说明

SysAK(System Analyse Kit)是阿里云操作系统提供的一个全方位的系统运维工具集,可以覆盖系统的日常监控、线上问题诊断和系统故障修复等常见运维场景。本文为您介绍SysAK的安装部署和使用方法。运维场景 阿里云通过对百万服务器运维经验...

什么是故障

包括根因检查点(如故障原因、最近活动、注入方式、恢复方式等)、故障变更检查、监控检查,并需要对每一个故障明确责任人及团队;故障改进:支持对故障制定明确的改进及验收措施、责任人及完成时间,确保每个深度复盘后的故障都能对业务...

故障复盘

复盘文档一般包含以下内容:故障简述:故障概述、影响面、处理人等 故障背景:故障发生时的业务链路 故障时间线:着重强调故障引入、故障发生、故障发现、业务响应、恢复执行、故障恢复几个时间点 故障原因分析:建议先一句话总结,再进行...

查询运维报表数据

NormalDeviceNum Integer 1500 正常设备数量 FaultDeviceNum Integer 12 故障设备数 HighFreqFaultDeviceNum Integer 8 频繁故障设备数量 TicketIndex Object 工单指标数据 TotalTicketNum Integer 1000 总故障数量 AutoRecoverTicketNum ...

访问策略

6.备用地址池是在默认地址池因故障原因不可用时,可以将用户的访问流量切换至备用地址池上。在 备用地址池 的下拉框中,选择已创建的地址池名称,最后单击 下一步。如果您还没有创建地址池,请参考 创建地址池 文档。注意:如未设置备用...

监控报警概述

故障预警 云电脑的故障信息、故障原因及故障时间等信息。使用场景 在日常业务运行的过程中,监控大盘帮助您及时了解账号下全部云电脑资源的全局情况,实时监控提供更详细的数据指标和故障预警信息,帮助您了解终端用户使用云电脑的情况,...

云盘三副本技术

重要 如果ECS实例由于病毒感染、人为误删除或黑客入侵等软故障原因造成数据丢失,需要您采用备份或者快照等技术手段来解决。任何技术都不可能解决全部问题,因地制宜地选择合适的数据保护措施,才能为您的业务数据筑起一道坚实的防线。更多...

ping不通云服务(SAG-100WM)

可能原因 终端到设备的链路故障设备到阿里云的VPN链路故障。目标ECS故障。运营商网络故障。解决方案 登录 智能接入网关控制台。单击智能接入网关实例ID,查看设备状态是否为 可用。如果离线,请参见 设备显示离线 处理。如果在线,请参见...

配置设备级高可用

动态HA功能无需配置虚IP地址,系统会主动帮您探测设备状态,在主网关设备故障时,自动帮您切换流量。智能接入网关仅支持同一实例中的两台设备组建HA备份组,系统会指定默认的主设备和备设备,您可以登录智能接入网关管理控制台查看设备的...

无法连接到同一个云连接网内的本地客户端

本文介绍SAG-1000设备无法连接到同一个云连接网内的本地客户端的原因和处理方法。问题现象 SAG-1000设备无法连接到同一个云连接网内的其他本地客户端。可能原因 终端到设备的链路故障设备到阿里云的VPN链路故障。目标PC环境的网络故障。...

ping不通云服务ECS(SAG-1000)

可能原因 终端到设备的链路故障设备到阿里云的VPN链路故障。目标ECS故障。运营商网络故障。解决方案 登录 智能接入网关控制台。单击智能接入网关实例ID,查看设备状态是否为 可用。如果离线,请参见 设备显示离线 处理。如果在线,请跳转...

EMR Kafka磁盘故障运维

当出现磁盘故障时,需要根据故障原因故障影响程度、业务需求(是否接受数据丢失、是否允许服务较长时间不可用)、集群状态等综合考虑恢复采取的策略。如果业务优先保证服务可用,但允许丢失部分数据,则应考虑在可能会丢失数据的情况下,...

应用场景

场景一:面向大中型企业的多地容灾高可用网络架构 当本地数据中心的关键业务对可用性要求极高时,建议在多个接入点建立专线连接,该拓扑确保了因光纤切断、设备故障或接入点位置故障导致的连接故障的恢复能力。自主申请专线和共享合作伙伴...

硬件功能说明

当主设备故障时,用备设备替换,保证业务的高可用性。安全 VPN加密 加密连接。访问控制(ACL)允许或者拒绝访问控制规则内IP对公网或私网的访问。说明 不支持公网访问控制。设备离线锁定 防盗,长期离线锁定。运维 远程重启 通过控制台远程...

关停或启动网站站点

相关文档 网站由于耗资源严重而影响性能时,阿里云会暂停您的网站,并向您发送网站耗资源(客户程序故障)停权通知,您可以通过关闭或重启站点方式来解决该问题。更多信息,请参见 网站耗资源(客户程序故障)的处理方法。

跨可用区容灾

当生产站点因为不可抗力因素(比如机房火灾、断电)或者设备故障(软、硬件破坏)导致应用在短时间内无法恢复时,ECS容灾服务支持业务的跨可用区(Availability Zone)的容灾能力,对整体的应用做容灾备份来应对单地区的故障,满足业务的...

故障诊断

用户可定义诊断规则来快速帮助定位问题并给出诊断建议。当集群内资源符合某些特征时,给出预置的解决方案,从而快速帮助运维人员解决问题。诊断建议将会被展示在ADP-Local上,也可以通过获取CR的...请重新运行此诊断程序获取新的命令进行执行

跨可用区容灾

当生产站点因为不可抗力因素(比如机房火灾、断电)或者设备故障(软、硬件破坏)导致应用在短时间内无法恢复时,ECS容灾服务支持业务的跨可用区(Availability Zone)的容灾能力,对整体的应用做容灾备份来应对单地区的故障,满足业务的...

跨可用区容灾

当生产站点因为不可抗力因素(比如机房火灾、断电)或者设备故障(软、硬件破坏)导致应用在短时间内无法恢复时,ECS容灾服务支持业务的跨可用区(Availability Zone)的容灾能力,对整体的应用做容灾备份来应对单地区的故障,满足业务的...

设计原则

这样可以确保一台设备故障时,数据仍然可用;容灾计划:制定容灾计划,包括灾难恢复策略、应急响应流程和恢复时间目标(RTO)等。容灾计划应该经常进行测试和演练,以确保其可行性和有效性;数据备份与恢复:定期进行数据备份,并确保备份...

应用场景

设备维护成本降低 您可以使用工业大脑平台,预测设备故障并进行维护,具体应用场景如下。设备行业:企业使用物联网与算法模型技术提前预测风机故障。通过温度传感器对整个风机的温度测点进行实时监控,并对海量温度数据进行深度学习,构建...

功能概览

跨可用区容灾 当生产站点因为不可抗力因素(比如机房火灾、断电)或者设备故障(软、硬件破坏)导致应用在短时间内无法恢复时,ECS容灾服务支持业务的跨可用区(Availability Zone)的容灾能力,对整体的应用做容灾备份来应对单地区的故障...

DeviceLinkDown

告警信息 事件名称 事件级别 状态码 状态描述 DeviceLinkDown CRITICAL linkdown Device Link State Change 可能原因 用户侧交换机设备故障。用户侧交换机配置故障。用户侧交换机和设备的连线问题。处理方法 检查用户侧交换机。...

网络架构容灾

如果为了满足业务对延迟等需求,必须选择相同接入点,也必须保证两条专线在两个不同的接入设备上,这样即使有一台设备故障导致其中一条线路异常时,也可以保证另外一条线路正常运转。专线/VPN主备:在物理专线、IPSec-VPN连接、BGP动态路由...

按步骤提交设备故障信息

本案例创建四个业务服务和一个Web应用,搭建一个设备故障上报的工单页面,引导使用Web应用的用户完成故障信息的提交。前提条件 已完成项目的创建(例如 project_space)。详细内容,请参见 项目。步骤一:使用云数据库创建数据库表 登录 云...

Pod诊断

重要 使用故障诊断功能时,系统将在您的集群执行数据采集程序并收集检查结果。采集的信息包括系统版本,以及负载、容器组件等运行状态及系统日志中关键错误信息。数据采集程序不会采集您的业务信息及敏感数据。诊断支持的异常场景 Pod诊断...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
数据库自治服务 数据库审计 文件存储NAS 负载均衡 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用