设计方案

故障恢复 定位故障原因后,按照应急预案快速恢复业务,并在事后进行复盘总结。预案执行:在故障响应的过程中,需要按照事先制定的应急预案进行执行。应急预案包括了应急响应流程、各个岗位的职责、处理流程等。预案执行能够保证故障恢复和...

条件节点的匹配模式

数值范围匹配:通过数值比较(例如等于、数值大于等于、数值范围比较等)完成条件匹配。模式 您可以通过标准模式或高级模式添加多个条件。标准模式:多个条件之间为AND关系。高级模式:多个条件之间可以为AND或OR关系,并支持您使用圆括号...

更新故障复盘改进详情

problemReason":"故障原因A","recentActivity":"2","injectionMode":"1","recoveryMode":"2","discoverSource":1,"userReport":10,"monitorSourceName":"Zabbix","relationChanges":"关联变更","dutyUserId":1231,"replayDutyUserId":1213...

如何解决MSE Nacos实例域名无法解析的问题?

如果使用的是ACK,请 提工单 联系ACK技术支持协助排查CoreDNS故障原因。方案二:使用ping命令 使用 ping${mse.nacos.host} 指令尝试解析。如果提示 unknown host,则无法解析域名。如果提示 PING${mse.nacos.host}(xxx.xx.xx.xx)56(84)...

故障止损恢复

故障初因定位 集成企业内部可利用的所有稳定性相关数据(变更事件,...通用垂直专项快恢能力:通过集成包括DB侧慢SQL限流、变更极速回滚、多活容灾切流快恢等通用的快恢能力,结合监控、日志等数据自动定位的故障原因进行对应的快恢方式推荐。

查询字符串语法

搜索 支持 支持 完全匹配搜索 支持 不支持 正则表达式搜索 支持 不支持 数值范围搜索 支持 不支持 数值比较 支持 不支持 关系and、or、not及组合 支持 支持 字符转义 在字符串查询语法中,需要对一些特殊字符,例如星号(*)、反斜线(\)...

什么是故障

包括根因检查点(如故障原因、最近活动、注入方式、恢复方式等)、故障变更检查、监控检查,并需要对每一个故障明确责任人及团队;故障改进:支持对故障制定明确的改进及验收措施、责任人及完成时间,确保每个深度复盘后的故障都能对业务...

访问策略

6.备用地址池是在默认地址池因故障原因不可用时,可以将用户的访问流量切换至备用地址池上。在 备用地址池 的下拉框中,选择已创建的地址池名称,最后单击 下一步。如果您还没有创建地址池,请参考 创建地址池 文档。注意:如未设置备用...

故障复盘改进详情

0c4840fd3812 幂等校验token 返回数据 名称 类型 示例值 描述 requestId String 4361a0e1-6747-4834-96ce-0c4840fd3811 Id of the request data Object data problemId String 231231 故障ID problemReason String 故障的原因 故障原因 ...

什么是消息演练

随着应用规模的扩大,系统变得越来越复杂,不可避免地会走向分布式化。各种中间组件会相继被引入系统,其中分布式消息服务更是系统中必不可少的一...需要注意的是演练场景仅是组件表象,其内部故障原因可能是多种多样的,需要进一步进行分析。

故障管理

包括根因检查点(如故障原因、最近活动、注入方式、恢复方式等)、故障变更检查、监控检查,并需要对每一个故障明确责任人及团队;故障改进:支持对故障制定明确的改进及验收措施、责任人及完成时间,确保每个深度复盘后的故障都能对业务...

监控报警概述

故障预警 云电脑的故障信息、故障原因及故障时间等信息。使用场景 在日常业务运行的过程中,监控大盘帮助您及时了解账号下全部云电脑资源的全局情况,实时监控提供更详细的数据指标和故障预警信息,帮助您了解终端用户使用云电脑的情况,...

托管节点池节点自动恢复

当发现节点故障时,ACK会根据故障原因触发对应恢复任务,并记录相应的事件。当恢复任务完成后,故障状态解除,节点恢复正常状态。当恢复任务完成后,故障状态依然存在,节点会被置为恢复失败状态。说明 如果集群中存在多个节点池,节点池...

SA混合云存储阵列

当控制器故障时,支持在线故障切换,业务连续性不受影响。阿里云混合云存储阵列将云存储的高性价比和可扩展性与本地数据中心架构相结合,帮助客户轻松实现数据在本地数据中心和公共云之间的无缝流动。产品规格 阿里云 SA混合云存储阵列 ...

EMR Kafka磁盘故障运维

当出现磁盘故障时,需要根据故障原因、故障影响程度、业务需求(是否接受数据丢失、是否允许服务较长时间不可用)、集群状态等综合考虑恢复采取的策略。如果业务优先保证服务可用,但允许丢失部分数据,则应考虑在可能会丢失数据的情况下,...

查看运行分析

该指标协助您进行作业诊断,排查作业Task级别的故障原因。个 TM自JVM启动以来已加载的类总数(TM ClassLoader)TM自JVM启动以来已加载的类总数。JM所在的JVM创建后加载类的总数或卸载类的总数过大,会导致占用过大内存空间,从而影响作业...

行和数组比较

本节描述几个特殊的结构,用于在值的组之间进行多重比较。这些形式语法上和前面一节的子查询形式相关,但是不涉及子查询。这种形式涉及的数组子表达式是本数据库的扩展;其它的是SQL兼容的。所有本节记录的表达式形式都返回布尔(Boolean)...

无法连接Windows实例

故障原因 可能是网卡驱动未开启或网卡配置有问题。解决方法 使用管理终端 登录实例,检查网卡驱动,如果存在异常,则重新安装。步骤三:检查重置实例密码后是否未重启实例 确认是否存在故障现象,如果存在,则参考本步骤解决问题,如果不...

监控指标说明

该指标协助您进行作业诊断,排查作业Task级别的故障原因。次数 TM GC Time 每次TM GC时间。长时间GC会导致占用过大内存空间,从而影响作业性能。该指标协助您进行作业诊断,排查作业级别的故障原因。毫秒(ms)TM ClassLoader/...

事件分析概述

以云服务ECS为例,很多情况会因系统错误或云盘性能受损而触发故障类事件,这类事件通常会涉及到周边产品(比如容器服务ACK等),捕获全部云上事件做基础排障的挑战性比较大。事件总线EventBridge 支持全部云服务事件无缝接入,更大程度...

网站耗资源(客户程序故障)常见问题

本文汇总了使用云虚拟主机出现网站耗资源(客户程序故障)时的常见问题。什么是网站耗资源(客户程序故障)?网站程序占用CPU及内存过多,是对资源的一种浪费。当您使用普通版共享云虚拟主机建站后,可能会因为网站程序编写不合理、代码...

诊断网页加载过慢的问题

慢加载详情 页面顶部的 页面信息 区域展示了本次访问的客户端IP地址、浏览、操作系统等信息,帮助您确认故障原因。慢加载详情 页面的 页面资源加载瀑布图 区域展示了页面静态资源加载的瀑布图,帮助您快速定位资源加载的性能瓶颈。慢加载...

Control Center设置告警

暂停和恢复所有警报操作 出于维护或故障排除原因,必要时暂停所有启用的警报。在暂停和恢复期间会遵守启用或禁用的单个操作的现有设置。暂停时会忽略满足和触发的任何触发条件,并抑制与触发关联的所有已启用操作。准备好后,再次恢复...

系统类故障排查

概述 本文主要介绍使用阿里云服务ECS时的系统类故障排查,包含CPU、磁盘I/O、内存、硬盘、带宽资源占用异常的问题排查与定位。详细信息 说明 阿里云提醒您:如果您对实例或数据有修改、变更等风险操作,务必注意实例的容灾、容错能力,...

接打电话时,听不到对方声音,或者对方听不到我声音

一、我使用的设备是笔记本电脑+普通的单孔手机耳机 这种原因普遍为没有为呼叫中心选择正确的扬声和麦克风设备造成的,极少数原因为笔记本设备故障或使用非谷歌浏览造成。请使用谷歌浏览登录呼叫中心,插入耳机,点击页面顶部的“设备...

配置规则:按模板(批量)

比较方式 当模板的规则类型为数值型时,比较方式包括 大于、大于等于、等于、不等于、小于、小于等于。当模板的规则类型为波动率型时,比较方式包括 绝对值、上升 和 下降。期望值 当模板的规则类型为数值型时,您需要填写 期望值。当触发...

PolarDB处理TPC-H查询的挑战和机遇

Overflow Handling 对数值的计算结果做溢出检查成本是比较高的,因为会使用if-else分支,破坏CPU流水线。一种乐观方案是可以根据数据的类型、range的范围和可能的计算方式,提前预测其不会overflow,就可以避免这种检查了,至少TPC-H中可以...

概览

应用场景 在不同业务场景下,云资源实例的监控指标的数值水位、周期变化、方差波动等统计特点会呈现不同状态,例如:您的流量日间大、夜间小,会导致ECS实例或CDN域名的网关流量、消息队列任务堆积等监控指标出现日夜波峰和波谷;...

存储资源

常由日志配置不合理,磁盘容量不足等原因造成的,是比较常见的问题。可能造成数据丢失、系统崩溃等影响。常见的容错策略如下:使用率预警:定期监控计算节点的磁盘空间使用情况,并设置告警机制。当磁盘空间即将满时,系统可以发送警报通知...

消息轨迹

您可根据TraceID或MessageId,追踪任意一条消息在物联网平台流转的全路径,还可根据出现的故障节点快速分析、定位问题。本文介绍查看消息轨迹的操作步骤。限制说明 仅中国地域的企业版实例和新版公共实例,支持使用消息轨迹功能。操作步骤 ...

交互分析管理

说明 以SQL名称的方式将参数添加到查询中,参数的值可以通过调整数值选择的值来实时更改。最小值参数名 设置数值选择的最小值的参数名称,当过滤类型选择 范围值过滤 时可配置。说明 以SQL名称的方式将参数添加到查询中,参数的值可以...

柱图

柱图可以展示每项数据在一段时间内的趋势及数据间的比较情况。例如,柱图可以比较某个路口不同时间段的车流量。本文为您介绍如何为柱图添加数据并配置样式。前提条件 已创建仪表板,请参见 新建仪表板。图表概述 使用场景 简单直观,根据...

Linux系统的ECS实例系统无响应,系统日志中出现“BUG:...

BUG:soft lockup-CPU#0 stuck for 61s 问题原因 该问题通常是由于ECS实例中,系统内核长时间占用CPU资源导致出现软死锁(soft lockup)故障,内核长时间占用CPU资源可能有以下原因:系统负载过高 内核死循环或死锁 内核调度问题 内核出现...

设备无法上电

问题现象 设备的系统指示灯(SYS或RUN)和电源指示灯都不亮。可能原因 未打开设备电源开关。...如果是可插拔电源适配,可通过更换其它可以正常供电的电源适配,更换之后如果设备可以正常上电,则可以确认是设备的可插拔电源适配故障

应用故障自动诊断

在EDAS中进入应用总览页面时,会按照您自定义的时间段对该应用的运行情况做一个自动诊断。...数据支持:这一部分包含了得到推测结论的数据支持,不同故障原因的诊断报告中包含的分析数据将不一样。图 1.故障诊断报告示例图-RT诊断

光模块故障

本文介绍光模块发生故障原因和处理方法。问题现象 光模块连接后,接口指示灯没有变为绿色。可能原因 光模块不兼容或损坏。智能接入网关设备支持的光模块型号请参见 光模块型号。说明 目前仅SAG-1000设备支持光模块插入。解决方案 通用多...

设备和交换机之间的链路故障

本文介绍SAG-1000设备发生设备和交换机之间链路故障原因和处理方法。问题现象 设备和交换机接口之间ping不通。设备的Web端口配置页,端口前的状态灯为红色。动态路由OSPF接入时,Web端口配置页,端口前的状态灯为红色。设备的Web状态查询...

Quick BI为什么图表预览时查询不到值...后又能看到数值...

概述 本文主要介绍图表预览时查询不到值,点击更新后又能看到数值原因。详细信息 打开仪表板查看图表时,显示“数据返回为空”,点击“更新”后,又可以看到数据了?说明如下:数据返回为空,说明当前查询不到内容,此时可以将生成的SQL...

文本分析

关键字分析 介绍:不分词,适合一些需要精确匹配的场景。如标签、关键词等,不分词的字符串或数值内容。注意:该分析适用于LITERAL、INT、LITERAL_ARRAY、INT_ARRAY字段类型。举例:例如:文档字段内容为“菊花茶”,则只有搜索“菊花...

文本分析

关键字分析 介绍:不分词,适合一些需要精确匹配的场景。如标签、关键词等,不分词的字符串或数值内容。注意:该分析适用于LITERAL、INT、LITERAL_ARRAY、INT_ARRAY 字段类型。举例:例如:文档字段内容为“菊花茶”,则只有搜索“菊花...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
数据库自治服务 应用实时监控服务 应用高可用服务 负载均衡 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用