附录:SOFAStack 产品目录

分布式链路跟踪 分布式链路跟踪(Distributed System Tracing,简称 DST)是一款面向分布式架构、微服务架构和云原生架构的应用可观察性的金融级解决方案,帮助用户厘清应用间复杂的调用关系,迅速定位故障或者缓慢节点。产品架构 产品优势...

更新故障复盘改进详情

problemReason":"故障原因A","recentActivity":"2","injectionMode":"1","recoveryMode":"2","discoverSource":1,"userReport":10,"monitorSourceName":"Zabbix","relationChanges":"关联变更","dutyUserId":1231,"replayDutyUserId":1213...

如何解决MSE Nacos实例域名无法解析的问题?

如果使用的是ACK,请 提工单 联系ACK技术支持协助排查CoreDNS故障原因。方案二:使用ping命令 使用 ping${mse.nacos.host} 指令尝试解析。如果提示 unknown host,则无法解析域名。如果提示 PING${mse.nacos.host}(xxx.xx.xx.xx)56(84)...

诊断网页加载过慢的问题

慢加载详情 页面顶部的 页面信息 区域展示了本次访问的客户端IP地址、浏览器、操作系统等信息,帮助您确认故障原因。慢加载详情 页面的 页面资源加载瀑布图 区域展示了页面静态资源加载的瀑布图,帮助您快速定位资源加载的性能瓶颈。慢加载...

故障止损恢复

故障初因定位 集成企业内部可利用的所有稳定性相关数据(变更事件,...通用垂直专项快恢能力:通过集成包括DB侧慢SQL限流、变更极速回滚、多活容灾切流快恢等通用的快恢能力,结合监控、日志等数据自动定位的故障原因进行对应的快恢方式推荐。

一键诊断

相关文档 通过一键诊断了解数据库性能情况的全貌后,您可以使用如下功能对数据库进行全面细致的诊断,准确定位故障原因,并解决故障。会话管理 性能趋势 锁分析 慢SQL 空间分析 常见问题 Q:一键诊断中,如何计算会话的线程使用率、连接数...

访问策略

6.备用地址池是在默认地址池因故障原因不可用时,可以将用户的访问流量切换至备用地址池上。在 备用地址池 的下拉框中,选择已创建的地址池名称,最后单击 下一步。如果您还没有创建地址池,请参考 创建地址池 文档。注意:如未设置备用...

DataV数据可视化服务协议

3.2.3 阿里云将消除您非人为操作所出现的故障,但因您的原因和/或不可抗力以及非阿里云控制范围之内的事项除外。3.2.4 阿里云提供本服务协议规定的技术支持,但不承担由于您的原因(包括但不限于代码质量、人为管理疏漏、自身安全管理等)...

DataV数据可视化服务协议

3.2.3 阿里云将消除您非人为操作所出现的故障,但因您的原因和/或不可抗力以及非阿里云控制范围之内的事项除外。3.2.4 阿里云提供本服务协议规定的技术支持,但不承担由于您的原因(包括但不限于代码质量、人为管理疏漏、自身安全管理等)...

什么是消息演练

随着应用规模的扩大,系统变得越来越复杂,不可避免地会走向分布式化。各种中间组件会相继被引入系统,其中分布式消息服务更是系统中必不可少的一...需要注意的是演练场景仅是组件表象,其内部故障原因可能是多种多样的,需要进一步进行分析。

功能概述

数据库发生故障后,无法在发生故障时定位到原因,可以通过智能压测功能,在克隆库上复现故障场景,定位故障原因。功能架构 智能压测的功能架构如下图所示:源数据库:将要进行大促、将要业务变更或者已经发生故障,需要进行流量捕获的数据...

云盘三副本技术

重要 如果ECS实例由于病毒感染、人为误删除或黑客入侵等软故障原因造成数据丢失,需要您采用备份或者快照等技术手段来解决。任何技术都不可能解决全部问题,因地制宜地选择合适的数据保护措施,才能为您的业务数据筑起一道坚实的防线。更多...

功能特性

此外,在数据库实例发生故障且无法定位原因时,可以利用克隆库复现故障场景,以便更好地定位故障原因。智能压测 搜索分析 查询并导出SQL语句对应的日志信息。搜索 SQL洞察 SQL洞察聚类分析,用作深度异常的排查。SQL洞察 安全审计 内置了...

故障复盘

复盘文档一般包含以下内容:故障简述:故障概述、影响面、处理人等 故障背景:故障发生时的业务链路 故障时间线:着重强调故障引入、故障发生、故障发现、业务响应、恢复执行、故障恢复几个时间点 故障原因分析:建议先一句话总结,再进行...

托管节点池节点自动恢复

当发现节点故障时,ACK会根据故障原因触发对应恢复任务,并记录相应的事件。当恢复任务完成后,故障状态解除,节点恢复正常状态。当恢复任务完成后,故障状态依然存在,节点会被置为恢复失败状态。说明 如果集群中存在多个节点池,节点池...

性能监控最佳实践

提高故障排查效率:当系统或应用出现故障时,传统的性能监控方案通常需要IT运维人员手动分析监控数据来确定故障原因,这样会浪费大量的时间和精力。而一体化性能监控能够对多种关联的监控数据进行自动分析和处理,帮助IT运维人员快速定位...

EMR Kafka磁盘故障运维

当出现磁盘故障时,需要根据故障原因、故障影响程度、业务需求(是否接受数据丢失、是否允许服务较长时间不可用)、集群状态等综合考虑恢复采取的策略。如果业务优先保证服务可用,但允许丢失部分数据,则应考虑在可能会丢失数据的情况下,...

服务条款

阿里云将消除您非人为操作所出现的故障,但因您原因和/或不可抗力以及非阿里云控制范围之内的事项除外。3.2.5.阿里云应严格遵守保密义务。4.用户数据的保存、销毁与下载4.1.为服务您的目的,阿里云可能通过使用您数据,向您提供服务,包括...

断点续传下载

断点续传下载是指客户端在从网络上下载资源时,由于网络等原因中断下载。当您再次开启下载时,可以从已下载完成的部分继续下载未完成的部分,从而节省时间和流量。注意事项 使用本文示例前您需要先通过自定义域名、STS等方式新建OSSClient...

跟踪概览

故障诊断与运维 服务故障分析:在出现服务中断或性能下降时,可以使用跟踪日志来分析事件前后的操作,以帮助确定故障原因。配置变更追踪:记录对云资源配置的所有更改,帮助识别可能导致服务中断的配置错误。基本概念 概念 说明 跟踪 跟踪...

无法连接Windows实例

故障原因 可能是网卡驱动未开启或网卡配置有问题。解决方法 使用管理终端 登录实例,检查网卡驱动,如果存在异常,则重新安装。步骤三:检查重置实例密码后是否未重启实例 确认是否存在故障现象,如果存在,则参考本步骤解决问题,如果不...

设计方案

故障恢复 定位故障原因后,按照应急预案快速恢复业务,并在事后进行复盘总结。预案执行:在故障响应的过程中,需要按照事先制定的应急预案进行执行。应急预案包括了应急响应流程、各个岗位的职责、处理流程等。预案执行能够保证故障恢复和...

专线连接类

排查物理专线故障原因,具体操作,请参见 故障排查。本地数据中心到阿里云的线路中断,如何解决?请在本地数据中心的网关设备上测试物理专线的客户端侧IP到阿里云侧IP是否可达,即此物理专线的直连IP是否可以ping通。如果不通,则需您向...

开通备份恢复

说明 保留全备个数+1的原因是只有在新备份完成后才会淘汰旧数据,在备份的过程中需要额外一份全备空间。全量空间大小可以在HBase Master页面或者UE集群管理页面获取。增量空间=日志保留天数*每天增量LOG大小。假设平均1MB/s的写入,每天需要...

开通备份恢复

备份恢复空间评估 重要 请合理评估备份恢复的使用空间,超过使用量后,会导致数据备份中断。备份恢复空间大小=全量备份空间大小+增量备份空间大小。全量备份空间大小=(保留全备个数+1)x 单个全备大小。说明 保留全备个数+1的原因是只有在...

服务条款

3.2.4 阿里云将消除您非人为操作所出现的故障,但因您原因和/或不可抗力以及非阿里云控制范围之内的事项除外。3.2.5 如 阿里云发现您利用云数据库Memcache版服务进行非法业务或对阿里云网站及服务进行攻击,或发生其他违法、违规和违反本...

远程桌面无法连接到Windows实例的快速排查方法

步骤十:杀毒软件检查 步骤十一:尝试重启实例 步骤一:使用管理终端登录实例 无论何种原因导致无法远程连接实例,请先尝试用阿里云提供的远程连接功能进行连接,确认实例还有响应,没有完全宕机,然后再按原因分类进行故障排查。...

通信能力技术服务协议

一旦您停止使用阿里或阿里基于任何原因终止对您提供阿里的服务,您必须立即停止使用并删除从阿里中获得的全部服务和数据。您不得违约或违法使用阿里的所有资源;您不得向任何单位或个人出售、转让、转授权阿里的代码、API接口(Application...

商业化服务条款

阿里云将消除您非人为操作所出现的故障,但因您原因和/或不可抗力以及非阿里云控制范围之内的事项除外。3.2.5.阿里云应严格遵守保密义务。用户数据的保存、销毁与下载 4.1.阿里云可能会使用您提交的注册账户的信息,向您发出产品、服务的...

常见报错及解决方案

Q:谐云组件故障排查思路 A:elasticsearch《故障排查思路》mysql《故障排查思路》redis《故障排查思路》harbor《故障排查思路》通用排查《中间件通用故障排查思路》ingress《故障排查思路》rocketmq《故障排查思路》kafka《故障排查思路》...

系统运维工具集SysAK使用说明

SysAK(System Analyse Kit)是阿里云操作系统提供的一个全方位的系统运维工具集,可以覆盖系统的日常监控、线上问题诊断和系统故障修复等常见运维场景。本文为您介绍SysAK的安装部署和使用方法。运维场景 阿里云通过对百万服务器运维经验...

服务条款

3.2.3 阿里云将消除您非人为操作所出现的故障,但因您的原因和/或不可抗力以及非阿里云控制范围之内的事项除外。3.2.4 阿里云提供本服务条款规定的技术支持,但不承担由于您的原因(包括但不限于代码质量,人为管理疏漏,自身安全管理等)...

服务条款

3.2.3 阿里云将消除您非人为操作所出现的故障,但因您的原因和/或不可抗力以及非阿里云控制范围之内的事项除外。3.2.4 阿里云提供本服务条款规定的技术支持,但不承担由于您的原因(包括但不限于代码质量,人为管理疏漏,自身安全管理等)...

节点异常问题排查

本文目录 类别 内容 诊断流程 诊断流程 常见排查方法 节点故障诊断 检查节点的详情 检查节点的状态 检查节点的事件 检查节点的诊断日志 检查节点的关键组件 检查节点的监控 检查节点的安全组 常见问题及解决方案 节点关键组件异常处理 ...

节点异常问题排查

本文目录 类别 内容 诊断流程 诊断流程 常见排查方法 节点故障诊断 检查节点的详情 检查节点的状态 检查节点的事件 检查节点的诊断日志 检查节点的关键组件 检查节点的监控 检查节点的安全组 常见问题及解决方案 节点关键组件异常处理 ...

查看并管理计划内事件

事件的原因与影响 升级类型 事件原因 影响类型 影响说明 热升级 实例迁移 实例闪断 进入 计划切换时间 后,将产生下述影响:一般情况下,实例小版本升级采用热升级模式。实例或实例中涉及切换的分片将发生连接闪断及30秒以内的只读状态...

查看并管理计划内事件

事件的原因与影响 升级类型 事件原因 影响类型 影响说明 热升级 实例迁移 实例闪断 进入 计划切换时间 后,将产生下述影响:一般情况下,实例小版本升级采用热升级模式。实例或实例中涉及切换的分片将发生连接闪断及30秒以内的只读状态...

计划内事件

您需要登录 消息中心,确保 云数据库故障或运维通知 的通知开关处于开启状态并设置消息接收人(推荐设置为数据库运维人员),否则您将无法收到相应的通知信息。图 1.消息中心通知设置 操作步骤 登录 RDS管理控制台。在左侧导航栏单击 事件...

查看并管理计划内事件

事件的原因与影响 升级类型 事件原因 影响类型 影响说明 热升级 实例迁移 实例闪断 进入 计划切换时间 后,将产生下述影响:一般情况下,实例小版本升级采用热升级模式。实例或实例中涉及切换的分片将发生连接闪断及30秒以内的只读状态...

计划内事件

您需要登录 消息中心,确保 云数据库故障或运维通知 的通知开关处于开启状态并设置消息接收人(推荐设置为数据库运维人员),否则您将无法收到相应的通知信息。图 1.消息中心通知设置 操作步骤 登录 RDS管理控制台。在左侧导航栏单击 事件...
共有139条 < 1 2 3 4 ... 139 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
数据库自治服务 云数据库 OceanBase 版 应用高可用服务 负载均衡 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用