附录:SOFAStack 产品目录

金融行业的日 金融行业的日是一个很复杂的操作,需要多个任务按照指定顺序协同工作才可以完成。传统实现方式是在系统代码里指定任务的执行顺序,当业务发生变化时需要修改代码才可以正常工作,可维护性很差。使用 SOFAStack 任务调度中...

监控指标说明

该指标协助您进行作业诊断,排查作业Task级别的故障原因。次数 TM GC Time 每次TM GC时间。长时间GC会导致占用过大内存空间,从而影响作业性能。该指标协助您进行作业诊断,排查作业级别的故障原因。毫秒(ms)TM ClassLoader/...

如何管理故障

可对故障根因进行原因检查并结构化录入,检查包括:故障原因、最近活动、注入方式、恢复方式等;关联故障期间的故障变更,新增故障改进措施等操作。故障状态 处理中:处理中仍未恢复的故障;已恢复:故障对处理中的故障做 恢复 操作后是...

基本概念

通过流量分发扩展应用系统对外的服务能力,通过消除单点故障提升应用系统的可用性。API 应用程序编程接口,是一些预先定义的函数,或指软件系统不同组成部分衔接的约定。API 分组 用于将 API 进行逻辑的分组,分组下的 API 使用相同的分组...

什么是多活容灾

RPO(Recovery Point Objective)即数据恢复目标,以时间为单位,即在灾难发生时,系统和数据必须恢复的时间要求。RPO标志系统能够容忍的最大数据丢失量。系统容忍丢失的数据量越小,RPO的值越小。RTO(Recovery Time Objective)即...

更新故障复盘改进详情

problemReason":"故障原因A","recentActivity":"2","injectionMode":"1","recoveryMode":"2","discoverSource":1,"userReport":10,"monitorSourceName":"Zabbix","relationChanges":"关联变更","dutyUserId":1231,"replayDutyUserId":1213...

如何解决MSE Nacos实例域名无法解析的问题?

如果使用的是ACK,请 提工单 联系ACK技术支持协助排查CoreDNS故障原因。方案二:使用ping命令 使用 ping${mse.nacos.host} 指令尝试解析。如果提示 unknown host,则无法解析域名。如果提示 PING${mse.nacos.host}(xxx.xx.xx.xx)56(84)...

产品架构

本文提供产品架构图,...ECS的跨区域容灾策略保证应用和数据的万无一失,RDS的主备架构避免了核心数据的单点风险,SLB的健康检查机制消除单点故障,CDN结合OSS有效提高内容加载速度,轻松搞定网站图片、短视频的内容分发,有效提高网站性能。

产品架构

本文提供产品架构图,并...ECS的跨区域容灾策略保证应用和数据的万无一失,RDS的主备架构避免了核心数据的单点风险,应用部署引入SLB消除单点故障,CDN结合OSS有效提高内容加载速度,轻松搞定网站图片、短视频的内容分发,有效提高网站性能。

功能和优势

集成程度高 目前Prometheus对接第三方存储系统的主流做法是实现一个独立于第三方存储系统的remote storage adapter,这个adapter需要单独部署和运维,另外单独部署的remote storage adapter还存在单点故障和读写性能问题。TSDB for ...

指定本地盘规格创建Pod

但本地盘来自于单台物理机,存在单点故障风险。更多信息,请参见 本地盘。重要 本地盘来自单台物理机,数据可靠性取决于物理机的可靠性,存在单点故障风险。更多信息,请参见 本地盘使用注意事项。支持指定的ECS本地盘规格族如下:大数据型...

产品优势

简单易用 服务开箱即用:支持即开即用的方式,购买之后即可使用,方便业务快速部署。...高可用 每个实例均有主从双节点:避免单点故障引起的服务中断。硬件故障自动检测与恢复:自动侦测硬件故障并在数秒内切换,恢复服务。

无法连接Windows实例

故障原因 可能是网卡驱动未开启或网卡配置有问题。解决方法 使用管理终端 登录实例,检查网卡驱动,如果存在异常,则重新安装。步骤三:检查重置实例密码后是否未重启实例 确认是否存在故障现象,如果存在,则参考本步骤解决问题,如果不...

一键诊断

相关文档 通过一键诊断了解数据库性能情况的全貌后,您可以使用如下功能对数据库进行全面细致的诊断,准确定位故障原因,并解决故障。会话管理 性能趋势 锁分析 慢SQL 空间分析 常见问题 Q:一键诊断中,如何计算会话的线程使用率、连接数...

应用故障自动诊断

在EDAS中进入应用总览页面时,会按照您自定义的时间段对该应用的运行情况做一个自动诊断。...数据支持:这一部分包含了得到推测结论的数据支持,不同故障原因的诊断报告中包含的分析数据将不一样。图 1.故障诊断报告示例图-RT诊断

访问策略

6.备用地址池是在默认地址池因故障原因不可用时,可以将用户的访问流量切换至备用地址池上。在 备用地址池 的下拉框中,选择已创建的地址池名称,最后单击 下一步。如果您还没有创建地址池,请参考 创建地址池 文档。注意:如未设置备用...

故障复盘改进详情

0c4840fd3812 幂等校验token 返回数据 名称 类型 示例值 描述 requestId String 4361a0e1-6747-4834-96ce-0c4840fd3811 Id of the request data Object data problemId String 231231 故障ID problemReason String 故障的原因 故障原因 ...

查看ECS实例的操作记录

如果您在使用ECS实例的过程中遇到故障,可以通过查看ECS实例的操作记录识别可能的故障原因。背景信息 操作记录 以ECS实例为入口,对实例及其关联资源的所有操作进行操作审计,并且对操作记录的影响等级进行标注,在众多操作记录中高亮出...

轻量应用负载均衡概述

该功能扩展了应用程序的吞吐能力,并且可以消除服务器的单点故障,提升应用程序的可用性。功能架构如下图所示:功能组件说明:轻量应用负载均衡:提供七层流量负载均衡能力,操作简单,性价比高。监听:默认采用HTTP协议,监听80端口。转发...

什么是消息演练

随着应用规模的扩大,系统变得越来越复杂,不可避免地会走向分布式化。各种中间组件会相继被引入系统,其中分布式消息服务更是系统中必不可少的一...需要注意的是演练场景仅是组件表象,其内部故障原因可能是多种多样的,需要进一步进行分析。

功能概述

数据库发生故障后,无法在发生故障时定位到原因,可以通过智能压测功能,在克隆库上复现故障场景,定位故障原因。功能架构 智能压测的功能架构如下图所示:源数据库:将要进行大促、将要业务变更或者已经发生故障,需要进行流量捕获的数据...

应用场景

消除单点故障 您可以在 CLB 实例下添加多台ECS实例。当其中一部分ECS实例发生故障后,CLB 会自动屏蔽故障的ECS实例,将请求分发给正常运行的ECS实例,保证应用系统仍能正常工作。同城容灾(多可用区容灾)为了提供更加稳定可靠的 CLB 服务...

作业调试

在正式环境中使用Session集群,JM的复用机制会对作业间的稳定性产生负面影响,详情如下:JobManager单点故障会对集群内的所有作业造成影响。TaskManager单点故障会对在其上有task运行的相关作业造成影响。同一个TaskManager内部,不同Task...

背景信息以及准备工作

DLA可以在不移动OSS日志文件的情况下读取并分析日志文件数据,定位服务故障原因等。对于一个服务而言,日志文件记录了服务运行的所有详细信息。在进行故障排除、状态监控或者预测告警时,都需要对日志文件进行查询分析。阿里云对象存储服务...

功能特性

此外,在数据库实例发生故障且无法定位原因时,可以利用克隆库复现故障场景,以便更好地定位故障原因。智能压测 搜索分析 查询并导出SQL语句对应的日志信息。搜索 SQL洞察 SQL洞察聚类分析,用作深度异常的排查。SQL洞察 安全审计 内置了...

监控报警概述

故障预警 云电脑的故障信息、故障原因及故障时间等信息。使用场景 在日常业务运行的过程中,监控大盘帮助您及时了解账号下全部云电脑资源的全局情况,实时监控提供更详细的数据指标和故障预警信息,帮助您了解终端用户使用云电脑的情况,...

什么是故障

包括根因检查(如故障原因、最近活动、注入方式、恢复方式等)、故障变更检查、监控检查,并需要对每一个故障明确责任人及团队;故障改进:支持对故障制定明确的改进及验收措施、责任人及完成时间,确保每个深度复盘后的故障都能对业务...

自动故障剔除

自动故障剔除功能会自动监控 RPC...com.alipay.sofa.rpc.aft.regulation.effective false 全局开关:如果应用打开了这个开关,则会开启整个单点故障自动剔除功能,否则该功能不启用。说明 每个参数都有默认值,您可以根据需要自行修改参数值。...

托管节点池节点自动恢复

当发现节点故障时,ACK会根据故障原因触发对应恢复任务,并记录相应的事件。当恢复任务完成后,故障状态解除,节点恢复正常状态。当恢复任务完成后,故障状态依然存在,节点会被置为恢复失败状态。说明 如果集群中存在多个节点池,节点池...

故障复盘

复盘文档一般包含以下内容:故障简述:故障概述、影响面、处理人等 故障背景:故障发生时的业务链路 故障时间线:着重强调故障引入、故障发生、故障发现、业务响应、恢复执行、故障恢复几个时间 故障原因分析:建议先一句话总结,再进行...

云盒计算资源配置最佳实践

背景信息 云盒的硬件设计中,各类硬件设备的保障如下:网络设备:采用双机冗余双上连设计,确保云盒内网络的高连续性,且不存在单点故障。存储设备:可以 确保在两台存储服务器同时宕机的情况下,数据的安全可靠。计算设备:支持宕机迁移和...

产品高可用

CLB系统的高可用 负载均衡实例采用集群部署,可实现会话同步,以消除服务器单点故障,提升冗余,保证服务的稳定性。其中四层负载均衡通过LVS(Linux Virtual Server)+keepalived的方式实现,七层负载均衡通过Tengine(淘宝网发起的Web...

跟踪概览

故障诊断与运维 服务故障分析:在出现服务中断或性能下降时,可以使用跟踪日志来分析事件前后的操作,以帮助确定故障原因。配置变更追踪:记录对云资源配置的所有更改,帮助识别可能导致服务中断的配置错误。基本概念 概念 说明 跟踪 跟踪...

故障管理

包括根因检查(如故障原因、最近活动、注入方式、恢复方式等)、故障变更检查、监控检查,并需要对每一个故障明确责任人及团队;故障改进:支持对故障制定明确的改进及验收措施、责任人及完成时间,确保每个深度复盘后的故障都能对业务...

产品架构

传统型负载均衡基础架构采用集群部署,提供四层(TCP和UDP协议)和七层(HTTP和HTTPS协议)的负载均衡,可实现会话同步,消除服务器单点故障,提升冗余性和服务稳定性。基础架构说明 负载均衡作为流量转发服务,将来自客户端的请求通过负载...

配置终端接入

且服务器规格需满足如下条件:操作系统:CentOS 7.0以上 CPU:4核 单台服务台支撑接入带宽:400 Mbp 内存:8 GB 说明 一个专属接入点支持多个服务器(物理机或虚拟机)上部署,以实现接入点的高可用性,避免单点故障。在 接入点管理>专属接...

什么是读写分离

说明 为避免单点故障,建议您为一个主实例创建至少两个只读实例。请求转发逻辑 只发往主实例 INSERT、UPDATE、DELETE、SELECT FOR UPDATE。所有DDL操作(建表/库、删表/库、变更表结构、权限等)。所有事务中的请求。用户自定义函数。存储...

NVMe协议介绍

实际业务使用过程中单点故障是常态,确保故障情况下业务连续性是高可用系统的核心能力,在云上存储和网络具备极高的可用性。而计算节点则经常受断电、宕机、硬件故障等影响,所以业务通常搭建主备模式解决计算的高可用问题。例如数据库场景...

什么是PolarDB MySQL企业版

高可用和高可靠保障,数据安全可靠 共享分布式存储的设计,彻底解决了主从异步复制所带来的备库数据非强一致的缺陷,使得整个数据库集群在应对任何单点故障时,可以保证数据零丢失。数据多副本跨可用区部署,主节点故障后RTO。GDN集群间...

设计方案

故障恢复 定位故障原因后,按照应急预案快速恢复业务,并在事后进行复盘总结。预案执行:在故障响应的过程中,需要按照事先制定的应急预案进行执行。应急预案包括了应急响应流程、各个岗位的职责、处理流程等。预案执行能够保证故障恢复和...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
数据库自治服务 云数据库 MongoDB 版 应用高可用服务 负载均衡 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用