故障基础数据管理

故障场景等级定义 日常运营中,除用户方环境或自身操作引起的问题外,无论什么原因导致的服务中断、服务品质下降或用户服务体验下降的现象,都称为故障。对故障影响程度的划分就是故障等级定义。定义故障等级是为了指定故障等级定义作为各...

容灾管理服务介绍

针对有高可用需求的用户,CADT容灾管理服务提供规划、优化、部署、演练高可用业务的能力,在业务上线前及业务上线定期进行容灾演练,验证系统是否能够抵御资源故障或者AZ故障,保障系统健壮性。主要功能 容灾规划 在用户部署资源前,通过...

什么是故障

本文主要介绍什么是故障。定义 在日常运营中,无论什么原因导致业务服务中断、服务品质...故障改进:支持对故障制定明确的改进及验收措施、责任人及完成时间,确保每个深度复盘故障都能对业务连续性形成改进,避免历史同类故障重复发生。

Windows系统的ECS实例ping外网地址提示“一般故障”...

本文介绍Windows系统的ECS实例ping外网地址提示“一般故障”的错误原因和解决方案。问题现象 Windows系统的ECS实例ping外网地址时提示“一般故障”错误。问题原因 出现该问题可能有以下原因:可能原因 排查方案 ECS实例中安装了第三方杀毒...

故障协同处理(基于钉钉)

云钉运维故障协同效果 功能概述 移动应用端(目前仅支持“钉钉”,以下功能说明均基于钉钉场景)支持接收故障消息提示和进行故障操作,且支持移动端操作管理故障,操作记录实时同步到 运维事件中心 控制台。故障协同处理使用条件 成功开通...

四川农信

业务挑战 现有 IT 系统在过去的一段时间有效地支撑了各业务系统的运营,但目前的 IT 技术环境在面对未来业务大发展的需求时仍会面临极大的挑战,主要有以下几点:传统架构面临挑战 新一代的银行系统必须直面来自不同阶层、不同背景的海量...

人保健康

业务挑战 面向互联网业务消费场景化、高频化的特征,需要 IT 系统具备应对海量高并发,横行扩展能力。传统集中式的 IT 架构无法满足业务对出单时间、新产品上线时间的要求,需要提升服务时效以及客户体验。解决方案 人保健康引入蚂蚁集团的...

GTM如何实现同城容灾

概述 方案介绍 同城容灾指应用服务部署是多机房、单地域时,当其中一机房出现故障时,全局流量管理(简称GTM)可实现业务7*24小时稳定运行,即使单机房故障也不影响业务的可持续性,保障用户访问连续不间断。本文将以同城双活的灾备架构为...

设计原则

面向失败的架构设计原则 众所周知,系统异常事件是不可避免的,如网络延迟、硬件故障、软件错误、突峰流量等,建议在系统设计阶段就要从这些异常事件引起的系统执行“失败”出发,提供冗余、隔离、降级、弹性等能力,旨在确保系统的高可用...

响应云盒维修事件

会向您发送ECS故障 事件(Reboot事件)通知,收到ECS故障事件通知,您可以响应故障事件并按照建议进行处理,例如:将现有业务迁移到冗余资源保证业务正常运行,将出现故障风险的ECS实例作为备机(备机仍受阿里云智能运维系统的检测)。...

GTM如何实现异地容灾

概述 方案介绍 异地容灾是指应用服务部署在不同地域时,当其中一地出现故障时,全局流量管理(简称GTM)可以将出现故障地域的用户访问流量,调度至异地灾备中心,保障用户访问连续不间断。本文将以两地三中心灾备架构为读者讲解异地灾备的...

接入主机

在普通主机上安装AHAS探针,即可体验架构感知和故障演练功能,直观地查看应用对基础架构的依赖关系,组件间的依赖关系,以及对应用进行故障演练。本文介绍如何将探针接入主机,主机类型包括Linux和Windows。操作步骤 登录 AHAS控制台,并...

使用ping命令检测ECS与Lindorm之间的连接

Windows系统会在4次ping之后显示测试结果,如下图。说明 如果需要持续检测连通性请使用 ping<host>-t 命令。图 1.Windows服务器执行ping命令 Linux系统执行该命令将会持续发送ping请求,您可以按下键盘上的Ctrl键加C键停止执行并统计结果...

发现并处理大Key和热Key

在使用 云原生内存数据库Tair 的过程中,如果未能及时发现并处理Big keys(下文称为“大Key”)与Hotkeys(下文称为“热Key”),可能会导致服务性能下降、用户体验变差,甚至引发大面积故障。本文将介绍大Key与热Key产生的原因、其可能...

网商银行

是中国第一家将核心系统架构在金融云上的银行。基于金融云计算平台,网商银行拥有处理高并发金融交易、海量大数据和弹性扩容的能力,可以利用互联网和大数据的优势,给更多小微企业提供金融服务。业务挑战 网商银行将普惠金融作为自身的...

故障注入

您可以通过故障注入功能向测试应用注入故障,检测应用面对异常时的处理情况。您可以根据检测的情况调整您的应用,以减少应用在正式使用时出现的异常问题。多用于测试环境。功能简介 故障注入流程如下所示:在微服务中,其实现方式为:管控...

产品优势

灵活支撑系统规模快速增长及业务突发性带来的资源伸缩,提高视频计算资源利用率。启动成本低,建设周期短 设备端无需集成SDK,RTMP或GB/T28181国标协议直接接入。极低的初始启动成本,减少本地建设、集成和运维。API方便业务集成和二次开发...

接入Ping监控数据

超时 发起Ping请求到返回Ping数据的时间超过指定时间,表示超时,即Ping操作失败。单位:秒,取值范围:[1,30]。ICMPing设置 采集ICMPing数据。具体参数说明如下所示。检测名称:自定义设置检测名称。源主机:执行Ping命令的服务器的IP...

服务等级目标SLO概述

例如,有些非关键业务系统的目标可用性为99%(每年大约3天的停机时间),而关键服务的系统可能需要99.999%的可用性(每年约5分钟的停机时间)。合规期 除了为SLI定义目标之外,SLO还指定衡量SLI的时间段。例如,某一天内的99%可用性与...

服务等级目标SLO概述

例如,有些非关键业务系统的目标可用性为99%(每年大约3天的停机时间),而关键服务的系统可能需要99.999%的可用性(每年约5分钟的停机时间)。合规期 除了为SLI定义目标之外,SLO还指定衡量SLI的时间段。例如,某一天内的99%可用性与...

自动/手动主备切换

系统发生故障时,PolarDB 集群会自动进行主备切换。您也可以手动进行主备切换,指定一个只读节点为新的主节点。注意事项 不论是自动切换还是手动切换,切换过程中,都可能会出现30秒左右的闪断,因此切换前请务必确保应用具备重连机制。...

自动/手动主备切换

系统发生故障时,PolarDB 集群会自动进行主备切换。您也可以手动进行主备切换,指定一个只读节点为新的主节点。注意事项 不论是自动切换还是手动切换,切换过程中,都可能会出现30秒左右的闪断,因此切换前请务必确保应用具备重连机制。...

Data API功能简介

降低使用成本 通过使用RDS Data API Service,一些特定的系统可以免去端服务,直接从前端请求到数据库,简化系统架构的同时,由于不再需要服务端业务逻辑开发,减少了应用程序开发的人力成本,降低了维护基础设施的风险,而且更便于扩展...

使用PING命令检测ECS与Redis之间的网络连接

新建Redis实例,或在使用过程中突然无法连接Redis实例时,您可以在ECS的命令行中使用PING命令检测ECS与Redis实例网络是否能够连通。操作步骤 获取Redis实例的连接地址,更多信息请参见 查看连接地址。登录客户端所在的ECS实例,并在命令...

概述

容器应用服务致力于通过成熟的技术和最佳实践经验的支撑,使金融场景亦能从容地应对云原生开发、运维、架构的难题,解决金融系统应用容器化转型的需求,使容器技术真正的大规模应用于金融行业生产环境里,帮助传统应用以更高效、低成本的...

ack-node-repairer

当Node Problem Detector(简称NPD)组件检测到节点上的故障并生成节点的事件(Event)或者Condition上报给集群时,ACK的自愈系统(ACK Node Repairer)会监听每个节点上的新故障事件,并根据配置对故障节点进行相应的修复操作。...

功能架构

分布式链路帮助运维人员、开发人员和架构师看清楚复杂的大规模微服务架构下的应用及服务之间的复杂调用关系、性能指标、出错信息与关联日志,从而实现故障根因分析、服务治理、应用开发调试、性能管理、性能调优、架构管控、故障定责等运维...

删除ECS实例的默认安全组规则无法ping通ECS实例

问题描述 无法ping通ECS实例,排查ECS实例的防火墙和网卡IP等配置,均无异常,即使回滚ECS实例的操作系统,仍然无法ping通ECS实例。问题原因 ECS实例的安全组中默认包含开放ICMP协议的规则,即允许ping通ECS实例,若该规则被删除,则无法...

证券交易所

阿里金融云提供整体架构解决方案,赋能证券交易行业IT体系平稳、有序地切换到新技术体系。金融级别的合规集群保障了容灾能力和稳定性;多运营商BGP优质网络接入为全国客户提供了流畅的网络体验,规避了运营商网络之间的互联互通风险。阿里...

产品功能

分布式架构,单节点故障业务不受影响 云数据库Memcache版采用分布式集群架构,每个节点均由双机热备架构组成,具备自动容灾及故障迁移能力。多种规格可适配不同的业务压力,数据库性能支持无限扩展。支持数据持久化及备份恢复策略,有效的...

产品架构

系统架构 高可用管理平台 HAS 的系统架构包括:风险管理模块是 HAS 的核心组件,实现风险事件的汇集以及风险事件处理的流转。日常巡检、业务监控、故障诊断发现风险事件,并将其上报至风险管理中心,由风险管理中心进行统一调度,如触发...

ECS实例无法通过ping命令访问OSS内网域名

问题描述 ECS实例和OSS实例在相同的地域,但是ECS实例无法ping通OSS的内网域名,系统显示如下。问题原因 正常现象。出于安全考虑,禁止ECS实例ping通OSS的内网域名,并非无法访问。解决方法 如果您需要测试ECS实例与OSS内网域名的网络连通...

通过异步复制功能实现容灾恢复

当您创建并启动云盘异步复制关系,如果主盘发生故障,您可以通过异步复制功能对主盘进行容灾恢复。本文主要介绍如何进行容灾恢复操作。前提条件 反向复制前,请确保源云盘(主盘)已经从对应的ECS实例上卸载,即主盘处于未挂载状态。具体...

故障注入

您可以通过故障注入功能向测试应用注入故障,检测应用面对异常时的处理情况。您可以根据检测的情况调整您的应用,以减少应用在正式使用时出现的异常问题。多用于测试环境。配置故障注入规则 登录 SOFAStack 控制台。在左侧菜单栏选择 ...

事件驱动架构

什么是事件驱动架构 事件驱动架构是一种松耦合、分布式的驱动架构,收集到某应用产生的事件实时对事件采取必要的处理路由至下游系统,无需等待系统响应。使用 事件总线EventBridge 可以构建各种简单或复杂的事件驱动架构,以标准化的...

故障隔离

故障隔离是在服务实例出现故障时,实现实例级别的精细化摘流隔离,使故障影响范围更小,提高服务的可用性。添加故障隔离规则 登录 SOFAStack 控制台。在左侧菜单栏选择 中间件>微服务平台>服务网格>服务治理,然后单击 故障隔离 页签。单击...

产品架构

PolarDB-X 1.0 承担着OLTP在线核心数据库的职责与定位,可与数据集成、数据传输,缓存、大数据生态配合使用。产品架构图 内核架构 PolarDB-X 1.0 由...支撑运维系统采用多地域隔离部署、核心数据服务SLA与运维管控SLA解绑,确保运维体系稳定。

通过一致性复制组实现容灾恢复

当您创建并启动一致性复制组,如果生产站点中的云盘发生严重故障,您可以通过一致性复制组批量对生产站点的云盘数据进行容灾恢复。本文主要介绍如何通过一致性复制组进行容灾恢复。背景信息 一致性复制组支持故障切换和反向复制功能,当...

本地设备通过公网无法连接Redis的常见问题排查

返回结果图示 Linux Linux系统执行该命令将会持续发送Ping请求,您可以按下键盘上的Ctrl+C键停止执行并统计结果,如下图。Windows Windows系统会在4次Ping之后显示测试结果,如下图。如果返回信息类似 0 packets received,100.0%packet ...

云资源视图

背景信息 当您在自己的系统中安装了AHAS探针,AHAS就能自动识别系统中的进程、容器和主机,并基于网络流量构建出拓扑图,显示进程、容器、容器组和主机之间的网络依赖关系,让您对自己的系统架构一目了然。说明 容器组层仅适用于...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
云服务器 ECS 云数据库 Redis 版 物联网无线连接服务 负载均衡 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用