故障复盘

故障复盘规范 故障复盘作为故障体系中的重要一环,整体复盘流程包括故障处理过程、改进分析、故障定责,基于包含标准化的复盘SOP、对应预防action推荐、问责管理机制,全面地回溯线上故障的发生,产出故障复盘报告和改进措施,避免故障重复...

设备无法连接SSID

问题症状 无线终端连接SSID,显示未连接,无法关联SSID。解决方案 检查AP配置中的最大连接数,最大可设置为128.2.DHCP不在AP上要检查一下地址池的使用情况,检查可用地址是否够用。3.更换新的AP,排除是否是AP故障。适用于 云AP

故障管理

在运维事件中心可以录入对应的故障等级,在关联的监控触发后,可以自动匹配到对应的等级定义,方便快速得到故障严重性的界定。服务组和故障应急群 服务组是一组人员,可以跟一个或者多个故障场景绑定,当故障触发时,会自动外呼对应的...

目标规则(Destination Rule)CRD说明

consecutiveLocalOriginFailures UInt32Value 否 触发排除需要的连续本地故障数。默认为5。该字段仅在 splitExternalLocalOriginErrors 设置为true时生效。consecutiveGatewayErrors UInt32Value 否 将主机排除出连接池需要的网关错误数。...

网络类场景

排除端口 无需注入网络延迟调用故障的端口,与本地服务端口和远程服务端口功能互斥。可以指定多个,使用逗号分隔,使用连接符表示范围。例如80,8000-8080。远端服务IP 指定演练对象访问的远端服务IP。可以通过子网掩码来指定一个网段的IP...

无法连接Windows实例

故障现象 无法ping通ECS实例,在排除Iptables和网卡IP配置问题且回滚系统后,仍然无法ping通。故障原因 可能是ECS实例安全组默认的公网规则被删除。解决方法 重新配置ECS实例的安全组公网规则,具体操作请参见 ECS实例安全组默认的公网规则...

电源故障定位

您可以参考以下方法定位电源故障并进行处理流程。诊断流程 电源故障详细处理流程,如下图所示。处理步骤 测量输入电压。使用万用表测量输入电压,根据电源适配器的工作电压范围判断输入电压是否异常。插拔电源适配器。把电源适配器以及电源...

概述

在交通云控平台(下文以“云端”代指)完成对边缘计算终端的统一管控、配置升级、运行监测、故障报警等功能。此处所言“边缘”是对于云计算中心而言的边缘。边缘计算终端指部署在数据源头(您的设备所在地)周边,可进行设备数据处理的...

教育实训

方案介绍 实训平台与无影云电脑结合,帮助培训机构实现一体化教学。实训环境不依赖于学生PC,教学和练习环节全部在培训系统内形成闭环,学生能够随时随地学习和实训。无影的价值:丰富且开放的API接口,方便实训平台集成 标准化的实训...

配置DDoS高防后访问网站提示502错误

网络出现拥塞或抖动 在已经排除以上两种原因后,偶发的局部网络抖动、运营商线路故障等因素,也可能导致502错误。相关文档 常见问题概览 配置DDoS高防后访问网站提示504错误 适用于 DDoS高防 如果您的问题仍未解决,您可以在阿里云社区 ...

故障排查

Service无法正常工作 在排除网络插件自身的问题外,最可能的是 label 配置有问题,您可以通过查看 endpoints 进行故障排查。具体操作,请参见 检查Service。如何升级集群?升级集群的Kubernetes版本,具体操作,请参见 手动升级ACK集群。从...

混沌工程缓存实战系列-Redis

这个查询路径切换的过程导致RT较于正常值有所延长。通过以上的演练证明了以下几点:缓存RT轻微增长,对业务影响可控。但是如果业务内部存在多次的缓存查询,会导致整体RT增加明显,就像本示例RT延长处于客户端连接超时范围内,无法触发弱...

AIOps 解决方案专家服务内容说明

智能运维又称AIOps,即人工智能与运维结合,可通过机器学习的防范来提升运维效率。它提供:时序指标异常诊断、根因分析、资源编排、故障自愈等能力。常见的AIOps应用路径为:对监控的各种关键性能指标(KPI)行实时异常检测;对多维指标...

SA混合云存储阵列

阿里云混合云存储阵列将云存储的高性价比和可扩展性与本地数据中心架构结合,帮助客户轻松实现数据在本地数据中心和公共云之间的无缝流动。产品规格 阿里云 SA混合云存储阵列 产品规格表 产品型号 SA2600 SA3700 SA5700 控制器 2-8控 2-...

高压缩引擎(X-Engine)介绍

在Sysbench测试场景下,与集群版的单InnoDB引擎比较,这种双引擎(InnoDB和X-Engine)混合部署方式,使集群整体性能下降控制在20%以内。当业务数据的存储空间达到一定规模(几百GB或几百TB),在集群整体性能可控范围内,用户能明显地...

迁移可用区

例如,单可用区实例可以承受服务器和机架级别的故障,而多可用区实例可以承受机房级别的故障。说明 对于包含主备节点的实例,建议迁移至多个可用区,实现实例的跨可用区容灾。从多个可用区迁移至一个可用区 为了满足特定功能的要求。操作...

高性能版实例

以下内容为 AnalyticDB PostgreSQL版 实例常见故障场景中高性能版和高可用版的对比:恢复(Recovery)模式 根据以往 AnalyticDB PostgreSQL版 运行情况,故障最大的场景为恢复模式,故障概率远大于另外两种场景(计算节点故障和计算节点宿...

转场效果示例

SubType:waterdrop 故障 SubType:glitchmemories 波点 SubType:polka 蔓延 SubType:perlin 扭曲旋转 SubType:directionalwarp 向上弹动 SubType:bounce_up 向下弹动 SubType:bounce_down 向右擦除 SubType:wiperight 向左擦除 ...

转场效果示例

SubType:waterdrop 故障 SubType:glitchmemories 波点 SubType:polka 蔓延 SubType:perlin 扭曲旋转 SubType:directionalwarp 向上弹动 SubType:bounce_up 向下弹动 SubType:bounce_down 向右擦除 SubType:wiperight 向左擦除 ...

云产品事件触发器概述

数据库 云原生数据库PolarDB事件 云原生数据库PolarDB事件类型包括实例主备切换(故障切换)、实例故障结束和实例故障开始等。云原生分布式数据库事件 云原生分布式数据库事件类型包括阿里云平台对资源执行的操作事件、API调用和控制台的...

云产品事件触发器概述

数据库 云原生数据库PolarDB事件 云原生数据库PolarDB事件类型包括实例主备切换(故障切换)、实例故障结束和实例故障开始等。云原生分布式数据库事件 云原生分布式数据库事件类型包括阿里云平台对资源执行的操作事件、API调用和控制台的...

应用场景

LDC 单元化(异地多活)LDC 单元化架构是可以实现异地多活和高并发场景的架构体系,LDC(Logic Data Center)逻辑数据中心是对于传统的 IDC(Internet Data Center)提出的。逻辑数据中心所表达的中心思想是无论物理结构如何的分布,整个...

DescribeWebLockExclusiveFileType-查询排除文件类型

查询排除文件类型。调试 您可以在OpenAPI Explorer中直接运行该接口,免去您计算签名的困扰。运行成功后,OpenAPI Explorer可以自动生成SDK代码示例。调试 授权信息 下表是API对应的授权信息,可以在RAM权限策略语句的 Action 元素中使用,...

如何管理故障

更新故障通知:在故障处理的过程中,当故障进展发生变化,包括进度更新、影响恶化、故障等级变化、原因明确、根因定位等场景下,可更新故障过程中的内容,并在 故障详情 页点击更新故障通知,选择需要的故障通告类型,并最终确认发出故障...

故障协同处理(基于钉钉)

2.故障应急场景群:事件升级故障后,群内推出 故障处理中 消息卡片,如果满足自动生成故障场景群的需求(下文详细介绍创建故障场景群逻辑),故障场景群内同时推出 故障处理中 消息卡片。本群故障消息卡片包含按钮:签到、签到记录、应急...

DescribeExcludeSystemPath-查询防勒索系统排除目录

查询防勒索系统排除目录。调试 您可以在OpenAPI Explorer中直接运行该接口,免去您计算签名的困扰。运行成功后,OpenAPI Explorer可以自动生成SDK代码示例。调试 授权信息 下表是API对应的授权信息,可以在RAM权限策略语句的 Action 元素中...

故障应急协同

故障通告及更新 基于7x24监控值班工作特性,对于业务异常达到故障等级时,以用户定制的(语音、短信、IM)的方式在约定时间内将故障影响信息以及处理进展通知给对应的接收人/组,并持续更新直至故障结束。故障应急协同群 故障发生后,可以...

故障排查

本文介绍微服务引擎MSE在使用过程中常见问题的故障分析和排查流程。微服务注册配置中心问题排查 在浏览器中输入 XXX:8848/nacos,访问MSE的Nacos注册中心时返回404错误。具体操作,请参见 通过“XXX:8848/nacos”访问MSE的Nacos注册中心时...

什么是故障

本文主要介绍什么是故障。定义 在日常运营中,无论什么原因导致业务服务中断、服务品质下降或用户服务体验下降的现象,称为故障,但不包括用户侧环境或用户自身操作引起的问题。“用户体验下降”说明故障的核心要关注用户感受,可通过客服...

故障应急

故障管理体系是围绕故障全生命周期采取的一系列控制流程,包括故障基础数据管理(故障等级定义、应急场景监控覆盖、服务组&值班表管理、故障订阅管理),故障发现(7*24监控值班、智能基线告警),故障应急协同(故障通告及更新、故障应急...

故障注入

您可以通过故障注入功能向测试应用注入故障,检测应用面对异常时的处理情况。您可以根据检测的情况调整您的应用,以减少应用在正式使用时出现的异常问题。多用于测试环境。配置故障注入规则 登录 SOFAStack 控制台。在左侧菜单栏选择 ...

故障注入

您可以通过故障注入功能向测试应用注入故障,检测应用面对异常时的处理情况。您可以根据检测的情况调整您的应用,以减少应用在正式使用时出现的异常问题。多用于测试环境。功能简介 故障注入流程如下所示:在微服务中,其实现方式为:管控...

故障演练

故障演练就是这个背景下诞生的,沉淀通用的故障场景,以可控成本在线上故障重放,以持续性的演练和回归方式的运营来暴露问题,不断验证和推动系统、工具、流程、人员能力的提升,从而提前发现并修复可避免的重大问题,或通过验证故障发现...

故障基础数据管理

故障场景等级定义 日常运营中,除用户方环境或自身操作引起的问题外,无论什么原因导致的服务中断、服务品质下降或用户服务体验下降的现象,都称为故障。对故障影响程度的划分就是故障等级定义。定义故障等级是为了指定故障等级定义作为各...

故障演练

高速通道故障演练功能是一种模拟故障场景的工具。例如,模拟在高速通道冗余链路中的一条链路发生故障时,网络流量会自动切换至其他冗余链路的场景。借助该工具,您可以测试和验证您与阿里云组建的混合云组网的可靠性。重要 故障演练会通过...

故障隔离

故障隔离是在服务实例出现故障时,实现实例级别的精细化摘流隔离,使故障影响范围更小,提高服务的可用性。添加故障隔离规则 登录 SOFAStack 控制台。在左侧菜单栏选择 中间件>微服务平台>服务网格>服务治理,然后单击 故障隔离 页签。单击...

API概览

API 描述 CreateProblem 故障升级 GetProblemImprovement 故障复盘改进详情 GetProblemPreview 获取故障通知预览 UpdateProblemImprovement 更新故障复盘改进详情 CancelProblem 取消故障 CreateProblemSubtotal 故障新增备注小计 ...

演练概述

基于阿里巴巴多年业务的真实线上故障库的积累,AHAS故障演练模块为您预定义了丰富的测试任务,检验应用的高可用能力。故障演练支持对部署在阿里云ECS实例、容器服务Kubernetes集群、K8s架构类应用、Java类应用进行故障演练。完整的故障演练...

故障演练

故障演练能力是ADP基于阿里云故障演练产品AHAS提供的一项能力,在线上集成环节即可对线下交付中常见的各类故障场景下产品编排的容错性、可靠性和可恢复性进行演练,保障编排稳定可靠。在进行故障演练之前,需要进行以下步骤:创建产品;...

步骤七:故障切换

保护组进入增量复制状态后,您就可以进行故障切换操作。本文介绍故障切换和恢复的基本操作。故障切换类型 数据同步后切换 该故障切换会先停止保护组中被保护的实例,并且等到所有被保护的实例停止后再进行最后一轮数据同步,等待数据同步...
共有190条 < 1 2 3 4 ... 190 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
数据库自治服务 应用高可用服务 负载均衡 云数据库 OceanBase 版 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用