AccessGatewayFailover

告警信息 事件名称 事件级别 状态码 状态描述 AccessGatewayFailover INFO agwfailover Access Gateway Failover 可能原因 IPsec链路网络故障处理方法 无需处理。icmsDocProps={'productMethod':'created','language':'zh-CN',};

ConnectionDisconnect

告警信息 事件名称 事件级别 状态码 状态描述 ConnectionDisconnect CRITICAL disconnect Connection Disconnected 可能原因 主备IPsec链路均出现网络故障处理方法 检查用户侧运营商网络接入是否正常。icmsDocProps={'productMethod':'...

故障应急协同

故障应急协同群 故障发生后,可以基于钉钉的沟通协同能力和API,自动创建故障处理应急协同场景群。将故障相关成员直接拉进处理群,相关成员包括故障受影响业务的“应急接口人”、可疑原因业务的“应急接口人”,并且系统自动电话通知。进群...

产品优势

提高开源组织版本管理效率,快速支持业务创新 更多开源软件支持 更高软件版本支持 覆盖从边缘到AI全场景 企业级的服务支持,降低运维成本,缩短故障处理时间 来自阿里云和Cloudera的7*24小时大数据专家服务支持 快速定位使用中遇到的问题,...

如何管理故障

故障过程 故障过程用于记录管理故障处理的全过程。当故障处于处理中/已恢复状态时,故障详情默认进入故障过程tab页;可以对故障的最新进展、故障影响面(影响服务)、舆情反馈、Timeline时间线进行在线化管理、编辑,并同步更新通告及故障...

设置Pod故障处理策略

如果您希望尽快得到创建结果以便及时处理故障,可以修改Pod故障处理策略。配置说明 在虚拟节点上创建ECI Pod时,可能会因为库存不足等原因导致Pod创建失败,默认情况下,系统会自动进行重调度,尝试重新创建Pod。您可以通过添加 k8s.aliyun...

故障协同处理(基于钉钉)

2.故障应急场景群:事件升级故障后,群内推出 故障处理中 消息卡片,如果满足自动生成故障场景群的需求(下文详细介绍创建故障场景群逻辑),故障场景群内同时推出 故障处理中 消息卡片。本群故障消息卡片包含按钮:签到、签到记录、应急...

上传插件

插件执行顺序由插件执行阶段和插件执行优先级两个参数共同决定,对请求和应答的处理顺序如下图所示:在平台提供插件的详情中,可以看到执行阶段和执行优先级的信息,如果希望在特定平台插件执行前后插入自定义插件,可以配置自定义插件的...

演练场景说明

网络故障是系统运行过程中时常遇到的问题,所以需要提升系统在网络异常情况下的容错能力。Java 场景名称 特性 虚拟机场景 故障演练支持的虚拟机场景。代码逻辑场景 故障演练支持的代码逻辑场景。JVM注入动态脚本 向指定的Java方法注入一段...

替换主机

当主机发生故障后,如果您创建 专属集群MyBase 时 主机故障处理策略 选择的是 手动替换主机,则您可以通过手动替换主机来解除故障。前提条件 专属集群MyBase 引擎的为MySQL,且主机存储类型为本地SSD盘。背景信息 当主机发生故障时,系统会...

RAM子账号授权

AliyunGEMPReadOnlyAccess」-只读管理运维事件中心的权限:适用于事件、故障处理流转等人员,如运营、测试、产品、管理等角色人员;AliyunGEMPCoordinatorAccess」-具备运维事件中心的事件和故障协同功能权限,拥有其它模块的只读权限,如...

替换主机

当主机发生故障后,如果您创建 专属集群MyBase 时 主机故障处理策略 选择的是 手动替换主机,则您可以通过手动替换主机来解除故障。前提条件 专属集群MyBase 引擎的为MySQL,且主机存储类型为本地SSD盘。背景信息 当主机发生故障时,系统会...

重启设备

网络故障时,重启设备可消除部分软件故障。背景信息 重启设备一般有两种方法:通过关闭或打开设备电源进行重启。通过智能接入网关控制台,远程重启设备。关闭或打开设备电源 警告 您通过关闭或打开设备电源进行重启时,请注意保存设备的...

管道

管道是一种可以实现多种处理任务顺序...处理顺序:先对图片执行Action1操作,再执行Action2操作。先对图片做文字水印,水印内容是:“Hello,图片服务!水印位置在右下角,然后再对图片做图片水印,水印object是panda.png,水印位置在中间。...

故障发现

故障处理过程需要人工组织跟进;故障应急争分夺秒,Oncall时效难以保障。7*24监控值班的主要考核指标有:通告及时率、通告准确率、快恢执行率。智能基线告警 智能基线告警是一套集成了统计学方法与机器学习算法,自动学习指标数据的历史...

实例的节点故障处理机制

本文档介绍云数据库MongoDB版实例的节点故障处理机制。单节点实例 由于单节点实例架构的特殊性,单节点实例仅拥有一个节点。当节点发生故障后,系统会对故障节点进行检查与修复。节点故障期间实例的相关服务不可用。说明 单节点实例适用于...

更新插件版本

插件执行阶段 阶段处理顺序:认证阶段>鉴权阶段>统计阶段>默认阶段。若不依赖其他插件执行顺序,填默认阶段即可。插件执行优先级 控制执行阶段内的优先级,数字越大优先级越高。若不依赖其他插件执行顺序,用默认值即可;若需定制,建议填...

应用场景

故障跟踪:支持对故障进展、故障影响面、舆情反馈、Timeline进行在线化管理、协同,提升故障处理效率。故障复盘:基于最佳实践经验,沉淀了对故障进行深度复盘的结构化要求,形成了线上检查点,以产品的方式承载流程落地。故障改进:支持对...

CLB访问日志功能简介

在使用CLB的七层负载均衡(HTTP/HTTPS监听)期间,如果您需要通过负载均衡日志进行业务开发测试、故障处理、客户端用户行为数据分析等,您可使用CLB访问日志功能分析负载均衡日志。CLB结合阿里云日志服务提供的访问日志功能,可帮助您大幅...

故障基础数据管理

在设计相应的管理方案时,需要考虑以下内容:服务组:提供服务的人员群体,服务包括故障处理,工单处理等 值班表:可以对服务组成员进行排班,让故障应急工作更有计划性、不易遗漏 升级组:服务组的一种,通过服务组和升级组,可表达组与组...

关于网络分析

APM 网络分析对客户端侧的网络请求情况进行检测、分析、诊断,帮助您快速查找和排除网络故障,提升网络性能,增大网络可用性价值。在网络监控指标分析中,APM 针对不同网关类型,提供网络请求响应时长、网络请求错误率、请求次数等网络监控...

使用云监控功能监控网站环境(部署于ECS实例)

同时,告警机制能让您在故障发生后第一时间发现问题,缩短故障处理时间,以便尽快恢复业务。前提条件 在开始设置云监控前,您需要完成以下操作:检查ECS监控插件运行情况,确保监控信息能够正常采集。如果安装失败则需要手动安装插件,具体...

应用故障自动诊断

网络问题 机房发生网络故障导致应用运行异常。查看故障自动诊断报告 登录 EDAS控制台。在左侧导航栏,单击 应用管理>应用列表,在顶部菜单栏选择地域并在页面上方选择 所属微服务空间,在 集群类型 下拉列表,选择 K8s集群,然后在页面单击...

事务中心

事务备注:对本条事务的描述 优先级:根据事务紧急程度选择优先级,方便处理人确认处理顺序 指派处理人:可以选择部门或者个人,支持关键字搜索 期望解决时间:也是给与事务处理人判断事务处理顺序的依据 更多内容:自定义字段信息,根据...

安全体系概述

流日志 专有网络VPC提供流日志功能,可以记录VPC网络中弹性网卡ENI(Elastic Network Interface)传入和传出的流量信息,帮助您检查访问控制规则、监控网络流量和排查网络故障。详细信息,请参见 流日志概述。流量镜像 VPC流量镜像功能可以...

功能发布记录

故障处理联动能力补全。9.新增故障协同处理、故障应急场景群创建和使用。10.新增事件协同处理-相似事件模块。11.事件和故障的消息卡片支持@关联人员。12.PC端移动应用开通模块支持展示钉应用(维蜜)的开通状态。13.PC端主RAM和子RAM账号...

流日志概述

专有网络VPC(Virtual Private Cloud)提供流日志功能,可以记录VPC网络中弹性网卡ENI(Elastic Network Interface)传入和传出的流量信息,帮助您检查访问控制规则、监控网络流量和排查网络故障。功能发布及地域支持情况 首次使用流日志...

故障演练

一年左右一次的生产突袭演练,一般由CTO操作注入,验证从监控感知发现->报警快速响应->高效组织应急->定位排查止损的全链路故障处理流程。仿真环境(常态引流1%线上流量的全链路灰度环境,或者新业务建设环境)做高频的模拟演练:各业务...

支持计划

业务不可用分钟(包含专项应急小组会诊)一般问题小时一般咨询小时 7×24小时专属企业钉钉群快速响应,提供业务咨询、自动预警、故障处理等服务,并可由多位专家进行疑难应急会诊案例严重性的响应时间:业务不可用分钟(包含专项应急小组...

服务等级目标SLO概述

设置短时间窗口可以保障故障处理后,及时解除告警。以设置30天的SLO为例:当1小时内错误预算消耗2%(即该小时内错误率高于阈值的14.4倍)或6小时内消耗5%(阈值的6倍)时,会触发一个Page级别的告警;1天内错误预算消耗10%(阈值的3倍)或3...

服务等级目标SLO概述

设置短时间窗口可以保障故障处理后,及时解除告警。以设置30天的SLO为例:当1小时内错误预算消耗2%(即该小时内错误率高于阈值的14.4倍)或6小时内消耗5%(阈值的6倍)时,会触发一个Page级别的告警;1天内错误预算消耗10%(阈值的3倍)或3...

基本概念

流日志 专有网络VPC提供流日志功能,可以捕获VPC网络中弹性网卡ENI(Elastic Network Interface)的传入和传出流量信息,帮助您检查访问控制规则、监控网络流量和排查网络故障。流量镜像 专有网络VPC流量镜像功能可以镜像经过ENI且符合筛选...

创建和管理流日志

流日志功能可以捕获VPC中弹性网卡ENI(Elastic Network Interface)传入和传出的流量信息,您可以通过分析流日志捕获的流量信息检查VPC下的访问控制规则、排查网络故障以及监控异常流量。本文介绍如何创建和管理流日志。前提条件 在创建流...

消费者分类

顺序性保障 基于 云消息队列 RocketMQ 版 顺序消息 的定义,SimpleConsumer在处理顺序消息时,会按照消息存储的先后顺序获取消息。即需要保持顺序的一组消息中,如果前面的消息未处理完成,则无法获取到后面的消息。适用场景 ...

新功能发布记录

创建和管理交换机 流日志 新增 专有网络VPC提供流日志功能,可以记录VPC网络中弹性网卡ENI(Elastic Network Interface)传入和传出的流量信息,帮助您检查访问控制规则、监控网络流量和排查网络故障。流日志概述 流日志计费说明 创建和...

EMR Kafka磁盘故障运维

此方案的优点在于不需要等待故障磁盘下线、维修、上线周期,故障处理周期短。适用场景 适合单个Broker只有一块数据盘的场景。如果Broker上数据较少、恢复速度较快、集群负载较低,您也可以选择此方式来进行故障节点的运维。说明 如果坏盘为...

顺序消息

顺序消息生命周期 初始化 消息被生产者构建并完成初始化,待发送到服务端的状态。待消费 消息被发送到服务端,对消费者可见,等待消费者消费的状态。消费中 消息被消费者获取,并按照消费者本地的业务逻辑进行处理的过程。此时服务端会等待...

常见重大封网时段公告

封网期间影响如下:封网期间禁止出入机房,只处理重启服务器和网络紧急故障,不再进行诸如路由策略,带宽流量调配,业务割接等涉及电路,数据调整等操作。封网期间机房不办理外部人员进出手续。说明 封网属于不可抗力或不可控因素,该时段...

查看应用分组

通过应用分组集中管理资源,便于您及时接收故障资源的报警通知,并及时处理故障。操作步骤 登录 云监控控制台。在左侧导航栏,选择 云资源监控>应用分组。在 应用分组 页签,单击目标应用分组名称链接。在 组概览 页面,您可以查看目标应用...

概览

自定义监控为您提供了自定义监控项和报警规则的功能,您可以通过上报监控数据接口,将自己关心的业务指标上报至云监控,并在云监控上添加监控图表和设置报警规则,对于故障指标发送报警通知,便于您及时处理故障,保障业务的正常运行。...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
NAT网关 共享流量包 弹性公网IP 负载均衡 短信服务 人工智能平台 PAI
新人特惠 爆款特惠 最新活动 免费试用