如何管理事件

故障等级:设置当前需要升级的 故障等级 P1-P4。P1最高优,P4最低优;故障状态:处理中(升级时故障还在处理中),输入发现故障的时间、已恢复(升级时故障已恢复),输入故障生成的时间和故障恢复的时间;所属服务:升级故障所属的 服务;...

关于网络分析

APM 网络分析对客户端侧的网络请求情况进行检测、分析、诊断,帮助您快速查找和排除网络故障,提升网络性能,增大网络可用性价值。在网络监控指标分析中,APM 针对不同网关类型,提供网络请求响应时长、网络请求错误率、请求次数等网络监控...

实时分析链路数据

如果异常请求分散在多台机器,那么大概率可以排除单机故障因素,可以重点分析下游依赖服务或程序逻辑是否异常。在 调用链分析 页面筛选错误调用或慢调用,并设置按IP进行分组统计,如果异常调用集中出现在特定机器,则有较大概率是机器故障...

故障复盘

故障复盘规范 故障复盘作为故障体系中的重要一环,整体复盘流程包括故障处理过程、改进分析、故障定责,基于包含标准化的复盘SOP、对应预防action推荐、问责管理机制,全面地回溯线上故障的发生,产出故障复盘报告和改进措施,避免故障重复...

如何管理故障

故障等级更新:当故障处理过程中或事后复盘,发现故障的影响程度发生变化,在 故障详情 页可以进行故障等级调整如故障升级或故障降级(P1-P4);变更所属服务:当故障处理过程中或事后复盘,发现故障影响的服务发生变化,在 故障详情 页更...

Hive巡检项及服务关键指标说明

异常等级说明 P0级异常:非常严重,表示服务已经不可用,必须马上排除问题。P1级异常:较严重,表示服务当前可用,但可能性能较低或者压力较大,也必须马上排除问题。HiveServer相关巡检项 HiveServer可用性巡检项(inspection_hive_server...

目标规则(Destination Rule)CRD说明

consecutiveLocalOriginFailures UInt32Value 否 触发排除需要的连续本地故障数。默认为5。该字段仅在 splitExternalLocalOriginErrors 设置为true时生效。consecutiveGatewayErrors UInt32Value 否 将主机排除出连接池需要的网关错误数。...

错误码

常见 PolarDB-X 数据节点连接失败的原因如下:后端数据节点连接数已满 计算节点到数据节点的连接超时 数据节点拒绝连接 如果排除后端数据节点问题后仍然出现该错误,请联系技术支持。PXC-4103 ERR_ATOM_CONNECTION_POOL_FULL 描述:PolarDB...

ModifyBackupPolicy-修改防勒索策略

例 1:I|1583216092|P21D 表示执行开始时间为 2020-03-03 14:14:52,执行间隔时间为 3 周。例 2:I|1583216092|PT24H 表示执行开始时间为 2020-03-03 14:14:52,执行间隔时间为 24 小时。Retention:备份数据保留时间,单位:天。7 表示 1 ...

ECI Pod Annotation

指定或排除ECS规格族创建Pod k8s.aliyun.com/eci-instance-generation "6,5"指定vCPU和内存创建ECI实例时,支持指定或排除ECS规格代数。指定或排除ECS规格代数创建Pod k8s.aliyun.com/eci-spot-strategy SpotAsPriceGo 抢占式实例的出价...

CreateBackupPolicy-创建勒索病毒防护策略

设置示例如下:例 1:I|1583216092|P21D 表示数据备份开始时间为 2020-03-03 14:14:52,备份策略执行间隔为 3 周。例 2:I|1583216092|PT24H 表示数据备份开始时间为 2020-03-03 14:14:52,备份策略执行间隔为 24 小时。Retention:设置...

ECI Pod Annotation

指定或排除ECS规格族创建Pod k8s.aliyun.com/eci-instance-generation "6,5"指定vCPU和内存创建ECI实例时,支持指定或排除ECS规格代数。指定或排除ECS规格代数创建Pod k8s.aliyun.com/eci-spot-strategy SpotAsPriceGo 抢占式实例的出价...

快速体验ADP

预估产品在部署后的可靠性,及早发现并排除交付隐患 利用1台或多台服务器,一键搭建稳定可靠的Kubernetes集群,并部署运行自己的业务应用 通过本地运维控制台,对部署完成的产品进行可视化的监控、配置告警通知、故障分析诊断等运维管理 2....

QueryIncidentIconList-获取溯源图标列表

}#end#if($p_procname),{"name"quot;{sas.trace2.property.procname}"quot;value"quot;{p_procname}"}#end#if($p_proc_path),{"name"quot;{sas.trace2.property.proc_path}"quot;value"quot;...

Postgres CDC(公测中)

Postgres CDC字段类型 Flink字段类型 SMALLINT SMALLINT INT2 SMALLSERIAL SERIAL2 INTEGER INT SERIAL BIGINT BIGINT BIGSERIAL REAL FLOAT FLOAT4 FLOAT8 DOUBLE DOUBLE PRECISION NUMERIC(p,s)DECIMAL(p,s)DECIMAL(p,s)BOOLEAN BOOLEAN ...

日志说明

SOFATracer 支持 Spring MVC、标准 JDBC 接口实现的数据库连接池(DBCP、Druid、c3p0、tomcat、HikariCP、BoneCP)、HttpClient、Dubbo、Spring Cloud OpenFeign 等开源组件。组件埋点接入后,即可查看相关 Tracer 日志。本文将介绍如下几...

网站被劫持问题概述

DNS解析一般都与DNS有关,如果有这类故障,请先排除本地绑定hosts的情况后,再收集出口DNS信息和被劫持的IP地址。如下所示,异常的DNS解析没有经过阿里云CNAME解析,即被劫持到2个IP地址。您可以通过使用阿里云的 HTTPDNS,防止被劫持。...

设备无法连接SSID

问题症状 无线终端连接SSID,显示未连接,无法关联SSID。解决方案 检查AP配置中的最大连接数,最大可设置为128.2.DHCP不在AP上要检查一下地址池的使用情况,检查可用地址是否够用。3.更换新的AP,排除是否是AP故障。适用于 云AP

运维服务内容说明

重大故障处理,原则上只针对P1级别的故障给出《故障处理报告》,其他情况由客户和运维服务专家协商是否输出。原则上阿里云不负责非阿里云平台(如第三方软件、应用系统)的运维支持工作。因客户自身原因导致的问题故障,不属于阿里云运维...

配置同城双活模式

排除不需要自动寻址的 DataSoure。有些数据源需要直连数据库或者类似 spring 的 AbstractRoutingDataSource-><bean id="dbpDiscovery" class="com.alipay.sofa.dbp.discovery.DbpDiscovery"><property name="excludeDataSources"><list>...

通知订阅详情

problemNotifyType String PROBLEM_NOTIFY 故障通知类型 level String P1 等级 action String INCIDENT_TRIGGER 时间动作 periodChannel Object 分时间段渠道 workday String DINGDING 工作时间 nonWorkday String DINGDING 非工作时间 ...

网络类场景

排除端口 无需注入网络延迟调用故障的端口,与本地服务端口和远程服务端口功能互斥。可以指定多个,使用逗号分隔,使用连接符表示范围。例如80,8000-8080。远端服务IP 指定演练对象访问的远端服务IP。可以通过子网掩码来指定一个网段的IP...

创建通知订阅

json格式,包含多个条件,比如级别、影响程度 kv格式 conditions Array Body 否 通知策略条件 effection String Body 否 HIGH 影响范围 problemNotifyType String Body 否 PROBLEM_UPDATE 故障通知类型 level String Body 否 P1 等级 ...

无法连接Windows实例

故障现象 无法ping通ECS实例,在排除Iptables和网卡IP配置问题且回滚系统后,仍然无法ping通。故障原因 可能是ECS实例安全组默认的公网规则被删除。解决方法 重新配置ECS实例的安全组公网规则,具体操作请参见 ECS实例安全组默认的公网规则...

GetDeviceAppUpdateFunnelEvents

F411-499F-BCE2-67CA563CB064</RequestId><EventList><TotalCount>25</TotalCount><Items><TenantId>P0VFCREU</TenantId><DeviceId>AS23DG23SA5D43GA34SD23GW456E</DeviceId><TargetVersionCode>2005680</TargetVersionCode><PackageName>...

GetDeviceSystemUpdateFunnelEvents

BCE2-67CA563CB064</RequestId><EventList><TotalCount>25</TotalCount><Items><TenantId>P0VFCREU</TenantId><DeviceId>AS23DG23SA5D43GA34SD23GW456E</DeviceId><TargetVersion>2.0.1-R-20180412.0824</TargetVersion><Event>os_download...

如何配置通知订阅

选择 事件通知 订阅:支持选择 P1、P2、P3、P4 优先级,影响程度 高、低 的选择条件;最多8个条件。选择 故障通知 订阅:和 事件 条件一致。通知渠道:通知渠道 根据 通知对象 类型做区分。当 通知对象 类型为 个人 时,通知渠道 可选范围...

对话结果支持参考图片最佳实践

详情如下:文档标题以及标签中的内容会参与图片的搜索 标签:<h1></h1>,<h2></h2>,<h3></h3>,<h4></h4>,<h5></h5>url示例:<h2>Alibaba travel front-end technology past and present</h2><br/><p><img src="http://gw.alicdn....

电源故障定位

您可以参考以下方法定位电源故障并进行处理流程。诊断流程 电源故障详细处理流程,如下图所示。处理步骤 测量输入电压。使用万用表测量输入电压,根据电源适配器的工作电压范围判断输入电压是否异常。插拔电源适配器。把电源适配器以及电源...

更新通知订阅

INCIDENT 订阅实例类型,事件、报警、故障 strategies Array Body 是 通知策略 id String Body 否 10 报警等级 channels String Body 否 SMS,WEIXIN_GROUP 故障等级 conditions Array Body 否 影响程度 level String Body 否 P1 等级 ...

CreateExperiment

调用CreateExperiment接口新建一个故障演练。调试 您可以在OpenAPI Explorer中直接运行该接口,免去您计算签名的困扰。运行成功后,OpenAPI Explorer可以自动生成SDK代码示例。请求参数 名称 类型 是否必选 示例值 描述 Action String 是 ...

背景信息以及准备工作

west-1a vpc-rj98sujw7ms8kkpdv9hak vsw-rj9o2vqz0xjbj9cmjqeiv 中国(香港)cn-hongkong-b vpc-j6cotfjiboiskto4htqga vsw-j6cv4uyb6qybxnpjzph2p 德国(法兰克福)eu-central-1b vpc-gw8mxe263blkfaurn81ej vsw-gw8j7409kagfk3rdjwdak ...

设计方案

容错 容错是指在分布式系统中,系统出现故障时,通过设计和实现可靠的机制和策略,使系统能够自动检测、排除或者纠正错误,保证系统能够正常运行,从而提高系统的可靠性和稳定性。容量 容量是在一定时间内,系统能够处理的最大工作量或数据...

什么是事件

事件分级:事件支持根据其影响面和重要程度可以设置为P1~P4层级的优先级和高低的事件影响程度,最终实现事件分级处理,关键事件优先响应、完结;全生命周期动态记录:事件全生命周期的变更动态记录,支持查看事件流转每个过程,即时定位...

配置DDoS高防后访问网站提示502错误

网络出现拥塞或抖动 在已经排除以上两种原因后,偶发的局部网络抖动、运营商线路故障等因素,也可能导致502错误。相关文档 常见问题概览 配置DDoS高防后访问网站提示504错误 适用于 DDoS高防 如果您的问题仍未解决,您可以在阿里云社区 ...

PageableQueryUserExperiment

故障演练标签 MiniApps Array of String cpu 故障演练有关的小程序 Name String 演练名称 故障演练名称 Creator String 1XXXXXXXXXX 演练创建人UserID HttpStatusCode Integer 200 HTTP状态码 Code String P_ERROR_*接口请求反馈编码 ...

演练场景

故障演练是业务系统上线前必要的演练环节,旨在对应急预案的可行性,进一步完成应急预案,从而帮助提升产品、集群、机房的稳定性,减少故障的发生,提高故障应急效率,进而提升产品竞争力。一个完整的故障演练过程为 创建故障原子服务>创建...

边缘应用 Link IoT Edge对接

[#数组,包含所有网关下的子设备 {"gwProductKey":"a1PQ9828qvr",#网关的 productkey"gwDeviceName":"yinlong_gw_dev1",#网关的 devicename"code":0,"message":"success","deviceList":[#设备列表 {"productKey":"a1KRepmC2XJ",#设备的 ...

故障排查

Service无法正常工作 在排除网络插件自身的问题外,最可能的是 label 配置有问题,您可以通过查看 endpoints 进行故障排查。具体操作,请参见 检查Service。如何升级集群?升级集群的Kubernetes版本,具体操作,请参见 手动升级ACK集群。从...

逻辑备份PostgreSQL数据

pg_dump-h '<hostname>'-U<username>-p<port>-Fc<dbname>>参数 说明 hostname RDS PostgreSQL实例连接地址。说明 ECS实例通过 内网连接地址 访问RDS实例,需要两者网络类型相同(如果是专有网络,VPC也要相同)。本地主机或ECS实例通过 外...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
数据库自治服务 负载均衡 应用高可用服务 云数据库 OceanBase 版 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用