故障演练常见问题

关于故障演练计费的常见问题 什么是故障规则下发次数?一次故障注入即为一次故障规则下发。例如:对 10 台 ECS 注入 CPU 满载和磁盘填充两种故障,则故障注入次数为 10(ECS数)×2(故障场景数)=20次,那么故障规则下发次数即为 20 次。...

应用防护规则常见问题

本文列举了应用防护规则常见的问题。请求链路页面添加规则是给单台机器添加还是给所有机器都添加?添加规则会推送到所有机器。流控规则中的来源应用是什么意思?Sentinel支持按调用来源限流。流控规则中来源应用(针对应用)指的是调用该...

高性能版实例

以下内容为 AnalyticDB PostgreSQL版 实例常见故障场景中高性能版和高可用版的对比:恢复(Recovery)模式 根据以往 AnalyticDB PostgreSQL版 运行情况,故障最大的场景为恢复模式,故障概率远大于另外两种场景(计算节点故障和计算节点宿...

主机规则管理

规则类型 适用场景 系统防御规则 常见恶意攻击行为防御 自动拦截常见恶意行为。支持通过停用系统防御规则或修改系统防御规则的生效服务器为您的资产定制防御规则,最大程度减少告警误报。安全告警事件误报处理 在处理告警类型为 精准防御 ...

启用并设置事件告警

关于告警监控规则会遇到的问题,请参见 告警监控规则常见问题。关于告警通知渠道的相关问题,请参见 通知渠道常见问题。关于告警通知内容的相关问题,请参见 通知内容常见问题。当您未收到告警通知时,可以在告警历史区域排查原因。具体...

设置黑名单规则

当前支持通过以下三种方式配置黑名单规则:固定规则模式:在控制台设置的常见的黑名单规则模式,每一种规则可以设定对某个账号以及某个集群生效。当前支持的常见规则请参见 配置SQL防火墙规则。用户自定义SQL参数化模式:该模式支持将您在...

虚拟服务(Virtual Service)CRD说明

对于访问指定目标主机的流量,虚拟服务定义了一组流量路由规则,每个路由规则定义了特定的流量匹配条件。如果流量匹配,则将其转发到路由规则所指定的目标服务或者目标服务的版本(子集)。本文介绍虚拟服务CRD的配置示例和字段说明。配置...

故障隔离

搜索故障隔离规则 支持从两个维度模糊搜索:应用名称 规则名称 编辑故障隔离规则 您可以随时编辑已创建的故障隔离规则规则提交后实时生效。在 故障隔离 页签,单击目标故障隔离规则右侧的 编辑。按需求编辑故障隔离规则后,单击 提交。...

设置报警规则

云数据库ClickHouse 提供集群状态监控及报警功能,通过对重要的监控指标设置报警规则,让您及时得知指标数据发生异常,帮您迅速定位处理故障。背景信息 监控报警是通过 云监控 产品实现的。通过阿里云云监控,您可以设置监控项,在触发监控...

设置告警规则

云数据库 SelectDB 版 提供集群状态监控及报警功能,通过对重要的监控指标设置报警规则,让您及时得知指标数据发生异常,帮您迅速定位处理故障。背景信息 监控报警是通过 云监控 产品实现的。通过阿里云云监控,您可以设置监控项,在触发...

查看事件与监控信息

故障列表 故障列表显示当前应用分组正在报警的全部资源,如果正在报警的规则被禁用,则故障列表中不再显示被禁用规则故障信息。可用性监控 查看服务实例可用性的监控信息。组进程监控 查看组进行监控的进程ID、动态规则匹配和状态等信息...

诊断规则

通过故障诊断平台,运维人员可以将诊断过程、排查顺序进行图形化编排与设计,即故障诊断决策树。而后,在实际故障发生时,即可执行自动化、标准化的故障排查,并直接输出诊断报告,反馈诊断结果。故障诊断功能有效提升了故障排查效率,实现...

API概览

流控规则 流控规则相关的API如下表。API 描述 CreateFlowRule 调用CreateFlowRule接口创建流控规则。DeleteFlowRule 调用DeleteFlowRule接口删除流控规则。DisableFlowRule 调用DisableFlowRule接口关闭流控规则。EnableFlowRule 调用...

服务支持

NLP自然语言处理 常见问题 调用异常自助排查(错误码汇总)服务协议 NLP自学习平台 常见问题 实体抽取项目常见问题 故障排除 私有化部署 企业智能搜索 错误码对照表 常见问题

按量计费

(0-50]M/min 1.5元/小时(50-100]M/min 3元/小时(100-150]M/min 4.5元/小时 以此类推/流转规则故障应急)流转规则触发类型为启动故障应急时的费用,按此类型流转规则条数收费。3.5元/条/日/变更管理 自定义审批配置费用,按审批流条数收费...

监控报警概述

常见问题 配置了报警规则,但收不到报警怎么办?云电脑的部分数据指标依赖云监控Agent进行数据采集。云监控Agent在云电脑内默认为关闭状态,如发现数据指标缺失,可以按以下步骤开启云监控Agent:在云电脑中按快捷键 Win+R,然后在 运行 ...

故障注入

单击 添加注入 规则,然后配置以下参数:参数 说明 规则名称 设置故障注入规则的名称。最多不超过 255 个字符。应用 选择或填写目标应用的名称。星号(*)表示所有应用。注入方向 设置故障注入的方向,可选值为:服务端注入:在应用的服务...

故障注入

功能简介 故障注入流程如下所示:在微服务中,其实现方式为:管控台 MS 拼接故障注入规则,将其发送到 DRM。MOSN 和 RPC 客户端订阅 DRM 的 Key 值。配置故障注入规则 登录 SOFAStack 控制台。在左侧菜单栏选择 中间件>微服务平台>服务网格...

规则概述

数据库审计服务提供内置安全规则,该规则包含常见的数据库危险操作,并支持自定义安全规则。重要 数据库审计C100实例对各类规则生效的优先级为(从高到低):过滤规则、信任规则、安全规则。数据库审计触发规则匹配的流程如下,在产生审计...

执行演练

在执行故障演练过程中,您可以实时查看演练进度、每个演练活动的运行状态及结果,同时也能够随时结束演练,进行恢复阶段的活动,清除故障演练影响。背景信息 一次完整的故障演练包括以下四个...后续步骤 停止演练 常见问题 故障演练常见问题

应用故障自动诊断

常见故障自动诊断场景 RT突增 下游业务导致的本应用的RT突增,您可以联系下游业务的负责人进行排查。应用变更导致的RT突增,您可以查看此次变更的具体变更进行排查。应用的某个服务导致RT突增,可以排查以下情况:服务是否在此时有发生...

虚拟机场景

本文列出了虚拟机常见故障演练场景。JvmCodeCache满 制造JVM CodeCache区域满的故障,CodeCache区域满会直接导致JIT编译关闭,从而引起业务系统性能下降。一般用于验证业务系统在高并发且系统性能下降的情况下,是否能够通过限流、快速扩...

ListReminds

调用ListReminds获取或搜索自定义...Action=ListReminds&PageNumber=1&PageSize=10&Founder=9527952795*&NodeId=1234&RemindTypes=FINISHED,ERROR&AlertTarget=9527952795*&SearchText=模糊搜索规则名称&公共请求参数 正常返回示例 XML 格式 ...

添加安全组规则

常见问题 关于 协议类型 和 端口范围 的问题,请参见 常用端口 或者 安全组规则中协议和端口之间是什么关系?关于实例设置安全组后还是无法访问业务的问题,请参见 为什么我配置安全组后还是无法访问服务?关于无法访问80端口和TCP 25端口...

GTM如何实现异地容灾

概述 方案介绍 异地容灾是指应用服务部署在不同地域时,当其中一地出现故障时,全局流量管理(简称GTM)可以将出现故障地域的用户访问流量,调度至异地灾备中心,保障用户访问连续不间断。本文将以两地三中心灾备架构为读者讲解异地灾备的...

I-V曲线诊断

数据服务中提供光伏智能运维的IV曲线诊断算法,结合环境光强度、环境温度等影响因素,对组串式光伏发电阵列的电流-电压曲线(I-V曲线)进行分析,检测系统可能出现的故障,进而提高设备的运行效率,保障电站高效运行。本文介绍光伏智能运维...

故障演练

常见故障类型都可以映射到这个故障模型中,模拟故障的演练系统及方案也可以基于该模型进行设计。在设计演练方案的过程中,可以考虑在模型中每个环节进行故障注入,验证故障应急方案。不同演练类型和目标 根据演练过程对线上业务的影响,...

告警监控规则常见问题

本文介绍日志服务告警监控规则常见问题。使用RAM用户操作告警时,如何为RAM用户授权?当您使用RAM用户操作告警时,需要先授予RAM用户告警操作权限。具体操作,请参见 授予RAM用户告警操作权限。创建告警监控规则时,遇到Alert count ...

GTM如何实现同城容灾

概述 方案介绍 同城容灾指应用服务部署是多机房、单地域时,当其中一机房出现故障时,全局流量管理(简称GTM)可实现业务7*24小时稳定运行,即使单机房故障也不影响业务的可持续性,保障用户访问连续不间断。本文将以同城双活的灾备架构为...

GTM实现跨网访问加速与故障切换

概述 方案介绍 大部分企业的应用服务都会使用多个运营商的IP地址,因此可能会存在跨网延迟、丢包、故障不可用等问题,而全局流量管理产品方案可以根据用户请求源地址的运营商,解析就近的应用服务器IP地址,实现就近接入、访问加速、故障...

故障排查与常见问题

控制台访问集群异常问题排查 组件异常问题排查 ACK Serverless集群 故障排查 常见问题索引 集群类型 相关文档 托管版与专有版容器集群ACK 常见问题 ACK Serverless集群 常见问题 分布式云容器平台ACK One 常见问题 容器服务ACK发行版 常见...

功能特性

高可用管理平台 HAS 定位于 IT 技术...故障演练平台支持触发 CPU 利用率升高、内存利用率升高、内存占用、网络丢包、容器宕机、物理机宕机等常见故障,并针对故障制定出详细的演练和恢复计划,保证用户能够有计划地测量和观测应用高可用能力。

新手指引

模块问题 计费常见问题 数据库常见问题 流量统计常见问题 网站管理常见问题 管理控制台常见问题 网站耗资源(客户程序故障常见问题 更多常见问题,请参见 常见问题和故障排除汇总。反馈与建议 在使用阿里云云虚拟主机时,如果有任何疑问...

lifecycle(生命周期)

常见的生命周期规则如下:示例1 指定生命周期规则应用于examplebucket内的所有Object(即Prefix为空),在距其最后一次修改时间超过365天后全部删除;此外还指定了Prefix为test/,指示与前缀test/匹配的Object距其最后修改时间超过30天后...

ADP底座介绍

常见故障场景自动诊断:内置长期经验沉淀的运维知识库,自动识别常见故障问题,并提供故障处置建议。自动化巡检和告警通知:内置基础告警策略并可灵活配置,可对接多种告警通知方式,定期巡检,及时感知问题。业务数据的存储备份及还原:...

如何管理故障

当报警来源的指标持续恶化,触发故障产生规则,系统自动产生故障故障过程 故障过程用于记录管理故障处理的全过程。当故障处于处理中/已恢复状态时,故障详情默认进入故障过程tab页;可以对故障的最新进展、故障影响面(影响服务)、舆情...

故障演练

ADP提供基于线下交付经验设计的丰富故障演练场景,对基础设施、底座、中间件的常见故障场景进行覆盖,涵盖了集群级别的大规模故障以及节点、pod级别的资源故障。部分演练场景为破坏性场景(如机器重启、网卡损坏),可能导致环境状态异常、...

使用Prometheus配置报警规则的最佳实践

索引 配置Prometheus报警规则 在阿里云Prometheus监控自定义PromQL配置报警规则 在开源Prometheus监控自定义PromQL配置报警规则 报警规则说明 配置Prometheus报警规则 在阿里云Prometheus监控自定义PromQL配置报警规则 在阿里云Prometheus...

微服务引擎MSE的审计事件

CreateFaultInjectionRule 创建故障注入规则。CreateGovernanceKubernetesCluster 注册已接入服务治理的集群信息。CreateMseServiceApplication 创建应用。CreateNacosConfig 创建Nacos配置。CreateNacosInstance 创建Nacos实例。...

查看指定报警规则的报警历史

您可以查看指定报警规则中的所有故障资源的报警详情和报警图表,及时定位并处理资源故障。操作步骤 登录 云监控控制台。在左侧导航栏,选择 报警服务>报警规则。在 报警规则列表 页面,单击目标报警规则对应 操作 列的 报警历史。您可以...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
NAT网关 物联网平台 数据库自治服务 负载均衡 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用