配置自动重试规则

当您的系统遇到一些非致命性的错误(如偶现的超时等)时,可以通过重试的方式来避免系统最终失败。AHAS的自动重试规则可以在客户端的部分场景下为系统提供自动重试的...黑名单异常 新增成功的自动重试规则会出现在 自动重试规则 页签中。

异地应用双活切流

选择 故障单元,代表此时,该单元当前出现故障,无法承接流量,MSHA自动将该单元的流量置0,将另一个单元置为100。b.单击 下一步,进入 容灾切换预览,在预览页,可以看到单元前后比例的对比,和 当前切流服务,如果和您预期不符,请返回...

同城多活切流

选择 故障单元格,代表此时,该单元格当前出现故障,无法承接流量,MSHA自动将该单元格的流量置0,将另一个单元格置为100。b.单击 下一步,进入 容灾切换预览,在预览页,可以看到单元格前后比例的对比,和 当前切流服务,如果和您预期...

在DMS中执行SQL语句后出现“禁止未知SQL执行”报错

问题描述 在使用DMS控制台时,执行SQL语句后,执行结果出现以下报错。自定义安全规则:禁止未知SQL执行 问题原因 DMS控制台的安全规则中,默认未配置相关SQL语句允许执行,因此执行相关SQL语句时,被拒绝执行。解决方案 阿里云提醒您:...

强弱依赖治理概述

如果商品详情页对下游依赖是强依赖,例如当下游依赖 库存、优惠、物流 出现故障的时候,将导致业务流程无法推进,会出现类似如下的说明,严重影响用户体验。如果商品详情页对下游依赖是弱依赖,例如当下游依赖 评价、店铺 等系统出现故障的...

事件中心

该视图可以帮助您在应用出现故障时,快速排查关联的资源各自发生了什么问题。例如在大型企业中,由于某个员工的误操作,重启了生产环境的RDS,导致线上业务故障,利用该视图,可以快速的发现应用访问的RDS出现了重启操作。订阅规则 订阅...

异地双活切流

此过程中,业务系统中依赖的MSHA-SDK开启数据库禁写控制,以此进行单元保护,避免更新规则推送到业务系统的时间不一致、机器时钟不一致,导致各机器规则生效时间不一致出现的数据脏写问题。各层切流。同时进行接入层和数据层切流。接入层...

安全FAQ

本文汇总了云服务器ECS安全方面的常见问题,涵盖了安全组配置、安全组规则设定、主机处罚与解禁流程、资源限额管理等问题。安全组问题 什么是安全组?为什么要在创建ECS实例时选择安全组?创建ECS实例前,未创建安全组怎么办?为什么ECS...

推广规则是固定不变的吗?

推广规则每月微调,一般每月底公布次月规则,请关注见云大使页面“主页-最新动态”或“个人中心-任务与奖励”,或开发者社区的云大使官方专栏号。查看当月规则

如何管理事件

故障状态:处理中(升级时故障还在处理中),输入发现故障的时间、已恢复(升级时故障已恢复),输入故障生成的时间和故障恢复的时间;所属服务:升级故障所属的 服务;影响服务:选择 影响服务(可多选);进展摘要:处理人将事件升级为...

页面优化

在某些特殊情况下,开启页面优化功能,改写网站页面中的HTML文件、CSS文件、JS文件可能会影响到网站的业务逻辑,客户端访问改写以后的网站页面可能会出现类似 Hydration completed but contains mismatches.这样的报错,通过关闭页面优化...

查看并管理整改流程

重新校验:仅待处理、已忽略可重新校验,发起重新校验后,如果数据质量问题已经处理,可以重新执行校验规则按照执行后的校验状态修改治理项状态:校验不通过-未处理,校验通过-已处理。关联知识库文档:规则关联知识后,可在质量规则和...

查看并管理整改流程

重新校验:仅待处理、已忽略可重新校验,发起重新校验后,如果数据质量问题已经处理,可以重新执行校验规则按照执行后的校验状态修改治理项状态:校验不通过-未处理,校验通过-已处理。关联知识库文档:规则关联知识后,可在质量规则和...

ARMS告警精细管理最佳实践

大规模系统告警管理的痛点 复杂系统中,告警规则的配置非常多且繁琐。如何保证告警规则的覆盖率,高效地配置告警规则?在复杂的组织架构中,如何快速将告警发送到正确的处理人?如何确保告警在需要人处理时,接手的时效性?如何应对告警...

网站耗资源(客户程序故障)常见问题

什么会出现网站耗资源(客户程序故障)?常见的造成网站耗资源(客户程序故障)现象的原因如下所示:网站程序编写不合理,例如ASP程序变量没有清空。网站数据库调用频繁,例如当ACCESS数据库的容量比较大时(超过100 MB以上),性能可能...

Prometheus告警规则模板

Prometheus告警规则模板的主要功能 创建Prometheus告警规则模板 编辑Prometheus告警规则模板 应用模板 Prometheus实例选择模式 标签控制器模式 删除Prometheus告警规则模板 查看通过模板创建的告警规则 批量启动告警规则 批量停止告警规则 ...

使用云监控功能监控网站环境(部署于ECS实例)

设置合理的监控可以让您实时了解系统业务的运行情况,并能帮助您提前发现问题,避免可能会出现的业务故障。同时,告警机制能让您在故障发生后第一时间发现问题,缩短故障处理时间,以便尽快恢复业务。前提条件 在开始设置云监控前,您需要...

数据建模

本文介绍数据建模的相关问题。逻辑表质量规则都支持哪些云计算资源?逻辑表质量规则都包含哪些?逻辑表数据质量的强规则和弱规则什么区别?逻辑表质量规则都支持哪些云计算资源?目前包含MaxCompute、Hive、ApsaraDB for RDS、DataHub ...

常见网络问题

常见网络问题概览 问题 诊断工具检测 客户端日志 问题分析及排查方法 控制台显示 打开备份库失败 通过诊断工具检测,出现如下问题:i/o timeout An existing connection was forcibly closed by the remote host No connection could be ...

自动化规则

在日常工作中使用协作工具你可能遇到这些问题:1.需求关联的代码已经发布了,但是状态还停留在待处理 2.这部分工作有固定接口人,但是每次我还要手动指定到这个人负责。3.我负责的工作项已经快到期了,但是一点提醒都没有,我错过了交付...

基本概念

更多请查看 什么是事件 故障 在日常运营中,无论什么原因导致业务服务中断、服务品质下降或用户服务体验下降的现象,称为故障,但不包括用户侧环境或用户自身操作引起的问题故障比事件优先级更高,事件在处理过程中出现影响扩大或恶化时...

告警监控规则常见问题

出现漏告警或者误告警,一般是由于数据写入到Logstore到可查询存在一定的延迟,当告警监控规则中的查询时间范围设置为相对时间时,导致告警的查询不完全准确。为了避免这两种情况,建议扩大告警监控规则中的查询时间范围或者将查询时间...

ALB Ingress Controller

2023年05月 版本号 变更时间 变更内容 变更影响 v2.8.2-aliyun.1 2023年05月25日 修复Pod重启时可能导致转发规则被删除的问题。去除调谐共享带宽包时的删除逻辑。临时禁用网络类型的更新。此次升级不会对业务造成影响。v2.8.1-aliyun.1 ...

错误编码:HSF-0024

步骤一:客户端是否为本地调用、泛化调用 如果客户端通过本地调用、泛化调用的方式消费服务,将不会使用路由规则逻辑,因此会出现路由规则不生效的情况。本地调用:指一个进程既是一个服务的发布者,又是这个服务的消费者。此时,HSF默认...

常见问题

多云成本运营中,成本是账单运行分摊后产生的,默认每月4号上午10点系统会自动运行成本分摊任务,如果需调整也可在成本运行页面调整或手工运行成本分摊,4日前运行成本分摊可能会出现账单和成本对不齐的情况,而且和最终版本会有些出入,仅...

Prometheus告警规则模板

为了解决这个问题,可观测监控 Prometheus 版 提供了告警规则模板功能,可以帮助用户快速为多个 Prometheus 实例创建告警规则,并且可以统一管理,降低用户管理多个 Prometheus 实例告警规则的成本。创建 Prometheus 告警规则模板 登录 ...

INSERT、UPDATE和DELETE上的规则

定义在 INSERT、UPDATE 和 DELETE 上的规则与前一节描述的视图规则有明显的不同。首先,它们的 CREATE RULE 命令允许更多:它们可以没有动作。它们可以有多个动作。它们可以是 INSTEAD 或 ALSO(缺省)。伪关系 NEW 和 OLD 变得有用了。...

限流配置

背景信息 在未进行限流配置的情况下,任务是否可以运行主要受到上游依赖、定时时间以及调度资源的影响,满足上述条件即下发,但可能出现以下问题:批量补数据场景下,如果圈选的时间周期过长,抢占调度资源,影响周期任务或即席查询等...

资源稳定性最佳实践

默认规则 规则名称 规则描述 RDS实例开启日志备份 如果没有开启日志备份,当本地日志丢失会出现无法恢复数据的风险。如果RDS实例开启日志备份,视为"合规。使用独享型的RDS实例 使用独享类型的RDS实例规格,视为“合规”。RDS实例SQL审计...

知识库配置

知识问题中的规则 这里的规则可以理解为是正则表达式与逻辑运算符的结合,这两部分在质检规则中均有出现,主要支持以下几种写法:基础规则 最基础最简单的规则是普通文本,比如“我要预订今天的车票”,这个规则仅能匹配一个用户输入,就是...

使用负载均衡SLB后出现500、502和504状态码

客户端IP地址被运营商拦截 测试其他ISP运营商的客户端是否有此问题,如果仅仅是某个固定运营商网络的客户端访问有问题一般是该运营商拦截导致。可以抓包查看是否被运营商拦截或提交工单联系阿里云技术支持排查。如果被运营商拦截,则需要...

服务管控和治理

您可以根据检测的情况调整您的应用,以减少应用在正式使用时出现的异常问题。更多信息,请参见 故障注入。服务鉴权 服务提供者提供服务后,您可以通过服务鉴权功能对服务调用方进行鉴权。更多信息,请参见 服务鉴权。故障隔离 某个服务故障...

限流配置

背景信息 在未进行限流配置的情况下,任务是否可以运行主要受到上游依赖、定时时间以及调度资源的影响,满足上述条件即下发,但可能出现以下问题:批量补数据场景下,如果圈选的时间周期过长,抢占调度资源,影响周期任务或即席查询等...

事件中心

该视图可以帮助您在应用出现故障时,快速排查关联的资源各自发生了什么问题。例如在大型企业中,由于某个员工的误操作,重启了生产环境的RDS,导致线上业务故障,利用该视图,可以快速的发现应用访问的RDS出现了重启操作。集群视图 集群...

邮件过滤

本文介绍如何设置邮件过滤规则什么是邮件过滤?为了保护企业信息安全和数据安全,阿里邮箱支持 邮件过滤 功能,可以设置邮件过滤规则,邮箱系统自动对员工收到的符合邮件规则的邮件进行指定操作。例如,可以设置过滤规则为如果邮件正文...

目标追踪规则

弹性伸缩的目标追踪规则是弹性伸缩服务与云监控深度结合的产物,定义了更加稳定、精准、快速的弹性伸缩策略,可以解决当前伸缩组动态调整过程存在的一些难点和问题(例如用户流量突增或硬件出现故障等突发事件),能快速实现伸缩组的自动扩...

作业超时监控告警

MaxCompute支持通过配置阈值报警规则,监控作业运行时长。当作业运行超时后,系统将报警信息发送至报警联系人,助力及时识别异常作业,提升运维效率。本文为您介绍作业超时报警的监控指标、配置方法及处理报警方式。前提条件 在配置作业...

进程监控

云监控采集CPU消耗Top5进程的CPU使用率,可能存在以下问题:如果您的进程占用多个CPU,则会出现CPU使用率超过100%的情况,因为采集结果为多核CPU的总使用率。如果您查询的时间范围内,CPU消耗Top5的进程不固定,进程列表会显示该时间范围内...

概览

由于单指标报警规则设置了固定的报警阈值,所以无法应对以上复杂场景,导致经常出现部分高负载实例持续报警,而低水位负载实例业务异常下达不到报警阈值或达到阈值后业务问题已持续半小时以上。因此,云监控为了更好地提升您的报警体验,...

数据风险点监控

DQC数据监控规则有强规则和弱规则:强规则:一旦触发报警就阻断任务的执行(将任务置为失败状态,使下游任务不会被触发执行)。弱规则:只报警但不阻断任务的执行。DQC提供常用的规则模板,包括 表行数较N天前波动率、表空间大小较N天前...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
NAT网关 商标服务 负载均衡 弹性公网IP 短信服务 人工智能平台 PAI
新人特惠 爆款特惠 最新活动 免费试用