使用云监控功能监控网站环境(部署于ECS实例)

设置合理的监控可以让您实时了解系统业务的运行情况,并能帮助您提前发现问题,避免可能会出现业务故障。同时,告警机制能让您在故障发生后第一时间发现问题,缩短故障处理时间,以便尽快恢复业务。前提条件 在开始设置云监控前,您需要...

集群巡检项及解决方案

CoreDNS版本过低 异常影响:集群内CoreDNS组件版本过低,导致业务出现DNS解析问题。最新版的CoreDNS提供了更好的稳定性配置和新的功能。解决方案:为避免业务出现DNS解析问题,您需要尽快升级CoreDNS。具体操作,请参见 CoreDNS手动升级...

通过可观测性能力进行故障处理最佳实践

具体使用时可将这些指标大致分为以下三类:一级指标:建议将没有歧义的、可衡量业务正常运行的指标作为一级指标,这些指标出现异常则一定是业务链路出现问题一般可用做监控报警项。例如,消息收发TPS超过规格限制可触发实例流控,您可以...

补数据

什么补数据选择业务时间昨天和今天,也会出现等待时间的情况?为什么补数据选择补0点~1点生成了多个实例?为什么进行大量补数据操作时,会出现等待资源情况(实例显示黄色,实例状态为等待资源)?为什么补数据报错调起的节点运行时间不...

策略配置

多样性规则 功能介绍 一些业务场景下,可能会出现同质性物品集中推荐的情况,例如:系统识别到用户对水果感兴趣,增加水果的推荐量,导致屏幕中呈现了多个水果商品;例如:系统识别到用户对短视频类型的物品更感兴趣,因此提高短视频物品的...

云盒计算资源配置最佳实践

说明 云盒中的硬件设备出现故障时,业务会迁移到冗余资源上来确保业务连续性,同时阿里云会向您发送云盒维修事件通知,您需要授权同意阿里云上门更换并维修硬件设备。关于如何授权维修以及维修相关流程,请参见 响应云盒维修事件 和 云盒...

风险治理的工作开展

风险治理策略的迭代 企业规划上云时,最初可能将一些内部平台和运维系统搬迁上云,此时往往不涉及核心业务,所以不需要过多考虑数据防护、网络防护、灾备机制的问题,只需要通过最小治理基线避免过度采购、过度授权的风险。但随着企业将...

执行补数据并查看补数据实例(旧版)

例如,业务日期为 1月11日~1月13日,并行数为2组,则生成两个补数据实例(其中一个补数据实例包含两个业务日期,这两个业务日期对应的任务串行执行),两个补数据实例并行执行。补数据告警 设置此次补数据操作是否触发告警。是:满足...

数据资产定级

局部性质:数据直接或间接用于某些业务线的运营、报告等,如果出现问题会业务线造成一定的影响或造成工作效率降低。标记为A3。一般性质:数据主要用于日常数据分析,出现问题带来的影响极。标记为A4。未知性质:无法明确数据的应用场景...

数据资产定级

局部性质:数据直接或间接用于某些业务线的运营、报告等,如果出现问题会业务线造成一定的影响或造成工作效率降低。标记为A3。一般性质:数据主要用于日常数据分析,出现问题带来的影响极。标记为A4。未知性质:无法明确数据的应用场景...

数据资产等级定义

一般性质:数据主要用于日常数据分析,出现问题带来的影响极。标记为A4。未知性质:无法明确数据的应用场景。标记为Ax。这些性质的重要性依次降低,即重要程度为A1>A2>A3>A4>Ax。如果一份数据出现在多个应用场景汇总,则根据其最重要程度...

EMR Kafka磁盘故障运维

业务场景 Kafka将日志数据存储到磁盘中,当磁盘出现故障时,导致磁盘IO能力下降、集群吞吐下降、消息读写延时或日志目录offline等问题。这些情况有可能影响到线上业务平稳运行、数据丢失、Kafka集群容错能力下降,单块盘故障甚至有可能...

外呼机器人常见问题解决方式

3)检查当前业务是否有绑定外呼号码(一般控制台内发起外呼时会进行校验业务下号码,但代码上传过程中会出现此状况);到号码管理中查看号码绑定情况。4)检查当前业务并发是否为0,业务并发为0时任务也无法正常发起;4、业务管理中,新建...

应用场景

出现这些故障时,如果用户业务部署在单个地区,那么就因为地区故障导致服务不可用,且不可用时间完全依赖故障恢复时间。通过构建灾备库,使用数据同步服务实时增量同步主库数据以确保主库与灾备库数据的完全一致,当业务中心发生地区...

实例运维常见问题

本文汇总了Lindorm实例在扩缩容、升降配、实例重启、版本升级等实例运维场景中的常见问题,包括但不限于操作耗时、业务影响及费用说明,帮助您快速了解运维操作中的相关细节和注意事项。问题导览 扩容、升配、服务开通 实例扩容节点需要...

自动SQL限流

SQL限流是限制数据库上执行SQL的并发度,通过限制问题SQL的并发度后,保障数据库正常响应业务请求,保障大部分的业务正常运转,即通过部分业务受损,保障大部分业务正常运行。背景信息 随着技术的发展,尤其是云数据库的普及,数据库系统...

容灾演练断网方式说明

在实例进行主备切换时,业务可能会出现长连接闪断的情况,以此验证业务是否具备失效重连机制。使用场景 部分业务或大规模业务实例不可用。Redis、RDS云服务高可用实例部分不可用。使用限制 安全组断网只针对新建立的网络连接进行阻断,并不...

强弱依赖治理概述

如果商品详情页对下游依赖是强依赖,例如当下游依赖 库存、优惠、物流 出现故障的时候,将导致业务流程无法推进,会出现类似如下的说明,严重影响用户体验。如果商品详情页对下游依赖是弱依赖,例如当下游依赖 评价、店铺 等系统出现故障的...

如何排查Java场景下故障注入不生效的问题

在对Java进程注入故障时,可能会出现故障注入失败的情况。为解决此类问题,在创建或编辑演练时,您可以在故障执行阶段选择开启Debug模式,并通过相关的日志信息来了解故障注入失败的原因。开启Debug模式 在查看目标演练的故障注入日志前,...

设置可维护时间窗口

注意事项 如果开启了版本自动升级,实时数仓Hologres会在您设置的可维护时间窗口内自动进行实时数仓Hologres版本升级,在版本升级过程中可能会出现Query失败的情况,请尽量将可维护时间窗口设置为业务低峰期。默认可维护时间窗口为 ...

搭建高可用架构

恢复数据 如果您已经按照前文的步骤搭建了高可用架构实例,您的业务一般是可以稳定运行的,即使出现问题也能快速恢复到可用状态。如果是单机故障,RDS除了基础系列之外的实例都可以在短时间内进行 主备切换 快速恢复您的业务。如果是可用区...

常见问题概览

服务器的流量未达到清洗阈值,为何安全总览中会出现清洗流量?DDoS高防服务是否支持接入采用NTLM协议认证的网站?DDoS高防热点问题 配置类 不同的阿里云账号如何共享使用DDoS高防 DDoS高防WebSocket配置 DDoS高防健康检查的主动探测IP 业务...

故障演练

有损演练是指直接在线上真实业务环境注入异常进行演练,演练模拟的真实有效性高,为了平衡业务影响一般会选择最核心场景、在业务最低峰期做演练,而且演练频次相对较,例如为了验证多活容灾能力的机房断网演练,一般是一个月一次的演练...

切换专有网络VPC和虚拟交换机

影响 切换过程会出现实例切换,请确保应用程序具有重连机制。实例切换的影响请参见 实例切换的影响。切换专有网络VPC和虚拟交换机会造成虚拟IP(VIP)的变更,请您在应用程序中尽量使用 连接地址 进行连接,不要使用IP地址。VIP的变更会...

内网访问安全常见问题

本文梳理了 SASE 内网访问安全的常见问题,如果您的业务中遇到相关问题可以参考解决。访问一个域名网站,如何配置内网DNS才能正常访问?如果您的业务组网中接入了PrivateZone,则 SASE 自动同步PrivateZone的解析数据,您无需在 SASE ...

常见问题

本文汇总了使用多活容灾时的常见问题。MSHA基础常见问题 什么是...同城多活单元格流量切零后,企业版RocketMQ的ons.log中为什么会出现日志brokerName=msha_mock_queueBrokerName?异地多活如何查看MSHA-agent是否从HTTP流量中提取出了路由标?

互联网服务:打卡

PolarDB-X 专注解决海量数据存储、超高并发吞吐、大表瓶颈以及复杂计算效率等数据库瓶颈问题,历经各届天猫双十一及阿里云各行业客户业务的考验,助力企业加速完成业务数字化转型。本文介绍打卡如何通过 PolarDB-X 应对业务挑战。所属...

自动/手动主备切换

当系统发生故障时,PolarDB 集群会自动进行主备切换。您也可以手动进行主备切换,指定一个只读节点为新的主节点。注意事项 不论是自动切换还是手动切换,当只读节点未开启热备时,主备切换过程中可能会出现20~30秒左右的闪断,因此切换前请...

使用限制

版本升级 实例升级内核版本或引擎版本(如MySQL 8.0 20230324升级至20230630、MySQL 5.5升级至5.6)的过程中,根据不同的实例系列,会出现数据库中断或者闪断。中断或者闪断期间,与数据库、账号、网络等相关的大部分操作都无法执行。...

使用创建反向任务功能

前提条件 已创建存储空间大于业务数据库已使用的灾备数据库,建议灾备数据比业务数据大10%。已在业务数据库和灾备数据库中创建用于数据同步的账号。权限要求,请参见 RDS MySQL实例间的同步 或 RDS SQL Server间的同步。重要 灾备数据库的...

实例的节点故障处理机制

当使用Connection String URI进行连接时,如果某个节点出现故障,不会因为节点的切换而影响应用的读写操作,详情请参见 副本集实例连接说明。分片集群实例 图 2.分片集群架构 分片集群实例的Shard节点和ConfigServer节点均采用三节点副本集...

迁移可用区节点

如果集群负载过高且索引没有副本,同时业务中存在大量的写入或查询等场景,在可用区迁移过程中,业务可能会出现偶发的访问超时现象。建议在可用区迁移前,在客户端访问机制中配置重试机制,以减小对业务的影响。操作步骤 登录 阿里云...

降低实例配置

禁写风险:目标降低磁盘容量评估不当,可能会出现如下风险:目标磁盘容量大小低于已使用磁盘量的1.3倍,高流量实例可能很快就会写满,进而提前删除数据和禁写。目标磁盘容量大小低于已使用磁盘量,会触发禁写。暂停弹缩风险:Serverless...

自动或手动主备切换

A:RDS在发生异常触发高可用切换时,应用端长连接可能无法感知到连接状态变化,如果没有设置socket超时时间,应用程序会一直等待数据库返回结果,通常会等到几百秒后才会断连,期间数据库的部分连接无法正常工作,SQL会出现大量执行异常。...

步骤五:应用容灾

故障恢复 本机出现故障后在云上拉起本地业务,待本地环境恢复后再将其恢复到本地。具体步骤如下:在 主站点管理 页签,单击+添加。在 添加计算平台 页面,填写计算平台 名称,选择 类型,填写 IP地址、用户名 和 密码。单击 创建。在连续...

在边缘场景无缝运行使用InClusterConfig的业务Pod

背景信息 当需要把原生Kubernetes中,通过InClusterConfig(即Kubernetes Service)访问kube-apiserver的业务Pod部署到边缘环境中,会出现以下问题问题一:Pod通过InClusterConfig地址访问kube-apiserver,节点上默认网络规则(iptables/...

实例状态与影响

重启中 Rebooting 重启实例 实例会出现秒级的连接闪断,请在业务低峰期执行该操作并确保应用具备重连机制。版本升级中 MinorVersionUpgrading 升级版本 在申请资源、升级备库或同步数据阶段,对 Tair 服务无影响。在实例切换或主备切换...

异地应用双活切流

在⼀个数据中心发生故障或灾难的情况下,将流量切换到其他数据中心,其他数据中心可以正常运行并对关键业务或全部业务进行接管,实现故障灾难场景的业务快速恢复。本文将介绍在异地应用双活中如何创建切流任务并查看切流详情。前提条件 ...

主备切换

RDS在发生异常触发高可用切换时,应用端长连接可能无法感知到连接状态变化,如果没有设置socket超时时间,应用程序会一直等待数据库返回结果,通常会等到几百秒后才会断连,期间数据库的部分连接无法正常工作,SQL会出现大量执行异常。...

WAF接入配置最佳实践

这种情况下,在将域名接入WAF后可能会出现访问空白页502的错误信息,您只需禁用该配置选项即可解决该问题。防护策略配置。参考以下推荐防护配置对已接入的网站业务进行防护:规则防护引擎 一般情况下,建议选用 拦截 模式,并选用 中等规则...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
云数据库 Redis 版 商标服务 Web应用防火墙 云服务器 ECS 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用