使用云监控功能监控网站环境(部署于ECS实例)

设置合理的监控可以让您实时了解系统业务的运行情况,并能帮助您提前发现问题,避免可能会出现业务故障。同时,告警机制能让您在故障发生后第一时间发现问题,缩短故障处理时间,以便尽快恢复业务。前提条件 在开始设置云监控前,您需要...

如何排查Java场景下故障注入不生效的问题

在对Java进程注入故障时,可能会出现故障注入失败的情况。为解决此类问题,在创建或编辑演练时,您可以在故障执行阶段选择开启Debug模式,并通过相关的日志信息来了解故障注入失败的原因。开启Debug模式 在查看目标演练的故障注入日志前,...

云盒计算资源配置最佳实践

说明 云盒中的硬件设备出现故障时,业务会迁移到冗余资源上来确保业务连续性,同时阿里云会向您发送云盒维修事件通知,您需要授权同意阿里云上门更换并维修硬件设备。关于如何授权维修以及维修相关流程,请参见 响应云盒维修事件 和 云盒...

通过可观测性能力进行故障处理最佳实践

具体使用时可将这些指标大致分为以下三类:一级指标:建议将没有歧义的、可衡量业务正常运行的指标作为一级指标,这些指标出现异常则一定是业务链路出现问题一般可用做监控报警项。例如,消息收发TPS超过规格限制可触发实例流控,您可以...

应用场景

如果现有计算资源突然出现故障导致业务受到影响,很难及时进行故障修复或者替换。您可以利用弹性伸缩的高可用优势,开启健康检查模式。阿里云自动检查实例的健康状态,当发现存在实例不健康时,自动增加实例替换不健康的实例,确保...

资源伸缩和系统扩展

如果现有计算资源突然出现故障导致业务受到影响,很难及时进行故障修复或者替换。此时可以利用弹性伸缩的高可用优势,开启健康检查模式。阿里云自动检查实例的健康状态,当发现存在实例不健康时,自动增加实例替换不健康的实例,确保...

修改带宽策略

业务会出现计划中的流量高峰,例如限时秒杀场景,需要灵活地变更带宽。业务中临时出现较多的大Key读写,需要快速消除带宽限制避免影响业务,同时为处理大Key问题预留时间。主机内网基础带宽详情 主机规格 规格族 CPU(核)内存(GB)内网...

确定需求

您需要了解真实的业务需求是什么,以及确定整个业务系统能解决什么问题业务调研 充分的业务调研和需求分析是数据仓库建设的基石,直接决定数据仓库能否建设成功。在数仓建设项目启动前,您需要请相关的业务人员介绍具体的业务,以便明确...

回切至本地VMware

本文主要介绍如何利用阿里云连续复制型容灾(CDR)服务,在本地虚拟机出现问题后把云上恢复出来的ECS回切到云下VMware环境中。前提条件 已部署CDR网关。更多信息,请参见 步骤三:部署CDR网关。已在被保护的Windows服务器上安装阿里云复制...

全景监控

全景监控支持业务链路配置监控场景,通过自定义监控链路和告警消息配置,可快速实现从数据生产到业务应用的全链路编排及溯源,实现全局监控和问题快速锁定。全景监控提供丰富的告警信息输出方式,包括:钉钉消息、标准协议等方式,出现问题...

功能简介

全景监控支持业务链路配置监控场景,通过自定义监控链路和告警消息配置,可快速实现从数据生产到业务应用的全链路编排及溯源,实现全局监控和问题快速锁定。全景监控提供丰富的告警信息输出方式,包括:钉钉消息、标准协议等方式,出现问题...

功能简介

全景监控支持业务链路配置监控场景,通过自定义监控链路和告警消息配置,可快速实现从数据生产到业务应用的全链路编排及溯源,实现全局监控和问题快速锁定。全景监控提供丰富的告警信息输出方式,包括:钉钉消息、标准协议等方式,出现问题...

接入说明

相关api:查询全部行业包(ListIndustryPackages)订阅行业包(InstallPackage)取消订阅行业包(UninstallPackage)步骤4 为机器人配置商家域知识 系统内置行业包无法覆盖商家全部业务问题,也可能会出现商家对场景的理解和系统内置行业包...

集群巡检项及解决方案

CoreDNS版本过低 异常影响:集群内CoreDNS组件版本过低,导致业务出现DNS解析问题。最新版的CoreDNS提供了更好的稳定性配置和新的功能。解决方案:为避免业务出现DNS解析问题,您需要尽快升级CoreDNS。Ingress版本过低 异常影响:集群内...

集群巡检项及解决方案

CoreDNS版本过低 异常影响:集群内CoreDNS组件版本过低,导致业务出现DNS解析问题。最新版的CoreDNS提供了更好的稳定性配置和新的功能。解决方案:为避免业务出现DNS解析问题,您需要尽快升级CoreDNS。具体操作,请参见 CoreDNS手动升级...

集群巡检项及解决方案

CoreDNS版本过低 异常影响:集群内CoreDNS组件版本过低,导致业务出现DNS解析问题。最新版的CoreDNS提供了更好的稳定性配置和新的功能。解决方案:为避免业务出现DNS解析问题,您需要尽快升级CoreDNS。具体操作,请参见 CoreDNS手动升级...

主备实例切换

背景信息 备实例切换为主实例的过程可能导致业务出现秒级闪断,建议在业务低谷期操作。切换完成后,原主实例将变为备实例,原主实例工作台展示的信息将切换为备实例的工作台信息。操作步骤 登录 OceanBase 管理控制台。在左侧导航栏中,...

故障排查

如果您在使用 ACK Serverless集群 时出现故障,可根据以下故障分类匹配故障场景和解决方案,帮助您快速排查问题,提升运维效率。分类 相关文档 集群资源和集群组件异常问题排查 集群检查项及修复方案(包括升级集群、迁移集群、安装组件、...

概述

在企业数字化转型过程中,基于云计算平台服务,可以让企业快速构建新业务、减少业务故障率、持续观测业务指标、提升业务稳定性,使企业更加专注于业务本身。总体而言,主要包括以下几个关键领域:卓越运营第一个关键领域是确定组织的运营...

移动性能监控简介

诊断迅速 结合网络请求数据分析、页面加载性能、JS 异常监控等功能,可迅速进行业务故障排查,将问题根源定位的时间提升至秒级。应用场景 网络性能问题定位 通过网络全链路数据监控,及时发现网络问题,定位故障链路问题节点,辅助用户进行...

WAF产品托管服务

序号 优先级 定义 响应时间 1 危险 用户核心业务严重受损或完全不可用 15分钟 2 紧急 用户核心业务出现非全局异常 30分钟 3 高 用户非核心业务严重受损或不可用 2小时 4 中 用户非核心业务出现非全局异常 4小时 5 低 用户日常技术咨询 8...

基本配置

⑥ 报警通知组:当业务出现异常时,用于接收通知消息的联系人组,此处读取云监控报警组配置。具体配置步骤请参考 创建报警联系人或报警联系组。报警通知方式:按照实际需求搭配报警事件类型、报警通知方式进行个性化定制。

订阅事件通知

数据传输服务DTS(Data Transmission Service)已接入云监控平台,您可以通过事件订阅对重要的事件设置定制化的报警通知,让您及时了解事件的发生与进展,帮助您实时掌握事件动态,便于您在业务故障时快速分析并定位问题。背景信息 云监控...

变更计算资源扩缩范围(RCU)

使用场景 业务上预计会出现流量高峰,会影响负载并导致性能发生抖动,可通过提升RCU下限(最小值)避免该情况。期望节省业务开支,可通过降低RCU上限(最大值)来实现。但该操作可能会影响实例性能,请谨慎操作。影响 Serverless实例的RCU...

设备显示离线

如果是静态路由接入,尝试通过交换机,能否 ping 通设备的每个接口IP,如果其中有无法 ping 通的接口,请参见 设备和交换机之间的链路故障,排除接口互联问题。如果是单机设备,观察设备机身的状态指示灯,确认右侧第二个和第三个灯是否为...

库表数太多导致实例卡顿或异常

说明 库表数量多不一定会出现问题,是否出现问题业务模型和负载等因素也有关系。例如以下两种业务场景,数据库规格相同且都有1万的库表数和10万的总文件数,但面临的问题完全不一样:会计软件系统:访问具备明显的聚集性特征,大多数库表...

补数据

什么补数据选择业务时间昨天和今天,也会出现等待时间的情况?为什么补数据选择补0点~1点生成了多个实例?为什么进行大量补数据操作时,会出现等待资源情况(实例显示黄色,实例状态为等待资源)?为什么补数据报错调起的节点运行时间不...

搭建高可用架构

恢复数据 如果您已经按照前文的步骤搭建了高可用架构实例,您的业务一般是可以稳定运行的,即使出现问题也能快速恢复到可用状态。如果是单机故障,RDS除了基础系列之外的实例都可以在短时间内进行 主备切换 快速恢复您的业务。如果是可用区...

连接保持

当Proxy在新旧主节点中进行切换时,需要保留这个状态,否则会出现字符集乱码问题。所以连接保持的核心在于保证连接切换前后的会话状态一致。说明 当Proxy将连接从旧主节点切换到新主节点的过程中,会存在短暂的新老数据库同时不可写不可读...

同城双活

在日常业务链路中,会出现多次跨机房调用,增加性能损耗。同城双活模式:会优先调用同可用区,同可用区找不到调用目标,再调用其他可用区。最佳实践 最佳实践方案建议包含下述逻辑:每个应用的所有节点对等部署在同城的两个可用区。每个...

网关辅助类使用说明

业务出现异常时被调用。MobileServiceInterceptor MobileServiceInterceptor 继承了框架的 Ordered 接口,因此,业务方实现的拦截器还可以通过实现 getOrder 方法指定执行顺序,设置的数值越小,执行的优先级越高;设置的数值越大,...

设置连接池类型

除了 sql_mode、character_set_server、collation_server、time_zone 这四个变量以外,如果业务依赖其他session级别的系统变量,那么需要客户端在建之后显式执行set语句,否则连接池可能复用系统变量已经被更改过的连接。由于连接可能...

通过调用链路和日志分析定位业务异常问题

当应用出现业务异常问题时,应用指标统计图会出现明显波动,您可据此粗略地分析异常问题;通过完整的调用链路和业务日志分析,可以精准定位业务异常问题。关联业务日志与TraceId 登录 ARMS控制台,在左侧导航栏选择 应用监控>应用列表。在 ...

弹性业务带宽计费方式

概述 业务接入DDoS高防实例防护后,如果业务的实际流量峰值超出了 业务带宽 规格,则业务流量转发过程会出现随机丢包现象;业务带宽长期超限,会导致业务被限流,影响业务正常访问。针对业务带宽超限问题业务带宽 规格无法满足日常业务...

弹性QPS计费说明

如果您的业务QPS通常比较平稳,仅在大促、新业务上线等特定场景才会出现QPS突增,您购买高防实例时业务QPS规格可以选择为正常场景下的QPS,然后开启弹性QPS,避免QPS超限导致的业务丢包或限流问题。本文介绍了DDoS高防实例弹性QPS的计费...

连接池

PolarDB 支持会话级连接池和事务级连接池,您可以根据业务场景选择合适的连接池,帮助降低因大量连接导致的数据库负载压力。注意事项 更改连接池设置后,仅对新建连接生效。如何修改连接池设置,请参见 配置数据库代理。当前连接池功能不...

分支门店

客户痛点 业务运维效率低 不同门店的建设阶段导致操作系统、浏览器、通用办公软件等版本存在差异,新业务系统上线或变更时容易出现兼容性问题,影响业务效率 全国提升门店连锁率的背景下,需要快速提升业务扩张的效率和门店的标准化 门店...

Linux实例存在OOM问题的处理方法

概述 本文主要介绍当您的Linux实例存在OOM问题的处理方法。...包年包月实例升级配置 按量付费实例升级配置 您的业务程序存在缺陷 您可以根据业务应用日志中出现问题优化您的业务代码。继续观察,确认OOM问题不再出现。适用于 云服务器ECS

故障演练

重要 故障演练通过将被演练的资源关闭,使资源处于人工构造的故障状态,请确保您已将演练资源进行冗余配置,否则导致业务中断.故障演练过程中控制台的资源状态显示存在一定的时延,但不影响底层资源状态切换的时效性。使用限制 每个...

DDoS高防(中国内地)计费说明

95弹性业务带宽 按天或按月后付费 弹性业务带宽表示在实例业务带宽的基础上,为实例弹性增加业务带宽,用于解决在业务高峰期间,正常业务流量波动(超出实例业务带宽规格),导致业务被限流的问题。更多信息,请参见 弹性业务带宽计费方式...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
风险识别 物联网无线连接服务 Web应用防火墙 云服务器 ECS 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用