使用云监控功能监控网站环境(部署于ECS实例)

设置合理的监控可以让您实时了解系统业务的运行情况,并能帮助您提前发现问题,避免可能会出现业务故障。同时,告警机制能让您在故障发生后第一时间发现问题,缩短故障处理时间,以便尽快恢复业务。前提条件 在开始设置云监控前,您需要...

云盒计算资源配置最佳实践

说明 云盒中的硬件设备出现故障时,业务会迁移到冗余资源上来确保业务连续性,同时阿里云会向您发送云盒维修事件通知,您需要授权同意阿里云上门更换并维修硬件设备。关于如何授权维修以及维修相关流程,请参见 响应云盒维修事件 和 云盒...

通过可观测性能力进行故障处理最佳实践

具体使用时可将这些指标大致分为以下三类:一级指标:建议将没有歧义的、可衡量业务正常运行的指标作为一级指标,这些指标出现异常则一定是业务链路出现问题一般可用做监控报警项。例如,消息收发TPS超过规格限制可触发实例流控,您可以...

应用场景

如果现有计算资源突然出现故障导致业务受到影响,很难及时进行故障修复或者替换。您可以利用弹性伸缩的高可用优势,开启健康检查模式。阿里云自动检查实例的健康状态,当发现存在实例不健康时,自动增加实例替换不健康的实例,确保...

资源伸缩和系统扩展

如果现有计算资源突然出现故障导致业务受到影响,很难及时进行故障修复或者替换。此时可以利用弹性伸缩的高可用优势,开启健康检查模式。阿里云自动检查实例的健康状态,当发现存在实例不健康时,自动增加实例替换不健康的实例,确保...

修改带宽策略

业务会出现计划中的流量高峰,例如限时秒杀场景,需要灵活地变更带宽。业务中临时出现较多的大Key读写,需要快速消除带宽限制避免影响业务,同时为处理大Key问题预留时间。主机内网基础带宽详情 主机规格 规格族 CPU(核)内存(GB)内网...

如何排查Java场景下故障注入不生效的问题

在对Java进程注入故障时,可能会出现故障注入失败的情况。为解决此类问题,在创建或编辑演练时,您可以在故障执行阶段选择开启Debug模式,并通过相关的日志信息来了解故障注入失败的原因。开启Debug模式 在查看目标演练的故障注入日志前,...

接入说明

相关api:查询全部行业包(ListIndustryPackages)订阅行业包(InstallPackage)取消订阅行业包(UninstallPackage)步骤4 为机器人配置商家域知识 系统内置行业包无法覆盖商家全部业务问题,也可能会出现商家对场景的理解和系统内置行业包...

集群巡检项及解决方案

CoreDNS版本过低 异常影响:集群内CoreDNS组件版本过低,导致业务出现DNS解析问题。最新版的CoreDNS提供了更好的稳定性配置和新的功能。解决方案:为避免业务出现DNS解析问题,您需要尽快升级CoreDNS。Ingress版本过低 异常影响:集群内...

集群巡检项及解决方案

CoreDNS版本过低 异常影响:集群内CoreDNS组件版本过低,导致业务出现DNS解析问题。最新版的CoreDNS提供了更好的稳定性配置和新的功能。解决方案:为避免业务出现DNS解析问题,您需要尽快升级CoreDNS。具体操作,请参见 CoreDNS手动升级...

主备实例切换

背景信息 备实例切换为主实例的过程可能导致业务出现秒级闪断,建议在业务低谷期操作。切换完成后,原主实例将变为备实例,原主实例工作台展示的信息将切换为备实例的工作台信息。操作步骤 登录 OceanBase 管理控制台。在左侧导航栏中,...

集群巡检项及解决方案

CoreDNS版本过低 异常影响:集群内CoreDNS组件版本过低,导致业务出现DNS解析问题。最新版的CoreDNS提供了更好的稳定性配置和新的功能。解决方案:为避免业务出现DNS解析问题,您需要尽快升级CoreDNS。具体操作,请参见 CoreDNS手动升级...

库表数太多导致实例卡顿或异常

说明 库表数量多不一定会出现问题,是否出现问题业务模型和负载等因素也有关系。例如以下两种业务场景,数据库规格相同且都有1万的库表数和10万的总文件数,但面临的问题完全不一样:会计软件系统:访问具备明显的聚集性特征,大多数库表...

同城双活

在日常业务链路中,会出现多次跨机房调用,增加性能损耗。同城双活模式:会优先调用同可用区,同可用区找不到调用目标,再调用其他可用区。最佳实践 最佳实践方案建议包含下述逻辑:每个应用的所有节点对等部署在同城的两个可用区。每个...

搭建高可用架构

恢复数据 如果您已经按照前文的步骤搭建了高可用架构实例,您的业务一般是可以稳定运行的,即使出现问题也能快速恢复到可用状态。如果是单机故障,RDS除了基础系列之外的实例都可以在短时间内进行 主备切换 快速恢复您的业务。如果是可用区...

补数据

什么补数据选择业务时间昨天和今天,也会出现等待时间的情况?为什么补数据选择补0点~1点生成了多个实例?为什么进行大量补数据操作时,会出现等待资源情况(实例显示黄色,实例状态为等待资源)?为什么补数据报错调起的节点运行时间不...

回切至本地VMware

本文主要介绍如何利用阿里云连续复制型容灾(CDR)服务,在本地虚拟机出现问题后把云上恢复出来的ECS回切到云下VMware环境中。前提条件 已部署CDR网关。更多信息,请参见 步骤三:部署CDR网关。已在被保护的Windows服务器上安装阿里云复制...

通过调用链路和日志分析定位业务异常问题

当应用出现业务异常问题时,应用指标统计图会出现明显波动,您可据此粗略地分析异常问题;通过完整的调用链路和业务日志分析,可以精准定位业务异常问题。关联业务日志与TraceId 登录 ARMS控制台,在左侧导航栏选择 应用监控>应用列表。在 ...

弹性业务带宽计费方式

概述 业务接入DDoS高防实例防护后,如果业务的实际流量峰值超出了 业务带宽 规格,则业务流量转发过程会出现随机丢包现象;业务带宽长期超限,会导致业务被限流,影响业务正常访问。针对业务带宽超限问题业务带宽 规格无法满足日常业务...

弹性QPS计费说明

如果您的业务QPS通常比较平稳,仅在大促、新业务上线等特定场景才会出现QPS突增,您购买高防实例时业务QPS规格可以选择为正常场景下的QPS,然后开启弹性QPS,避免QPS超限导致的业务丢包或限流问题。本文介绍了DDoS高防实例弹性QPS的计费...

应用场景

出现这些故障时,如果用户业务部署在单个地区,那么就因为地区故障导致服务不可用,且不可用时间完全依赖故障恢复时间。通过构建灾备库,使用数据同步服务实时增量同步主库数据以确保主库与灾备库数据的完全一致,当业务中心发生地区...

变更配置

警告 根据变更项不同,切换过程中可能会出现业务闪断或实例重启,而且与数据库、账号、网络等相关的大部分操作都无法执行,请选择在 可维护时间段 内执行变配操作。变更项 说明 业务影响 系列 支持 PostgreSQL基础系列升级高可用系列。...

设置源站保护

在WAF集群出现故障时,WAF可能将域名访问请求旁路回源至源站,确保网站正常访问。这种情况下,如果源站已设置ECS安全组或SLB白名单访问控制策略,可能导致源站暂时无法通过公网访问。当WAF集群扩容增加新的回源IP段时,如果源站已设置...

功能特性

跨数据库分布式事务 当业务规模增大,单库单表无法满足业务需求时,自然就会出现分库分表的情况。但是,单机事务又不能保证分库后的事务属性,分布式事务几乎无法避免。分布式事务可以让应用轻松具备跨库分布式事务处理能力,像使用单机...

基于Kubernetes容器集群的容灾架构与方案

备份与恢复(Backup-Restore)如上图所示,在备份与恢复模式下,系统运行时备份应用和数据,故障或灾难发生时,系统将备份的应用和数据在另一地点进行恢复,并切换业务流量。由于数据无法实时备份,在恢复数据时有一定的数据丢失,...

应用场景

对于传统企业的服务化转型来说,使用分布式框架不是银弹,在解决了传统的单块架构系统随着业务需求的快速变化而面临的挑战后,分布式架构也为研发和运维增加了更大的复杂度和管理成本,基于分布式框架来进行架构改造的应用和业务通常面临...

策略配置

多样性规则 功能介绍 一些业务场景下,可能会出现同质性物品集中推荐的情况,例如:系统识别到用户对水果感兴趣,增加水果的推荐量,导致屏幕中呈现了多个水果商品;例如:系统识别到用户对短视频类型的物品更感兴趣,因此提高短视频物品的...

使用说明

背景信息 设备基于物联网平台的消息通信能力开展业务,由于不同设备业务的复杂性,以及业务需要定期变更升级,导致设备的业务程序容易出现故障,导致设备不可用。如果设备的业务程序与远程登录程序在同一进程,导致设备不可使用远程登录...

业务切换流程

由于创建的反向迁移任务将目标库产生的增量数据实时迁移回源库,如果业务运行出现问题,可随时将业务切换回源库。后续步骤 业务切换至目标数据库并稳定运行一段时间,测试所有业务涉及的功能并确认无问题,可结束反向数据迁移的任务,...

业务切换流程

由于创建的反向迁移任务将目标库产生的增量数据实时迁移回源库,如果业务运行出现问题,可随时将业务切换回源库。后续步骤 业务切换至目标数据库并稳定运行一段时间,测试所有业务涉及的功能并确认无问题,可结束反向数据迁移的任务,...

数据资产定级

局部性质:数据直接或间接用于某些业务线的运营、报告等,如果出现问题会业务线造成一定的影响或造成工作效率降低。标记为A3。一般性质:数据主要用于日常数据分析,出现问题带来的影响极小。标记为A4。未知性质:无法明确数据的应用场景...

概述

异地容灾 如果业务部署在多个地域,可以通过在多个地域创建主备实例,实现跨地域的数据库高可用,当一个地域出现故障时,只需要将业务手动切换到备实例即可。说明 主备实例切换耗时约 5 分钟,切换过程中,可能会出现链接闪断。建议在业务...

数据资产定级

局部性质:数据直接或间接用于某些业务线的运营、报告等,如果出现问题会业务线造成一定的影响或造成工作效率降低。标记为A3。一般性质:数据主要用于日常数据分析,出现问题带来的影响极小。标记为A4。未知性质:无法明确数据的应用场景...

资源规划

最常见的情况,客户可以使用成本中心(costcenter)、业务单元(businessunit)或者项目组(project)将成本与业务部门进行关联。在分账账单中,费用报告可以以任何标签维度归纳账单。因此,客户也可以轻松地将成本与技术/安全性维度作为分...

执行补数据并查看补数据实例(旧版)

例如,业务日期为 1月11日~1月13日,并行数为2组,则生成两个补数据实例(其中一个补数据实例包含两个业务日期,这两个业务日期对应的任务串行执行),两个补数据实例并行执行。补数据告警 设置此次补数据操作是否触发告警。是:满足...

数据资产等级定义

局部性质:数据直接或间接用于某些业务线的运营、报告等,如果出现问题会业务线造成一定的影响或造成工作效率降低。标记为A3。一般性质:数据主要用于日常数据分析,出现问题带来的影响极小。标记为A4。未知性质:无法明确数据的应用场景...

security-inspector

变更时间 变更内容 变更影响 v0.5.0.2-g5e33765-aliyun registry.cn-hangzhou.aliyuncs.com/acs/security-inspector:v0.5.0.2-g5e33765-aliyun 2021年06月24日 解决多个集群使用同一个SLS Project时会出现报表数据显示异常的问题。...

使用创建反向任务功能

前提条件 已创建存储空间大于业务数据库已使用的灾备数据库,建议灾备数据比业务数据大10%。已在业务数据库和灾备数据库中创建用于数据同步的账号。权限要求,请参见 RDS MySQL实例间的同步 或 RDS SQL Server间的同步。重要 灾备数据库的...

变更计算资源扩缩范围(RCU)

使用场景 业务上预计会出现流量高峰,会影响负载并导致性能发生抖动,可通过提升RCU下限(最小值)避免该情况。期望节省业务开支,可通过降低RCU上限(最大值)来实现。但该操作可能会影响实例性能,请谨慎操作。影响 Serverless实例的RCU...

如何排查移动网关调用错误

问题描述 前提条件:客户端已经正确接入移动网关组件(MGS)。MGS 控制台已经正确配置好后端应用 API 服务。问题表现:客户端通过代码发起 PRC 调用,但未能拿到预期结果。常见错误类型:MGS 无返回(客户端报错)。MGS 无返回(超时)。...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
商标服务 云数据库 Redis 版 云服务器 ECS Web应用防火墙 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用