性能监控最佳实践

提高故障排查效率:当系统或应用出现故障时,传统的性能监控方案通常需要IT运维人员手动分析监控数据来确定故障原因,这样会浪费大量的时间和精力。而一体化性能监控能够对多种关联的监控数据进行自动分析和处理,帮助IT运维人员快速定位...

0036-00000005

问题原因 您发起了PutBucketAccessMonitor请求来关闭某个Bucket的访问跟踪功能,但是您指定的Bucket存在基于最后一次访问时间(Last Access Time)的生命周期规则,此类生命周期规则依赖于访问跟踪功能,因此无法关闭该功能导致请求失败。...

监控服务概览

OSS监控服务为您提供系统基本运行状态、性能以及计量等方面的监控数据指标,并且提供自定义报警服务,帮助您跟踪请求、分析使用情况、统计业务趋势,及时发现以及诊断系统的相关问题。OSS监控指标主要分为基础服务指标、性能指标和计量指标...

概述

再者云计算平台会提供冗余存储和备份能力,避免系统因为硬件故障或其他原因导致的停机或数据丢失。这种备份机制可以提高系统的可靠性。责任共担模型 阿里云平台提供高可用的基础设施,并提供应用稳定性相关工具体系。用户可以基于阿里云...

监控、诊断和故障排除

相对于传统应用程序,开发云端应用虽然降低了用户在基础设施搭建、运维等方面的成本,但却增大了监控、诊断和故障排查的难度。OSS存储服务为您提供了丰富的监控和日志信息,帮助您深刻洞察程序行为,及时发现并快速定位问题。本文主要描述...

产品优势

支持企业级管理组件,降低运维复杂度和运维能力要求 更专业的数据安全和治理,满足数据合规要求 提供完整一套基于元数据的安全和治理技术 简化多用户的数据访问和分析,对数据访问进行授权、跟踪和审核 符合法规要求,以减少安全原因导致的...

CLB健康检查FAQ

负载均衡的代理分布到很多节点上,因此看到的健康检查日志访问频率和控制台设置的频率不一致,这是正常现象。负载均衡因后端数据库故障导致健康检查失败,如何处理?问题现象 ECS实例内配置了两个网站:www.example.com 是静态网站,...

附录:SOFAStack 产品目录

分布式链路跟踪 分布式链路跟踪(Distributed System Tracing,简称 DST)是一款面向分布式架构、微服务架构和云原生架构的应用可观察性的金融级解决方案,帮助用户厘清应用间复杂的调用关系,迅速定位故障或者缓慢节点。产品架构 产品优势...

操作审计开启全量日志跟踪

规则详情 参数 说明 规则名称 操作审计开启全量日志跟踪 规则标识 actiontrail-trail-intact-enabled 标签 Actiontrail 自动修正 不支持 规则触发机制 周期执行 触发频率 24小时 规则入参 无 修正指导 修改跟踪的日志事件类型为所有事件。...

公告:操作审计不支持呈现读事件中的相关资源信息

云上的读操作频率很高,当您通过创建跟踪将事件投递到SLS Logstore或OSS Bucket时,记录读操作的相关资源列表也将占用非常多的存储空间,花费很多存储费用。因此,操作审计将不再支持呈现读事件中的相关资源信息,以便为您提供更简单精炼且...

实时分析链路数据

如果您的应用遇到流量不均、单机故障、慢接口治理、业务流量统计、灰度发布监控等问题,可以通过应用监控的调用链分析快速定位问题代码。本文介绍如何通过调用链分析快速定位五种经典线上问题,更直观地了解调用链分析的用法与价值。背景...

使用须知

服务可用性不包括以下原因导致的不可用时间:运营商核心网异常、阿里云预先通知用户后进行的系统维护、任何阿里云以外的网络和设备异常、客户原因引起的异常等。边缘节点存在割接情况,一般割接频率不高于1次/月/节点,每次持续时间不多于6...

设备显示离线

可能原因 设备软件故障。设备到阿里云联网故障。解决方案 通过尝试在同一个运营商出口环境内 ping 其他知名网站,确认您的运营商网络正常。如果不正常,请处理运营商网络问题。如果正常,请跳转至 步骤2。请检查设备本身是否上电。电源状态...

SQL优化技术

效果评估:效果评估算法会对被优化的SQL及相关SQL模板进行性能跟踪,避免出现性能恶化导致故障。性能跟踪的算法基于决策树模型,包括全量SQL追踪和慢SQL追踪等多维度追踪,对SQL模板优化后的性能指标与优化前进行对比,综合判断SQL模板在该...

GTM如何实现异地容灾

两地三中心容灾架构,是指在同城双中心的基础上,在异地的城市建立一个备份的灾备中心,用于双中心的数据备份,当双中心出现自然灾害等原因而发生故障时,异地灾备中心可以用备份数据进行业务的恢复。目标读者 企业网络部、业务运维部工作...

应用场景

场景二:数据实时分析/数据库数据入数仓 数据分析在提高企业洞察力和用户体验方面发挥着举足轻重的作用,数据同步服务使您能够以几分钟而不是几小时或几天的频率从您的数据中获得洞见,从而提升企业的竞争力。数据同步服务可在增量数据同步...

配置消息监控告警实现风险预警

RocketMQ监控告警分类 重要监控告警 最佳配置时机 关注人员角色 实例运行水位和消耗指标 实例发送API调用频率 实例消费API调用频率 公网下行带宽消耗 配置时机:实例创建成功后立即配置。原因分析:实例级的水位消耗和单个Topic、Group无关...

公告:部分事件从写事件变更为读事件

变更说明 以下事件将由 写事件 变更为 读事件:服务名称 服务代码 API版本号 事件名称 变更原因 内容安全 Green 2018-05-09 TextScan 对内容素材的扫描评估,并不会影响云上的产品配置和应用运行。由于此类操作为业务高频操作,并非管控...

虚拟机场景

本文列出了虚拟机常见的故障演练场景。JvmCodeCache满 制造JVM CodeCache区域满的故障,CodeCache区域满会直接导致JIT编译关闭,从而引起业务系统性能下降。一般用于验证业务系统在高并发且系统性能下降的情况下,是否能够通过限流、快速扩...

配置消息监控告警实现风险预警

资源运维人员 业务开发人员 配置实例API调用频率告警最佳实践 背景:消息队列RocketMQ每个实例都明确了消息收发API调用TPS,例如,标准版实例支持每秒5000次API调用,若实例消息收发API调用频率超过规格限制,会导致实例被限流。...

发现并处理大Key和热Key

在使用 云原生内存数据库Tair 的过程中,如果未能及时发现并处理Big keys(下文称为“大Key”)与Hotkeys(下文称为“热Key”),可能会导致服务性能下降、用户体验变差,甚至引发大面积故障。本文将介绍大Key与热Key产生的原因、其可能...

发现并处理Redis的大Key和热Key

在使用Redis的过程中,如果未能及时发现并处理Big keys(下文称为“大Key”)与Hotkeys(下文称为“热Key”),可能会导致服务性能下降、用户体验变差,甚至引发大面积故障。本文将介绍大Key与热Key产生的原因、其可能引发的问题及如何快速...

监控与日志

为日志配置告警监控规则 创建日志告警监控规则后,系统根据定义的检查频率、触发条件等配置产生告警,并根据所选择的告警策略和行动策略进行告警降噪和通知。适用于监控 表格存储 中不能删除的表、不能删除的索引等场景。更多信息,请参见 ...

节点诊断

ECS实例云盘读写IOPS超过上限读写受限,请您降低磁盘的读写频率或升级为更高性能的云盘类型,有关云盘的读写性能指标,请参见 块存储性能。ECS实例磁盘加载情况 检查ECS实例在启动时云盘是否能正常挂载。云盘挂载失败,导致实例无法正常...

网络不通畅导致网站无法正常访问

说明 Tracert(跟踪路由)是路由跟踪实用程序,用于确定IP数据包访问目标所采取的路径。tracert 命令通过IP生存时间(TTL)字段和ICMP(Internet Control Message Protocol)错误消息确定从一个主机到网络上其他主机的路由。其命令格式如下...

GxP欧盟附录11标准合规包

规则名称 规则描述 建议项编号 建议项说明 操作审计开启全量日志跟踪 操作审计中存在开启状态的跟踪,且跟踪全部地域和全部事件类型,视为“合规”。1.1 风险管理应贯穿计算机化系统的整个生命周期,同时考虑到患者安全、数据完整性和产品...

核心自治技术案例解析

基于全局的Workload优化,基于Workload特征,例如SQL执行频率,读写比等进行优化,最大限度地消除局部优化的片面性弊端。下面是双11期间自动SQL优化一个实际案例:某自治服务接入实例,DAS于11月7日通过负载异常检测到因慢SQL引起的负载...

错误处理

由于服务器临时故障请求失败,请稍后重试。503 ServiceUnavailable.RegionMaintaining System maintenance is in progress on the selected region.Please wait a few minutes before trying again.所选地域的系统正在维护中,请等待几分钟...

启用并设置事件告警

步骤一:创建跟踪 请创建满足以下条件的跟踪跟踪的地域为全部地域。跟踪的事件类型为所有事件。跟踪将事件投递到日志服务SLS。具体操作,请参见 创建单账号跟踪 和 创建多账号跟踪。说明 在创建跟踪的同时可设置将历史的90天事件补投到该...

邮件推送常见退信代码及处理方法

接收方临时故障 400 the mta server of unexpected closed 450 Service temporarily unavailable 451$DOMAIN Resources temporarily unavailable 451 4.7.1 Sorry,the service is currently unavailable 451 Internal resource temporarily...

用云成本需求分析

数据备份是另一个为了满足安全要求而进行的必要的操作,按照数据安全的合规,企业有可能会增加数据备份的频率,数据备份选择的工具的实效性,数据存储和带宽都是会影响成本的约束。要了解安全性注意事项,请参阅 安全合规支柱。业务稳定性...

事件管理

通过事件管理可以实现快速定位问题、提高解决效率、减少重复问题的发生频率、增强业务连续性、提高用户体验、规范企业工作流程。事件管理包括以下几点:事件的识别与记录:通过监控工具、日志分析、人工上报等方式发现事件,并将其记录。...

通过PC端探测目标站点的网络质量

例如:选择1分钟频率,各地域探测点将以1分钟一次的频率监控目标地址。您还可以自定义监控周期,设置准确的监控时间。说明 2022年09月13日22:00:00之前已开通基础云监控的按量计费(cms_post)或已订购基础云监控的包年包月套餐(cms_...

诊断项与诊断结果说明

为避免该情况再次发生,请您降低磁盘的读写频率或升级为更高性能的云盘类型。各类云盘的读写性能指标,请参见 块存储性能。实例配置管理诊断 实例配置管理诊断项具体如下表所示。诊断项 描述 诊断范围及建议操作 实例核心操作异常 您对实例...

自动SQL限流

即使硬件设备或者网络出现故障,巡检系统也可以快速迁移、及时重启,保证服务稳定。但现有的这些手段几乎都是针对服务端的稳定性保证,来自业务端的异常使用造成的问题还需要人工介入处理,比如业务变化中引入了新的慢SQL,突然涌入的洪峰...

Pod诊断

容器智能运维平台 构建了基于专家经验的故障诊断系统,并基于海量数据训练了AI智能故障诊断模型。Pod诊断融合了基于专家经验和AI智能诊断两种诊断模式,进一步深入定位问题根因。Pod诊断包括诊断检查项和诊断根因。诊断检查项:包括Pod检查...

如何备份RDS只读实例

A:可能原因:本文方法二中的IP是一个即时的内网IP,当只读实例发生克隆、迁移可用区、切换VPC、切换交换机时,即时内网IP可能会发生变化,从而源实例连接失败,导致备份失败。解决方法:通过只读实例的 内网地址,并在本地通过 ping 命令...

RDS MySQL只读实例逻辑备份

A:可能原因:本文方法二中的IP是一个即时的内网IP,当只读实例发生克隆、迁移可用区、切换VPC、切换交换机时,即时内网IP可能会发生变化,从而源实例连接失败,导致备份失败。解决方法:通过只读实例的 内网地址,并在本地通过 ping 命令...

企业版和标准版功能对比

支持 支持 连接保持 PolarDB 新增支持连接保持功能,避免由于一些运维操作(如升级配置、主备切换或升级小版本等)或非运维操作故障(如节点所在服务器故障)导致的连接闪断或新建连接短暂失败的问题,进一步提高PolarDB的高可用性。...

通过移动端探测目标站点的网络质量

例如:选择1分钟频率,各地域探测点将以1分钟一次的频率监控目标地址。高级设置 高级设置如下表所示。重要 由于TLS1.2以下版本的握手协议有安全漏洞,因此云监控与主流浏览器保持同步,不再支持服务端TLS1.2以下版本。当站点监控任务运行时...
共有174条 < 1 2 3 4 ... 174 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
数据库自治服务 智能对话机器人 应用高可用服务 负载均衡 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用