时延洞察

您可以通过该功能排查 Tair 数据库的故障和性能降低的原因。功能简介 原生Redis在2.8.13版引入时延监控(Latency Monitoring)特性,基于事件机制帮助您发现和排查可能的时延问题。该功能仅支持获取最近160秒的数据,且只存取每秒内时延...

割接与上线

割接上线前的准备 应用的割接上线是整个应用上云迁移实施的最关键环节,这一环节出问题,可能会造成重大故障。针对割接上线的重要性,我们建议在实施应用割接前,制定详细的割接前检查清单,这个清单的严谨程度很大程度上决定了割接成功率...

实例启动异常常见错误与对应解决方案

问题原因 该问题可能是因为Windows系统引导配置数据(Boot Configuration Data,BCD)配置异常或者磁盘文件系统故障,导致系统无法加载。解决方案 在存有快照的情况下,您可以使用快照来恢复系统盘。具体操作如下:警告 回滚云盘是不可逆...

查询并配置计划内事件

您需要登录 消息中心,确保 云数据库故障或运维通知 的通知开关处于开启状态并设置消息接收人(推荐设置为数据库运维人员),否则您将无法收到相应的通知信息。 1.消息中心通知设置 操作步骤 登录 HBase管理控制台。在左侧导航栏,单击 ...

混沌工程缓存实战系列-Redis

示例架构如下:从架构可以看出,在Jedis配置、缓存查询、网络传输、服务端处理这条链路上,每个环节都有可能出现问题。借助混沌工程可以了解到问题发生时对系统、业务的影响面是否符合预期。梳理演练场景 对于示例应用,可以按照以下...

实时分析链路数据

如果您的应用遇到流量不均、单机故障、慢接口治理、业务流量统计、灰度发布监控等问题,可以通过应用监控的调用链分析快速定位问题代码。本文介绍如何通过调用链分析快速定位五种经典线上问题,更直观地了解调用链分析的用法与价值。背景...

监控、诊断和故障排除

相对于传统应用程序,开发云端应用虽然降低了用户在基础设施搭建、运维等方面的成本,但却增大了监控、诊断和故障排查的难度。OSS存储服务为您提供了丰富的监控和日志信息,帮助您深刻洞察程序行为,及时发现并快速定位问题。本文主要描述...

邮件推送服务等级协议

赔偿范围不包括以下原因所导致的服务不可用:(1)用户因发送钓鱼、欺诈、病毒等有恶劣影响的邮件、涉嫌滥注服务、发送大量垃圾邮件而被第三方投诉,RBL列黑,造成邮件推送产品的通道信誉受损等引起的;(2)阿里云预先通知客户后进行系统...

混合云应用双活容灾最佳实践

容灾切换数据质量保障难 容灾切换过程中,可能因数据同步延迟导致读到旧数据,以及切换规则推送到分布式应用节点时间不一致等原因可能造成云上云下数据库同时读写而出现脏写的问题,整个切换过程数据质量保障是关键点及难点。无业务代码...

风险视图

查看风险 登录 AHAS控制台,从左侧导航栏选择 故障演练>架构感知。在 场景视图 区域,单击 风险视图 的 查看视图,进入详情页。默认进入的是 缩略 视图模式。将鼠标悬浮在图标上,可查看该产品需重点关注的TOP5风险和风险总数。在页面右...

使用集群诊断

容器智能运维平台 提供一键故障诊断能力,包括节点诊断、Pod诊断、Service诊断、Ingress诊断、内存诊断、网络诊断,可以辅助您定位集群中出现的问题。本文介绍如何在ACK集群中使用集群诊断功能。前提条件 已创建Kubernetes托管版集群。具体...

Tair选型指南

选择容灾方案 3.Tair容灾架构演进 灾备方案 灾备级别 说明 单可用区高可用方案★主从节点部署在同一可用区中的不同机器上,当任一节点发生故障时,由高可用HA(High Availability)系统自动执行故障切换,避免单点故障引起的服务中断。...

服务等级协议

2.3 除外情形 因 下述原因导致的服务不可用的时长不计入服务不可用时间:(1)阿里云预先通知用户后进行系统维护所引起的,包括割接、维修、升级和模拟故障演练;(2)任何阿里云所属设备以外的网络、设备故障或配置调整引起的;(3)用户...

查看智能洞察事件列表

智能洞察支持对不同地域的不同应用进行...Pod pending突增 Pod pending突增 类型的事件详情页面显示了最近30分钟内问题集群的内存和CPU总量、请求总量以及使用总量的趋势,同时可以查看相应时间段内关联事件以及相应Deployment的配置信息。

云数据库Redis版产品选型必读

选择容灾方案 3.Redis容灾架构演进 灾备方案 灾备级别 说明 单可用区高可用方案★主从节点部署在同一可用区中的不同机器上,当任一节点发生故障时,由高可用HA(High Availability)系统自动执行故障切换,避免单点故障引起的服务中断。...

查看消费者状态

应用场景 消费者状态信息包括在线状态、订阅关系、消费TPS、消息堆积量和线程堆栈信息等,经常被应用于以下故障排查场景:故障场景 现象 处理建议 订阅关系不一致 在 Group 详情 页面,看到Group ID的 订阅关系 显示 订阅关系不一致,请...

消息轨迹

您可根据TraceID或MessageId,追踪任意一条消息在物联网平台流转的全路径,还可根据出现的故障节点快速分析、定位问题。本文介绍查看消息轨迹的操作步骤。限制说明 仅中国地域的企业版实例和新版公共实例,支持使用消息轨迹功能。操作步骤 ...

冷备操作手册

五 数据恢复操作 5.1 登录控制台项目 登录链接:阿里云应用服务平台,找到相关项目 5.2 设备配置恢复 进入项目内,找到 边缘一体机-网关管理,如下所示。点击网关对应的 设备集成 点击部署,推送设备配置到边缘一体机 点击部署后可以查看...

服务条款

3.2.3阿里云将消除您非人为操作所出现的故障,但因您原因和/或不可抗力以及非阿里云控制范围之内的事项除外。用户数据的使用 4.1 阿里云可能会使用您提交的注册账户的信息,向您发出产品、服务的推广营销信息;阿里云可能会检测、记录您的...

使用Redis实现多地容灾的会话管理

读操作 如果用户获取会话信息的请求因某种原因被发送到了异地的Redis实例,例如上海用户的请求发送到了北京,则优先从当地(北京)的Redis实例读取数据。如果在北京的Redis实例中没有查询到所请求的数据,则返回源地域(上海)的Redis实例...

查看监控信息

在进行数据库日常维护或处理数据库故障时,查看数据库相关的性能指标是必不可少的步骤。RDS MySQL的标准监控提供了丰富的性能监控指标,以及强大的诊断能力,能够及时发现数据库的异常并提供相应的治理方案。并且提供了常见数据库问题场景...

功能概览

链路详情 提供系统间调用的链路、链路详情、时序等,清晰全方位的展现系统间调用的交互、性能和异常信息。兼容 Open-telementry 原生与 SOFAStack 上的应用进行无缝对接,用户的业务代码无需任何修改即可轻松接入,也支持接收 zipkin、...

管理主备切换

对于集群系列实例,您也可以在实例的 基本信息 页面的实例拓扑上进行主备节点切换操作。临时关闭主备自动切换 自动切换默认为开启,主实例出现故障会自动切换到备实例,在遇到如下情形时您可以选择临时关闭主备自动切换:大促活动等,不...

节点弹性大盘

可用节点数:集群中KubeletReady的节点数目,如果与总节点数不一致则说明有些节点处于KubeletNotReady状态,如果这些节点并非正在加入,那有可能是故障,需要特别关注。集群可扩容:集群是否处于可扩容的状态,如果这里显示 NO,表示集群中...

企业单AZ架构升级到多AZ

方案架构 本方案提供的默认设置完成部署后在阿里云上搭建的架构如下所示。实际部署时您可以根据资源规划修改配置。本方案的技术架构包括以下基础设施和云服务:1个专有网络VPC:为应用型负载均衡ALB、云服务器ECS、云数据库RDS MySQL版等...

CLB健康检查FAQ

负载均衡因后端数据库故障导致健康检查失败,如何处理?负载均衡服务TCP端口健康检查成功,为什么在后端业务日志中出现网络连接异常信息?为什么业务本身没有异常但是健康检查显示异常?健康检查的原理是什么?负载均衡采用集群部署。四层...

使用ACK AI助手进行故障排查和智能问答

若ACK AI助手无法定位问题的根因并提供可用的解决方案,您可以发起进一步发起诊断,对异常的Pod、Node节点发起基于ACK技术专家诊断经验的深度故障诊断功能。更多信息,请参见 使用集群诊断。前提条件 已开通 容器服务 Kubernetes 版 并已...

功能特性

此外,在数据库实例发生故障且无法定位原因时,可以利用克隆库复现故障场景,以便更好地定位故障原因。智能压测 搜索分析 查询并导出SQL语句对应的日志信息。搜索 SQL洞察 SQL洞察聚类分析,用作深度异常的排查。SQL洞察 安全审计 内置了...

设备显示离线

可能原因 设备软件故障。设备到阿里云联网故障。解决方案 通过尝试在同一个运营商出口环境内 ping 其他知名网站,确认您的运营商网络正常。如果不正常,请处理运营商网络问题。如果正常,请跳转至 步骤2。请检查设备本身是否上电。电源状态...

使用访问日志

全球加速提供访问日志功能,可以记录所有访问终端节点的流量信息,帮助您检查访问控制规则、排查网络故障等。访问日志介绍 您可以选择为全球加速实例的一个或者多个终端节点组创建访问日志,采集到的访问日志将会投递到终端节点组所在地域...

使用访问日志

全球加速提供访问日志功能,可以记录所有访问终端节点的流量信息,帮助您检查访问控制规则、排查网络故障等。访问日志介绍 您可以选择为全球加速实例的一个或者多个终端节点组创建访问日志,采集到的访问日志将会投递到终端节点组所在地域...

地域和可用区常见问题

地域和可用区之间的关系如下所示。ECS与RDS在不同地域,可以跨地域连接吗?流量是否收费?不同地域内的实例默认是无法内网互访的,只能通过 外网地址 互通。外网连接的性能、安全性、稳定性较差,外网流量(流入和流出)目前零折优惠,不...

地域和可用区常见问题

地域和可用区之间的关系如下所示。ECS与RDS在不同地域,可以跨地域连接吗?流量是否收费?不同地域内的实例默认是无法内网互访的,只能通过 外网地址 互通。外网连接的性能、安全性、稳定性较差,外网流量(流入和流出)目前零折优惠,不...

Coredump 分析能力

换言之,依赖 Coredump 文件,我们可以更好地去还原应用故障现场来定位问题。因此 Node.js 性能平台提供了针对服务器上 Node.js 应用生成的 Coredump 文件的 文件生成告警、自动保存、一键转储(commandx>=v1.5.2)和 智能化分析 的功能;...

概览

该用户使用单指标报警规则时统一配置内存使用率大于80%,负责离线渲染的ECS持续报警一周,报警200条,配置智能阈值后效果如下,一周报警5条以内,误报收敛95%。除了云服务器ECS的内存使用率,其他指标也适用于报警降噪最佳实践,现推荐...

读写分离架构

同时,读写分离架构实例由阿里云 Tair 团队自研的Proxy组件进行数据分发、故障切换等服务,为您降低了运维成本。组件介绍 读写分离架构主要由主节点、只读节点、代理节点(Proxy)和高可用系统等组成,架构如下。 1.云原生(原云盘)...

读写分离版

同时,读写分离架构实例由阿里云 Tair 团队自研的Proxy组件进行数据分发、故障切换等服务,为您降低了运维成本。组件介绍 读写分离架构主要由主节点、只读节点、代理节点(Proxy)和高可用系统等组成,架构如下。 1.云原生(原云盘)...

东软案例

总得来说,造成这种现象的主要问题原因,可总结为以下两个方面:新需求推动IT系统监控数据量激增:移动智能终端设备的普及使应用逐渐渗入到我们工作生活的方方面面,企业应用数量激增。企业面向客户、合作伙伴和内部员工建设IT系统及应用...

从Spring Cloud到服务网格体系的结合与迁移

其根本原因是两套服务发现导致的不一致问题,因此解决办法较为简单,统一服务发现即可。也就是说,Kubernetes已经在Pod调度的同时维护了服务和Endpoint间的数据,则没有必要再单独使用一套命名服务的机制进行服务注册,统一收敛到...

流量回放和压测

此外,在数据库发生故障且无法定位原因时,可以利用克隆库复现故障场景,以便更好地定位故障原因。前提条件 源数据库支持:RDS MySQL PolarDB MySQL版 说明 不支持 PolarDB MySQL版 的 企业版 单节点 实例。PolarDB-X 2.0。目标数据库实例...
共有113条 < 1 2 3 4 ... 113 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
数据库自治服务 云数据库 OceanBase 版 应用高可用服务 负载均衡 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用