查看消费者状态

如果消息消费出现异常,您可以在 云消息队列 RocketMQ 版 控制台查看指定Group ID的消费状态,包括消费者在线状态、订阅关系一致性结果、消费堆积相关指标、消费者客户端信息等,帮助您快速定位异常原因。应用场景 消费者状态信息包括在线...

Tair选型指南

3 选择容灾方案 云原生内存数据库Tair 实例若因不可预料的原因(例如设备故障、机房断电等)发生故障,容灾机制保障数据的一致性和业务可用性。云原生内存数据库Tair 提供多种灾备方案供您选择,可满足不同的业务场景。4 预估内存规格 提前...

混合云应用双活容灾最佳实践

多活控制台提供MSFE集群界面白屏化的部署、扩缩容、监控等常规运维能力,以及应对故障场景的分钟级切流能力。服务互通和同单元优先调用:业务应用需要按业务产品线分批上云,过程中存在下游应用仅IDC部署的情况。利用MSHA注册中心同步功能...

云端运行日志

通过日志记录的消息内容、业务类型、操作类型和状态码等信息,可以了解设备状态、通信情况,并定位操作失败的原因,帮助您监控和管理设备,进行故障排查。本文介绍如何查看云端运行日志,以及相关错误码和排错方法。日志业务类型说明 上行...

SSL-VPN连接常见问题

本文汇总了建立SSL-VPN连接时出现客户端连接失败、流量不通现象的常见原因并提供了相应的解决方案。常见问题快捷链接 客户端连接问题 客户端连接失败怎么办?客户端之前连接成功,但间歇性中断下线怎么办?仅部分客户端连接成功怎么办?SSL...

概述

再者云计算平台会提供冗余存储和备份能力,避免系统因为硬件故障或其他原因导致的停机或数据丢失。这种备份机制可以提高系统的可靠性。责任共担模型 阿里云平台提供高可用的基础设施,并提供应用稳定性相关工具体系。用户可以基于阿里云...

GTM如何实现异地容灾

两地三中心容灾架构,是指在同城双中心的基础上,在异地的城市建立一个备份的灾备中心,用于双中心的数据备份,当双中心出现自然灾害等原因而发生故障时,异地灾备中心可以用备份数据进行业务的恢复。目标读者 企业网络部、业务运维部工作...

查询并配置计划内事件

云原生多模数据库 Lindorm 的运维事件(例如小版本升级)除了通过 短信、语音、邮件或站内信通知之外,还会在控制台进行通知。您可以在计划内事件中,查看具体的事件类型、地域、流程、注意事项和系统默认切换时间等信息,也可以手动修改...

使用访问日志

全球加速提供访问日志功能,可以记录所有访问终端节点的流量信息,帮助您检查访问控制规则、排查网络故障等。访问日志介绍 您可以选择为全球加速实例的一个或者多个终端节点组创建访问日志,采集到的访问日志将会投递到终端节点组所在地域...

使用访问日志

全球加速提供访问日志功能,可以记录所有访问终端节点的流量信息,帮助您检查访问控制规则、排查网络故障等。访问日志介绍 您可以选择为全球加速实例的一个或者多个终端节点组创建访问日志,采集到的访问日志将会投递到终端节点组所在地域...

采集客户端数据的高可用方案

但是在一些相对极端的场景下,单集群可能由于一些预期外原因存在故障停服风险。针对该单集群故障风险,日志服务提供两种异地多活的客户端数据采集方案。方案比较 对比项 方案1:双写 方案2:数据加工复制+写入切换 部署复杂度 低 需要额外...

主从实例读写分离部署(共享存储)

当出现1分钟容器响应超时(可能是内存溢出、硬件故障、软件Bug等原因导致),Resource Manager会自动拉起新的计算节点,并迁移Shard职责到新的节点上(例如Worker Node3响应超时,Resource Manager拉起Worker Node4取代Worker Node3),...

Pod异常问题排查

本文目录 类别 内容 诊断流程 诊断流程 常见排查方法 检查Pod的状态 检查Pod的详情 检查Pod的配置 检查Pod的事件 检查Pod的日志 检查Pod的监控 使用终端进入容器 Pod故障诊断 常见问题及解决方案 常见的Pod异常状态及处理方式 Pod OOM异常...

使用集群诊断

容器智能运维平台 提供一键故障诊断能力,包括Pod诊断、Service诊断、Ingress诊断,可以辅助您定位集群中出现的问题。本文介绍如何在ACS集群中使用集群诊断功能。前提条件 已创建ACS集群。具体操作,请参见 创建ACS集群。确保ACS集群运行...

自动/手动主备切换

当系统发生故障时,PolarDB 集群会自动进行主备切换。您也可以手动进行主备切换,指定一个只读节点为新的主节点。注意事项 不论是自动切换还是手动切换,切换过程中,都可能会出现30秒左右的闪断,因此切换前请务必确保应用具备重连机制。...

自动/手动主备切换

当系统发生故障时,PolarDB 集群会自动进行主备切换。您也可以手动进行主备切换,指定一个只读节点为新的主节点。注意事项 不论是自动切换还是手动切换,切换过程中,都可能会出现30秒左右的闪断,因此切换前请务必确保应用具备重连机制。...

K8s应用运维管理最佳实践

重要 禁止从负载均衡控制台直接修改SLB实例的监听配置(含监听+证书),可能导致SLB控制台修改的配置回退,引发应用入口相关的故障。请勿配置私网SLB进行集群内部服务的访问。Pod实例之间无法直接访问私网SLB地址,私网SLB只是用来提供VPC...

创建演练

背景信息 一次完整的故障演练包括以下四个阶段:安装故障演练探针 创建演练 执行演练 停止演练 操作步骤 登录 AHAS控制台,在左侧导航栏中选择 故障演练>我的空间。在 我的空间 页面,单击 新建演练。选择 新建空白演练 或 从经验库新建。...

Pod异常问题排查

本文目录 类别 内容 诊断流程 诊断流程 常见排查方法 检查Pod的状态 检查Pod的详情 检查Pod的配置 检查Pod的事件 检查Pod的日志 检查Pod的监控 使用终端进入容器 Pod故障诊断 常见问题及解决方案 常见的Pod异常状态及处理方式 Pod OOM异常...

连接保持

PolarDB 新增支持连接保持功能,避免由于一些运维操作(如升级配置、主备切换或升级小版本等)或非运维操作故障(如节点所在服务器故障)导致的连接闪断或新建连接短暂失败的问题,进一步提高 PolarDB 的高可用性。前提条件 PolarDB 数据库...

使用集群诊断

容器智能运维平台 提供一键故障诊断能力,包括节点诊断、Pod诊断、Service诊断、Ingress诊断、内存诊断、网络诊断,可以辅助您定位集群中出现的问题。本文介绍如何在ACK集群中使用集群诊断功能。前提条件 已创建Kubernetes托管版集群。具体...

GxP欧盟附录11标准合规包

他要求涵盖了计算机化系统的开发、验证、操作、维护和监测等方面,以确保这些系统符合相关法规和标准,用于生产、控制和保证产品质量和可靠性。Annex 11是GMP(Good Manufacturing Practice)的一部分,作为药品生产过程中的重要指导标准之...

自助诊断GPU节点问题

ACK集群提供节点级别的GPU诊断功能,供您进行部分GPU相关问题的故障排查。如果您在ACK Pro版集群中使用GPU节点时遇到问题,可以启用GPU节点自助诊断,采集GPU诊断的基础指标进行问题排查。本文介绍如何使用节点诊断功能,自助排查GPU节点...

云数据库Redis版产品选型必读

选择容灾方案 当云数据库Redis实例因不可预料的原因(例如设备故障、机房断电等)发生故障,容灾机制可用于保障数据的一致性和业务可用性。云数据库Redis提供多种灾备方案供您选择,可满足不同的业务场景。选择大版本 推荐使用更新的大版本...

一键诊断

在数据库出现故障时,您可以利用一键诊断功能,快速诊断选定时间段内数据库性能情况,直观地查看数据库性能情况的全貌,快速定位异常原因。前提条件 目标数据库引擎为:RDS MySQL MyBase MySQL 自建MySQL 目标数据库实例已经接入DAS,详情...

管理运维事件

您可以设置运维事件通知,在控制台上查看运维事件的任务ID、切换时间、事件状态等,以及手动修改待处理事件的切换时间。本文介绍如何管理运维事件。前提条件 集群为 AnalyticDB MySQL 数仓版(3.0)集群。有未处理的运维事件。说明 您可以...

消费重试

消费者出现异常,云消息队列 RocketMQ 版 会根据消费重试策略重新投递该消息进行故障恢复。本文介绍消费重试的应用场景、原理机制、版本兼容性和使用建议。应用场景 云消息队列 RocketMQ 版 的消费重试主要解决的是业务处理逻辑失败导致的...

CLB健康检查FAQ

问题原因 如果返回的状态码与控制台配置的正常状态码不一致,则判定健康检查异常。如果您配置的正常状态码为http_2xx,则所有返回的非HTTP 2xx状态码均被认为是健康检查失败。Tengine/Nginx配置执行 curl 命令会发现没有问题,但是执行 ...

升级ASM实例

为避免过期版本实例存在的安全和稳定性风险,同时保证您业务的连贯性,服务网格 ASM支持通过原地升级或金丝雀升级的方式升级控制平面和数据平面。本文介绍ASM实例升级前后的注意事项和说明、升级路径、升级流程和操作步骤等。前提条件 已...

管理拓扑任务

查看任务列表 登录 SOFAStack 控制台。在左侧导航栏选择 中间件>任务调度>任务编排。您可以在任务列表中查看已创建的拓扑任务,包括拓扑名称、调度类型、创建时间等信息。查看调度记录 在拓扑任务列表,单击目标任务名称。单击 调度记录 页...

常见网络问题

专线故障 VPN或云企业网故障 具体排查方法,请参见 请求失败排查方法。控制台显示 打开备份库失败 通过诊断工具检测,出现如下问题:This is usually a temporary error during hostname resolution and means that the local server did ...

运维服务内容说明

因客户自身原因导致的问题故障,不属于阿里云运维服务范围。如客户有不定期现场服务需求,可按天购买运维专家现场服务。运维服务专家可帮助客户进行疑难问题现场处理,故障现场救援,变更现场保障、现场运维培训等服务。运维专家现场服务需...

查询并配置计划内事件

云数据库HBase的运维事件(例如小版本升级)除了通过 短信、语音、邮件或站内信通知之外,还会在控制台进行通知。您可以在计划内事件中,查看具体的事件类型、地域、流程、涉及的实例列表、注意事项和系统默认切换时间,也可以手动修改计划...

实例启动异常常见错误与对应解决方案

问题原因 该问题可能是因为Windows系统引导配置数据(Boot Configuration Data,BCD)配置异常或者磁盘文件系统故障,导致系统无法加载。解决方案 在存有快照的情况下,您可以使用快照来恢复系统盘。具体操作如下:警告 回滚云盘是不可逆...

附录:SOFAStack 产品目录

分布式链路跟踪 分布式链路跟踪(Distributed System Tracing,简称 DST)是一款面向分布式架构、微服务架构和云原生架构的应用可观察性的金融级解决方案,帮助用户厘清应用间复杂的调用关系,迅速定位故障或者缓慢节点。产品架构 产品优势...

通过错/慢调用链排查应用产生异常的原因

在生产环境中,引发应用异常(如耗时突增、错误率突增)的原因有很多,常见的包括流量不均、单机故障、程序异常和依赖组件故障等。在新应用上线或大促备战前通常建议做一次系统性的性能调优,分析当前系统存在哪些性能瓶颈,梳理出常出错的...

混沌工程缓存实战系列-Redis

登录 AHAS控制台,在左侧栏选择 故障演练>我的空间。在 我的空间 页面,单击 新建演练>新建空白演练。在 演练配置 页面,填写相关参数,选择 演练内容 为 主机内网络延迟。更多参数信息,请参见 创建演练。单击 主机内网络延迟,在 本地...

DDH常见问题

如果您因为过保迁移等原因被分配了一台新的物理服务器,您的DDH会对应一个新的机器码,该机器码就是这台新物理服务器的唯一识别码。DDH故障时是否会自动迁移到健康的DDH?阿里云为您提供DDH故障迁移服务,开启服务后,DDH因故障停机时,会...

上下文查询

开发人员无需登录服务器,在大量日志中通过关键字检索日志,日志服务支持通过控制台查看指定日志在原始文件中的上下文信息。前提条件 已通过Logtail采集到日志。具体操作,请参见 通过Logtail采集日志。重要 如果您使用了Logtail插件处理...

查看并管理计划内事件

云数据库ClickHouse 社区兼容版集群 的运维事件(例如小版本升级、网络升级等)除了通过 短信、语音、邮件或站内信通知之外,还会在控制台进行通知。您可以在计划内事件中,查看具体的集群ID、事件类型、地域、事件原因和业务影响等,也...
共有101条 < 1 2 3 4 ... 101 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
数据库自治服务 云数据库 OceanBase 版 应用高可用服务 负载均衡 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用