产品高可用

最佳实践:会话同步可以保证长连接不受集群服务器故障的影响,但是对于短连接或连接未触发会话同步规则时(未完成三次握手),集群内的服务器故障仍可能会影响用户请求。为了防止集群中某台机器故障导致的会话中断,您可以在业务逻辑中...

如何解决MSE Nacos实例域名无法解析的问题?

请 提工单 联系网络技术支持协助排查DNS服务器或NameServer故障原因。如果使用的是ACK,请 提工单 联系ACK技术支持协助排查CoreDNS故障原因。方案二:使用ping命令 使用 ping${mse.nacos.host} 指令尝试解析。如果提示 unknown host,则...

系统架构

Region内可用区之间的管控服务器集群为多活模式,任一可用区管控服务器集群可承担Region下其他可用区所有解析配置下发流量。解析层:解析层在全球Region内均有部署,每个可用区均部署解析服务器集群,集群内解析服务器负载均摊。Region内...

集群管理FAQ

journalctl-u kubelet 集群常见问题 下表罗列了一部分ACK集群常见的故障原因以及处理方法。故障场景 处理方法 API Server组件停止或Master组件停止:不能创建、停止、更新Pod、Service、Deployment等资源。已有的Pod和Service仍然能够正常...

查看集群概况

智能运维系统通过红黄绿3种颜色来展示集群的健康状况:红色:表示集群已经出现了很严重的问题或者很严重的隐患,已经影响了您的使用,需要立即处理,否则会存在数据丢失,集群故障等问题。黄色:表示集群存在较严重的问题或隐患,可能会...

云盒故障服务器维修流程

本文介绍当云盒内的服务器出现故障时,阿里云如何进行更换和维修,保证数据安全。背景信息 当云盒内的服务器出现故障,需要更换和维修时,出于客户成本考虑,云盒内没有部署数据擦除服务,阿里云不在客户现场进行数据擦除。重要 在您购买...

通过云原生网关管理多个ACK集群

例如,集群A部署在可用区A,集群B部署在可用区B,A与B两个集群部署的服务一致,当其中一个集群故障时可以快速切换流量。云原生网关为了支持业务的高可用部署诉求,提供了多ACK集群接入功能。即用一个云原生网关实例同时关联A、B两个集群,...

基于MSE云原生网关实现同城多活

云原生网关默认采用多可用区部署,提供了地域级的、...压测执行到1分钟以后,手动把可用区I集群中的所有工作负载删除掉,模拟集群故障,观察流量损失。可以看到MSE在I可用区的集群挂掉后,可实现秒级切流,切流过程中仅有不到1%的流量损失。

实例健康诊断

实例健康诊断功能可以对 轻量应用服务器 实例的计算服务状态、网络服务、存储服务和配置管理等进行全方位的诊断,帮助您了解实例的健康状态,及时发现并解决常见的问题。前提条件 轻量应用服务器...轻量应用服务器故障问题,请参见 故障排除。

故障隔离

故障隔离是在服务实例出现故障时,实现实例级别的精细化摘流隔离,使故障影响范围更小,提高服务的可用性。添加故障隔离规则 登录 SOFAStack 控制台。在左侧菜单栏选择 中间件>微服务平台>服务网格>服务治理,然后单击 故障隔离 页签。单击...

集群异常状态

ACK会定时检测集群运行状态,如果集群符合特定的异常条件,集群状态将自动变更为“不活跃(inactive)”或“不可用(unavailable)”。集群变更为“不活跃”或“不可用”状态时,ACK将会通过短信、邮件、站内信的方式向您发送相关通知。...

CentOS系统时区错误的排查思路

概述 本文主要介绍CentOS系统时区错误的排查思路。详细信息 CentOS系统时区错误,显示为UTC时区,以下为...将正常服务器/usr/share/zoneinfo/Asia/Shanghai 文件拷贝到故障服务器后,执行 date 命令,确认时区恢复正常。适用于 云服务器ECS

设置独享集群

为更好地支持个性化业务的应用防护需求,Web应用防火墙WAF(Web Application Firewall)提供独享版,即采用虚拟独享集群,支持基于业务特性的定制化接入和防护能力。背景信息 为了特定的业务需求,网站业务可能使用非常规的设计方式实现。...

常见问题旧版索引

使用Terway网络的ENI模式出现网络异常 Terway网络场景中交换机的IP资源不足 ACK集群中SLB实例的具体用途 集群管理 容器服务ACK集群故障排查 添加Kubernetes集群节点的常见问题 删除Kubernetes集群失败 通过CloudShell管理集群出现超时问题 ...

轻量应用服务器网速较慢与预期带宽不符

问题原因 服务器的地域为中国香港。中国内地访问中国香港以及海外地域部分轻量应用服务器,出现网络无法连通的情况(海外客户端访问正常)。根据路由跟踪分析,异常节点处于跨境互联出口处,阿里云已向运营商报障,目前运营商尚未反馈恢复...

集群巡检项及解决方案

具体操作,请参见 容器服务ACK集群故障排查。集群控制面vSwitch剩余IP 异常影响:集群控制面的vSwitch剩余IP小于10个,新创建的Pod可能将分配不到IP无法正常启动。解决方案:请 提交工单 处理。检查是否存在多个Service复用同一个SLB同一个...

Pod诊断

更多信息,请参见 容器服务ACK集群故障排查。节点AUFS mount hung情况 检查节点系统AUFS mount是否出现hung。节点系统出现AUFS mount hung问题,请收集节点日志并 提交工单 处理。关于收集节点日志操作,请参见 一键采集节点的诊断日志。...

常见问题

ECS实例无法连接 PolarDB 集群的常见原因如下:集群白名单未配置或配置有误。如果使用本地公网进行连接,需要检查本地公网出口IP地址是否会变化;用户未创建数据库账号或当前数据库账号没有访问数据库的权限;私网、公网地址使用错误;网络...

部署高可用架构应用集群

背景信息 高可用架构应用集群具备的特点如下所述:轻量应用负载均衡可以将公网访问的流量分发到后端多台轻量应用服务器上,在增强应用吞吐能力的同时,可以消除服务器的单点故障,提升应用可用性。通过自定义镜像功能,您可以快速创建部署...

DNS解析异常问题排查

集群外部域名解析异常 新增Headless类型域名无法解析 StatefulSets Pod域名无法解析 安全组、交换机ACL配置错误 容器网络连通性异常 CoreDNS Pod负载高 CoreDNS Pod负载不均 CoreDNS Pod运行状态异常 客户端负载原因导致解析失败 ...

DNS解析异常问题排查

集群外部域名解析异常 新增Headless类型域名无法解析 StatefulSets Pod域名无法解析 安全组、交换机ACL配置错误 容器网络连通性异常 CoreDNS Pod负载高 CoreDNS Pod负载不均 CoreDNS Pod运行状态异常 客户端负载原因导致解析失败 ...

集群巡检项及解决方案

具体操作,请参见 容器服务ACK集群故障排查。节点公网访问情况 异常影响:检查节点能否正常访问公网。解决方案:请检查集群是否开启SNAT公网访问。关于开启SNAT公网相关操作,请参见 为已有集群开启公网访问能力。集群控制面vSwitch剩余IP ...

连接保持

PolarDB 新增支持连接保持功能,避免由于一些运维操作(如升级配置、主备切换或升级小版本等)或非运维操作故障(如节点所在服务器故障)导致的连接闪断或新建连接短暂失败的问题,进一步提高 PolarDB 的高可用性。前提条件 PolarDB 数据库...

CLB健康检查FAQ

如果某一台四层集群中的服务器对某一台后端服务器健康检查失败,则该四层集群中的服务器将不会再将新的客户端请求分发给相应的异常的后端服务器。四层集群内所有服务器同步进行该操作。如下图所示,传统型负载均衡CLB健康检查使用的地址段...

AIOps套件概述

集群诊断 集群诊断提供一键故障诊断能力,辅助您定位集群中出现的问题,包括Pod诊断、节点诊断、Service诊断、Ingress诊断、内存诊断。诊断项 说明 Pod诊断 涵盖了常见的Pod问题,例如Pod启动失败、Pod镜像拉取失败、Pod运行异常等,并在...

混合云接入

如果服务器已关机,则该节点将无法提供WAF防护服务,请您及时检查服务器关机原因,尽快修复异常。应用状态 表示节点上的WAF客户端应用程序vagent是否正常运行。正常 状态表示运行正常,已停止 状态表示vagent已停止运行。如果vagent已停止...

AIOps套件概述

集群诊断 集群诊断提供一键故障诊断能力,辅助您定位集群中出现的问题,包括Pod诊断、节点诊断、Service诊断、Ingress诊断、内存诊断。更多信息,请参见 使用集群诊断。诊断项 说明 Pod诊断 涵盖了常见的Pod问题,例如Pod启动失败、Pod镜像...

DNS最佳实践

DNS是Kubernetes集群中至关重要的基础服务之一,在客户端设置不合理、集群规模较大等情况下DNS容易出现解析超时、解析失败等现象。本文介绍Kubernetes集群中DNS的最佳实践,帮助您避免此类问题。前提条件 创建Kubernetes托管版集群 获取...

DNS最佳实践

DNS是Kubernetes集群中至关重要的基础服务之一,在客户端设置不合理、集群规模较大等情况下DNS容易出现解析超时、解析失败等现象。本文介绍Kubernetes集群中DNS的最佳实践,帮助您避免此类问题。前提条件 创建Kubernetes托管版集群 获取...

集群高可用架构推荐配置

容器服务 Kubernetes 版 基于Kubernetes架构提供了多种集群高可用保障机制,以确保集群控制面、节点与节点池、工作负载、负载均衡等维度的高可用,帮助您构建稳定、安全、可靠的集群和应用架构。本文使用指引 本文主要面向 容器服务 ...

故障排查

ACK集群异常 添加Kubernetes集群节点的常见问题 容器镜像仓库构建服务失败问题排查 容器镜像服务源码绑定失败问题排查 Kubernetes集群如何指定安全组 Kubernetes集群网络异常的排查方法 容器服务ACK应用故障排查 如何升级集群?排查故障的...

查看节点详情

集群 创建或 导入完成后,如需查看集群中节点的详细信息,您可以通过 LHC 控制台查看节点信息,包括节点服务器 IP、节点创建时间、Pod 列表以及节点事件等信息。说明 从对接 ACK 集群的功能上线时起(2020 年 8 月 15 号),阿里云底座上...

Pod诊断

重要 使用故障诊断功能时,系统将在您的集群执行数据采集程序并收集检查结果。采集的信息包括系统版本,以及负载、容器组件等运行状态及系统日志中关键错误信息。数据采集程序不会采集您的业务信息及敏感数据。诊断支持的异常场景 Pod诊断...

Pod诊断

重要 使用故障诊断功能时,系统将在您的集群执行数据采集程序并收集检查结果。采集的信息包括系统版本,以及负载、Docker、Kubelet等运行状态及系统日志中关键错误信息。数据采集程序不会采集您的业务信息及敏感数据。诊断支持的异常场景 ...

自助诊断GPU节点问题

ACK集群提供节点级别的GPU诊断功能,供您进行部分GPU相关问题的故障排查。如果您在ACK Pro版集群中使用GPU节点时遇到问题,可以启用GPU节点自助诊断,采集GPU诊断的基础指标进行问题排查。本文介绍如何使用节点诊断功能,自助排查GPU节点...

控制台发布记录

2022-12-16 冷数据归档 2022年11月 功能名称 功能描述 发布时间 相关文档 新增集群保护锁 开启集群保护锁,可以有效避免因操作疏忽、团队成员沟通不及时等原因造成的集群释放。2022-11-20 集群保护锁 新增全局只读节点 在产品系列为多主...

集群实例工作台

在云数据库 OceanBase 中,一个集群实例指 OceanBase 数据库及其运行所需的资源组合,关联了若干服务器节点、专有网络等云资源。在云数据库 OceanBase 控制台中创建集群实例之后,您可以查看名下的所有集群实例的详细信息。查看集群实例...

集群巡检项及解决方案

检查类型 预警风险 资源配额 ResourceQuotas VPC内SLB配额紧张 SLB后端服务器配额紧张 SLB可监听数配额紧张 SLB实例数配额检查 资源水位 ResourceLevel SLB带宽使用率过高 SLB最大连接数过高 SLB新建连接速率过高 SLB QPS过高 集群Pod网段...

使用须知及高危风险操作说明

阿里云容器服务Kubernetes版(简称容器服务ACK)提供容器服务相关的技术架构以及核心组件的托管服务,对于非托管组件以及运行在ACK集群中的应用,不当操作可能会导致业务故障。为了更好地预估和避免相关的操作风险,在使用容器服务ACK前,...

查看连接地址

Proxy为阿里云完全自研,承担着路由转发、负载均衡、模式转换与故障转移等职责,同时支持执行 阿里云自研的Proxy命令,具有聚合连接、增强读性能、简单易用等优势,有助于您设计更高效的业务系统,更多信息请参见 Tair Proxy特性说明。...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
轻量应用服务器 云服务器 ECS 云数据库 Redis 版 负载均衡 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用