集群磁盘使用率过高和read_only问题的排查与处理方法

如果存在未分配的分片,可执行 GET_cluster/allocation/explain 命令查看未分配分片的原因。如果原因如下图,请手动执行 POST/_cluster/reroute?retry_failed=true 命令。等待分片下发完成后,查看集群状态。如果集群状态依然为Red,请联系...

计算资源

资源调度:根据系统的负载情况和资源利用率,动态调整资源的分配。当节点负载过重时,可以将部分任务或数据迁移到其他节点上,以平衡资源的利用。资源容量不足 指CPU、内存资源不足。CPU资源不足会导致任务延迟增加,系统响应变慢,甚至...

网络资源

网络闪断故障可能由多种原因引起,如网络设备故障、电力波动、通信线路故障等。网络闪断会导致数据传输中断,影响系统和应用程序之间的数据传输,频繁的网络闪断可能导致系统或应用程序无法正常运行。常使用的容错策略如下:设备冗余:使用...

容器网络FAQ

使用Terway网络的ENI模式出现网络异常 容器服务Kubernetes的Terway网络场景中交换机的IP资源不足 Terway网络模式下,Pod分配的IP不在虚拟交换机网段中怎么办?Terway网络模式扩容vSwitch后,依然无法分配Pod IP怎么办?如何选择Kubernetes...

加速资源请求场景实践

动态内容基于智能选路技术,从众多回源线路中选择最优质的一条线路进行传输。配置流程 前提条件 在进行本操作之前,需确保您已经满足了以下条件:您已经拥有部署了应用程序的ECS,并为ECS绑定了对外服务的公网IP,如果您已经为ECS搭配了...

租户内存使用率告警

可能原因 业务租户的写入流量突然增大。集群转储功能可能发生故障。处理方法 查看租户的写入量监控,如果发现内存告警期间同时写入量突然增大,那么需要根据业务场景来调整租户的内存规格,如果集群内存资源已经分配满了,可以考虑对集群...

金融行业最佳实践

方案优势:阿里云DCDN提供多源负载均衡能力,实现多源异地灾备,可以按照主备、权重、性能等维度在多源站间分配流量,当某一个源站出现故障时,可以无缝切换,保障业务连续性和稳定性。协同办公 业务挑战:金融企业往往存在总部、多分支...

常见问题-FAQ

同时通过健康检查动态更新DNS解析IP列表,实现故障隔离以及故障切换。最终用户的访问直接连接服务的IP地址,并不通过GTM。而 SLB 是通过代理用户访问请求的形式将用户访问请求实时分发到不同的服务器,最终用户的访问流量必须要经过SLB。...

FAQs

同时通过健康检查动态更新DNS解析IP列表,实现故障隔离以及故障切换。最终用户的访问直接连接服务的IP地址,并不通过GTM。而 SLB 是通过代理用户访问请求的形式将用户访问请求实时分发到不同的服务器,最终用户的访问流量必须要经过SLB。...

功能变更记录

本文为您介绍弹性公网IP(Elastic IP Address,简称EIP)的产品动态和相关文档。2023年03月 功能名称 变更类型 功能描述 相关文档 实例诊断 新增 实例诊断功能支持对EIP实例进行公网诊断,可检查中国内地运营商和非中国内地运营商到目标EIP...

在离线混部概述

本文介绍在离线混部的技术架构、混部资源模型和单机QoS保障,帮助您快速了解和使用在离线混部。背景信息 从集群维度来看,混部是将多种应用在一个集群内部署,通过预测分析应用特性,实现业务对集群资源的充分利用;从节点维度来看,混部是...

CLB健康检查FAQ

您无需在ECS安全组中额外针对该地址段配置放行策略,但如有配置iptables等安全策略,请务必放行(100.64.0.0/10 是阿里云保留地址,其他用户无法分配到该网段内,不会存在安全风险)。更多信息,请参见 CLB健康检查工作原理。推荐的健康...

DDH常见问题

如果您因为过保迁移等原因分配了一台新的物理服务器,您的DDH会对应一个新的机器码,该机器码就是这台新物理服务器的唯一识别码。DDH故障时是否会自动迁移到健康的DDH?阿里云为您提供DDH故障迁移服务,开启服务后,DDH因故障停机时,会...

功能发布记录

故障演练支持自定义监控 故障演练支持自定义监控。演练场景、演练方案、演练执行单展示优化 演练场景、演练方案、演练执行单展示优化,区分我的和全部。场景实例、系统原子操作展示优化 场景实例、系统原子操作展示关联演练执行单列表。...

ECS灾备解决方案

通过快照恢复数据 当云盘因误删误改、勒索病毒等原因造成数据丢失事故时,您可以使用该云盘的历史快照回滚云盘,从而使该云盘的数据恢复到创建快照时的状态。具体操作,请参见 使用快照回滚云盘。通过镜像备份恢复数据 镜像文件相当于副本...

监控、诊断和故障排除

相对于传统应用程序,开发云端应用虽然降低了用户在基础设施搭建、运维等方面的成本,但却增大了监控、诊断和故障排查的难度。OSS存储服务为您提供了丰富的监控和日志信息,帮助您深刻洞察程序行为,及时发现并快速定位问题。本文主要描述...

混沌工程缓存实战系列-Redis

连接池满 建立网络连接 无法分配新连接,客户端建连失败。无 设置timeout和tcp-keeplive参数。网络监控。单次查询耗时过长 如果Key过多,可以模拟Keys*查询。单次请求RT变长。连接池占满。QPS RT 成功率 避免Keys*类查询。RT监控。IO读写过...

IT服务:SAE支持石家庄掌讯应用极速上云

背景信息 石家庄掌讯信息技术有限公司是一家提供企业信息化咨询、创新型软件产品、电商代运营服务,标准化管理、快速发展的高新技术企业。公司处于企业互联网市场突破转型重要阶段,希望将更多精力转移到业务创新,以提升开发和交付效率,...

网络架构容灾

专线/VPN主备:在物理专线、IPSec-VPN连接、BGP动态路由协议均正常运行的情况下,VPC实例可以通过物理专线和IPSec-VPN连接同时学习到本地IDC的网段,本地IDC也可以通过物理专线和IPSec-VPN连接同时学习到VPC实例的路由。系统默认通过物理...

连接公网概述

产品对比 ECS实例固定公网IP 创建专有网络类型的ECS实例时,您可以选择分配公网IPv4地址,系统会为您自动分配一个支持访问公网和被公网访问的IP地址。目前,ECS实例固定公网IP不能动态与VPC ECS实例解绑,但可以将固定公网IP转换为EIP。...

SSL-VPN连接常见问题

本文汇总了建立SSL-VPN连接时出现客户端连接失败、流量不通现象的常见原因并提供了相应的解决方案。常见问题快捷链接 客户端连接问题 客户端连接失败怎么办?客户端之前连接成功,但间歇性中断下线怎么办?仅部分客户端连接成功怎么办?SSL...

常见问题

A:只读节点间负载不均衡的原因有只读节点连接数较少、自定义集群地址分配时未包括某个只读节点等。Q:造成主节点负载高或低的原因是什么?A:造成主节点(主库)负载高的原因有直连主地址、主库接受读请求、存在大量的事务请求、主从复制...

历史功能发布记录(2022年)

本文介绍容器服务ACK 2022年功能发布的相关动态。背景信息 容器服务ACK支持的Kubernetes(K8s)版本:v1.24、v1.22、v1.20。容器服务ACK支持的操作系统:CentOS 7.9、Alibaba Cloud Linux 3.2104、Alibaba Cloud Linux 2.1903、Windows ...

客户案例

优化结果 OceanBase 作为一个通用的分布式关系数据库系统,其提供了丰富的分区方式(HASH,RANGE,RANGE+HASH 等),并且提供在线的业务无感知的动态分区能力,集群扩容只需要 DBA 简单的增加存储节点,以及做一些简单的 DDL 操作即可,...

常见报错及解决方案

Q:谐云组件故障排查思路 A:elasticsearch《故障排查思路》mysql《故障排查思路》redis《故障排查思路》harbor《故障排查思路》通用排查《中间件通用故障排查思路》ingress《故障排查思路》rocketmq《故障排查思路》kafka《故障排查思路》...

技术面临的挑战与革新

由于是共享存储架构,节点间状态接近于完全同步,当一个计算节点故障时,可以快速切换到其他节点,保障了RTO。在Proxy的协同下,甚至可以做到节点切换对应用无感知 传统分布式架构与存储计算分离架构对比 分布式数据库其实已经有了不短的...

企业单AZ架构升级到多AZ

本方案的技术架构包括以下基础设施和云服务:1个专有网络VPC:为应用型负载均衡ALB、云服务器ECS、云数据库RDS MySQL版等云资源形成云上私有网络。2台交换机:将2台云服务器ECS连接在同一网络上,实现它们之间的通信,并提供基本的网络分段...

常见问题

A:只读节点间负载不均衡的原因有只读节点连接数较少、自定义集群地址分配时未包括某个只读节点等。Q:造成主节点负载高或低的原因是什么?A:造成主节点(主库)负载高的原因有直连主地址、主库接受读请求、存在大量的事务请求、主从复制...

PAI灵骏智算服务概述

支持动态创建、销毁。支持热升级。支持用户态技术,保证更高可靠性。PAI灵骏网络使用限制 限制项 限制 提升配额方式 单个账号在同一地域支持创建的灵骏网段数量 8 具体操作,请参见 管理配额。单个灵骏网段支持创建的灵骏子网数量 16 具体...

事件中心

risk-vpn-bgpRouteLimit BGP动态路由数量超限风险 警告 BGP动态路由数量超限风险 VPN实例最近十分钟学习到的BGP动态路由数量已超过实例BGP路由配额的90%。建议关注,若出现超规格情况建议您可以根据实际网络规划在对端VPN网关进行网段聚合...

集群负载不均问题的分析方法及解决方案

导致阿里云Elasticsearch(简称ES)的负载不均问题的原因很多,目前主要包括shard设置不合理、segment大小不均、冷热数据需求、负载均衡及多可用区架构部署的长连接不释放等。本文介绍ES集群负载不均问题的分析方法及解决方案。问题现象 ...

DeviceLinkDown

DeviceLinkDown事件提示您线下机构侧动态路由邻居发生故障或者静态接入链路发生故障。告警信息 事件名称 事件级别 状态码 状态描述 DeviceLinkDown CRITICAL linkdown Device Link State Change 可能原因 用户侧交换机设备故障。用户侧交换...

DeviceSwitched

告警信息 事件名称 事件级别 状态码 状态描述 DeviceSwitched CRITICAL switched Device Role Changed 可能原因 智能接入网关主设备故障。智能接入网关主设备动态路由邻居故障。处理方法 无需处理。icmsDocProps={'productMethod':'created...

错误码

遇到该错误的通常原因是数据节点故障,请联系技术支持。PXC-4108 ERR_VARIABLE_CAN_NOT_SET_TO_NULL_FOR_NOW 描述:变量(variable)不允许被设置为NULL。示例:ERR-CODE:[PXC-4108][ERR_VARIABLE_CAN_NOT_SET_TO_NULL_FOR_NOW]System ...

云盘三副本技术

重要 如果ECS实例由于病毒感染、人为误删除或黑客入侵等软故障原因造成数据丢失,需要您采用备份或者快照等技术手段来解决。任何技术都不可能解决全部问题,因地制宜地选择合适的数据保护措施,才能为您的业务数据筑起一道坚实的防线。更多...

运维事件中心的审计事件

ListProblemOperations 查询故障动态。ListProblems 查询故障列表。ListProblemSubtotals 查询故障小计列表。ListProblemTimeLines 查询故障时间线列表。ListRouteRules 查询规则列表。ListRouteRulesByAssignWhoId 获取指定分配对象的流转...

RDS MySQL内存使用问题

RDS MySQL内存高常见原因 通常InnoDB Buffer Pool的内存占用是最大的,Buffer Pool的内存占用上限受到Buffer Pool配置参数的限制,但是还有很多内存是在请求执行中动态分配和调整的,例如内存临时表消耗的内存、prefetch cache、table ...

产品优势

弹性伸缩 根据作业需求动态分配计算资源。支持任务依赖关系(DAG),轻松组建工作流。I/O优化 独有数据分布式缓存技术,极大加速大规模共享数据分发。直接挂载对象存储,透明处理 I/O 访问异常。易用安全 无需特殊编程实现已有流程上云。...

光模块故障

本文介绍光模块发生故障原因和处理方法。问题现象 光模块连接后,接口指示灯没有变为绿色。可能原因 光模块不兼容或损坏。智能接入网关设备支持的光模块型号请参见 光模块型号。说明 目前仅SAG-1000设备支持光模块插入。解决方案 通用多...

内存管理

更正文档 概述 AliOS Things操作系统内核通过内存管理实现应用程序可以调用标准C库的malloc和free接口来动态分配和释放内存。内存管理函数 函数名 描述 aos_malloc()从系统heap分配内存给用户 aos_zalloc()从系统heap分配内存给用户,...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
云服务器 ECS 负载均衡 弹性公网IP 短信服务 人工智能平台 PAI 物联网平台
新人特惠 爆款特惠 最新活动 免费试用