同城多活常见问题

资源双活在业务节点故障时,南北走向流量切走,东西走向流量仍旧持续进入,业务无法恢复,因此无法做到业务同城多活。和EDAS、MSE集群流量同可用区优先的差异和优势?类别 MSHA EDAS、MSE 微服务日常场景 面向可用区级别,解决RT问题。面向...

标准版-单副本

当数据库节点发生故障时,数据会丢失,系统会重新拉起一个Redis进程(没有数据),当节点故障业务自动切换完成后,应用程序需要将数据重新预热。单副本架构不支持以下功能:自动或手动备份、离线全量Key分析 和 实例回收站。若您对数据有...

标准架构

节点提供日常服务访问,从节点提供HA高可用,当主节点发生故障,系统会自动在30秒内切换至从节点,保证业务平稳运行。标准架构高可用类型的特点如下:可靠性 服务可靠 采用双机主从(master-replica)架构,主从节点位于不同物理机。主...

集群版-单副本

纯缓存应用 单副本集群版的分片服务器由单节点组成,分片服务器某节点出现故障时,系统会重新拉起一个Redis进程(没有数据),当节点故障业务自动切换完成后,数据将会丢失,有可能流量被冲击到后端数据库,需要做好应用程序的预热保护机制...

灾备方案

Tair 容灾架构演进 当 Tair 实例因不可预料的原因(例如设备故障、机房断电等)发生故障,容灾机制可用于保障数据的一致性和业务可用性。Tair 提供多种灾备方案供您选择,可满足不同的业务场景。图 1.Tair 容灾架构演进 灾备方案 灾备级别 ...

灾备方案介绍

云数据库Redis容灾架构演进 当云数据库Redis实例因不可预料的原因(例如设备故障、机房断电等)发生故障,容灾机制可用于保障数据的一致性和业务可用性。云数据库Redis提供多种灾备方案供您选择,可满足不同的业务场景。图 1.Redis容灾架构...

使用须知

服务可用性不包括以下原因导致的不可用时间:运营商核心网异常、阿里云预先通知用户后进行的系统维护、任何阿里云以外的网络和设备异常、客户原因引起的异常等。边缘节点存在割接情况,一般割接频率不高于1次/月/节点,每次持续时间不多于6...

MongoDB只读节点简介

只读节点架构 只读节点(ReadOnly)的特点如下:只读节点(ReadOnly)通过操作日志(Oplog)从延迟最低的主节点(Primary)或从节点(Secondary)同步数据,应用于有大量读请求的场景,以减轻主节点(Primary)和从节点(Secondary)的访问...

业务连续性

跨地域主备容灾 应用的主备切换 为了避免地域级别的故障造成业务中断,在某个边缘节点上部署应用之外,还应该在其他边缘节点或公共云地域部署备份应用。您可以借助 全局流量管理服务,在出现地域级别故障时,自动将域名解析指向到其他地域...

主备方案介绍

主备容灾:当云数据库HBase实例因不可预料的原因(例如设备故障、机房断电断网等)发生故障,容灾机制可用于保障数据的一致性和业务可用性。功能优势 主备双活:请求低毛刺。故障自动容错。资源利用率高。主备容灾:支持云数据库HBase、EMR...

故障应急协同

故障相关成员直接拉进处理群,相关成员包括故障受影响业务的“应急接口人”、可疑原因业务的“应急接口人”,并且系统自动电话通知。进群后的成员,可直接在群内签到。每个故障建议设置单独的故障处理群,群内成员均为故障的相关人,为...

设备和交换机之间的链路故障

本文介绍SAG-1000设备发生设备和交换机之间链路故障原因和处理方法。问题现象 设备和交换机接口之间ping不通。设备的Web端口配置页,端口前的状态灯为红色。动态路由OSPF接入时,Web端口配置页,端口前的状态灯为红色。设备的Web状态查询...

创建和管理终端节点

修改接口终端节点策略 若接口终端节点连接的终端节点服务为阿里云服务或其他终端节点服务,创建完接口终端节点之后,您可以修改接口终端节点策略。登录终端节点控制台。在顶部菜单栏处选择目标地域。在 终端节点 页面的 接口终端节点 页签...

混沌工程缓存实战系列-Redis

由于要观测演练前和故障注入后系统的业务情况,因此除了故障注入节点之外,还需要增加业务探活的节点故障演练提供了类似K8s的探活功能,可以通过访问指定接口来判断业务是否可用。参数配置说明如下:参数 描述 示例值 failureThreshold ...

Tair选型指南

3 选择容灾方案 云原生内存数据库Tair 实例若因不可预料的原因(例如设备故障、机房断电等)发生故障,容灾机制保障数据的一致性和业务可用性。云原生内存数据库Tair 提供多种灾备方案供您选择,可满足不同的业务场景。4 预估内存规格 提前...

配置值转化

为了监测设备运行温度,防止设备故障,使用温度传感器将温度(temperature)数据上报到物联网平台,此时如果需要对温度范围划分等级(例如 normal、alarm、danger 等),根据不同等级来触发不同的后续操作,可以使用值转化节点,新增字段 ...

编辑项目领域架构图

单击+添加业务节点,设置 业务节点名称,选择业务节点的 填充颜色,填写描述信息(非必填),选择 关联业务领域(非必选)。拖动 业务节点 组件至页面右侧,在 业务节点 面板,完成相关配置。说明 拖动外层组件时,需保证其内部任何组件...

云数据库Redis版产品选型必读

选择容灾方案 当云数据库Redis实例因不可预料的原因(例如设备故障、机房断电等)发生故障,容灾机制可用于保障数据的一致性和业务可用性。云数据库Redis提供多种灾备方案供您选择,可满足不同的业务场景。选择大版本 推荐使用更新的大版本...

控制台发布记录

2022-11-20 集群保护锁 新增全局只读节点 在产品系列为多主集群(库表)的集群中,您可以通过增加全局只读节点的方式,来读取集群中所有读写节点的数据,以处理跨节点的汇聚库请求,而无需额外配置数据同步和部署独立的集群资源来实现数据...

集群管理FAQ

journalctl-u kubelet 集群常见问题 下表罗列了一部分ACK集群常见的故障原因以及处理方法。故障场景 处理方法 API Server组件停止或Master组件停止:不能创建、停止、更新Pod、Service、Deployment等资源。已有的Pod和Service仍然能够正常...

节点诊断

节点文件系统只读状态 节点出现文件系统只读,通常是因为磁盘故障,会导致节点无法写入数据,可能造成业务异常。请尝试在节点上使用fsck命令修复文件系统,然后重启节点节点硬件时间 检查节点硬件时钟与系统时间是否一致,时间相差超过2...

NVMe协议介绍

非易失性内存主机控制器接口规范NVMe(Non-Volatile Memory Express)是一个逻辑设备接口规范,它是与AHCI类似的、基于设备逻辑接口的总线传输协议规范。本文为您介绍NVMe协议的基本概念和使用场景。基本概念 基本概念 说明 优势 NVMe NVMe...

事件监控

完成 节点网络割接 边缘节点定期网络设备维护,一般半夜执行,可能存在网络抖动或网络中断。计划、执行、完成 节点网络 边缘节点意料之外的网络中断。失联、恢复 事件级别 描述 CRITICAL 严重 WARN 警告 INFO 消息 事件类型 描述 Executing...

按步骤提交设备故障信息

本案例创建四个业务服务和一个Web应用,搭建一个设备故障上报的工单页面,引导使用Web应用的用户完成故障信息的提交。前提条件 已完成项目的创建(例如 project_space)。详细内容,请参见 项目。步骤一:使用云数据库创建数据库表 登录 云...

Pod诊断

节点文件系统只读状态 节点出现文件系统只读,通常是因为磁盘故障,会导致节点无法写入数据,可能造成业务异常。请尝试在节点上使用fsck命令修复文件系统,然后重启节点节点硬件时间 检查节点硬件时钟与系统时间是否一致,时间相差超过2...

自助诊断GPU节点问题

ACK集群提供节点级别的GPU诊断功能,供您进行部分GPU相关问题的故障排查。如果您在ACK Pro版集群中使用GPU节点时遇到问题,可以启用GPU节点自助诊断,采集GPU诊断的基础指标进行问题排查。本文介绍如何使用节点诊断功能,自助排查GPU节点...

高压缩引擎(X-Engine)介绍

高压缩引擎(X-Engine)多节点架构可用于保障集群的高可用,当系统发生故障时,可读写的主节点和只读节点之间会自动进行故障切换(Failover),保证了服务可用性不低于99.99%。高压缩引擎(X-Engine)多节点架构图如下:产品优势 超大存储...

集群管理常见问题

您可以通过ListNodes接口查询EMR集群节点列表,详情请参见 ListNodes-查询节点。EMR的滚动重启是什么意思?滚动重启机制是指在一个ECS实例重启完成且该实例上的大数据服务全部恢复后,再启动下一个ECS实例。每个节点重启耗时约5分钟。集群...

实时分析链路数据

如果您的应用遇到流量不均、单机故障、慢接口治理、业务流量统计、灰度发布监控等问题,可以通过应用监控的调用链分析快速定位问题代码。本文介绍如何通过调用链分析快速定位五种经典线上问题,更直观地了解调用链分析的用法与价值。背景...

混合云接入

混合云接入是阿里云为部署在非阿里云的业务流量提供的Web应用防护和管理方案。如果您的业务部署在第三方公共云、私有云、线下IDC机房等,您可以通过混合云接入方式,通过 Web应用防火墙(Web Application Firewall,简称WAF)统一管控和运...

消息堆积和延迟问题

通过了解 云消息队列 RocketMQ 版 客户端的消费原理和消息堆积的主要原因,帮助您可以在业务部署前更好的规划资源和配置,或在运维过程中及时调整业务逻辑,避免因消息堆积和延迟影响业务运行。背景信息 消息处理流程中,如果客户端的消费...

步骤三:调试

在正式发布服务之前,可使用设备模拟器对业务服务进行调试。前提条件 已完成业务逻辑配置、部署和启动。具体操作,请参见 步骤二:配置空气净化和告警服务。背景信息 HTTP接口的服务调试,只需单击 调试 即可。日志中将显示调试结果。定时...

数据湖集群

数据湖集群特性介绍 可靠性 如果您启用了集群的高可用服务,则EMR把3台Master节点分布在底层不同的硬件上以降低故障风险。另外,考虑到Master节点在损坏情况下的修复时间,数据湖集群不再支持2台Master模式。同时在高可用集群模式下,EMR...

CPFS并行文件存储

CPFS并行文件存储 提供高性能计算文件存储,支持标准的POSIX和MPI-IO协议,自带的高性能计算程序无需任何接口适配和性能优化即可高效执行,满足高性能文件存储需求。产品架构 CPFS并行文件存储 是针对高性能和超大规模存储场景推出的文件...

以太网接口频繁Up/Down

接口接口模块或设备故障。解决方案 检查本端和对端设备线缆、模块是否插好。检查设备两端链路、接口模块是否故障。设备之间是通过双绞线连接,需要做如下检查。检查项 检查标准 后续操作 用测试仪测试双绞线是否故障。测试仪显示双绞线...

节点异常问题排查

本文目录 类别 内容 诊断流程 诊断流程 常见排查方法 节点故障诊断 检查节点的详情 检查节点的状态 检查节点的事件 检查节点的诊断日志 检查节点的关键组件 检查节点的监控 检查节点的安全组 常见问题及解决方案 节点关键组件异常处理 ...

节点异常问题排查

本文目录 类别 内容 诊断流程 诊断流程 常见排查方法 节点故障诊断 检查节点的详情 检查节点的状态 检查节点的事件 检查节点的诊断日志 检查节点的关键组件 检查节点的监控 检查节点的安全组 常见问题及解决方案 节点关键组件异常处理 ...

以太网接口无法接通

可能原因 设备没有连接电源或者以太网接口连接的线缆没有插好。光纤、双绞线过长或者链路损耗太大。接口接口模块或者设备故障。解决方案 检查本端和对端设备是否接通电源,设备线缆和模块是否插好。检查设备两端链路、接口模块是否故障。...

ack-node-repairer

当Node Problem Detector(简称NPD)组件检测到节点上的故障并生成节点的事件(Event)或者Condition上报给集群时,ACK的自愈系统(ACK Node Repairer)会监听每个节点上的新故障事件,并根据配置对故障节点进行相应的修复操作。...

Sidecar Acceleration using eBPF

重要 Sidecar Acceleration using eBPF组件开启后,ACK集群中注入Sidecar的业务Pod下,业务Container和Sidecar之间的网络通信在环回接口LO设备上抓不到PSH包。同节点下Sidecar和Sidecar之间的通信也抓不到PSH包。创建ASM实例。具体操作,请...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
物联网无线连接服务 云数据库 Redis 版 云服务器 ECS 负载均衡 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用