读多写少型业务场景多活实践

在杭州单元发生故障的情况下,可以使用MSHA切流功能将受影响的用户流量切换到另外的单元,进行快速业务恢复(这里区别于传统的思路,不是去排查、处理和修复故障,而是立即使用切流进行恢复,将业务恢复和故障恢复解耦)。容灾切换预期:将...

逻辑复制槽故障转移(Logical Replication Slot ...

RDS PostgreSQL逻辑复制槽故障转移(Logical Replication Slot Failover)功能可以将所有的逻辑复制槽从主实例同步到备实例,从而实现逻辑复制槽的故障转移。前提条件 PostgreSQL 10或以上版本均支持此功能,如提示不支持,请升级内核小...

故障演练

高速通道故障演练功能是一种模拟故障场景的工具。例如,模拟在高速通道冗余链路中的一条链路发生故障时,网络流量会自动切换至其他冗余链路的场景。借助该工具,您可以测试和验证您与阿里云组建的混合云组网的可靠性。重要 故障演练会通过...

故障演练

ADP提供基于线下交付经验设计的丰富故障演练场景,对基础设施、底座、中间件的常见故障场景进行覆盖,涵盖了集群级别的大规模故障以及节点、pod级别的资源故障。部分演练场景为破坏性场景(如机器重启、网卡损坏),可能导致环境状态异常、...

逻辑复制槽故障转移(Logical Replication Slot ...

PolarDB PostgreSQL版(兼容Oracle)的逻辑复制槽故障转移(Logical Replication Slot Failover)功能可以将所有的逻辑复制槽从主实例同步到备实例,从而实现逻辑复制槽的故障转移。背景信息 在主实例创建的Replication Slot,不会通过流...

逻辑复制槽故障转移(Logical Replication Slot ...

PolarDB PostgreSQL版(兼容Oracle)的逻辑复制槽故障转移(Logical Replication Slot Failover)功能可以将所有的逻辑复制槽从主实例同步到备实例,从而实现逻辑复制槽的故障转移。背景信息 在主实例创建的Replication Slot,不会通过流...

逻辑复制槽故障转移(Logical Replication Slot ...

PolarDB PostgreSQL版(兼容Oracle)的逻辑复制槽故障转移(Logical Replication Slot Failover)功能可以将所有的逻辑复制槽从主实例同步到备实例,从而实现逻辑复制槽的故障转移。背景信息 在主实例创建的Replication Slot,不会通过流...

逻辑复制槽故障转移(Logical Replication Slot ...

PolarDB PostgreSQL版 的逻辑复制槽故障转移(Logical Replication Slot Failover)功能可以将所有的逻辑复制槽从主实例同步到备实例,从而实现逻辑复制槽的故障转移。前提条件 支持的 PolarDB PostgreSQL版 的版本如下:PostgreSQL 11...

云盘异步复制概述

功能介绍 功能原理 云盘异步复制功能支持将一块ESSD云盘(主盘)的数据跨地域或者同地域跨可用区异步复制到另一块相同配置的ESSD云盘(从盘)中,当主盘出现故障时,可通过从盘进行故障切换以及数据恢复。异步复制功能原理如下图所示:跨...

实体识别干预词典

目前实体识别的干预主要包括两个对实体识别结果本身的干预,以及实体类型重要性的干预。当实体识别的结果不准时,可以通过实体识别的干预来进行解决。概念介绍 实体识别干预 通过创建实体干预的词典,并在查询分析中实体识别中配置相应的...

通过一致性复制组实现容灾恢复

背景信息 一致性复制组支持故障切换和反向复制功能,当生产站点中的云盘出现严重故障时,您可以通过故障切换功能开启容灾站点中云盘数据的读写权限,然后将容灾站点中的云盘挂载到临时创建的ECS实例上继续运行业务。当生产站点中的云盘故障...

查询分析概览

实体识别功能基本介绍 命名实体识别(Named Entity Recognition,简称NER)是对Query分词后识别每个语义实体功能。每个语义实体会被打上相应的类型标签,类型标签重要性低的语义实体在查询中可能会被省略。比如“耐克修身连衣裙”,实体...

耗资源用户处理流程

为了保证您的站点能够安全、...关于网站耗资源的原因以及排查方法,更多信息,请参见 网站耗资源(客户程序故障常见问题。增强版共享虚拟主机和独享虚拟主机可以更好地应对耗资源问题,避免站点被关停。更多信息,请参见 云虚拟主机官网。

EasyCkpt:AI大模型高性能状态保存恢复

功能介绍 针对频繁故障的情况,PAI通过之前的故障失败场景总结出以下GPU和深度学习场景故障功能特点:特点1:任务的故障是部分的。通常,故障的根因是一到两台机器的故障,这只会影响部分Worker。对于大规模分布式训练任务而言,不会所有...

实体转交

查看可被转交的实体 在使用说明区域可以查看实体转交功能可被转交的实体、自动转交触发条件及转交注意事项。说明 可转交的实体正在逐步丰富中,具体请以产品界面为准。配置实体转交规则 在转交规则配置区域搜索目标工作空间。配置实体接收...

SA混合云存储阵列

故障恢复:支持故障切换和故障恢复功能。当控制器故障时,支持在线故障切换,业务连续性不受影响。阿里云混合云存储阵列将云存储的高性价比和可扩展性与本地数据中心架构相结合,帮助客户轻松实现数据在本地数据中心和公共云之间的无缝流动...

基本概念

当告警与其他词组合时,代表告警功能对应的子系统、功能实体、模块等。例如告警监控系统、告警监控规则等。告警监控(Alert monitoring)告警子系统,负责产生告警。告警监控系统由告警监控规则和资源数据等组成。通过告警监控规则定期...

【通知】故障演练功能模块退市公告

由于业务及技术架构调整,阿里云将于2024年05月01日起停止应用高可用服务AHAS下的故障演练功能模块的技术支持,并于2024年11月01日正式下线该模块,但飞天企业版的应用高可用服务AHAS的故障演练CHAOS模块将持续发展。此外,应用高可用服务...

自动故障剔除

自动故障剔除功能会自动监控 RPC 调用的情况,当某个节点出现故障时,可对故障节点进行权重降级,并在节点恢复健康时进行权重恢复。目前支持 Bolt 协议。配置方式 将自动故障剔除的参数配置到 SOFABoot 中的 application.properties 即可。...

安装探针概述

为您的主机等资源安装应用高可用探针后,即可使用AHAS架构感知和故障演练功能,能直观地看到应用对基础架构的依赖关系、组件间的依赖关系,以及对指定机器进行故障演练。接入 AHAS架构感知和故障演练可以接入云服务器ECS、自建Kubernetes、...

使用集群诊断

配置故障诊断 重要 使用故障诊断功能时,系统将在您的集群上执行数据采集程序并收集检查结果。采集的信息包括系统版本、负载、容器组件等运行状态及系统日志中关键错误信息。数据采集程序不会采集您的业务信息及敏感数据。配置Pod诊断和...

步骤六:启动复制

保护组初始化完成后,您就可以启动保护组复制。启动复制就是将生产站点所有数据复制到容灾站点,此时会在容灾站点自动...后续步骤 步骤七:故障切换 常见问题 ECS容灾云盘异步复制型启动复制时,控制台提示容灾站点实例规格异常,如何处理?

RAM子账号授权

AliyunGEMPCoordinatorAccess」-具备运维事件中心的事件和故障协同功能权限,拥有其它模块的只读权限,如开发角色人员;重要:被赋予以上3种权限的人员可以直接访问运维事件中心,填写个人姓名、手机号、邮箱等联系方式后即可正常使用;也...

步骤六:启动复制

保护组初始化完成后,您就可以启动保护组复制。启动复制就是将生产站点所有数据复制到容灾站点,此时会在容灾站点自动...后续步骤 步骤七:故障切换 常见问题 ECS容灾云盘异步复制型启动复制时,控制台提示容灾站点实例规格异常,如何处理?

管理探针

使用架构感知、故障演练功能前需安装此探针。应用高可用Java探针:这是针对JVM的Java探针,通过字节码增强技术进行实时监控和流量防护。如果需要使用流量防护功能,可安装此探针。安装高可用探针(AHAS探针)如果您需要使用架构感知、故障...

接入主机

在普通主机上安装AHAS探针后,即可体验架构感知和故障演练功能,直观地查看应用对基础架构的依赖关系,组件间的依赖关系,以及对应用进行故障演练。本文介绍如何将探针接入主机,主机类型包括Linux和Windows。操作步骤 登录 AHAS控制台,并...

故障诊断

功能,如下图所示:一般来说,如果涉及到内存泄漏的,可以抓取 堆快照,如果是 CPU 异常飙高的,可以抓取 CPU Profile 数据,下面我们以一个 CPU 异常飙高和内存泄漏的例子来看下如何使用 Node.js 性能平台提供的故障诊断功能。CPU 异常飙...

FailoverDiskReplicaPair-启用云盘异步复制故障切换

启用异步复制关系的故障切换功能。接口说明 异步复制功能支持的地域请参见 云盘异步复制概述。异步复制关系不能处于 失效(invalid)或 已删除(deleted)状态。故障切换完成后,异步复制关系处于 故障切换完成(failovered)状态。调试 您...

云防火墙常见问题

售前常见问题 功能特性相关 为什么使用云防火墙需要授予服务关联角色(AliyunServiceRoleForCloudFW)?云防火墙最多支持几个跨账号部署?金融云基础版云防火墙与其他版本有哪些差异?云防火墙是否有抗APT攻击的能力?云防火墙支持公网SLB...

FailoverDiskReplicaGroup-启用异步复制组故障切换

启用一致性复制组中复制对的故障切换功能。当一致性复制组中某些复制对的主盘出现故障时,可以调用该接口恢复从盘的读写权限。接口说明 一致性复制组功能支持的地域请参见 云盘异步复制概述。一致性复制组必须处于 单次同步中(manual_...

功能内容配置介绍

PC端常见问题 功能说明:发送时机:开启本功能后,在PC端,用户进入聊天窗时,在聊天窗右侧显示“辅助栏”,在辅助栏显示“常见问题”模块。卡片样式:详见上方截图示例。您可以在页面右侧实时预览配置。卡片功能:您可以按分类配置常见...

常见问题

故障诊断时,执行诊断功能 3 分钟,随后自动切回到正常运行状态。Node.js 性能平台运行时提供了哪些额外的功能 Node.js 虚拟机 V8 的运行时内存状态监控;libuv 运行时状态监控;在线故障诊断功能:堆快照、CPU Profile、GC Trace 等。...

网络诊断

容器服务平台提供网络诊断功能,帮助您诊断网络常见问题,例如Pod之间不通、集群到公网访问不通、公网到LoadBalancer不通。本文介绍网络诊断的基本原理、使用方式、以及如何针对常见网络不通的场景定位网络问题和使用网络诊断。重要 使用...

功能优势

本文向您介绍故障演练产品的功能优势,故障演练以下简称 AHAS Chaos。灵活的流程编排 AHAS Chaos 将故障演练的环节分为了准备、注入、检查以及恢复四个阶段,每个阶段除了系统初始化完成的必要节点之外,您也可以根据需要添加所需的流程...

常见问题FAQ

云投屏产品FAQ问题 M21播放盒子常见问题 Q:遥控器无法控制屏幕 A:请尝试将遥控器与屏幕重新配对。操作步骤如下:拔掉盒子的电源,然后重新插上,盒子开机。在盒子开机后10分钟内,同时按住遥控器的“OK键”(中间大圆圈按键)和“返回键...

监控服务概览

OSS监控服务为您提供系统基本运行状态、性能以及计量...故障排除 提供常见的问题场景和故障排除方法。注意事项 OSS Bucket全局唯一,如果删除Bucket之后再创建同名的Bucket,那么被删除的Bucket的监控以及报警规则会应用在新的同名Bucket上。

探针安装常见问题

ahas-pilot常见问题5 容器服务安装ack-ahas-pilot常见问题6 容器服务安装ack-ahas-pilot常见问题7 AHAS架构感知和故障演练探针limits配置 问题现象 架构感知和故障演练功能需要使用AHAS Agent探针,AHAS Agent以Daemonset方式部署在每个...

监控、诊断和故障排除

相对于传统应用程序,开发云端应用虽然降低了用户在基础设施搭建、运维等方面的成本,但却增大了监控、诊断和故障排查的难度。OSS存储服务为您提供了丰富的监控和日志信息,帮助您深刻洞察程序行为,及时发现并快速定位问题。本文主要描述...

服务支持

云消息系列 RocketMQ 版常见问题 产品功能常见问题 客户端连接常见问题 售卖、计费和实例升降配常见问题 控制台常见问题 消息发送常见问题 消息消费常见问题 相关协议 阿里云产品服务协议(通用)云消息队列 RocketMQ 版服务等级协议

什么是消息演练

消息演练概述 目前市面上有RocketMQ、Kafka、RabbitMQ等流行的消息中间件服务,消息演练功能将这些常见的中间件进行了统一抽离,为消息服务安排分配了精选后的演练最佳实践。您无需分析每种消息服务需要什么演练场景,仅需选择演练方案即可...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
检索分析服务 Elasticsearch版 VPN网关 负载均衡 弹性公网IP 短信服务 人工智能平台 PAI
新人特惠 爆款特惠 最新活动 免费试用