同城容灾演练产品概述

基础设置故障导致的整个可用区故障。容灾演练示意图 同城容灾架构评估项 评估项 要求 SLB 多可用区SLB实例。应用层 ECS多可用区部署,相关应用多可用区部署。数据库 以RDS为例,实例为多可用区部署。缓存 以Redis为例,实例为多可用区部署...

API概览

组件 API 标题 API概述 InstallClusterAddons 安装集群组件 为了增强Kubernetes能力,ACK集群支持了多种组件,例如托管的核心组件,应用、日志和监控、网络、存储、安全组件等。您可以调用InstallClusterAddons接口,通过组件名称和版本...

API概览

组件 API 标题 API概述 InstallClusterAddons 安装集群组件 为了增强Kubernetes能力,ACK集群支持了多种组件,例如托管的核心组件,应用、日志和监控、网络、存储、安全组件等。您可以调用InstallClusterAddons接口,通过组件名称和版本...

API概览

组件 API 标题 API概述 InstallClusterAddons 安装集群组件 为了增强Kubernetes能力,ACK集群支持了多种组件,例如托管的核心组件,应用、日志和监控、网络、存储、安全组件等。您可以调用InstallClusterAddons接口,通过组件名称和版本...

状态卡片

本文介绍 状态卡片 组件的图表样式和各配置项的含义。图表样式 状态卡片是文字组件的一种,支持多系列的状态类别配置,能够以彩色圆点的形式在可视化应用中直观地展示多种类别的状态信息,比如展示一个集群中多台服务器的运行状态。配置...

使用须知及高危风险操作说明

阿里云容器服务Kubernetes版(简称容器服务ACK)提供容器服务相关的技术架构以及核心组件的托管服务,对于非托管组件以及运行在ACK集群中的应用,不当操作可能会导致业务故障。为了更好地预估和避免相关的操作风险,在使用容器服务ACK前,...

ARMS告警精细管理最佳实践

背景知识 在告警管理中有一个非常重要的指标Mean Time To Contain(MTTC),MTTC描述了从检测到故障事件到控制和解决该事件所需的平均时间。它是一个关键指标,因为它衡量了一个组织对事件的响应能力和效率。较短的MTTC意味着组织能够快速...

功能优势

本文向您介绍故障演练产品的功能优势,故障演练以下简称 AHAS Chaos。...对依赖的阿里云组件进行故障注入。基于接入的阿里云监控系统数据如 ARMS 来丰富演练检查和恢复的手段。通过 RAM 服务来授权不同账号的演练权限,提升演练的安全性。

组件概述

网络 组件名称 组件类型 描述 CoreDNS 系统组件 Kubernetes集群域名解析服务器。managed-kube-proxy 系统组件 ACK灵骏托管版集群上使用的容器化kube-proxy,用于管理节点上Service的访问入口。Terway 系统组件 阿里云开源的基于专有网络VPC...

数字范围

使用场景 当页面需要输入一个数字区间,您可以使用 数字范围 组件。使用说明 数字范围 组件通过两个数字来表示一个数字范围。使用示例 从 组件面板 拖拽 数字范围 组件至画布。绑定变量。数字范围组件需要绑定数字数组类型的变量。您可按需...

选择合适的网络转发组件

当您的业务资源部署在非阿里云业务资源上,您需要通过网络连接组件来打通企业本地网络和非阿里云上业务资源的网络通道。本文介绍 SASE 连接器以及 SASE 支持的阿里云VBR、CCN和VPN网关的网络实例的区别和使用场景等。选择合适的网络 转发 ...

滑块

使用场景 需要对页面中的音量、亮度、色彩饱和度等显示强度等级时,您可以使用 滑块 组件。使用说明 您可以在连续或间断的区间内滑动 滑块 组件的锚点来选择一个合适的数值。滑块 组件区间最小值放在左侧,最大值放在右侧。您可以在 滑块 ...

时间选择

使用场景 当页面需要输入一个时间,您可以使用 时间选择 组件。使用说明 时间选择 组件支持选择时、分、秒。如果您需选择年、月、日,则可使用 日期 组件。使用示例 从 组件面板 拖拽 时间选择 组件至画布。绑定变量。时间选择 组件需要...

日期范围

使用场景 当页面需要输入一个日期区间,您可以使用 日期范围 组件。使用说明 日期范围 组件通过两个日期来表示一个日期区间。使用示例 从 组件面板 拖拽 日期范围 组件至画布。绑定变量。日期范围 组件需要绑定 List类型的变量。您可按需...

组件持续集成/持续部署说明

此时,可以通过组件持续集成功能,在自研组件版本发生更新时,自动将产品版本已关联的自研组件,更新为新的版本。对于尚未发布的latest产品版本,在组件编排页面,点击右上方的“持续集成”按钮,即可开启持续集成功能。在开启持续集成功能...

操作指南

组件日志 当组件请求发生错误时,面板内会将在原来的记录的最上方新增一条报错记录。单击某一条日志记录,查看报错详情。常见报错类型 报错类型 类型说明 数据获取失败 组件请求数据源发生错误时,产生该报错。数据源的请求可能发生组件...

拖拽上传

使用场景 您可根据提示将相应信息(包含本地和云储存文件)上传至网站,且 拖拽上传 组件可以帮助您对上传过程和上传结果进行控制,同时您也可以更改或撤销上传行为。使用说明 您需要定义一个以包含特定结构对象集合为数据类型的变量。使用...

调试预览指南

数据源的请求可能发生组件首次加载时、组件自动更新时、组件回调ID触发更新时、蓝图触发请求数据源动作时。展示报错的组件ID、数据源ID、错误描述。过滤器报错 组件请求数据源成功返回数据后,经过过滤器时产生报错,将记录为过滤器报错...

常用管理

报错类型 说明 组件数据获取失败 组件请求数据源发生错误时,产生该报错。数据源的请求可能发生组件首次加载时、组件自动更新时和全局变量触发更新时等。过滤器执行错误 组件请求数据源成功返回数据后,经过过滤器时产生报错,将记录为...

MSE Ingress Controller从应用市场迁移至组件管理

为了更好地服务容器用户,MSE Ingress Controller组件已经在集群的组件管理页面中上线,应用市场中的MSE Ingress Controller会停止维护并逐步下线,请您尽快将MSE Ingress Controller组件迁移至组件管理。本文介绍如何将MSE Ingress ...

什么是故障

本文主要介绍什么是故障。定义 在日常运营中,无论什么原因导致业务服务中断、服务品质...故障改进:支持对故障制定明确的改进及验收措施、责任人及完成时间,确保每个深度复盘后的故障都能对业务连续性形成改进,避免历史同类故障重复发生

AI助手使用说明

安装AI助手并开启PAI的作业监控和恢复功能后,当训练任务发生故障或异常时,能自动上报故障信息、隔离问题节点,无需人工干预即可快速恢复任务。本文为您介绍AI助手的具体配置方法。前提条件 已创建带有ACK灵骏托管版的集群。具体操作,请...

集群版-双副本

数据分片(data shards)每个数据分片均为双副本(分别部署在不同机器上)高可用架构,主节点发生故障后,系统会自动进行主备切换保证服务高可用。配置服务器(config server)采用双副本高可用架构,用于存储集群配置信息及分区策略。各...

集群架构

数据分片(data shards)每个数据分片均为双副本(分别部署在不同机器上)高可用架构,主节点发生故障后,系统会自动进行主备切换保证服务高可用。配置服务器(config server)采用双副本高可用架构,用于存储集群配置信息及分区策略。各...

同城多活架构实践

在杭州单元格B的商品应用发生故障的情况下,可使用MSHA切流功能将流量全部切换到另外的单元格,进行快速业务恢复(这里区别于传统的思路,不是去排查、处理和修复故障,而是立即使用切流进行恢复,将业务恢复和故障恢复解耦)。容灾切换...

功能概览

当主系统发生故障时,业务系统切换到容灾系统,有效避免了地域性灾害导致的系统故障,保障业务的可用性,满足业务的RTO/RPO核心指标。云盘异步复制是一种基于块存储数据复制能力实现跨地域或者跨可用区数据保护的功能。更多信息,请参见 云...

什么是 SOFATracer

应用场景 解决在实施大规模微服务架构时的链路跟踪问题,达到透视化网络调用的目的,并可用于故障的快速发现、服务治理等。组件埋点 目前 SOFATracer 支持 Spring MVC、标准 JDBC 接口实现的数据库连接池(DBCP、Druid、c3p0、tomcat、...

跨地域容灾

容灾系统部署在阿里云的两个地域中,当生产站点发生故障(例如海啸、地震)时,业务系统切换到容灾站点。生产站点和容灾站点部署在不同的地域,提供容灾即服务,RPO低至1分钟、RTO低至15分钟的高可靠的业务持续性保障,有效避免了地域性...

什么是消息演练

单个或多个模块都可能会有不同类型的故障发生,导致模块不能正常运行,例如Producer无法发送消息,这种场景叫做消息的演练场景。需要注意的是演练场景仅是组件表象,其内部故障原因可能是多种多样的,需要进一步进行分析。

功能概览

当主系统发生故障时,业务系统切换到容灾系统,有效避免了地域性灾害导致的系统故障,保障业务的可用性,满足业务的RTO、RPO核心指标。云盘异步复制是一种基于块存储数据复制能力实现跨地域或者跨可用区数据保护的功能。更多信息,请参见 ...

官方组件

配置权限 iframe iframe组件是网页设计中一个常见元素,主要用于将站点外的内容纳入页面中,外部站点iframe请连接网络后查看。步骤一:添加组件 1.在工业组态编辑器中,点击左侧面板的组件Tab。2.在基础中,找到iframe组件,然后将iframe...

设计方案

风险预测:风险预测是指在发生故障前,通过数据分析、机器学习等方式,预测系统的风险情况,提前进行预防和处理。在故障应急响应中,风险预测可以作为重要参考,帮助快速识别问题的根本原因,提高故障处理效率和精度。故障响应 在发现故障...

组件概述

网络 组件名称 组件类型 描述 CoreDNS 系统组件 ACK集群中默认采用的DNS服务发现插件,其遵循Kubernetes DNS-Based Service Discovery规范。Nginx Ingress Controller 系统组件 Nginx Ingress Controller解析Ingress的转发规则。Ingress ...

步骤五:应用容灾

确保操作人员熟悉容灾恢复流程,当主站真正发生故障时,操作人员可以顺畅地进行容灾切换。按如下步骤进行容灾演练:在 受保护服务器 页签,单击要启动容灾演练服务器右侧对应的 操作 列表下的 容灾演练。在 容灾演练 页面,选择 恢复网络、...

跨可用区容灾

确保操作人员熟悉容灾恢复流程,确保在主站真正发生故障时,操作人员可以顺畅地进行容灾切换。按如下步骤进行容灾演练:在 受保护服务器 页签,单击要启动容灾演练服务器右侧对应的 操作 列表下的 容灾演练。在 容灾演练 面板,选择 恢复...

FAQs

答:经过测试团队对GTM多次测试验证,当应用服务发生故障时,GTM能在 3分钟左右 准确发现故障并切换。全网故障恢复时间=故障发现时间+全网生效时间。说明 受限于拨测平台探点发生变化和全国各地运营商TTL缓存原因,如使用不同的拨测平台、...

常见问题-FAQ

答:经过测试团队对GTM多次测试验证,当应用服务发生故障时,GTM最快可在1分钟左右准确发现故障并切换。全网故障恢复时间=故障发现时间+全网生效时间。说明 受限于拨测平台探点发生变化和全国各地运营商TTL缓存原因,如使用不同的拨测平台...

设计原则

网络延迟、硬件故障、软件错误、突峰流量等,建议在系统设计阶段就要从这些异常事件引起的系统执行“失败”出发,提供冗余、隔离、降级、弹性等能力,旨在确保系统的高可用性和高可靠性,以应对不可避免的故障和意外发生。面向精细的运维...

故障演练

确保操作人员熟悉容灾恢复流程,确保在生成站点真正发生故障时,操作人员可以顺畅地进行容灾切换。前提条件 保护组处于 增量复制中 或者已有恢复点之后,您就可以进行故障演练。如何创建跨可用区和跨地域容灾的保护组,请参见 跨可用区容灾...

故障演练

确保操作人员熟悉容灾恢复流程,确保在生成站点真正发生故障时,操作人员可以顺畅地进行容灾切换。前提条件 保护组处于 增量复制中 或者已有恢复点之后,您就可以进行故障演练。如何创建跨可用区和跨地域容灾的保护组,请参见 跨可用区容灾...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
NAT网关 共享流量包 弹性公网IP 负载均衡 短信服务 人工智能平台 PAI
新人特惠 爆款特惠 最新活动 免费试用