创建DDH

关闭宿主机故障时自动迁移服务:DDH发生故障停机后,您需要 提交工单 申请置换一台健康的DDH。默认值:开启宿主机故障时自动迁移服务。您也可以在创建DDH后修改该配置,具体操作,请参见 设置宕机自动迁移。重要 本地SSD型DDH不支持宿主机...

异地应用双活切流

在⼀个数据中心发生故障或灾难的情况下,将流量切换到其他数据中心,其他数据中心可以正常运行并对关键业务或全部业务进行接管,实现故障灾难场景的业务快速恢复。本文将介绍在异地应用双活中如何创建切流任务并查看切流详情。前提条件 ...

什么是用户体验监控

数据探索 为满足您在日常问题追踪过程中对指标维度的灵活分析需求,用户体验监控 数据探索能力已开放全部维度与指标数据的组合分析,可以通过配置筛选出任意维度与指标的数据,帮助您进一步缩短问题分析路径,快速定位故障影响范围。...

常见问题-FAQ

答:经过测试团队对GTM多次测试验证,当应用服务发生故障时,GTM最快可在1分钟左右准确发现故障并切换。全网故障恢复时间=故障发现时间+全网生效时间。说明 受限于拨测平台探点发生变化和全国各地运营商TTL缓存原因,如使用不同的拨测平台...

FAQs

答:经过测试团队对GTM多次测试验证,当应用服务发生故障时,GTM能在 3分钟左右 准确发现故障并切换。全网故障恢复时间=故障发现时间+全网生效时间。说明 受限于拨测平台探点发生变化和全国各地运营商TTL缓存原因,如使用不同的拨测平台、...

创建专有宿主机

关闭宿主机故障时自动迁移服务:DDH发生故障停机后,您需要 提交工单 申请置换一台健康的DDH。默认值:开启宿主机故障时自动迁移服务。您也可以在创建DDH后修改该配置,具体操作,请参见 设置宕机自动迁移。重要 本地SSD型DDH不支持宿主机...

一致性复制组概述

容灾站点 除了生产站点以外另外建立容灾站点,当生产站点发生故障时,容灾站点可以接管业务,实现业务不间断。恢复点目标(RPO)由于云盘异常可能丢失的数据量,以时间为单位,是异步复制功能的数据指标之一(一致性复制组功能的RPO默认为...

重写URL

如果您的源站资源的存放路径发生变化,但希望用户访问的URL路径保持不变,您可以在 全站加速 DCDN 节点上通过重写URL的方式,支持在用户请求需要回源时对URL中的路径和查询字符串(请求参数)进行改写,使用重写后的URL向源站请求资源。...

故障演练

确保操作人员熟悉容灾恢复流程,确保在生成站点真正发生故障时,操作人员可以顺畅地进行容灾切换。前提条件 保护组处于 增量复制中 或者已有恢复点之后,您就可以进行故障演练。如何创建跨可用区和跨地域容灾的保护组,请参见 跨可用区容灾...

故障演练

确保操作人员熟悉容灾恢复流程,确保在生成站点真正发生故障时,操作人员可以顺畅地进行容灾切换。前提条件 保护组处于 增量复制中 或者已有恢复点之后,您就可以进行故障演练。如何创建跨可用区和跨地域容灾的保护组,请参见 跨可用区容灾...

转换规则

托管转换-客户端地理位置 支持 支持 支持 支持 功能介绍 您可通过转换规则,针对特定用户请求执行如下配置:配置项 功能描述 重写URL 如果您的源站资源的存放路径发生变化,但希望用户访问的URL路径保持不变,您可以在 全站加速 DCDN 节点...

重新定向规则

如果源站资源的存放路径发生变化,全站加速 DCDN 节点上的资源存放路径也将同步变更,但用户请求的URL路径没有变化时,您可以通过配置重新定向规则在 全站加速 DCDN 节点来改写用户请求的URL,将用户请求URL重定向到目标URL,减少回源,...

归档存储服务等级协议

赔偿方案 阿里云对用户存在故障的每个Archive按不可用时间的100倍赔偿,即赔付金额=发生故障的Archive故障前24小时平均每分钟费用×不可用时间×100倍;其中:(1)赔偿只针对使用归档存储服务已产生费用的用户,以归档存储代金券的形式赔偿,...

光模块故障

本文介绍光模块发生故障的原因和处理方法。问题现象 光模块连接后,接口指示灯没有变为绿色。可能原因 光模块不兼容或损坏。智能接入网关设备支持的光模块型号请参见 光模块型号。说明 目前仅SAG-1000设备支持光模块插入。解决方案 通用多...

容灾管理服务介绍

容灾切换:模拟故障发生时,验证业务系统是否能够达到预期的灾备效果。容灾切回:故障恢复后,将资源切回到之前的状态,验证系统的灾难恢复预案是否合理。相关概念 容灾计划 当CADT应用需要进行容灾演练时,需要为其创建容灾计划,加入了容...

改写回源URL

适用场景 源站的资源路径发生了变更,客户源站的资源存放路径发生了变更,但是用户请求URL里面包含的资源路径没有变更,这时就需要CDN节点来改写回源请求里面的资源路径。例如:图片文件原先存放在目录“/download/”,现在变更为“/image/...

故障协同处理(基于钉钉)

时间线:展示故障的时间线记录,其中有7个节点必须完善详细内容,节点已用红星标注,包含:故障发生故障发现、故障通告、业务响应、初因定位、恢复执行和故障恢复。节点记录和PC端故障时间线保持一致。复盘 按钮:故障恢复后,需进行故障...

改写回源URL

适用场景 源站的资源路径发生了变更,客户源站的资源存放路径发生了变更,但是用户请求URL里面包含的资源路径没有变更,这时就需要CDN节点来改写回源请求里面的资源路径。例如:图片文件原先存放在目录“/download/”,现在变更为“/image/...

运维服务内容说明

2.服务范围 运维产品范围:阿里公共云云产品(详见 附录一:运维服务产品清单)阿里云运维服务范围 包含:阿里云 产品使用咨询、问题处理、故障救援、配置指导、最佳实践等。阿里云 产品相关的操作或系统问题的技术指导。阿里云 管理控制台...

执行演练

在执行故障演练过程中,您可以实时查看演练进度、每个演练活动的运行状态及结果,同时也能够随时结束演练,进行恢复阶段的活动,清除故障演练影响。背景信息 一次完整的故障演练包括以下四个...后续步骤 停止演练 常见问题 故障演练常见问题

设计方案

理论上回滚永远是最合适最有效的方法,当问题发生时,保证业务连续运行永远是第一要义。实际中可能存在其他解决方案,但后果无法预料,所以选择回滚是最好方式。在发布时建议多版本小更新,避免因变更版本跨度较大,带来的系统依赖关系问题...

故障应急协同

故障应急协同群 故障发生后,可以基于钉钉的沟通协同能力和API,自动创建故障处理应急协同场景群。将故障相关成员直接拉进处理群,相关成员包括故障受影响业务的“应急接口人”、可疑原因业务的“应急接口人”,并且系统自动电话通知。进群...

基线监控概述

关键路径(最长路径):影响基线任务运行的多条路径中,运行耗时最长的路径。可以简单的理解为 PERT图的关键路径。基线告警:当业务时间到达基线的预警时间且未完成时,将产生基线告警。事件告警:基线任务及其上游任务出错,或关键路径上...

基线监控概述

关键路径(最长路径):影响基线任务运行的多条路径中,运行耗时最长的路径。可以简单的理解为 PERT图的关键路径。基线告警:当业务时间到达基线的预警时间且未完成时,将产生基线告警。事件告警:基线任务及其上游任务出错,或关键路径上...

配置域名和路径的转发策略

全球加速 的监听支持配置基于域名和路径的转发策略。本文为您介绍转发条件中域名和路径的配置规则,及转发动作中重写和重定向的路径增强配置规则。转发条件的域名配置规则 域名配置规则支持精准域名、通配符域名和正则表达式域名。关于如何...

配置自定义域名

路由设置 路由配置 设置路径与函数的对应关系,即不同的请求路径可以触发不同的函数执行。您需要设置以下字段:路径:可以触发指定函数的请求路径。函数名称:来自指定路径的请求触发的指定的函数。版本或别名:来自指定路径的请求触发的...

配置自定义域名

路由配置 设置路径与函数的对应关系,即不同的请求路径可以触发不同的函数执行。您需要设置以下字段:路径:可以触发指定服务下的指定函数的请求路径。服务名称:来自指定路径的请求触发的对应服务。函数名称:来自指定路径的请求触发的...

配置域名和路径的转发规则

如果您需要为ALB监听的转发条件配置域名和路径规则,及转发动作配置重写和重定向的路径增强规则,本文为您介绍了详细的配置规则。转发条件的域名配置规则 域名配置规则支持精准域名、通配符域名和正则表达式域名。关于如何添加转发规则,请...

应用场景

如果主地域发生故障,您可以将用户请求切换到灾备地域。异地多活 随着业务的快速发展和用户数量的增长,如果业务部署在单个地域中,可能会面临如下问题:用户在地理位置上分布较广,地理位置较远的用户访问延迟较高,影响用户体验。单个...

诊断规则

而后,在实际故障发生时,即可执行自动化、标准化的故障排查,并直接输出诊断报告,反馈诊断结果。故障诊断功能有效提升了故障排查效率,实现故障的快速定位与处理。本节将向您介绍诊断规则的相关操作。诊断规则是诊断节点的构成,诊断规则...

SDK集成

集成操作步骤:重要 上线前测试阶段,请检查以下几项:在控制台配置的 网络探测规则 是否成功...mtr,目标www.aliyun.com,路径最长长度30,探测1条路径,每个节点测试10次,超时时间1000ms AliMTRConfig*config=[[AliMTRConfig alloc]init:@...

什么是消息演练

单个或多个模块都可能会有不同类型的故障发生,导致模块不能正常运行,例如Producer无法发送消息,这种场景叫做消息的演练场景。需要注意的是演练场景仅是组件表象,其内部故障原因可能是多种多样的,需要进一步进行分析。

故障复盘

复盘文档一般包含以下内容:故障简述:故障概述、影响面、处理人等 故障背景:故障发生时的业务链路 故障时间线:着重强调故障引入、故障发生故障发现、业务响应、恢复执行、故障恢复几个时间点 故障原因分析:建议先一句话总结,再进行...

如何处理健康检查导致的大量日志

风险说明 HTTP/HTTPS模式下关闭健康检查后,负载均衡不再检查后端服务器,一旦某台后端服务器发生故障,则无法实现访问流量自动切换至其它正常的后端服务器。操作步骤 登录 传统型负载均衡CLB控制台。在 实例管理 页面中找到对应的CLB实例...

智能基线概述

核心逻辑介绍:关键路径与关键实例 基线上需要保障的任务,其依赖关系可能错综复杂,DataWorks提供甘特图功能帮助您快速定位阻塞基线上数据产出的关键路径与关键实例,其中影响基线任务产出的多条路径中,耗时最长路径为基线关键路径。...

自动或手动主备切换

当主实例发生故障或不可用时(例如操作系统错误、硬件故障等),系统会自动触发主备切换,主实例和备实例将进行互换,切换后实例地址保持不变,应用程序会自动连接到新的主实例(原备实例),从而保障业务的连续性和高可用性。此外,您还...

健康检查

警告 关闭健康检查后,ALB 不再检查后端服务器,一旦某台后端服务器发生故障,则无法实现访问流量自动切换至其他正常的后端服务器。如延长健康检查的间隔时间,后端服务器出现故障时,ALB 发现故障后端服务器的时间也会变长。方式二:通过...

EasyCkpt:AI大模型高性能状态保存恢复

因此,在发生故障时,迫切需要一种以低成本的方法来保存最新的Checkpoint。这样在重新启动训练时就无需重复计算,从而减少时间和成本的浪费。功能介绍 针对频繁故障的情况,PAI通过之前的故障失败场景总结出以下GPU和深度学习场景故障的...

网络架构容灾

当地址池中地址发生故障时,HealthCheck模块会准确的检测到异常情况并与DNS交互(如下图中序号3所示),摘除故障地址(如下图中序号4所示),这样用户端会自动解析到可用的地址池(如下图中序号5所示)。并当故障地址恢复时,自动恢复至...

故障管理

通过建立一个规范可遵循、全流程闭环的故障管理体系,配合技术手段的提升,可以有效降低故障发生的几率,缩短故障的MTTR,最终使故障造成的破坏性趋近于0。在日常运营中,无论什么原因导致业务服务中断、服务品质下降或用户服务体验下降的...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
数据库自治服务 云数据库 OceanBase 版 应用高可用服务 负载均衡 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用