设计方案

风险预测:风险预测是指在发生故障前,通过数据分析、机器学习等方式,预测系统的风险情况,提前进行预防和处理。在故障应急响应中,风险预测可以作为重要参考,帮助快速识别问题的根本原因,提高故障处理效率和精度。故障响应 在发现故障...

基本概念

RPO Recovery Point Objective(数据恢复点目标),指应用发生故障时预期的数据丢失量。例如,RPO=15 分钟,表示在应用发生故障时,最近 15 分钟的数据无法在云上恢复。RTO Recovery Time Objective(恢复时间目标),指故障发生时,在云...

添加和管理代码类型组件

编辑代码类型组件 在 应用组件 页面,单击目标代码类型组件名称或目标代码类型组件名称右侧 操作 列下的 编辑。在 编辑组件 面板,修改相关配置项后,单击 保存。编辑代码类型组件 在 应用组件 页面,单击目标代码类型组件名称右侧 操作 列...

DeviceLinkDown

DeviceLinkDown事件提示您线下机构侧动态路由邻居发生故障或者静态接入链路发生故障。告警信息 事件名称 事件级别 状态码 状态描述 DeviceLinkDown CRITICAL linkdown Device Link State Change 可能原因 用户侧交换机设备故障。用户侧交换...

什么是混合云容灾服务

RPO Recovery Point Objective(数据恢复点目标),指应用发生故障时预期的数据丢失量。例如,RPO=15 分钟,表示在应用发生故障时,最近 15 分钟的数据无法在云上恢复。RTO Recovery Time Objective(恢复时间目标),指故障发生时,在云...

实例的节点故障处理机制

当节点发生故障后,系统会对故障节点进行检查与修复。节点故障期间实例的相关服务不可用。说明 单节点实例适用于测试、培训、非核心业务等场景,生产环境建议使用副本集实例或分片集群实例以保障服务的高可用性。副本集 图 1.副本集架构 ...

日志管理

如果发生故障,您可以下载日志或提供日志上传路径给阿里云工程师定位问题。下载日志 在浏览器中,输入 https://<块网关IP地址>访问本地块网关控制台。输入用户名和密码,单击 确认。单击 关于,进入 关于系统 页面。找到 日志信息 区域,...

日志管理

如果发生故障,您可以下载日志或提供日志上传路径给阿里云工程师定位问题。下载日志 在浏览器中,输入 https://<文件网关IP地址>访问本地文件网关控制台。输入用户名和密码,单击 确认。单击 关于,进入 关于系统 页面。找到 日志信息 区域...

创建和管理中心应用

在 管理代码源 面板,单击目标代码源,设置相关参数,然后单击 保存,界面提示 保存成功 后,单击 关闭。如果您需要删除代码源,单击 代码源 右侧的 管理代码源。在 管理代码源 面板,单击目标代码源右侧的 图标,界面提示 删除成功 后,...

调试代码片段:快捷运行

本文为您介绍如何快捷运行目标代码。前提条件 已创建ODPS SQL或EMR Hive节点,并编写任务代码。创建ODPS SQL节点,详情请参见 开发ODPS SQL任务。创建EMR Hive节点,详情请参见 创建EMR Hive节点。使用限制 目前仅支持ODPS SQL、EMR Hive...

应用场景

当其中一部分ECS实例发生故障后,CLB 会自动屏蔽故障的ECS实例,将请求分发给正常运行的ECS实例,保证应用系统仍能正常工作。同城容灾(多可用区容灾)为了提供更加稳定可靠的 CLB 服务,CLB 已在各地域部署了多可用区以实现同地域容灾。当...

分支管理

新建分支 从左侧导航栏进入 代码服务>我的仓库,选择目标代码仓库,单击进入代码仓库详情页面。在页面上方,单击 分支>新建分支,填写新的分支名,然后选择或输入创建来源,可以是其他分支、标签或者版本。单击 新建 后,分支创建完成。...

光模块故障

本文介绍光模块发生故障的原因和处理方法。问题现象 光模块连接后,接口指示灯没有变为绿色。可能原因 光模块不兼容或损坏。智能接入网关设备支持的光模块型号请参见 光模块型号。说明 目前仅SAG-1000设备支持光模块插入。解决方案 通用多...

高可用版

优势 可用性 采用经典高可用架构,主备之间通过复制(默认半同步)实现数据同步,一旦主库发生故障,将迅速检测并触发主备切换来保证可用性。备库故障对业务无影响,但会快速被检测到并触发备库自愈。可靠性 计算与存储分离,计算节点的...

仓库管理

从左侧导航栏进入 代码服务>我的仓库,选择目标代码仓库,单击进入代码仓库详情页面。单击页面右上方的 Clone 按钮。单击 SSH 或 HTTP 选择用于克隆的协议,然后查看下载地址。单击复制按钮,获取下载地址链接。标签管理 标签作为一次发布...

单实例快速恢复

该方案为当前每个实例内部默认启用,当系统发生故障时,无需手工运维介入,系统可以自动恢复。在恢复期间,如果查询算子需要访问恢复中的节点,则查询会立即失败。节点恢复速度在一分钟左右,当表数量明显增加时,恢复时间会更长。Hologres...

代码诊断

日志服务与云效代码管理Codeup联合推出代码诊断功能,帮助您一键定位并跳转到对应代码的位置,快速排查和修复代码问题。前提条件 日志服务 已采集日志...设置完成后,单击对应字段的值,然后单击您所添加的交互事件,即可跳转到目标代码库中。

合并请求

操作步骤 在左侧导航栏进入 代码服务>我的仓库,选择目标代码仓库,点击进入代码仓库详情页面。在页面上方,点击 合并请求>新建合并申请,选择合并的 来源分支 及 目标分支,点击 比较,查看差异。若来源分支及目标分支没有差异,则无需...

同城容灾架构概述

非机房级故障(某个机房的单产品故障,例如其中一个机房的ECS服务器损坏),可以通过对单产品的灾备设计来保障发生故障时系统及时切换。应用设计相关参考标准 应用设计相关参考标准如下:无状态化。分布式集群设计、避免单点逻辑出现。幂等...

灾备方案

Tair 容灾架构演进 当 Tair 实例因不可预料的原因(例如设备故障、机房断电等)发生故障,容灾机制可用于保障数据的一致性和业务可用性。Tair 提供多种灾备方案供您选择,可满足不同的业务场景。图 1.Tair 容灾架构演进 灾备方案 灾备级别 ...

灾备方案介绍

云数据库Redis容灾架构演进 当云数据库Redis实例因不可预料的原因(例如设备故障、机房断电等)发生故障,容灾机制可用于保障数据的一致性和业务可用性。云数据库Redis提供多种灾备方案供您选择,可满足不同的业务场景。图 1.Redis容灾架构...

查看代码结构

DataWorks的代码结构功能,帮助您根据当前节点编写的SQL代码,解析出SQL代码运行的流程结构图。您可以通过代码结构快速定位、查看及修改SQL代码。查看代码结构 进入DataStudio。登录 DataWorks控制台...您可以根据实际需求编辑修改目标代码

什么是故障演练

适用场景 故障演练可适用于以下典型场景:衡量微服务的容错能力 通过模拟调用延迟、服务不可用、机器资源满载等,查看发生故障的节点或实例是否被自动隔离、下线,流量调度是否正确,预案是否有效,同时观察系统整体的QPS或RT是否受影响。...

标准架构

主节点提供日常服务访问,从节点提供HA高可用,当主节点发生故障,系统会自动在30秒内切换至从节点,保证业务平稳运行。特点 可靠性 服务可靠 采用双机主从(master-replica)架构,主从节点位于不同物理机。主节点对外提供访问,用户可...

管理应用接口

在 扫描代码分支 面板的代码分支下拉列表中选中目标代码分支后,单击 提交。您可以在 代码扫描上报接口信息 面板查看代码扫描状态,如果上报成功,则接口信息更新成功;如果上报失败,则可查看失败的原因。您可以单击刷新,查看最新代码...

高可用和容灾设计

可通过集群可读地址访问备节点,在发生故障切换时,RDS的高可用系统会自动执行以下三个步骤:将一个备节点提升为主节点,该备节点从集群可读地址中移除,同时清除该备节点上的可读连接,此时集群可读地址会发生闪断。故障主节点从集群读写...

ECS灾备解决方案

ECS集群 在分布于不同可用区的机房内,每个ECS节点都配置有相同的能力,以确保在单个节点发生故障时,整体服务不受影响。这些对等的节点共同支撑着数据层的应用和服务器管控功能。如果某个ECS节点出现故障,系统将自动执行热迁移,将受影响...

触发策略

此外,定时触发还支持代码变化检测,仅在代码发生变化时进行触发,定时触发的最小间隔时间为10分钟。其它 上述的触发策略中,除了手工触发可以个性化设置全局变量和选择运行阶段外,其余方式会运行所有阶段,全局变量也将全部使用默认值。

托管应用

在 创建部署实例-选择部署组件 面板,选中目标代码类型组件,单击 下一步。说明 当前环境下已部署的组件不能重复创建部署。在 创建实例部署-部署配置 面板,完成配置如下图所示的相关参数后,单击 下一步。相关参数配置说明,请参见 参数...

功能概览

当主系统发生故障时,业务系统切换到容灾系统,有效避免了地域性灾害导致的系统故障,保障业务的可用性,满足业务的RTO/RPO核心指标。云盘异步复制是一种基于块存储数据复制能力实现跨地域或者跨可用区数据保护的功能。更多信息,请参见 云...

功能概览

当主系统发生故障时,业务系统切换到容灾系统,有效避免了地域性灾害导致的系统故障,保障业务的可用性,满足业务的RTO、RPO核心指标。云盘异步复制是一种基于块存储数据复制能力实现跨地域或者跨可用区数据保护的功能。更多信息,请参见 ...

JVM注入动态脚本

受影响的请求数 否 0 限制最多发生故障的请求总数,每生效一次故障计数加1,累计发生故障请求数超出设定值后,请求则不再发生故障。填写数值小于等于0时,则表示不限制。受影响的请求占比(%)否 0 限制发生故障的请求数占所有应该发生故障...

异地应用双活切流

在⼀个数据中心发生故障或灾难的情况下,将流量切换到其他数据中心,其他数据中心可以正常运行并对关键业务或全部业务进行接管,实现故障灾难场景的业务快速恢复。本文将介绍在异地应用双活中如何创建切流任务并查看切流详情。前提条件 ...

常见问题-FAQ

答:经过测试团队对GTM多次测试验证,当应用服务发生故障时,GTM最快可在1分钟左右准确发现故障并切换。全网故障恢复时间=故障发现时间+全网生效时间。说明 受限于拨测平台探点发生变化和全国各地运营商TTL缓存原因,如使用不同的拨测平台...

FAQs

答:经过测试团队对GTM多次测试验证,当应用服务发生故障时,GTM能在 3分钟左右 准确发现故障并切换。全网故障恢复时间=故障发现时间+全网生效时间。说明 受限于拨测平台探点发生变化和全国各地运营商TTL缓存原因,如使用不同的拨测平台、...

流水单据型业务场景多活实践

在北京单元发生故障的情况下,可以使用MSHA切流功能将受影响的用户流量切换到另外的单元,进行快速业务恢复。说明 这里区别于传统的解决思路,不是去排查、处理和修复故障,而是立即使用切流进行恢复,将业务恢复和故障恢复解耦。容灾切换...

步骤五:应用容灾

确保操作人员熟悉容灾恢复流程,当主站真正发生故障时,操作人员可以顺畅地进行容灾切换。按如下步骤进行容灾演练:在 受保护服务器 页签,单击要启动容灾演练服务器右侧对应的 操作 列表下的 容灾演练。在 容灾演练 页面,选择 恢复网络、...

新手指引

访问目标代码库,刷新浏览器,可以看到推送记录以及与本地相同的修改内容,即新增了 hello.java 文件。步骤三:邀请成员协作 库管理员及以上角色可以为代码库邀请成员。网页端进入代码库,选中左侧导航栏中的 成员,查看代码库成员信息。库...

读多写少型业务场景多活实践

在杭州单元发生故障的情况下,可以使用MSHA切流功能将受影响的用户流量切换到另外的单元,进行快速业务恢复(这里区别于传统的思路,不是去排查、处理和修复故障,而是立即使用切流进行恢复,将业务恢复和故障恢复解耦)。容灾切换预期:将...

跨可用区容灾

确保操作人员熟悉容灾恢复流程,确保在主站真正发生故障时,操作人员可以顺畅地进行容灾切换。按如下步骤进行容灾演练:在 受保护服务器 页签,单击要启动容灾演练服务器右侧对应的 操作 列表下的 容灾演练。在 容灾演练 面板,选择 恢复...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
数据库自治服务 函数计算(旧版) 智能商业分析 Quick BI 负载均衡 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用