设计方案

从提前发现系统风险、提升测试质量、完善风险预案、加强监控告警、提升故障应急效率等方面做到故障发生前有效预防,故障发生时及时应对,故障恢复后回归验证。基于故障本身打造分布式系统韧性,持续提升软件质量,增强团队对软件生产运行的...

新建刷新频率定义

模型命名属性用于逻辑表命名规则中,让逻辑表的命名更规范标准,您可对模型命名组成中的一些常用属性进行自定义配置,其中包括刷新频率定义、增量定义和统计周期定义。本文介绍如何新建刷新频率定义。操作步骤 登录企业数据智能平台。在...

新建刷新频率定义

模型命名属性用于逻辑表命名规则中,让逻辑表的命名更规范标准,您可对模型命名组成中的一些常用属性进行自定义配置,其中包括刷新频率定义、增量定义和统计周期定义。本文介绍如何新建刷新频率定义。操作步骤 登录 数据资源平台控制台。在...

查看刷新频率定义

创建完刷新频率定义以后,您可以通过查看刷新频率定义详情和操作日志,了解刷新频率定义的基本信息和操作变更详情。本文介绍如何查看刷新频率定义。前提条件 已存在刷新频率定义,具体操作,请参见 新建刷新频率定义。操作步骤 登录 数据...

查看刷新频率定义

创建完刷新频率定义以后,您可以通过查看刷新频率定义详情和操作日志,了解刷新频率定义的基本信息和操作变更详情。本文介绍如何查看刷新频率定义。前提条件 已存在刷新频率定义,具体操作,请参见 新建刷新频率定义。操作步骤 登录企业...

10创建模型命名属性

模型命名属性用于为逻辑表提供命名规则,让逻辑表的命名更规范标准,本章节介绍如何创建刷新频率定义和增量定义的模型命名属性。前提条件 已新建工作组“信息中心(xxzx)”,具体操作,请参见 新建工作组。背景信息 模型命名规则是由“目录+...

代码逻辑场景

受影响的请求数 否 0 限制最多发生故障的请求总数,每生效一次故障计数加1,累计发生故障请求数超出设定值后,请求则不再发生故障。填写数值小于等于0时,则表示不限制。受影响的请求占比(%)否 0 限制发生故障的请求数占所有应该发生故障...

DeviceLinkDown

DeviceLinkDown事件提示您线下机构侧动态路由邻居发生故障或者静态接入链路发生故障。告警信息 事件名称 事件级别 状态码 状态描述 DeviceLinkDown CRITICAL linkdown Device Link State Change 可能原因 用户侧交换机设备故障。用户侧交换...

SubmitCheck-提交云产品配置检查

500 ServerError ServerError 服务故障,请稍后试!访问 错误中心 查看更多错误码。变更历史 变更时间 变更内容概要 操作 2023-07-17 OpenAPI 错误码发生变更、OpenAPI 入参发生变更 看变更集 变更项 变更内容 错误码 OpenAPI 错误码发生...

日志管理

如果发生故障,您可以下载日志或提供日志上传路径给阿里云工程师定位问题。下载日志 在浏览器中,输入 https://<块网关IP地址>访问本地块网关控制台。输入用户名和密码,单击 确认。单击 关于,进入 关于系统 页面。找到 日志信息 区域,...

日志管理

如果发生故障,您可以下载日志或提供日志上传路径给阿里云工程师定位问题。下载日志 在浏览器中,输入 https://<文件网关IP地址>访问本地文件网关控制台。输入用户名和密码,单击 确认。单击 关于,进入 关于系统 页面。找到 日志信息 区域...

基本概念

RPO Recovery Point Objective(数据恢复点目标),指应用发生故障时预期的数据丢失量。例如,RPO=15 分钟,表示在应用发生故障时,最近 15 分钟的数据无法在云上恢复。RTO Recovery Time Objective(恢复时间目标),指故障发生时,在云...

云端运行日志

通过日志记录的消息内容、业务类型、操作类型和状态码等信息,可以了解设备状态、通信情况,并定位操作失败的原因,帮助您监控和管理设备,进行故障排查。本文介绍如何查看云端运行日志,以及相关错误码和排错方法。日志业务类型说明 上行...

操作流程

新建模型命名属性 新建刷新频率定义 通过新建刷新频率定义的模型命名属性,统一逻辑表命名规则中刷新频率的定义,让逻辑表的命名更规范标准。具体操作,请参见 新建刷新频率定义。新建增量定义 通过新建增量定义的模型命名属性,统一逻辑表...

操作流程

新建模型命名属性 新建刷新频率定义 通过新建刷新频率定义的模型命名属性,统一逻辑表命名规则中刷新频率的定义,让逻辑表的命名更规范标准。具体操作,请参见 新建刷新频率定义。新建增量定义 通过新建增量定义的模型命名属性,统一逻辑表...

AccessGatewayFailover

AccessGatewayFailover事件提示您智能接入网关设备主IPsec链路发生故障。告警信息 事件名称 事件级别 状态码 状态描述 AccessGatewayFailover INFO agwfailover Access Gateway Failover 可能原因 IPsec链路网络故障。处理方法 无需处理。...

DeviceWanLinkDown

DeviceWanLinkDown事件提示您设备WAN链路发生故障。告警信息 事件名称 事件级别 状态码 状态描述 DeviceWanLinkDown CRITICAL down Wan Link Down 可能原因 WAN链路出现故障。处理方法 请提交工单,联系阿里云工程师。icmsDocProps={'...

跨地域容灾

容灾系统部署在阿里云的两个地域中,当生产站点发生故障(例如海啸、地震)时,业务系统切换到容灾站点。生产站点和容灾站点部署在不同的地域,提供容灾即服务,分钟级的高可靠的业务持续性保障,有效避免了地域性灾害导致的系统故障。

替换主机

当主机发生故障后,如果您创建 专属集群MyBase 时 主机故障处理策略 选择的是 手动替换主机,则您可以通过手动替换主机来解除故障。前提条件 专属集群MyBase 引擎的为MySQL,且主机存储类型为本地SSD盘。背景信息 当主机发生故障时,系统会...

替换主机

当主机发生故障后,如果您创建 专属集群MyBase 时 主机故障处理策略 选择的是 手动替换主机,则您可以通过手动替换主机来解除故障。前提条件 专属集群MyBase 引擎的为MySQL,且主机存储类型为本地SSD盘。背景信息 当主机发生故障时,系统会...

链路状态

发生故障时,及时进行切换。操作步骤 登录 智能接入网关控制台。在 智能接入网关 页面,单击目标实例ID。在智能接入网关实例详情页面,单击 高可用配置,可查看链路状态。绿灯:表示链路正常。红灯:表示链路故障。icmsDocProps={'...

应用场景

当其中一部分ECS实例发生故障后,CLB 会自动屏蔽故障的ECS实例,将请求分发给正常运行的ECS实例,保证应用系统仍能正常工作。同城容灾(多可用区容灾)为了提供更加稳定可靠的 CLB 服务,CLB 已在各地域部署了多可用区以实现同地域容灾。当...

功能概述

数据库发生故障后,无法在发生故障时定位到原因,可以通过智能压测功能,在克隆库上复现故障场景,定位故障原因。功能架构 智能压测的功能架构如下图所示:源数据库:将要进行大促、将要业务变更或者已经发生故障,需要进行流量捕获的数据...

光模块故障

本文介绍光模块发生故障的原因和处理方法。问题现象 光模块连接后,接口指示灯没有变为绿色。可能原因 光模块不兼容或损坏。智能接入网关设备支持的光模块型号请参见 光模块型号。说明 目前仅SAG-1000设备支持光模块插入。解决方案 通用多...

高可用版

优势 可用性 采用经典高可用架构,主备之间通过复制(默认半同步)实现数据同步,一旦主库发生故障,将迅速检测并触发主备切换来保证可用性。备库故障对业务无影响,但会快速被检测到并触发备库自愈。可靠性 计算与存储分离,计算节点的...

设计原则

数据容灾是指在数据中心或服务器发生故障、灾难或意外情况时,能够保证数据的安全性和可用性的一系列措施和策略。数据容灾的目标是确保在不可避免的情况下,数据的完整性、可恢复性和可用性不受到严重影响,以保障业务的持续运行和数据的...

单实例快速恢复

该方案为当前每个实例内部默认启用,当系统发生故障时,无需手工运维介入,系统可以自动恢复。在恢复期间,如果查询算子需要访问恢复中的节点,则查询会立即失败。节点恢复速度在一分钟左右,当表数量明显增加时,恢复时间会更长。Hologres...

主从(备)切换原因

实例故障 阿里云检测到实例发生故障,无法正常使用,系统会发起主从(备)切换,及时恢复业务正常运转,缩小故障影响范围。主从(备)切换完成后,实例状态会显示运行中,您不需要进行任何操作,实例可以正常运行。您可以在 服务可用性 ...

备份和灾难恢复

阿里金融云可以支持同城双活/灾备、两地三中心等架构方式。1.同城双活 同城双活、灾备是阿里金融云的...故障切换回切:DNS将生产IP从原生产中心修改到灾备中心,实现跨Region的故障切换和服务恢复机制,主站发生故障时,由备站继续提供服务。

故障复盘

故障分计算方案 在设计故障分的计算规则时,建议考虑以下维度数据指标:故障时长 故障时长=故障恢复时间-故障发生时间 故障发生时间 最接近故障等级定义激活(P4起)的时间点。按照如下顺序:针对业务监控:取首次达到故障等级(P4起)的...

主备方案介绍

主备容灾:当云数据库HBase实例因不可预料的原因(例如设备故障、机房断电断网等)发生故障,容灾机制可用于保障数据的一致性和业务可用性。功能优势 主备双活:请求低毛刺。故障自动容错。资源利用率高。主备容灾:支持云数据库HBase、EMR...

概述

分布式系统将计算任务和数据分布在多个节点上以实现更高的性能、可靠性和可扩展性,当一个节点发生故障或错误时,其他节点可以继续工作,相比于单机系统,架构本身就有较高的节点容错性。但随着服务拆分,更多组件的引入,分布式系统的复杂...

故障基础数据管理

定义故障等级是为了指定故障等级定义作为各业务的安全生产法则,推进各业务稳定性提升。如评判各业务团队的故障发现能力的标准就是故障等级定义的监控发现率等。在定义故障等级的时候,需要从功能等级、业务体量、业务特性、量化影响4个...

设置宕机自动迁移

若您未开启宕机自动迁移,DDH发生故障停机后,您需要 提交工单 申请置换一台健康的DDH。警告 本地SSD型DDH(例如本地SSD型i2)不支持自行手动迁移和故障时自动迁移。如果本地SSD型DDH出现故障,您可以 提交工单 申请人工迁移,但迁移后本地...

什么是混合云容灾服务

RTO Recovery Time Objective(恢复时间目标),指故障发生时,在云上将应用恢复运行所需要的时间。混合云灾备一体机 阿里云推出的具有容灾备份功能的一体机。混合云容灾定价 HDR支持按量付费和包年包月资源包。关于混合云容灾HDR的计量项...

AI助手使用说明

安装AI助手并开启PAI的作业监控和恢复功能后,当训练任务发生故障或异常时,能自动上报故障信息、隔离问题节点,无需人工干预即可快速恢复任务。本文为您介绍AI助手的具体配置方法。前提条件 已创建带有ACK灵骏托管版的集群。具体操作,请...

标准版-单副本

当数据库节点发生故障时,数据会丢失,系统会重新拉起一个Redis进程(没有数据),当节点故障业务自动切换完成后,应用程序需要将数据重新预热。单副本架构不支持以下功能:自动或手动备份、离线全量Key分析 和 实例回收站。若您对数据有...

如何通过 mPaaS 框架解决 App 线上问题

如果真的在线上发生故障,开发者就可以通过服务器推送开关,及时将故障代码关闭。这种推拉结合的方式,即时到达率 100%。发布 H5 离线包更新如果某些故障是发生在离线包内,在定位到问题后,可以直接通过实时发布控制台发布新的版本即可。...

通过异步复制功能实现容灾恢复

当您创建并启动云盘异步复制关系后,如果主盘发生故障,您可以通过异步复制功能对主盘进行容灾恢复。本文主要介绍如何进行容灾恢复操作。前提条件 反向复制前,请确保源云盘(主盘)已经从对应的ECS实例上卸载,即主盘处于未挂载状态。具体...

标准架构

主节点提供日常服务访问,从节点提供HA高可用,当主节点发生故障,系统会自动在30秒内切换至从节点,保证业务平稳运行。特点 可靠性 服务可靠 采用双机主从(master-replica)架构,主从节点位于不同物理机。主节点对外提供访问,用户可...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
数据库自治服务 NAT网关 负载均衡 弹性公网IP 短信服务 人工智能平台 PAI
新人特惠 爆款特惠 最新活动 免费试用