智能卡简介

网络灾备 当前网络出现故障后,支持切换到备份网络,提升设备在线时长。降低成本 节省了事前勘测和故障后运维的人力以及相关成本。支持存量设备升级 设备本身无需硬件改造,安装相关SDK进行存量设备OTA升级后,即可支持智能卡。可选网络 ...

强弱依赖治理最佳实践

在对业务分析进行依赖预判后,应通过故障注入的方式验证真实依赖关系是否与预判相符,例如注入依赖的服务间的网络延迟故障。强弱依赖的验证可以有多种指标,例如监控与日志的报警,请求的返回状态码等等。本文示例预期frontend与...

跨地域容灾

故障恢复时,HDR使用该网络恢复容灾数据。HDR默认读取从站VPC网络的可用虚拟交换机。复制网络和恢复网络不在一个可用区时,将导致RTO时间变长。建议配置和 复制网络 相同的可用区。IP地址 故障恢复时,创建的ECS实例的IP地址的生成方式。...

跨可用区容灾

故障恢复时,HDR使用该网络恢复容灾数据。HDR默认读取从站VPC网络的可用虚拟交换机。复制网络和恢复网络不在一个可用区时,将导致RTO时间变长。建议配置和 复制网络 相同的可用区。IP地址 故障恢复时,创建的ECS实例的IP地址的生成方式。...

多可用区部署

如果可用区A的网络存在故障,由于同步延迟问题,在可用区A网络恢复之前的时间段内可用区B的数据会一直处于缺失的状态。备实例资源利用率不高。在主备容灾下,大部分时间备实例的资源不会被使用,只有在主备切换操作的时候才会被访问。主备...

网络诊断

容器服务平台提供网络诊断功能,帮助您诊断网络常见问题,例如Pod之间不通、集群到公网访问不通、公网到LoadBalancer不通。本文介绍网络诊断的基本原理、使用方式、以及如何针对常见网络不通的场景定位网络问题和使用网络诊断。重要 使用...

功能特性

产品主要功能包括风险管理、日常巡检、故障诊断、应急预案故障演练等。风险管理 风险管理 是高可用管理平台核心,是风险事件汇集、处置的中枢平台,具体如下。风险事件 风险事件汇集:负责将监控、巡检、诊断产生的风险或告警信息进行...

售前常见问题

本文介绍使用云防火墙前的常见问题解决方案。功能特性相关 为什么使用云防火墙需要授予服务关联角色(AliyunServiceRoleForCloudFW)?云防火墙最多支持几个跨账号部署?金融云基础版云防火墙与其他版本有哪些差异?云防火墙是否有抗APT...

共享内存通信(SMC)常见问题

如果您在Alibaba Cloud Linux 3系统中启用了共享内存通信SMC(Shared Memory Communication),且使用过程中遇到无法正常通信、部分端口不可用、对比TCP没有应用性能提升等问题,可以参考本文提供的方案进行排查并解决。启用SMC后应用性能...

网站建设方案

根据广东省管局要求,前缀不一致的域名需(如example.com与aliyundoc.com是两个前缀不一致的域名)按不同的网站备案。如果备案主体下域名过多(包含已备案域名及本次提交域名),需提供网站建设方案书。...应急处置方案

演练场景

故障演练是业务系统上线前必要的演练环节,旨在对应急预案的可行性,进一步完成应急预案,从而帮助提升产品、集群、机房的稳定性,减少故障的发生,提高故障应急效率,进而提升产品竞争力。一个完整的故障演练过程为 创建故障原子服务>创建...

异地双活切流

场景二:故障>云间网络故障,会自动选中 切流组件。说明 单元(地域)间通信出现故障,将流量,主数据库全部切换到主单元(地域)。a.MSHA会自动将备单元的流量切零。b.单击 下一步,进入 容灾切换预览,在预览页,可以看到单元前后比例的...

网络类场景

网络延迟 网络延迟场景可以指定网络延迟因素(例如网卡、本地端口、远程端口、目标IP等)和延迟时间,对应用或服务注入网络调用延迟故障。验证网络延迟情况下系统的容错能力。表 1.参数说明 参数名称 参数说明 网卡名称 具体的网卡设备,为...

异地应用双活切流

场景三:故障>云间网络故障,会自动选中 切流组件。说明 单元(地域)间通信出现故障,将流量,主数据库全部切换到主单元(地域)。a.MSHA会自动将备单元的流量切0,主数据在备单元的也会自动选中,后续会切换单主单元。b.单击 下一步,...

归档存储服务等级协议

故障恢复能力 阿里云为付费用户的云服务提供7×24小时的运行维护,并以在线工单和电话报障等方式提供技术支持,具备完善的故障监控、自动告警、快速定位、快速恢复等一系列故障应急响应机制。2.11.网络接入性能 阿里云归档存储对用户不限制...

什么是故障演练

定位与解决问题的应急能力 通过故障突袭,随机对系统注入故障,考察相关人员对问题的应急能力,以及问题上报、处理流程是否合理,达到以战养战,锻炼定位与解决问题的能力。故障演练与AHAS服务体系 故障演练作为AHAS的一部分,与AHAS其他...

监控报警概述

实时监控提供终端用户登录云电脑的实时数据(例如用户在线数量、在线时长的前十用户、平均登录时间和云电脑网络延迟分布情况)以及相关故障预警信息,以便快速准确定位,迅速处理故障,避免因资源、网络问题或者外部操作原因造成不必要的...

产品架构

本文介绍故障演练的产品架构,以下简称故障演练为AHAS Chaos。产品架构图 AHAS Agent AHAS Agent安装在指定的目标机器上,用来执行服务端下发的故障注入命令以及采集演练相关的必要信息,例如CPU、内存占用等。主要有以下特点:快捷高效:...

故障演练

例如,模拟在高速通道冗余链路中的一条链路发生故障时,网络流量会自动切换至其他冗余链路的场景。借助该工具,您可以测试和验证您与阿里云组建的混合云组网的可靠性。重要 故障演练会通过将被演练的资源关闭,使资源处于人工构造的故障...

服务等级说明

(2)任何阿里云所属设备以外的网络、设备故障或配置调整引起的;(3)客户的应用程序或数据信息受到黑客攻击而引起的;(4)客户维护不当或保密不当致使数据、口令、密码等丢失或泄漏所引起的;(5)客户的疏忽或由客户授权的操作所引起的...

服务等级协议

(2)任何阿里云所属设备以外的网络、设备故障或配置调整引起的;(3)客户的应用程序或数据信息受到黑客攻击而引起的;(4)客户维护不当或保密不当致使数据、口令、密码等丢失或泄露所引起的;(5)客户的疏忽或由客户授权的操作所引起的...

服务协议

(2)任何阿里云所属设备以外的网络、设备故障或配置调整引起的;(3)客户的应用程序受到黑客攻击而引起的;(4)客户维护不当或保密不当致使数据、口令、密码等丢失或泄漏所引起的;(5)客户的疏忽或由客户授权的操作所引起的;(6)...

服务等级协议

本服务等级协议(Service Level Agreement,以下简称“SLA”)规定了阿里云向客户提供的基因分析平台(简称“平台”)的服务可用性等级指标及补偿方案。1.定 义 1.1 服务周期:一个服务周期为一个自然月。1.2 服务周期总分钟数:服务周期内...

SLA服务等级协议

本服务等级协议(Service Level Agreement,以下简称“SLA”)约定了阿里云向客户提供的客服工作台的服务可用性等级指标及赔偿方案。特别提示您,除非另有约定,本SLA不适用于客服工作台的公测、邀测或免费的功能及版本,也不适用于客服...

产品服务等级协议

(2)任何阿里云所属设备以外的网络、设备故障或配置调整引起的;(3)任何数据资源平台以外原因引起的,比如:由数据资源平台所依赖的上下游软件产品故障或配置调整引起的;数据同步模块中由于源端数据库或目的端数据库自身原因导致的;...

地址标准化服务等级协议

本服务等级协议(Service Level Agreement,以下简称“SLA”)规定了阿里云向客户提供的地址标准化的服务可用性等级指标及赔偿方案。1.定义 1.1服务周期:一个服务周期为一个自然月。1.2服务周期总分钟数:服务周期内的总天数╳24(小时)...

重保应急原则

应急预案 应急预案计划在落地前需与商务、法务等团队确认重保范围和职责,再与安全GOC以及合规团队确认落地方案方案具有一定的统一性,但均会根据重保场景定制个案方案。以下为您介绍常见的对政务云平台的被攻击风险,以及通用的应急预案...

源为PolarDB-X的功能规范和约束说明

在出现故障(如网络中断、机房批量设备故障或互联网数据中心IDC故障),且DTS任务存在延迟的情况下,此时如更新至目标库的最后一条数据的时间与故障发生时的时间之差小于RPO(如5分钟),则可以业务优先恢复为准则切流。切流后可能有5分钟...

源为PolarDB-X的功能规范和约束说明

在出现故障(如网络中断、机房批量设备故障或互联网数据中心IDC故障),且DTS任务存在延迟的情况下,此时如更新至目标库的最后一条数据的时间与故障发生时的时间之差小于RPO(如5分钟),则可以业务优先恢复为准则切流。切流后可能有5分钟...

什么是全球加速

全球加速 GA(Global Accelerator)是一款覆盖全球的网络加速服务,依托阿里云优质BGP带宽和全球传输网络,实现全球网络就近接入,可以减少延迟、抖动、丢包等网络问题对服务质量的影响,为全球用户提供高可用和高性能的网络加速服务。...

使用NLB挂载跨地域VPC内的服务器

方案测试使用时建议使用按量付费 按量付费 地域 实例所属地域 西南1(成都)网络及可用区 ECS 实例所属网络及可用区 网络类型:专有网络 VPC:VPC1-test 交换机:VPC1交换机1 勾选“指定主网卡主私网IP地址”并配置为172.16.20.100 实例...

集群巡检项及解决方案

解决方案:若SLB实例网络带宽使用率过高,您需要提升实例规格。具体操作,请参见 使用指定的SLB实例。SLB最大连接数过高 异常影响:过去三天最大连接数达到上限的80%以上。当连接数达到上限后,无法建立新连接,导致客户端无法访问。解决...

设计方案

故障演练可分为方案验证的容灾演练、稳定性验收的红蓝攻防,以及故障应急验证的突袭演练。容灾演练 容灾演练是通过模拟实例、机房或地域级故障,判断系统服务的逃逸能力,验证系统的容灾能力以及面对灾难时的应对能力。容灾演练可以帮助...

设计原则

面向风险的应急快恢原则 在一些场景下,即使设计了各种技术手段去提高系统的冗余、保持业务的高可用,但还是避免不了生产系统故障的发生,所以需要面对故障建立一个高效的故障应急流程机制和稳定的技术平台,实现故障风险实时发现、应急...

故障演练

故障演练是整体容灾流程中极其重要的一环。本文介绍ECS容灾中故障演练的操作流程。故障演练的意义 故障演练将被容灾保护的服务器在云上拉起并验证应用正确性,是容灾流程整体中及其重要的一环,它的核心意义在于:方便地验证被容灾保护的...

故障演练

故障演练是整体容灾流程中极其重要的一环。本文介绍ECS容灾中故障演练的操作流程。故障演练的意义 故障演练将被容灾保护的服务器在云上拉起并验证应用正确性,是容灾流程整体中及其重要的一环,它的核心意义在于:方便地验证被容灾保护的...

自建MySQL应急恢复

数据库备份DBS 提供自建MySQL应急恢复功能,该功能基于Copy Data Management(CDM)技术,通过开启DBS沙箱,您可以快速创建出应急数据库实例(本文称为沙箱实例),使备份数据快速可用。多个沙箱实例之间的读写不会互相影响,也不会影响源...

弹性加速计算实例EAIS安全性说明

弹性加速计算实例EAIS的云上安全性,是阿里云在面对当前的网络安全形势和挑战时所采取的措施,以及提高用户在资源和网络访问控制、EAIS资源操作、故障隔离和风险检测等方面的安全性所具备的能力。说明 通过在ECS实例(非GPU实例)上绑定...

功能特性

查看同域流量分析 网络监测与诊断 帮助用户在云上运维阶段更高效地监测网络业务变化和故障诊断排查。功能集 功能 功能描述 参考文档 事件中心 问题事件 展示已经造成业务受损,并且7天内状态一直处于进行中的异常事件列表。查看问题事件 ...

同城多活架构实践

虽然故障最终得以解决,但故障导致的客户流失和企业口碑影响,对快速发展的业务造成不小的打击,迫使企业开始重视同城多活容灾能力的建设,以及定期做故障演练确保故障恢复能力的有效性。同城多活架构改造 基于MSHA多活容灾解决方案,您...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
云服务器 ECS 共享流量包 弹性公网IP 负载均衡 短信服务 人工智能平台 PAI
新人特惠 爆款特惠 最新活动 免费试用