容灾演练断网方式说明

可用区断网 当整个机房的外部网络出现中断后,外部请求无法进入故障机房,机房内业务同样无法访问外部网络,但机房内网络互通,形成一个局部环境。可用区断网正是为了模拟此类真实故障而提供的机房级故障模拟能力。可用区断网方式采用租户...

跨可用区容灾

故障恢复时,HDR使用该网络恢复容灾数据。HDR默认读取从站VPC网络的可用虚拟交换机。复制网络和恢复网络不在一个可用区时,将导致RTO时间变长。建议配置和 复制网络 相同的可用区。IP地址 故障恢复时,创建的ECS实例的IP地址的生成方式。...

跨地域容灾

故障恢复时,HDR使用该网络恢复容灾数据。HDR默认读取从站VPC网络的可用虚拟交换机。复制网络和恢复网络不在一个可用区时,将导致RTO时间变长。建议配置和 复制网络 相同的可用区。IP地址 故障恢复时,创建的ECS实例的IP地址的生成方式。...

强弱依赖治理最佳实践

在对业务分析进行依赖预判后,应通过故障注入的方式验证真实依赖关系是否与预判相符,例如注入依赖的服务间的网络延迟故障。强弱依赖的验证可以有多种指标,例如监控与日志的报警,请求的返回状态码等等。本文示例预期frontend与...

多可用区部署

如果可用区A的网络存在故障,由于同步延迟问题,在可用区A网络恢复之前的时间段内可用区B的数据会一直处于缺失的状态。备实例资源利用率不高。在主备容灾下,大部分时间备实例的资源不会被使用,只有在主备切换操作的时候才会被访问。主备...

网络诊断

容器服务平台提供网络诊断功能,帮助您诊断网络常见问题,例如Pod之间不通、集群到公网访问不通、公网到LoadBalancer不通。本文介绍网络诊断的基本原理、使用方式、以及如何针对常见网络不通的场景定位网络问题和使用网络诊断。重要 使用...

OSS文件上传和下载失败的排查方法

若存在网络故障,请解决网络故障,确保网络正常后再进行下一步排查。检查下载文件的数量是否超过限制。通过OSS控制台可一次批量下载最多100个文件。请参见 OSS上传文件失败 中的第3步和第4步,进行排查配置是否正常。使用以下OSS工具通过...

网络类场景

网络延迟 网络延迟场景可以指定网络延迟因素(例如网卡、本地端口、远程端口、目标IP等)和延迟时间,对应用或服务注入网络调用延迟故障。验证网络延迟情况下系统的容错能力。表 1.参数说明 参数名称 参数说明 网卡名称 具体的网卡设备,为...

三网合一卡2.0使用入门

步骤四:验证重启是否切网成功 设备手工重启后自动切换网络,查看运营商信息是否更新 步骤五:验证网络故障设备自动重启切网 登录阿里云控制台,对当前使用的运营商卡片进行停机操作,模拟断网场景,在 步骤二 的基础上等触发检测后,设备...

网络安全

对网络流量数据进行分析监控 阿里云VPC提供流日志功能,可以记录VPC网络中弹性网卡ENI(Elastic Network Interface)传入和传出的流量信息,帮助您检查访问控制规则、监控网络流量和排查网络故障。通过分析这些信息可以查找VPC内资源(包括...

监控报警概述

实时监控提供终端用户登录云电脑的实时数据(例如用户在线数量、在线时长的前十用户、平均登录时间和云电脑网络延迟分布情况)以及相关故障预警信息,以便快速准确定位,迅速处理故障,避免因资源、网络问题或者外部操作原因造成不必要的...

服务等级说明

(2)任何阿里云所属设备以外的网络、设备故障或配置调整引起的;(3)客户的应用程序或数据信息受到黑客攻击而引起的;(4)客户维护不当或保密不当致使数据、口令、密码等丢失或泄漏所引起的;(5)客户的疏忽或由客户授权的操作所引起的...

产品架构

本文介绍故障演练的产品架构,以下简称故障演练为AHAS Chaos。产品架构图 AHAS Agent AHAS Agent安装在指定的目标机器上,用来执行服务端下发的故障注入命令以及采集演练相关的必要信息,例如CPU、内存占用等。主要有以下特点:快捷高效:...

归档存储服务等级协议

(2)任何阿里云所属设备以外的网络、设备故障或配置调整引起的;(3)用户的应用程序或数据信息受到黑客攻击而引起的;(4)用户维护不当或保密不当致使数据、口令、密码等丢失或泄漏所引起的;(5)用户自行升级操作系统所引起的;(6)...

服务等级协议

(2)任何阿里云所属设备以外的网络、设备故障或配置调整引起的;(3)用户的应用程序或数据信息受到黑客攻击而引起的;(4)用户维护不当或保密不当致使数据、口令、密码等丢失或泄漏所引起的;(5)用户的疏忽或由用户授权的操作所引起的...

混沌工程缓存实战系列-Redis

本示例创建网络延迟的故障场景。登录 AHAS控制台,在左侧栏选择 故障演练>我的空间。在 我的空间 页面,单击 新建演练>新建空白演练。在 演练配置 页面,填写相关参数,选择 演练内容 为 主机内网络延迟。更多参数信息,请参见 创建演练。...

故障演练

例如,模拟在高速通道冗余链路中的一条链路发生故障时,网络流量会自动切换至其他冗余链路的场景。借助该工具,您可以测试和验证您与阿里云组建的混合云组网的可靠性。重要 故障演练会通过将被演练的资源关闭,使资源处于人工构造的故障...

EasyCkpt:AI大模型高性能状态保存恢复

通过对众多故障失败案例的分析,对于训练集群而言:GPU易损坏,但机器的CPU和内存通常仍可正常使用。以节点为单位,内存的闲置空间很大(通常远大于模型状态)。在节点上,通常很难出现所有网卡都损坏的情况,即使节点出现故障,它通常仍然...

同城多活架构实践

案例背景:一次故障的发生 本示例的电商业务已自行进行了同城容灾能力建设,在杭州的多个可用区进行应用的对等部署,并自行实现了可用区级粒度的入口流量控制。但因为一次线上可用区级故障,才发现将故障可用区的HTTP流量切换到其他可用区...

什么是Web应用防火墙

产品优势 产品优势 优势说明 10年以上网络安全经验 建立在阿里巴巴集团10年以上的网络安全经验上,提供与淘宝、天猫、支付宝等成功应用案例同样的安全体验。由专业的安全团队为您提供服务。抵御已知的OWASP漏洞并不断修复披露漏洞。防御CC...

实时分析链路数据

如果您的应用遇到流量不均、单机故障、慢接口治理、业务流量统计、灰度发布监控等问题,可以通过应用监控的调用链分析快速定位问题代码。本文介绍如何通过调用链分析快速定位五种经典线上问题,更直观地了解调用链分析的用法与价值。背景...

源为PolarDB-X的功能规范和约束说明

在出现故障(如网络中断、机房批量设备故障或互联网数据中心IDC故障),且DTS任务存在延迟的情况下,此时如更新至目标库的最后一条数据的时间与故障发生时的时间之差小于RPO(如5分钟),则可以业务优先恢复为准则切流。切流后可能有5分钟...

源为PolarDB-X的功能规范和约束说明

在出现故障(如网络中断、机房批量设备故障或互联网数据中心IDC故障),且DTS任务存在延迟的情况下,此时如更新至目标库的最后一条数据的时间与故障发生时的时间之差小于RPO(如5分钟),则可以业务优先恢复为准则切流。切流后可能有5分钟...

混合云应用双活容灾最佳实践

通过MSHA多活容灾助力企业进行混合云应用双活容灾建设的实践案例,给出了容灾架构建设实践方法,同时利用Chaos故障演练产品注入真实故障,来验证故障场景业务容灾能力是否符合预期。若您在使用过程中有任何疑问,欢迎您搜索钉钉群号...

故障排查

ACK集群异常 添加Kubernetes集群节点的常见问题 容器镜像仓库构建服务失败问题排查 容器镜像服务源码绑定失败问题排查 Kubernetes集群如何指定安全组 Kubernetes集群网络异常的排查方法 容器服务ACK应用故障排查 如何升级集群?排查故障的...

专家成长计划技术培训课程

本课程亮点在于在介绍上述云网络产品运维和故障排查的同时,还包含SLB、VPC、VPN、云企业网、高速通道、云解析等产品全链路的故障排查动手操作实验,使得学员对课程理论有更直观和深入的理解(我们将为学员准备实验环境及账号信息)。...

专家成长计划服务内容说明

30人 阿里云网络产品运维 8 通过深入介绍阿里云网络族产品介绍,包括SLB、VPC、VPN、混合云、云解析、全球加速等产品的原理、架构、操作使用和运维详解,使学习者全面了解物理网络和虚拟网络,快速具备网络产品的操作使用和深入故障处理和...

创建集群

您需要先创建专属集群MyBase...了解更多 加入钉钉群(32484333),数据库专家答疑、获取成功案例干货、定期参加专家直播互动。后续步骤 专属集群MyBase创建完成后,您需要添加主机,也可以管理集群。具体操作,请参见 添加主机 和 管理集群。

创建集群

您需要先创建云数据库专属集群,...了解更多 加入钉钉群(32484333),数据库专家答疑、获取成功案例干货、定期参加专家直播互动。后续步骤 MyBase集群创建完成后,您需要添加主机,也可以管理集群。具体操作,请参见 添加主机 和 管理集群。

常见问题

磁盘/CPU/内存/带宽问题 Windows实例负载的查询及分析 Linux实例CPU负载的查询和案例分析 如何配置Windows实例的虚拟内存 入网带宽和出网带宽 Linux实例网络流量负载情况的查询和案例分析 Linux实例中如何查看物理CPU和内存信息 Linux实例...

常用端口

0.0.0.0/0 1 经典网络 公网入方向 公网Ping ECS实例 专有网络VPC 入方向 允许 全部ICMP-1/-1 地址段访问或安全组访问 根据授权类型填写 1 经典网络 公网入方向 ECS实例作Web服务器 专有网络VPC 入方向 允许 自定义TCP HTTP (80)地址段访问 ...

手动执行主备切换

除了自动故障转移,云原生内存数据库Tair 支持手动执行主备切换(即切换节点角色),方便您进行实时容灾演练,验证客户端程序的差错处理能力。如果实例部署在多可用区,您还可以根据业务的部署情况执行主备切换,满足应用就近连接的需求。...

手动执行主备切换

除了自动故障转移,云数据库Redis还支持手动执行主备切换(即切换节点角色),方便您进行实时容灾演练,验证客户端程序的差错处理能力。如果实例部署在多可用区,您还可以根据业务的部署情况执行主备切换,满足应用就近连接的需求。前提...

客户案例

DataWorks在多个行业中均有典型的案例落地,帮助多个行业的企业解决数据痛点,挖掘数据价值,本文为您介绍典型行业中已落地的客户案例。新零售行业:大润发云上数据中台建设 客户架构如下。客户简介 为了快速数字化转型,拥抱新零售,...

全链路专家服务内容说明

17、最佳中间件行业级别的典型案例 18、产品使用技巧/最佳实践(如高性能网络架构、PolarDB特性及适用场景)交付物:现场或线上技术专场咨询 5.服务SLA 提供云产品技术专家。提供《项目启动报告》、《项目专家服务方案》、《项目架构调查...

诊断项与诊断结果说明

实例健康诊断功能是一种自助诊断方式,可以对实例的计算服务状态、存储服务状态、网络服务状态、实例配置管理和实例操作系统内相关配置进行全方位的诊断,帮助您了解实例的健康情况,及时发现并解决常见的问题。本文介绍轻量应用服务器支持...

常见问题

云数据库Redis版是否支持主从节点的故障切换?云数据库Redis版是否支持全球多活形态?Redis CSRF漏洞分析及云数据库Redis版安全措施介绍 云数据库Redis集群版与原生Redis集群版有什么区别?网络与连接 如何获取Redis实例的连接地址和实例ID...

附录:SOFAStack 产品目录

分布式链路跟踪 分布式链路跟踪(Distributed System Tracing,简称 DST)是一款面向分布式架构、微服务架构和云原生架构的应用可观察性的金融级解决方案,帮助用户厘清应用间复杂的调用关系,迅速定位故障或者缓慢节点。产品架构 产品优势...

设计原则

面向失败的架构设计原则 众所周知,系统异常事件是不可避免的,如网络延迟、硬件故障、软件错误、突峰流量等,建议在系统设计阶段就要从这些异常事件引起的系统执行“失败”出发,提供冗余、隔离、降级、弹性等能力,旨在确保系统的高可用...

故障演练

故障演练是整体容灾流程中极其重要的一环。本文介绍ECS容灾中故障演练的操作流程。故障演练的意义 故障演练将被容灾保护的服务器在云上拉起并验证应用正确性,是容灾流程整体中及其重要的一环,它的核心意义在于:方便地验证被容灾保护的...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
共享流量包 负载均衡 高速通道 弹性公网IP 短信服务 人工智能平台 PAI
新人特惠 爆款特惠 最新活动 免费试用