搭建高可用架构

为保障您的业务正常运行,RDS提供各类高可用功能,例如独享型规格、高可用系列、多可用区、跨地域备份恢复等等。创建高可用架构实例 在 创建实例 时,您需要关注如下几个涉及高可用架构的选项:系列:RDS支持多种系列,建议您选择 高可用...

跨可用区容灾

当生产站点因为不可抗力因素(比如机房火灾、断电)或者设备故障(软、硬件破坏)导致应用在短时间内无法恢复时,ECS容灾服务支持业务的跨可用区(Availability Zone)的容灾能力,对整体的应用做容灾备份来应对单地区的故障,满足业务的...

标准版-单副本

当数据库节点发生故障时,数据会丢失,系统会重新拉起一个Redis进程(没有数据),当节点故障业务自动切换完成,应用程序需要将数据重新预热。单副本架构不支持以下功能:自动或手动备份、离线全量Key分析 和 实例回收站。若您对数据有...

跨地域容灾

说明 若受保护服务器表格未显示 故障切换/故障恢复信息 列,请单击 设置可见列 配置即可。如果检查发现当前时间点应用运行正常,选择 更多>故障切换>确认故障切换,确认故障切换。说明 在故障切换或者切换恢复点完成,并且已经确认被容灾...

跨地域容灾

容灾系统部署在阿里云的两个地域中,当生产站点发生故障(例如海啸、地震)时,业务系统切换到容灾站点。生产站点和容灾站点部署在不同的地域,提供容灾即服务,RPO低至1分钟、RTO低至15分钟的高可靠的业务持续性保障,有效避免了地域性...

ECS服务器的外网地址ping不通的排查方法

Windows系统:具体操作请参见 Windows实例ping外网地址提示“一般故障”。运营商问题:检查运营商是否存在网络问题,如公网运营商链路中断,路由震荡等。具体操作请参见 使用ping命令丢包或不通时的链路测试方法。相关文档 ECS实例间ping...

标准架构

当数据库节点发生故障时,数据会丢失,系统会重新拉起一个 Tair 进程(没有数据),当节点故障业务自动切换完成,应用程序需要将数据重新预热。单副本架构不支持以下功能:自动或手动备份、离线全量Key分析 和 实例回收站。若您对数据有...

虚拟机场景

一般用于验证业务系统在高并发且系统性能下降的情况下,是否能够通过限流、快速扩容等手段保证业务连续性。参数说明如下:参数名称 是否必选 默认值 参数说明 进程ID 必选其一 无 Java进程的ID。进程关键字 无 用于识别唯一的关键字,可以...

在Windows实例无法访问外部网络如何处理?

或 Windows实例ping外网地址提示“一般故障”。检查Windows实例是否存在性能问题 Windows实例可能存在CPU资源占用高、内存耗尽、带宽占用满、网络动态端口耗尽等问题,您可以通过如下方式进行检查:使用工具进行分析,具体操作,请参见 ...

支持计划

业务不可用分钟(包含专项应急小组会诊)一般问题小时一般咨询小时 7×24小时专属企业钉钉群快速响应,提供业务咨询、自动预警、故障处理等服务,并可由多位专家进行疑难应急会诊案例严重性的响应时间:业务不可用分钟(包含专项应急小组...

业务流量隔离功能实践

VIP业务流量重保 可以通过搭建流量隔离环境,将VIP业务流量引流到专属的隔离环境,来做重保护航,避免系统上不同业务的资源抢占和故障影响,例如在大促期间对重点商家、VIP客户流量做重保护航。日常多项目开发、测试 当一个系统或应用存在...

故障演练

故障演练就是这个背景下诞生的,沉淀通用的故障场景,以可控成本在线上故障重放,以持续性的演练和回归方式的运营来暴露问题,不断验证和推动系统、工具、流程、人员能力的提升,从而提前发现并修复可避免的重大问题,或通过验证故障发现...

混沌工程缓存实战系列-Redis

Redis是一个开源高性能的Key-Value存储系统,虽然Redis本身具备了非常高的可用性,但是在实际应用中也会随着系统业务的复杂性以及不合理的使用,而导致很多的问题。本文将讲述如何通过混沌工程来暴露可能存在的使用风险,提升缓存问题的...

内网访问安全常见问题

本文梳理了 SASE 内网访问安全的常见问题,如果您的业务中遇到相关问题可以参考解决。访问一个域名网站,如何配置内网DNS才能正常访问?如果您的业务组网中接入了PrivateZone,则 SASE 会自动同步PrivateZone的解析数据,您无需在 SASE ...

读多写少型业务场景多活实践

说明 基于MSHA流量监控或其他监控能力,确定业务稳态的监控指标,以便在故障发生时判断故障影响面以及在故障恢复判断业务的实际恢复情况。演练预期如下:导购链路对购物车应用是弱依赖(导购页会展示用户放入购物车的商品数量),弱依赖...

快速开始

云速搭CADT为您提供应用架构...容灾管理服务 容灾管理服务提供规划、优化、部署、演练高可用业务的能力,在业务上线前及业务上线定期进行容灾演练,验证系统是否能够抵御资源故障或者AZ故障,检验系统健壮性,详细内容请查看 容灾管理服务。

什么是故障

本文主要介绍什么是故障。定义 在日常运营中,无论什么原因导致业务服务中断、服务品质...故障改进:支持对故障制定明确的改进及验收措施、责任人及完成时间,确保每个深度复盘故障都能对业务连续性形成改进,避免历史同类故障重复发生。

异地应用双活切流

在⼀个数据中心发生故障或灾难的情况下,将流量切换到其他数据中心,其他数据中心可以正常运行并对关键业务或全部业务进行接管,实现故障灾难场景的业务快速恢复。本文将介绍在异地应用双活中如何创建切流任务并查看切流详情。前提条件 ...

名词解释

另一方面是在⼀个数据中心发⽣故障或灾难的情况下,其他数据中心可以正常运行并对关键业务或全部业务实现接管,实现用户的故障无感知。两地三中心 即生产数据中心、同城灾备中心、异地灾备中心建设方案。这种模式下,两个城市的三个数据...

EMR Kafka磁盘故障运维

磁盘故障及其运维通常伴随着磁盘上的数据销毁。在进行磁盘运维时,您应考虑数据是否需要迁移备份。对于Kafka集群,您还需要考虑Topic分区副本数据是否可以从其他Broker节点分区副本同步恢复。本文以EMR Kafka 2.4.1版本为例,介绍Kafka磁盘...

灾备规划

需求分析 数据保护和业务连续性对数据中心的意义重大,关键应用的故障或数据丢失会对您的业务造成重大损失。混合云容灾服务提供了两个层次的能力来保护数据,并确保业务连续性。异地备份 服务器镜像和数据备份会直接上传至阿里云灾备库,...

如何查看CDN节点是否生效

概述 本文主要介绍将源站业务配置到CDN,如何查看CDN节点是否生效。详细信息 可通过以下三种方法查看CDN节点是否生效,请根据现场实际情况,选择下列对应的步骤:方法一:通过ping或dig的方式查看所添加的加速域名 方法二:在CDN控制台中...

强弱依赖治理最佳实践

在对业务分析进行依赖预判,应通过故障注入的方式验证真实依赖关系是否与预判相符,例如注入依赖的服务间的网络延迟故障。强弱依赖的验证可以有多种指标,例如监控与日志的报警,请求的返回状态码等等。本文示例预期frontend与...

上下文查询

通过查看指定日志的上下文信息,您可以在业务故障排查中快速查找相关故障信息,方便定位问题。应用场景 例如,O2O外卖网站在服务器上的程序日志里会记录一次订单成交的轨迹:用户登录>浏览商品>选择物品>加入购物车>下单>订单支付>支付扣款...

流水单据型业务场景多活实践

说明 基于MSHA流量监控或其他监控能力,确定业务稳态的监控指标,以便在故障发生时判断故障影响面以及在故障恢复判断业务的实际恢复情况。演练预期如下:下单链路对订单应用是强依赖,强依赖故障会影响业务不可用。故障爆炸半径控制在...

集群巡检项及解决方案

检查类型 预警风险 资源配额 ResourceQuotas VPC内SLB配额紧张 SLB端服务器配额紧张 SLB可监听数配额紧张 SLB实例数配额检查 资源水位 ResourceLevel SLB带宽使用率过高 SLB最大连接数过高 SLB新建连接速率过高 SLB QPS过高 集群Pod网段...

部署初始化

请输入:用户名:owner 密码:changepassword 登录成功显示下面的界面:输入命令:ls/etc/sysconfig/network-scripts 上面示例,显示有6个网卡配置文件(ifcfg-enp61s0f0、ifcfg-enp61s0f1、ifcfg-enp95s0f0、ifcfg-enp95s0f1、ifcfg-...

集群巡检项及解决方案

检查类型 预警风险 资源配额 ResourceQuotas VPC内SLB配额紧张 SLB端服务器配额紧张 SLB可监听数配额紧张 SLB实例数配额检查 资源水位 ResourceLevel SLB带宽使用率过高 SLB最大连接数过高 SLB新建连接速率过高 SLB QPS过高 集群Pod网段...

查看应用分组

创建应用分组,您可以查看应用分组的组内资源、监控视图、故障列表、可用性监控等数据,并执行相关操作。通过应用分组集中管理资源,便于您及时接收故障资源的报警通知,并及时处理故障。操作步骤 登录 云监控控制台。在左侧导航栏,选择...

安全隧道概述

访问端与设备端均成功连接安全隧道,您可在访问端基于安全隧道远程登录设备(例如通过SSH服务),进行设备的远程诊断、故障排查、运维操作、配置更新和其他操作任务等。名词解释 名词 说明 安全隧道 设备端和访问端与物联网平台之间建立...

集群巡检项及解决方案

资源配额 ResourceQuotas VPC路由表条目配额紧张 VPC内SLB配额紧张 ECS可关联SLB配额紧张 SLB端服务器配额紧张 SLB可监听数配额紧张 SLB实例数配额检查 资源水位 ResourceLevel SLB带宽使用率过高 SLB最大连接数过高 SLB新建连接速率过高...

概览

可以结合业务场景进行网络故障的定界定位、网络质量的优化以及与其他云产品联动。应用场景 全局用户网络质量概览 通过网络质量分析器,您可以了解分布在全球不同地域及运营商的终端用户访问您服务端的网络质量情况;了解不同地域及运营商到...

附录:SOFAStack 产品目录

业务日志关联查询 自定义配置应用系统的业务日志,自动关联业务报错和摘要信息,快速定位问题及跟踪业务信息。应用场景 问题的分析和快速定位 在分布式场景下,服务调用错综复杂,问题分析与定位非常困难。分布式链路跟踪系统能迅速定位到...

什么是多活容灾

多活容灾MSHA(Multi-Site High Availability)是在阿里巴巴电商业务环境演进出来的多活容灾商业化产品,是应用高可用服务AHAS的核心模块,为客户提供容灾架构建设能力。横向支持容灾架构的上线、运维、演练、切流,升级到下线。纵向支持...

访问云虚拟主机中的网站速度较慢的排查方法

如果出现ping丢包或ping不通的情况,请根据系统类型参见以下方案进行排查:Linux:Linux实例网站访问丢包延时高的排查方法 Windows:Windows实例网络访问丢包延时高的排查方法 使用 dig 或 nslookup 命令查看DNS解析情况。使用 traceroute ...

JedisPool资源池优化

1,800,000(即30分钟)可根据自身业务决定,一般默认值即可,也可以考虑使用下方 JeidsPoolConfig 中的配置。numTestsPerEvictionRun 做空闲资源检测时,每次检测资源的个数。3 可根据自身应用连接数进行微调,如果设置为-1,就是对所有...

异地双活切流

场景三:日常>日常流量调节 说明 非故障场景,根据业务要求调整各单元(地域)或单元格(机房)承担的流量比例。选择 切流组件。选择 切换方式,切换方式分为 范围 和 精准。说明 范围:调整切流规则的比例范围。精准:通过路由标精准路由...

同城多活切流

场景二 选择 日常>日常流量调节 说明 指非故障场景,根据业务要求调整各单元(地域)或单元格(机房)承担的流量比例。a.选择 切流组件 b.调整单元格的流量比例 c.单击 下一步,进入 容灾切换预览,在预览页,可以看到单元格前后比例的对比...

ECS DNS查询请求限速该如何缓解?

VPC内每台ECS机器每秒最高DNS峰值为5000次,单机每秒请求DNS峰值超过阈值,将面临限速风险,可用性SLA将无法保证。为了缓解此类情况,建议您从如下两个方面考虑:扩容ECS数量,使得DNS查询请求能够负载分摊到更多的ECS,从而降低每个ECS...

概述

变更是指对线上系统的任何操作(如:发布、增加、修改或移除等),或其他对生产业务可能有影响的任何操作。基于阿里巴巴的历史经验,有一半以上的重大故障皆为变更触发,因此,变更过程的风险防御显得尤为重要,会直接关乎业务的稳定性。...
共有145条 < 1 2 3 4 ... 145 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
数据库自治服务 边缘网络加速 音视频通信 负载均衡 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用