故障演练

ADP提供基于线下交付经验设计的丰富故障演练场景,对基础设施、底座、中间件的常见故障场景进行覆盖,涵盖了集群级别的大规模故障以及节点、pod级别的资源故障。部分演练场景为破坏性场景(如机器重启、网卡损坏),可能导致环境状态异常、...

功能特性

高可用管理平台 HAS 定位于 IT 技术...故障演练平台支持触发 CPU 利用率升高、内存利用率升高、内存占用、网络丢包、容器宕机、物理机宕机等常见故障,并针对故障制定出详细的演练和恢复计划,保证用户能够有计划地测量和观测应用高可用能力。

ADP底座介绍

常见故障场景自动诊断:内置长期经验沉淀的运维知识库,自动识别常见故障问题,并提供故障处置建议。自动化巡检和告警通知:内置基础告警策略并可灵活配置,可对接多种告警通知方式,定期巡检,及时感知问题。业务数据的存储备份及还原:...

NAT网关故障排查指南

本文介绍NAT网关的常见故障及排查方案。流量不通类故障排查:ECS实例配置DNAT条目后无法被公网访问 VPC内新建交换机的ECS无法通过SNAT访问公网 VPC内存在多个NAT网关时,某交换机的ECS实例不能访问公网 访问流量异常类故障排查:客户端访问...

容灾恢复

集群中通常一个服务有多个服务提供者,其中部分服务提供者可能由于网络、配置、长时间 fullgc、线程池满、硬件故障等导致长连接还存活但是程序已经无法正常响应。单机故障剔除功能会将这部分异常的服务提供者进行降级,使客户端的请求更多...

异地双活切流

前提条件 新建多活实例 接入层配置 配置数据层 创建切流工 登录 AHAS控制台。在控制台左侧导航栏中单击 多活容灾。在左侧导航栏,单击 多活实例。在多活实例详情页面,单击 多活切流>切流。在 切流 页面,单击 新建切流。在 新建切...

搭建高可用架构

如果是可用区故障,多可用区的实例可以快速自动恢复,可用区的实例需要等待故障修复或切换使用灾备实例。如果是地域级别的灾难,可以切换使用灾备实例,或者通过跨地域备份将数据恢复到新的实例上使用。如何恢复数据请参见如下文档:恢复...

K8s应用运维管理最佳实践

关于如何制作应用镜像并上传到容器服务,请参见 制作应用镜像。应用配置信息 建议为应用配置2个及以上Pod实例。配置多个Pod实例,可有效避免单个Pod实例故障而导致的应用无法使用。建议为应用配置合理的CPU资源预留(Request)和Mem资源...

什么是Web应用防火墙

通过防护集群作用,避免故障和冗余。防护流量处理性能高。应用场景 WAF适用于阿里云以及阿里云外所有用户,主要用于金融、电商、O2O、互联网+、游戏、政府、保险等行业各类网站的Web应用安全防护。说明 WAF仅支持通过域名方式进行防护...

常见问题

本文介绍 PolarDB PostgreSQL版 的常见问题和解答。基本问题 Q:什么是 PolarDB?A:PolarDB 是一个关系型数据库云服务,目前已在全球十多个地域(Region)的数据中心部署,向用户提供开箱即用的在线数据库服务。PolarDB 目前100%兼容...

常见问题

本文介绍 PolarDB PostgreSQL版(兼容Oracle)的常见问题和解答。基本问题 Q:什么是 PolarDB?A:PolarDB 是一个关系型数据库云服务,目前已在全球十多个地域(Region)的数据中心部署,向用户提供开箱即用的在线数据库服务。PolarDB 目前...

事件分析概述

微服务领域:微服务在现代开发架构中比较常见,该架构由小型、松耦合、可独立部署的服务集合而成,这导致微服务架构很难调试,系统中某一部分的小故障可能会导致大规模服务崩溃。很多时候不得不跳过某些正常服务来调试单个请求。事件总线...

迁移可用区

可用区实例可以承受服务器和机架级别的故障,而多可用区实例可以承受机房级别的故障。例如将三节点副本集中的节点,分别部署在同一地域的三个不同的可用区,可承受更高级别的灾难。说明 关于多可用区副本集实例和分片集群实例的节点部署...

性能监控最佳实践

端到端问题诊断:VIP 客户下失败,内测用户请求超时,许多终端用户的体验问题,追根溯源就是由于后端应用或云端组件异常导致的。而全链路追踪是解决端到端问题的首选方案。系统间依赖梳理:新业务上线,老业务裁撤,机房搬迁/架构升级,...

常见问题

本文列举了 Web应用防火墙(Web Application Firewall,简称WAF)相关的常见问题。类型 问题列表 产品FAQ 售前咨询问题 非阿里云服务器能否使用WAF?WAF支持云虚拟主机吗?WAF是否支持防护HTTPS业务?WAF是否支持自定义端口?WAF是否对接入...

常见问题

本文列举了 Web应用防火墙(Web Application Firewall,简称WAF)相关的常见问题。类型 问题列表 产品FAQ 售前咨询问题 非阿里云服务器能否使用WAF?WAF支持云虚拟主机吗?WAF是否支持防护HTTPS业务?WAF是否支持自定义端口?WAF是否对接入...

存储FAQ-CSI

类型 问题 常见问题分析流程 常见问题分析流程 云盘存储卷常见问题 云盘创建常见问题 动态创建PV失败且提示InvalidDataDiskCatagory.NotSupported 动态创建PV失败且提示The specified AZone inventory is insufficient 动态创建PV失败且...

服务支持

NLP自然语言处理 常见问题 调用异常自助排查(错误码汇总)服务协议 NLP自学习平台 常见问题 实体抽取项目常见问题 故障排除 私有化部署 企业智能搜索 错误码对照表 常见问题

演练原子操作

故障演练原子操作指最小单元的故障。在 故障演练>演练原子操作 页面中,展示了平台上可用于故障演练的原子服务。可根据原子服务状态分类,查看当前环境中的故障原子操作信息,包括原子操作名称、操作编码、添加时间、状态、被引用次数等...

应用场景

消除故障 您可以在 CLB 实例下添加多台ECS实例。当其中一部分ECS实例发生故障后,CLB 会自动屏蔽故障的ECS实例,将请求分发给正常运行的ECS实例,保证应用系统仍能正常工作。同城容灾(多可用区容灾)为了提供更加稳定可靠的 CLB 服务...

节点架构

常见问题 问:节点架构是否提供高可用?答:不提供。节点架构只有一个副本,极端情况下如发生故障会造成30分钟左右服务不可用状态,建议您在生产环境中使用副本集架构或分片集群架构。问:节点实例是否支持增量数据迁移与同步、按...

基于MSE云原生网关实现同城多活

说明 两个可用区各一个SLB,可有效避免SLB故障,当可用区SLB发生故障后,可通过DNS切流。一个云原生网关,多可用区部署,实现跨可用区、多业务集群的全局流量管理能力,可有效保证多集群的请求负载均衡,可实现可用区故障后秒级、...

执行演练

在执行故障演练过程中,您可以实时查看演练进度、每个演练活动的运行状态及结果,同时也能够随时结束演练,进行恢复阶段的活动,清除故障演练影响。背景信息 一次完整的故障演练包括以下四个...后续步骤 停止演练 常见问题 故障演练常见问题

虚拟机场景

本文列出了虚拟机常见故障演练场景。JvmCodeCache满 制造JVM CodeCache区域满的故障,CodeCache区域满会直接导致JIT编译关闭,从而引起业务系统性能下降。一般用于验证业务系统在高并发且系统性能下降的情况下,是否能够通过限流、快速扩...

功能和优势

集成程度高 目前Prometheus对接第三方存储系统的主流做法是实现一个独立于第三方存储系统的remote storage adapter,这个adapter需要单独部署和运维,另外单独部署的remote storage adapter还存在故障和读写性能问题。TSDB for ...

故障演练常见问题

欢迎您反馈在使用故障演练过程中遇到的问题,目前提供以下常见问题供您参考。单个演练活动成功状态怎么判断?因为一个活动可能会有很多目标机器,当所有机器执行完毕之后,如果有机器没有执行成功,那么这个演练活动就会被系统判断为失败。...

同城容灾架构概述

非机房级故障(某个机房的产品故障,例如其中一个机房的ECS服务器损坏),可以通过对产品的灾备设计来保障发生故障时系统及时切换。应用设计相关参考标准 应用设计相关参考标准如下:无状态化。分布式集群设计、避免点逻辑出现。幂等...

使用须知

本地盘来自台宿主机,数据可靠性取决于宿主机的可靠性,存在故障风险和数据丢失风险。如果您对数据可靠性要求高,建议在应用层做数据冗余保证数据的可靠性。用户具备边缘节点服务ENS提供的节点资源在有效期内的完整使用权,但不具备...

GTM如何实现异地容灾

概述 方案介绍 异地容灾是指应用服务部署在不同地域时,当其中一地出现故障时,全局流量管理(简称GTM)可以将出现故障地域的用户访问流量,调度至异地灾备中心,保障用户访问连续不间断。本文将以两地三中心灾备架构为读者讲解异地灾备的...

I-V曲线诊断

数据服务中提供光伏智能运维的IV曲线诊断算法,结合环境光强度、环境温度等影响因素,对组串式光伏发电阵列的电流-电压曲线(I-V曲线)进行分析,检测系统可能出现的故障,进而提高设备的运行效率,保障电站高效运行。本文介绍光伏智能运维...

故障应急协同

故障通告及更新 基于7x24监控值班工作特性,对于业务异常达到故障等级时,以用户定制的(语音、短信、IM)的方式在约定时间内将故障影响信息以及处理进展通知给对应的接收人/组,并持续更新直至故障结束。故障应急协同群 故障发生后,可以...

高可用和容灾设计

说明 可用区实例和多可用区实例可以互相转换,具体请参见各引擎的迁移可用区文档:RDS MySQL迁移可用区 RDS PostgreSQL迁移可用区 RDS SQL Server迁移可用区 当备实例出现故障不可用时,主实例会进行实时备份,主实例备份临近完成时会...

业务连续性

最佳实践 多实例容灾 为了确保高可用,应用必须能处理高负载、避免节点故障造成业务中断。这些可以通过 边缘负载均衡 ELB 来实现。为此,您可以先在多个 ENS 实例上部署应用,然后结合ELB来实现流量负载均衡。这样即使某个 ENS 实例出现...

产品优势

简单易用 服务开箱即用:支持即开即用的方式,购买之后即可使用,方便业务快速部署。...高可用 每个实例均有主从双节点:避免故障引起的服务中断。硬件故障自动检测与恢复:自动侦测硬件故障并在数秒内切换,恢复服务。

点登录概述

云SSO支持基于SAML 2.0的点登录(SSO登录)。...配置示例 Azure AD与云SSO进行点登录的示例 Okta与云SSO进行点登录的示例 AD FS与云SSO进行点登录的示例 Shibboleth与云SSO进行点登录的示例 常见问题 点登录(SSO)常见问题

功能相关

本地盘来自台宿主机,数据可靠性取决于宿主机的可靠性,存在故障风险和数据丢失风险。如果您对数据可靠性要求高,建议在应用层做数据冗余保证数据的可靠性。icmsDocProps={'productMethod':'created','language':'zh-CN',};

产品功能

分布式架构,节点故障业务不受影响 云数据库Memcache版采用分布式集群架构,每个节点均由双机热备架构组成,具备自动容灾及故障迁移能力。多种规格可适配不同的业务压力,数据库性能支持无限扩展。支持数据持久化及备份恢复策略,有效的...

GTM实现跨网访问加速与故障切换

概述 方案介绍 大部分企业的应用服务都会使用多个运营商的IP地址,因此可能会存在跨网延迟、丢包、故障不可用等问题,而全局流量管理产品方案可以根据用户请求源地址的运营商,解析就近的应用服务器IP地址,实现就近接入、访问加速、故障...

CRM-实例

其底层服务横跨阿里云地域的三个可用区,提供能够经受一整个可用区故障以及同时另一个可用区中一个以上的单独组件故障的高可用性和容灾能力。底层服务中的“核心服务”,提供了如销售云、服务云以及Salesforce平台(Platform)的主要功能。...

集群高可用架构推荐配置

节点池高可用配置 您可以基于节点的弹性伸缩、部署集、多AZ,结合K8s调度的拓扑分布约束,确保服务在不同的故障域(failure-domain)资源充足且有所隔离,从而当某一故障域出现问题时,服务仍然可以保持运行,减少故障的风险,提高系统...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
云原生数据仓库AnalyticDB MySQL版 数据库自治服务 轻量应用服务器 负载均衡 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用