故障演练

ADP提供基于线下交付经验设计的丰富故障演练场景,对基础设施、底座、中间件的常见故障场景进行覆盖,涵盖了集群级别的大规模故障以及节点、pod级别的资源故障。部分演练场景为破坏性场景(如机器重启、网卡损坏),可能导致环境状态异常、...

故障基础数据管理

在定义故障等级的时候,需要从功能等级、业务体量、业务特性、量化影响4个维度进行设计,一个简要的通用故障等级定义参考模板如下:业务量级 功能分类 影响面 P1 P2 P3 P4 大体量 核心功能 成功率下跌30%及以上 P1 成功率下跌20%~30%P2 ...

概述

在企业数字化转型过程中,基于云计算平台服务,可以让企业快速构建新业务、减少业务故障率、持续观测业务指标、提升业务稳定性,使企业更加专注于业务本身。总体而言,主要包括以下几个关键领域:卓越运营第一个关键领域是确定组织的运营...

订阅事件通知

数据传输服务DTS(Data Transmission Service)已接入云监控平台,您可以通过事件订阅对重要的事件设置定制化的报警通知,让您及时了解事件的发生与进展,帮助您实时掌握事件动态,便于您在业务故障时快速分析并定位问题。背景信息 云监控...

强弱依赖治理概述

故障根源定位:后台系统的故障,往往通过上一级的业务故障表现出来。故障处理讲究的是争分夺秒,良好的强弱依赖,对于系统自动化诊断有非常大的助力作用。依赖容量评估:正常调用链路下的系统容量需要评估。例如当某个弱依赖挂掉时,需要...

设计方案

在突袭演练中,红蓝双方是纯对抗的关系,因此对红蓝双方提出了更高的要求,蓝军不仅需要了解目标系统的薄弱点,更需要了解目标系统的业务,红军不仅仅需要修复故障,还需要快速的发现故障和有效的应急协同。相比较计划演练,突袭演练涉及到...

出海加速

例如,在CDN和高防联动且回源到OSS的场景,由于CDN回源支持修改 回源HOST,而DDoS高防不支持,导致发生攻击自动切换到DDoS高防后,DDoS高防回源到OSS的正常流量无法被识别,出现业务故障。关于验证流量调度规则的操作,请参见 本地验证转发...

云产品联动

云产品联动表示通过自定义规则,联动使用DDoS高防与阿里云公网IP资源,解决网站业务接入高防防护后,正常业务访问延时增加的问题。前提条件 业务使用阿里云公网IP资源,具体包括拥有公网IP的云服务器ECS或负载均衡SLB、弹性公网IP、Web应用...

ADP底座介绍

常见故障场景自动诊断:内置长期经验沉淀的运维知识库,自动识别常见故障问题,并提供故障处置建议。自动化巡检和告警通知:内置基础告警策略并可灵活配置,可对接多种告警通知方式,定期巡检,及时感知问题。业务数据的存储备份及还原:...

配置消息监控告警实现风险预警

云消息队列 RocketMQ 版 支持通过云监控配置告警规则,以便您可以实时监控实例的运行状态和关键的业务指标,并能够及时收到异常的告警通知,实现生产环境的风险预警。背景信息 云消息队列 RocketMQ 版 提供全托管的消息服务,对于每个规格...

业务场景

本文为您介绍PCDN服务适用的常见业务场景。PCDN服务适用于哪些业务场景?PCDN服务适用于视频点播、直播、大文件下载等业务场景,包括且不限于版权长视频点播、短视频点播、互动娱乐直播、晚会赛事直播、应用市场分发、音频点播等各类产品,...

配置消息监控告警实现风险预警

云消息队列 RocketMQ 版 支持通过云监控配置告警规则,以便您可以实时监控实例的运行状态和关键的业务指标,并能够及时收到异常的告警通知,实现生产环境的风险预警。背景信息 云消息队列 RocketMQ 版 提供全托管的消息服务,对于每个规格...

标准版-单副本

使用场景 纯缓存类业务场景 单副本架构不能提供数据可靠性,如果发生节点故障,您需要重新对业务进行预热,因此,在对数据可靠性要求较高的敏感性业务中,建议选用双副本架构。对Redis协议兼容性要求较高的业务 标准版完全兼容Redis协议,...

产品功能

分布式架构,单节点故障业务不受影响 云数据库Memcache版采用分布式集群架构,每个节点均由双机热备架构组成,具备自动容灾及故障迁移能力。多种规格可适配不同的业务压力,数据库性能支持无限扩展。支持数据持久化及备份恢复策略,有效的...

集群版-单副本

纯缓存应用 单副本集群版的分片服务器由单节点组成,分片服务器某节点出现故障时,系统会重新拉起一个Redis进程(没有数据),当节点故障业务自动切换完成后,数据将会丢失,有可能流量被冲击到后端数据库,需要做好应用程序的预热保护机制...

通用问题

本文列举了接入 美颜特效SDK 常见的咨询类问题。目录 什么是 美颜特效SDK?美颜特效SDK 是否支持第三方接入使用?如何选择 美颜特效SDK 版本?如何申请不同版本的SDK?想要手势识别或智能抠图SDK如何获取?什么是 美颜特效SDK?美颜特效SDK...

标准架构

标准架构单副本类型的适用场景:纯缓存类业务场景 单副本架构不能提供数据可靠性,如果发生节点故障,您需要重新对业务进行预热,因此,在对数据可靠性要求较高的敏感性业务中,建议选用双副本架构。对Redis协议兼容性要求较高的业务 标准...

通用问题

本文列举了接入 美颜特效SDK 常见的咨询类问题。目录 什么是 美颜特效SDK?美颜特效SDK 是否支持第三方接入使用?如何选择 美颜特效SDK 版本?如何申请不同版本的SDK?想要手势识别或智能抠图SDK如何获取?什么是 美颜特效SDK?美颜特效SDK...

评估合适的云服务

阿里云服务 主要特征 常见业务场景 块存储 EBS 高性能、低延迟,99.9999999%数据可靠性 应用程序、OLTP数据库、NoSQL数据库等I/O密集型的高性能、低时延业务 对象存储 OSS 海量、高吞吐、安全、低成本,多种访问方式,99.9999999999%数据...

应用场景

无影云应用 可以应用于对建模渲染、移动办公、数据安全、共享协作等方面有高要求的业务领域,例如高端设计、企业办公和软件云化等业务场景。建模、渲染和非编 场景痛点 建模、渲染和非编等场景面临以下常见痛点:对GPU算力要求高,IT设施的...

应用场景

无影云应用 可以应用于对建模渲染、移动办公、数据安全、共享协作等方面有高要求的业务领域,例如高端设计、企业办公和软件云化等业务场景。建模、渲染和非编 场景痛点 建模、渲染和非编等场景面临以下常见痛点:对GPU算力要求高,IT设施的...

应用故障自动诊断

常见故障自动诊断场景 RT突增 下游业务导致的本应用的RT突增,您可以联系下游业务的负责人进行排查。应用变更导致的RT突增,您可以查看此次变更的具体变更进行排查。应用的某个服务导致RT突增,可以排查以下情况:服务是否在此时有发生...

资源使用优化

可以将模式固定的结构化数据存储在关系型数据库中,模式灵活的业务存储在MongoDB中,高热数据存储在 云数据库Redis版 或 云数据库 Memcache 版 中,实现对业务数据高效存取,降低存储数据的投入成本。数据库的选型,需要在一致性、可用性和...

变更发布策略

当新版本服务验证通过后,将业务流量全部切至新版本。旧版本作为热备。如新版本上线后出现问题,可将流量全部切回至旧版本完成回滚,缩短故障恢复时间。A/B测试:通过用户请求的元信息将流量路由到新版本,是一种基于请求内容匹配的灰度...

一致性复制组概述

应用场景 一致性复制组常见的应用场景如下:虚拟组管理 业务系统部署在跨ECS实例的集群文件系统中,需要将这些跨ECS实例的所有云盘作为一个虚拟组管理,以确保在异步复制时每个云盘写入顺序一致。例如基于ECS自建的MySQL集群,基于多个云盘...

迁移可用区

单可用区实例可以承受服务器和机架级别的故障,而多可用区实例可以承受机房级别的故障。例如将三节点副本集中的节点,分别部署在同一地域的三个不同的可用区,可承受更高级别的灾难。说明 关于多可用区副本集实例和分片集群实例的节点部署...

Redis客户端重连指南

常见的重试间隔方式包括立即重试、固定时间重试、指数增加时间重试、随机时间重试等。避免重试嵌套 避免重试嵌套,否则可能会导致重复的重试且无法停止。记录重试异常并打印失败报告 在重试过程中,建议在WARN级别上打印重试错误日志,同时...

网络概述

负载均衡默认检查云服务器池中的ECS实例的健康状态,自动隔离异常状态的ECS实例,消除了单台ECS实例的单点故障,提高了应用的整体服务能力。此外,负载均衡还具备抗DDoS攻击的能力,增强了应用服务的防护能力。负载均衡由以下三个部分组成...

Tair客户端重连指南

常见的重试间隔方式包括立即重试、固定时间重试、指数增加时间重试、随机时间重试等。避免重试嵌套 避免重试嵌套,否则可能会导致重复的重试且无法停止。记录重试异常并打印失败报告 在重试过程中,建议在WARN级别上打印重试错误日志,同时...

网络概述

ACS常见网络能力一览表 分类 常见网络能力 功能支持 参考文档 网络配置管理 IPv4/IPv6双栈 不支持 无 Pod维度网络配置 支持 为Pod配置固定IP注解说明 Pod固定IP 支持 为Pod配置固定IP 设置Pod安全组 支持 为Pod配置固定IP注解说明 南北向...

消费重试

消费者出现异常,云消息队列 RocketMQ 版 会根据消费重试策略重新投递该消息进行故障恢复。本文介绍消费重试的应用场景、原理机制、版本兼容性和使用建议。应用场景 云消息队列 RocketMQ 版 的消费重试主要解决的是业务处理逻辑失败导致的...

使用组复制

相比传统主备复制方式,组复制具有以下优势:数据的强一致性:组复制集群能够自主管理集群,当主库故障时,能够主动进行故障节点剔除和主备切换,并且切换后主备库的数据仍然保持一致。数据的强可靠性:组复制中事务在提交时,一定保证数据...

购买企业版实例

物联网平台提供标准型和尊享型的企业版实例,帮助您针对不同业务需求管理产品、设备、消息转发、数据服务和监控运维等资源,进而实现对物联网设备业务的提效目的。背景信息 物联网平台实例的使用说明,请参见 实例概述。企业版实例分为标准...

创建RDS SQL Server实例

如果选择通用云盘,您还可以开启通用云盘的IO突发功能,该功能开启后,业务波动较大、业务波峰较频繁时,通用云盘的实例将能够提供更高的IO能力。更多详情,请参见 通用云盘简介。配置实例网络,网络类型 固定配置为 专有网络。选择 VPC。...

新功能发布记录

通过主备回源,您可以预先配置主源站和备用源站,当其中一条回源线路发生故障时,一键切换到备用线路,提升高防回源灾备能力,保证业务可用性。修改端口回源设置 2021-08-18 DDoS高防(新BGP)、DDoS高防(国际)调查分析 攻击分析报表新...

NVMe协议介绍

NVMe共享盘可以帮助应用实现高可用、高并发、可扩展的业务,可以帮助基于传统SAN的业务无缝上云,共享盘常见的应用场景包括数据共享、高可用故障转移、分布式缓存加速、机器模型训练等。数据共享 NVMe最简单的应用场景为数据共享,当数据被...

故障发现

7*24监控值班 对于有条件的企业,可以设立全球运行指挥中心(Global Operations Center,简称GOC),实现7*24监控值班,时刻关注核心业务线上异常与故障。对于完成监控覆盖的核心业务场景,在异常上报时,通过工具自动检测或值班人员人工...

服务支持

NLP自然语言处理 常见问题 调用异常自助排查(错误码汇总)服务协议 NLP自学习平台 常见问题 实体抽取项目常见问题 故障排除 私有化部署 企业智能搜索 错误码对照表 常见问题

什么是公网NAT网关

您可以选用公网NAT网关,满足您以下业务场景需求:如果您的云上网络只希望主动访问公网上的业务,而不希望云上的业务直接暴露在公网上从而有被攻击的风险,您可以选用公网NAT网关为业务提供安全防护能力。如果您的业务具有突增的访问公网的...

功能特性

高可用管理平台 HAS 定位于 IT 技术...故障演练平台支持触发 CPU 利用率升高、内存利用率升高、内存占用、网络丢包、容器宕机、物理机宕机等常见故障,并针对故障制定出详细的演练和恢复计划,保证用户能够有计划地测量和观测应用高可用能力。
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
物联网无线连接服务 云服务器 ECS 云数据库 Redis 版 负载均衡 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用