ADP底座介绍

常见故障场景自动诊断:内置长期经验沉淀的运维知识库,自动识别常见故障问题,并提供故障处置建议。自动化巡检和告警通知:内置基础告警策略并可灵活配置,可对接多种告警通知方式,定期巡检,及时感知问题。业务数据的存储备份及还原:...

什么是故障

本文主要介绍什么是故障。定义 在日常运营中,无论什么原因导致业务服务中断、服务品质...故障改进:支持对故障制定明确的改进及验收措施、责任人及完成时间,确保每个深度复盘后的故障对业务连续形成改进,避免历史同类故障重复发生。

故障管理

故障改进:支持对故障制定明确的改进及验收措施、责任人及完成时间,确保每个深度复盘后的故障对业务连续形成改进,避免历史同类故障重复发生。最佳实践 运维事件中心是阿里云提供的云上故障管理服务。制定故障应急响应流程机制。可...

RedeployDedicatedHost-执行专有宿主机的故障迁移

接口说明 DDH 状态为报警状态(UnderAssessment),即故障潜伏期时,建议您调用该接口执行 DDH 的故障迁移,避免 DDH 产生永久性故障。您可以调用 API DescribeDedicatedHosts 查询专有宿主机的状态信息。调试 您可以在OpenAPI Explorer中...

RedeployDedicatedHost-执行专有宿主机的故障迁移

接口说明 DDH 状态为报警状态(UnderAssessment),即故障潜伏期时,建议您调用该接口执行 DDH 的故障迁移,避免 DDH 产生永久性故障。您可以调用 API DescribeDedicatedHosts 查询专有宿主机的状态信息。调试 您可以在OpenAPI Explorer中...

实例容灾

将实例A作为主实例,实例B作为容灾实例,当实例A所在地域发生突发性故障(例如自然灾害)时,实例B可以作为主实例。通过修改应用程序中的数据库连接配置,将应用请求转到实例B上,实现跨地域的数据容灾。说明 建议您在实例B上部署与实例A上...

使用云监控功能监控网站环境(部署于ECS实例)

设置站点监控 在云服务器外层的监控服务,站点监控主要用于模拟真实用户访问情况,实时测试业务可用,有助于排查处理故障。如果以上监控选项不满足您的实际业务监控需求,您可以使用自定义监控。更多信息,请参见 概览。

故障演练

ADP提供基于线下交付经验设计的丰富故障演练场景,对基础设施、底座、中间件的常见故障场景进行覆盖,涵盖了集群级别的大规模故障以及节点、pod级别的资源故障。部分演练场景为破坏场景(如机器重启、网卡损坏),可能导致环境状态异常、...

高性能版实例

以下内容为 AnalyticDB PostgreSQL版 实例常见故障场景中高性能版和高可用版的对比:恢复(Recovery)模式 根据以往 AnalyticDB PostgreSQL版 运行情况,故障最大的场景为恢复模式,故障概率远大于另外两种场景(计算节点故障和计算节点宿...

NAT网关故障排查指南

本文介绍NAT网关的常见故障及排查方案。流量不通类故障排查:ECS实例配置DNAT条目后无法被公网访问 VPC内新建交换机的ECS无法通过SNAT访问公网 VPC内存在多个NAT网关时,某交换机的ECS实例不访问公网 访问流量异常类故障排查:客户端访问...

虚拟机场景

本文列出了虚拟机常见故障演练场景。JvmCodeCache满 制造JVM CodeCache区域满的故障,CodeCache区域满会直接导致JIT编译关闭,从而引起业务系统性能下降。一般用于验证业务系统在高并发且系统性能下降的情况下,是否能够通过限流、快速扩...

应用场景

故障改进:支持对故障制定明确的改进及验收措施、责任人及完成时间,确保每个深度复盘后的故障对业务连续形成改进。其他应用场景 降低管理难度:同时维护多套监控系统,操作成本高,降低管理难度。规避报警风暴:单监控源的报警不...

GTM如何实现同城容灾

概述 方案介绍 同城容灾指应用服务部署是多机房、单地域时,当其中一机房出现故障时,全局流量管理(简称GTM)可实现业务7*24小时稳定运行,即使单机房故障也不影响业务的可持续,保障用户访问连续不间断。本文将以同城双活的灾备架构为...

GTM实现跨网访问加速与故障切换

发现故障,支持自动或手动将访问流量切换到其他运营商IP上,从发现故障到完成故障切换最快仅需1分钟左右,能够保障用户访问连续。访问加速:支持就近接入,可提升跨运营商网络、跨地域的访问体验。接入简单:满足需要短期内且快速构建容...

产品优势

服务部署后,计算巢提供阿里云自助服务和全链路检测能力,实现一键排查、智能故障检测,提升业务稳定。计算巢为用户提供了丰富的软件选择,覆盖常见的软件类型,包括:数据库等基础软件,CRM等应用软件,以及制造、医疗等行业软件。已经...

常见问题

一般性常见问题 什么是 表格存储?表格存储 面向海量结构化数据提供Serverless表存储服务,同时针对物联网场景深度优化提供一站式的IoTstore解决方案。适用于海量账单、IM消息、物联网、车联网、风控、推荐等场景中的结构化数据存储,提供...

产品架构介绍

同机房优先路由:支持Consumer优先调用同机房内的Provider,从而减少跨机房调用,同时还故障的爆炸半径控制在一个机房内。故障隔离:当局部Provider出现异常时,支持将异常的Provider进行故障隔离,保证所有机房内的Consumer均不会调用...

地域和可用区常见问题

本文介绍RDS地域和可用区的概念,以及关于地域和可用区的常见问题。地域和可用区介绍 地域(Region)是指物理的数据中心。实例创建成功后不更换地域。可用区(Zone)是指在同一地域内,电力和网络互相独立的物理区域。同一可用区内实例...

集群管理FAQ

本文介绍您在创建集群、使用集群、管理集群等过程中可能遇到的常见问题及对应解决方案。Alibaba Cloud Linux操作系统的集群兼容CentOS的容器镜像吗?创建集群选择了containerd容器运行时,是否可以改为Docker?容器运行时containerd、...

地域和可用区常见问题

本文介绍RDS地域和可用区的概念,以及关于地域和可用区的常见问题。地域和可用区介绍 地域(Region)是指物理的数据中心。实例创建成功后不更换地域。可用区(Zone)是指在同一地域内,电力和网络互相独立的物理区域。同一可用区内实例...

地域和可用区常见问题

本文介绍RDS地域和可用区的概念,以及关于地域和可用区的常见问题。地域和可用区介绍 地域(Region)是指物理的数据中心。实例创建成功后不更换地域。可用区(Zone)是指在同一地域内,电力和网络互相独立的物理区域。同一可用区内实例...

地域和可用区常见问题

本文介绍RDS地域和可用区的概念,以及关于地域和可用区的常见问题。地域和可用区介绍 地域(Region)是指物理的数据中心。实例创建成功后不更换地域。可用区(Zone)是指在同一地域内,电力和网络互相独立的物理区域。同一可用区内实例...

地域和可用区常见问题

本文介绍RDS地域和可用区的概念,以及关于地域和可用区的常见问题。地域和可用区介绍 地域(Region)是指物理的数据中心。实例创建成功后不更换地域。可用区(Zone)是指在同一地域内,电力和网络互相独立的物理区域。同一可用区内实例...

NVMe协议介绍

多个不同客户端同时写入一个云盘可能导致数据被写坏,PR可用精确地控制某个云盘的读写权限,从而确保计算端按照预期写入数据,例如PR能力在故障切换场景确保失效节点不再写入数据,从而保证新节点上线后写入数据的正确。NVMe共享盘 是...

网站耗资源(客户程序故障常见问题

本文汇总了使用云虚拟主机出现网站耗资源(客户程序故障)时的常见问题。什么是网站耗资源(客户程序故障)?网站程序占用CPU及内存过多,是对资源的一种浪费。当您使用普通版共享云虚拟主机建站后,可能会因为网站程序编写不合理、代码...

同城容灾演练产品概述

在同一地域内可用区与可用区之间内网互通,可用区之间做到故障隔离。是否将实例放在同一可用区内,主要取决于对容灾能力和网络延时的要求。断网范围 实施断网演练的具体范围,涉及可用区内的一个或者多个云产品、应用。RPO(Recovery ...

云盘异步复制容灾常见问题

ECS容灾中云盘异步复制容灾的常见问题。ECS容灾云盘异步复制型,支持哪些实例规格?云盘有限制?IP地址有限制吗?在可用地域、可用区、云盘规格、ECS网卡、配置额度均存在限制。支持绝大多数实例规格。仅支持ESSD云盘(不含entry和autoPL)...

DDH常见问题

DDH为您的应用部署提供了更大的灵活、可见和控制力,确保您的应用满足更高等级的合规和监管要求。更多信息,请参见 产品优势。在什么场景下需要购买DDH?DDH满足一些特殊场景的需求,更多信息,请参见 应用场景。DDH是裸机产品吗...

ECS容灾常见问题

ECS容灾中云盘异步复制和连续复制型容灾的常见问题。ECS容灾云盘异步复制型,支持哪些实例规格?云盘有限制?IP地址有限制吗?在可用地域、可用区、云盘规格、ECS网卡、配置额度均存在限制。支持绝大多数实例规格。仅支持ESSD云盘(不含...

架构信息查询导航

警告 单副本架构不保障数据可用和服务连续,选用前请务必确认风险,不建议您在生产环境中使用该架构的实例。架构类型 说明 标准架构 标准架构高可用:采用主从(master-replica)架构搭建。主节点提供日常服务访问,从节点提供HA高...

OSS文件上传和下载失败的排查方法

若存在网络故障,请使用ping命令测试与OSS的网络连通,确保网络正常后再进行下一步排查。检查上传文件的大小是否超过限制。通过OSS控制台上传、简单上传、表单上传、追加上传的方式上传单个文件,文件的大小不超过5 GB。如要上传超过5 ...

ECS容灾常见问题

ECS容灾中云盘异步复制和连续复制型容灾的常见问题。ECS容灾云盘异步复制型,支持哪些实例规格?云盘有限制?IP地址有限制吗?在可用地域、可用区、云盘规格、ECS网卡、配置额度均存在限制。支持绝大多数实例规格。仅支持ESSD云盘(不含...

业务连续

阿里云的客户需要负责业务系统的架构设计合理,确保在必要时实现故障转移,保障业务连续不中断。建议您根据本文介绍的相关方案,来建设您的边缘计算应用的业务连续能力。最佳实践 多实例容灾 为了确保高可用,应用必须处理高负载、...

什么是消息演练

这些消息服务之前并没有在系统中实际经历过真实流量考验,其中某些隐患或缺陷很难被发现,急需通过故障演练来评测高可用。AHAS提供了强大且高灵活度的故障演练功能,可以根据不同的场景注入对应的故障类型。为了使您的演练服务更便捷,...

专家成长计划技术培训课程

现场面授(特殊情况可调整为线上钉钉群直播)云上存储运维工程师专家培训(专项)1天 30人 本课程将全面介绍块存储、OSS、日志服务三大产品的常见问题的定位、排查和处理,使学习者深入故障处理和排查能力。本课程包含一定的实验动手操作,...

API概览

我们已经为开发者封装了常见编程语言的SDK,开发者可通过 下载SDK 直接调用本产品OpenAPI而无需关心技术细节。如果现有SDK不满足使用需求,可通过签名机制进行自签名对接。由于自签名细节非常复杂,需花费 5个工作日左右。因此建议加入...

监控、诊断和故障排除

相对于传统应用程序,开发云端应用虽然降低了用户在基础设施搭建、运维等方面的成本,但却增大了监控、诊断和故障排查的难度。OSS存储服务为您提供了丰富的监控和日志信息,帮助您深刻洞察程序行为,及时发现并快速定位问题。本文主要描述...

常见问题

本文列举了 Web应用防火墙(Web Application Firewall,简称WAF)相关的常见问题。类型 问题列表 产品FAQ 售前咨询问题 非阿里云服务器能否使用WAF?WAF支持云虚拟主机吗?WAF是否支持防护HTTPS业务?WAF是否支持自定义端口?WAF是否对接入...

常见问题

本文列举了 Web应用防火墙(Web Application Firewall,简称WAF)相关的常见问题。类型 问题列表 产品FAQ 售前咨询问题 非阿里云服务器能否使用WAF?WAF支持云虚拟主机吗?WAF是否支持防护HTTPS业务?WAF是否支持自定义端口?WAF是否对接入...

主从版的应用场景

下面介绍三种常见架构以及如何创建对应实例。前提条件 您已创建数据库为MyBase MySQL云盘版引擎的主机。具体操作,请参见 添加MySQL主机。架构介绍 架构 说明 优劣势 示例场景 单节点 仅一个主实例,无只读实例。优点:价格低。缺点:当主...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
弹性公网IP 轻量应用服务器 云服务器 ECS 负载均衡 短信服务 人工智能平台 PAI
新人特惠 爆款特惠 最新活动 免费试用