ADP底座介绍

常见故障场景自动诊断:内置长期经验沉淀的运维知识库,自动识别常见故障问题,并提供故障处置建议。自动化巡检和告警通知:内置基础告警策略并可灵活配置,可对接多种告警通知方式,定期巡检,及时感知问题。业务数据的存储备份及还原:...

RedeployDedicatedHost-执行专有宿主机的故障迁移

接口说明 DDH 状态为报警状态(UnderAssessment),即故障潜伏期时,建议您调用该接口执行 DDH 的故障迁移,避免 DDH 产生永久性故障。您可以调用 API DescribeDedicatedHosts 查询专有宿主机的状态信息。调试 您可以在OpenAPI Explorer中...

RedeployDedicatedHost-执行专有宿主机的故障迁移

接口说明 DDH 状态为报警状态(UnderAssessment),即故障潜伏期时,建议您调用该接口执行 DDH 的故障迁移,避免 DDH 产生永久性故障。您可以调用 API DescribeDedicatedHosts 查询专有宿主机的状态信息。调试 您可以在OpenAPI Explorer中...

实例容灾

将实例A作为主实例,实例B作为容灾实例,当实例A所在地域发生突发性故障(例如自然灾害)时,实例B可以作为主实例。通过修改应用程序中的数据库连接配置,将应用请求转到实例B上,实现跨地域的数据容灾。说明 建议您在实例B上部署与实例A上...

故障管理

故障管理概述 故障管理是源于ITIL的一个概念,在IT企业或者互联网企业进行故障管理的目的是当生产环境出现重大宕机时尽快恢复正常的服务运营,将组件失败对业务所造成的负面影响降到最低,从而确保满足事先与业务客户之间所约定的服务级别...

故障演练

ADP提供基于线下交付经验设计的丰富故障演练场景,对基础设施、底座、中间件的常见故障场景进行覆盖,涵盖了集群级别的大规模故障以及节点、pod级别的资源故障。部分演练场景为破坏场景(如机器重启、网卡损坏),可能导致环境状态异常、...

ADP底座/本地运维控制台

针对常见故障场景,提供修复方案和处理建议。组件运维操作可视化:本地运维控制台新增以下几项白屏化运维操作 prometheus、loki、local:新增水平扩容、垂直扩容、PVC存储扩缩容 所有谐云中间件:新增水平扩容、垂直扩容、PVC存储扩缩容、...

词汇表

通过使用VPN,用户的实际IP地址被隐藏,从而为用户提供匿名性。VPN常用于远程办公、保护数据传输及私密访问网络资源等场景。更多信息,请参见 什么是VPN。vSwitch 虚拟交换机vSwitch(Virtual Switch)是一种在虚拟化环境中使用的网络交换...

使用SysOM定位容器内存问题

为解决因容器引擎层的不透明而导致的故障排查困难问题,阿里云 容器服务 Kubernetes 版 ACK(Container Service for Kubernetes)团队推出操作系统内核层的容器监控可观测能力,为您提供更可靠、透明的容器引擎层,助力您更顺利地进行...

服务支持

NLP自然语言处理 常见问题 调用异常自助排查(错误码汇总)服务协议 NLP自学习平台 常见问题 实体抽取项目常见问题 故障排除 私有化部署 企业智能搜索 错误码对照表 常见问题

功能特性

高可用管理平台 HAS 定位于 IT 技术...故障演练平台支持触发 CPU 利用率升高、内存利用率升高、内存占用、网络丢包、容器宕机、物理机宕机等常见故障,并针对故障制定出详细的演练和恢复计划,保证用户能够有计划地测量和观测应用高可用能力。

托管节点池节点自动恢复

由于故障的复杂,自动恢复任务无法修复所有的故障场景。当节点自动恢复任务执行失败,或者恢复任务执行完毕后故障并未解除,ACK会将节点标记为恢复失败状态。如果托管节点池中恢复某个节点失败,在故障修复前,该节点池不会再触发自动...

强弱依赖治理概述

强弱依赖治理就是通过科学的手段持续稳定地得到应用间依赖关系、流量、强弱等数据,提前发现因为依赖问题可能导致的故障,避免依赖故障影响用户体验,积累数据持续推进系统稳定提升。什么是强弱依赖?异常发生时,不影响核心业务流程,不...

服务支持

常见问题 售前常见问题 DDoS原生防护常见问题 DDoS高防常见问题 DDoS高防(中国内地)弹性计费常见问题 相关协议 DDoS高防(中国内地)服务条款 DDoS原生防护服务条款 DDoS高防(中国内地)服务等级协议 DDoS高防(非中国内地)服务条款 ...

执行演练

在执行故障演练过程中,您可以实时查看演练进度、每个演练活动的运行状态及结果,同时也能够随时结束演练,进行恢复阶段的活动,清除故障演练影响。背景信息 一次完整的故障演练包括以下四个...后续步骤 停止演练 常见问题 故障演练常见问题

应用故障自动诊断

常见故障自动诊断场景 RT突增 下游业务导致的本应用的RT突增,您可以联系下游业务的负责人进行排查。应用变更导致的RT突增,您可以查看此次变更的具体变更进行排查。应用的某个服务导致RT突增,可以排查以下情况:服务是否在此时有发生...

GTM如何实现异地容灾

常见问题 故障切换时间是多少?在健康检查间隔设置为15秒,TTL10秒,连续失败次数3次的配置下,GTM能在1分钟左右准确发现故障并切换,故障切换后理论上10秒左右可以全网生效,但实际情况取决于全国各地运营商的缓存设置时间。DNS未使用云...

I-V曲线诊断

数据服务中提供光伏智能运维的IV曲线诊断算法,结合环境光强度、环境温度等影响因素,对组串式光伏发电阵列的电流-电压曲线(I-V曲线)进行分析,检测系统可能出现的故障,进而提高设备的运行效率,保障电站高效运行。本文介绍光伏智能运维...

故障排查与常见问题

控制台访问集群异常问题排查 组件异常问题排查 ACK Serverless集群 故障排查 常见问题索引 集群类型 相关文档 托管版与专有版容器集群ACK 常见问题 ACK Serverless集群 常见问题 分布式云容器平台ACK One 常见问题 容器服务ACK发行版 常见...

告警全局操作常见问题

本文介绍告警全局操作常见问题。如何设置告警中心Project所在地域?首次选择告警中心Project所在地域 首次使用新版告警时,请根据页面提示,选择告警中心Project所在地域。配置完成后,日志服务将自动在您所选的地域创建一个名为 sls-...

集群高可用架构推荐配置

高可用(High Availability,HA)是指系统的设计能够确保服务可靠和持续的一种特性。容器服务 Kubernetes 版 基于Kubernetes架构提供了多种集群高可用保障机制,以确保集群控制面、节点与节点池、工作负载、负载均衡等维度的高可用,...

公网连通FAQ

本文介绍了EIP网络连通常见问题。无法访问目标EIP,可能有哪些原因?无法访问目标EIP,可能原因如下:可能原因 排查建议 EIP实例未绑定到云资源 请排查EIP实例是否已绑定到目标云资源。您可以登录 弹性公网IP管理控制台,在目标EIP实例...

新手指引

模块问题 计费常见问题 数据库常见问题 流量统计常见问题 网站管理常见问题 管理控制台常见问题 网站耗资源(客户程序故障常见问题 更多常见问题,请参见 常见问题和故障排除汇总。反馈与建议 在使用阿里云云虚拟主机时,如果有任何疑问...

网络架构容灾

根据地址的可用进行故障自动隔离,并通知相应报警组。当地址恢复后,自动添加至解析列表。此外,当地址池整体出现问题时,触发默认地址池与备用地址池之间自动切换。能达到5分钟内,90%流量的切换速度。访问策略配置:根据用户的请求来源...

耗资源用户处理流程

为了保证您的站点能够安全、...关于网站耗资源的原因以及排查方法,更多信息,请参见 网站耗资源(客户程序故障常见问题。增强版共享虚拟主机和独享虚拟主机可以更好地应对耗资源问题,避免站点被关停。更多信息,请参见 云虚拟主机官网。

邮箱风险评估事件及返回参数

值 描述 风险描述 temp_email 临时邮箱(匿名邮箱)常见于作弊、欺诈、盗卡等风险中,此类邮箱通常只有几分钟到几小时不等的有效。建议针对此类邮箱打标,或进一步安全验证。gibberish_email 随机邮箱 常见于作弊、欺诈、虚假交易等风险...

步骤六:启动复制

保护组初始化完成后,您就可以启动保护组复制。启动复制就是将生产站点所有数据复制到容灾站点,此时会在容灾站点自动...后续步骤 步骤七:故障切换 常见问题 ECS容灾云盘异步复制型启动复制时,控制台提示容灾站点实例规格异常,如何处理?

步骤六:启动复制

保护组初始化完成后,您就可以启动保护组复制。启动复制就是将生产站点所有数据复制到容灾站点,此时会在容灾站点自动...后续步骤 步骤七:故障切换 常见问题 ECS容灾云盘异步复制型启动复制时,控制台提示容灾站点实例规格异常,如何处理?

步骤六:启动复制

保护组初始化完成后,您就可以启动保护组复制。启动复制就是将生产站点所有数据复制到容灾站点,此时会在容灾站点自动...后续步骤 步骤七:故障切换 常见问题 ECS容灾云盘异步复制型启动复制时,控制台提示容灾站点实例规格异常,如何处理?

高性能版实例

以下内容为 AnalyticDB PostgreSQL版 实例常见故障场景中高性能版和高可用版的对比:恢复(Recovery)模式 根据以往 AnalyticDB PostgreSQL版 运行情况,故障最大的场景为恢复模式,故障概率远大于另外两种场景(计算节点故障和计算节点宿...

监控、诊断和故障排除

故障排除:提供常见的问题场景和故障排除方法。服务监控 监视总体运行状况 可用和有效请求率 可用和有效请求率是有关系统稳定和用户是否正确使用系统的最重要指标,指标小于100%说明某些请求失败。可能因为一些系统优化因素出现暂时...

产品优势

服务部署后,计算巢提供阿里云自助服务和全链路检测能力,实现一键排查、智能故障检测,提升业务稳定。计算巢为用户提供了丰富的软件选择,覆盖常见的软件类型,包括:数据库等基础软件,CRM等应用软件,以及制造、医疗等行业软件。已经...

故障演练

故障演练就是这个背景下诞生的,沉淀通用的故障场景,以可控成本在线上故障重放,以持续的演练和回归方式的运营来暴露问题,不断验证和推动系统、工具、流程、人员能力的提升,从而提前发现并修复可避免的重大问题,或通过验证故障发现...

NAT网关故障排查指南

本文介绍NAT网关的常见故障及排查方案。流量不通类故障排查:ECS实例配置DNAT条目后无法被公网访问 VPC内新建交换机的ECS无法通过SNAT访问公网 VPC内存在多个NAT网关时,某交换机的ECS实例不能访问公网 访问流量异常类故障排查:客户端访问...

虚拟机场景

本文列出了虚拟机常见故障演练场景。JvmCodeCache满 制造JVM CodeCache区域满的故障,CodeCache区域满会直接导致JIT编译关闭,从而引起业务系统性能下降。一般用于验证业务系统在高并发且系统性能下降的情况下,是否能够通过限流、快速扩...

存储资源

磁盘性能下降,读写速度变慢,任务执行时间增加,系统的实时降低,当磁盘IO负载过大无法承受时,可能导致磁盘故障、系统崩溃或数据丢失。常见的容错策略如下:数据缓存:将数据暂时存储在内存中,减少对磁盘IO的频繁访问。可以利用内存...

Redis客户端重连指南

由于受网络和运行环境的影响,应用程序可能会遇到暂时故障,例如瞬时的网络抖动、服务暂时不可用、服务繁忙导致超时等。通过设计自动重试机制可以大幅避免此类故障,保障操作的成功执行。引发暂时性故障的原因 原因 说明 故障触发了高...

Tair客户端重连指南

由于受网络和运行环境的影响,应用程序可能会遇到暂时故障,例如瞬时的网络抖动、服务暂时不可用、服务繁忙导致超时等。通过设计自动重试机制可以大幅避免此类故障,保障操作的成功执行。引发暂时性故障的原因 原因 说明 故障触发了高...

故障排查

本文介绍微服务引擎MSE在使用过程中常见问题的故障分析和排查流程。微服务注册配置中心问题排查 在浏览器中输入 XXX:8848/nacos,访问MSE的Nacos注册中心时返回404错误。具体操作,请参见 通过“XXX:8848/nacos”访问MSE的Nacos注册中心时...

企业单AZ架构升级到多AZ

多可用区部署的常见应用:关键业务系统:对于需要高可用和连续的关键业务系统,如金融服务、医疗保健和电子商务平台,多AZ部署可以确保系统即使在一个数据中心发生故障的情况下也能继续运行。容灾要求高的场景:当组织需要符合特定的...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
弹性公网IP 轻量应用服务器 云服务器 ECS 负载均衡 短信服务 人工智能平台 PAI
新人特惠 爆款特惠 最新活动 免费试用