功能特性

高可用管理平台 HAS 定位于 IT 技术...故障演练平台支持触发 CPU 利用率升高、内存利用率升高、内存占用、网络丢包、容器宕机、物理机宕机等常见故障,并针对故障制定出详细的演练和恢复计划,保证用户能够有计划地测量和观测应用高可用能力。

ADP底座介绍

常见故障场景自动诊断:内置长期经验沉淀的运维知识库,自动识别常见故障问题,并提供故障处置建议。自动化巡检和告警通知:内置基础告警策略并可灵活配置,可对接多种告警通知方式,定期巡检,及时感知问题。业务数据的存储备份及还原:...

演练概述

执行演练 将故障注入机器,可通过演练时需曲线、演练参数、演练日志等检查故障注入的效果是否符合预期。停止演练 清除故障。当故障演练自动结束、您主动终止或者演练中的任何环节出现异常后,系统都会进入恢复阶段,自动清除相应的故障,使...

高性能版实例

以下内容为 AnalyticDB PostgreSQL版 实例常见故障场景中高性能版和高可用版的对比:恢复(Recovery)模式 根据以往 AnalyticDB PostgreSQL版 运行情况,故障最大的场景为恢复模式,故障概率远大于另外两种场景(计算节点故障和计算节点宿...

CLB健康检查工作原理

负载均衡通过健康检查来判断后端服务器的业务可用性。开启健康检查功能后,当某台后端服务器健康检查出现异常时,负载均衡会自动将新的请求分发到其他健康检查正常的后端服务器上;...健康检查常见问题可参考 健康检查FAQ。

API概览

我们已经为开发者封装了常见编程语言的SDK,开发者可通过 下载SDK 直接调用本产品OpenAPI而无需关心技术细节。如果现有SDK不能满足使用需求,可通过签名机制进行自签名对接。由于自签名细节非常复杂,需花费 5个工作日左右。因此建议加入...

数据治理中心概述

如果模板中包含您无需使用的检查项,则您可以配置指定工作空间停止使用目标检查项,停止使用后,该检查项对目标工作空间不生效,数据治理中心后续将不会检测目标工作空间中该检查项触发的检查项事件。配置检查项 自定义治理项 如果模板中...

节点异常问题排查

本文目录 类别 内容 诊断流程 诊断流程 常见排查方法 节点故障诊断 检查节点的详情 检查节点的状态 检查节点的事件 检查节点的诊断日志 检查节点的关键组件 检查节点的监控 检查节点的安全组 常见问题及解决方案 节点关键组件异常处理 ...

节点异常问题排查

本文目录 类别 内容 诊断流程 诊断流程 常见排查方法 节点故障诊断 检查节点的详情 检查节点的状态 检查节点的事件 检查节点的诊断日志 检查节点的关键组件 检查节点的监控 检查节点的安全组 常见问题及解决方案 节点关键组件异常处理 ...

配置健康检查

边界路由器VBR(Virtual Border Router)连接至云企业网实例后,您可以通过云企业网的健康检查功能探测VBR实例关联的物理专线的连通性。在云企业网和本地数据中心存在冗余路由的场景下,健康检查探测到物理专线故障后支持自动切换到可用...

GTM如何实现异地容灾

概述 方案介绍 异地容灾是指应用服务部署在不同地域时,当其中一地出现故障时,全局流量管理(简称GTM)可以将出现故障地域的用户访问流量,调度至异地灾备中心,保障用户访问连续不间断。本文将以两地三中心灾备架构为读者讲解异地灾备的...

GTM如何实现同城容灾

概述 方案介绍 同城容灾指应用服务部署是多机房、单地域时,当其中一机房出现故障时,全局流量管理(简称GTM)可实现业务7*24小时稳定运行,即使单机房故障也不影响业务的可持续性,保障用户访问连续不间断。本文将以同城双活的灾备架构为...

通过物理专线实现本地IDC与云上VPC互通

步骤四:配置阿里云侧健康检查 阿里云默认每隔2秒从每个健康检查源IP地址向本地IDC中的健康检查目的IP地址发送一个ping报文,如果某条物理专线上连续8个ping报文都无响应,则说明该物理专线链路故障。登录 云企业网管理控制台。在左侧导航...

词汇表

云防火墙 阿里云云防火墙是一款云平台SaaS(Software as a Service)化的防火墙,可针对您云上网络资产的互联网边界、VPC边界及主机边界实现三位一体的统一安全隔离管控,是您业务上云的第一道网络防线。更多信息,请参见 什么是云防火墙。...

本地IDC通过负载冗余专线连接上云

健康检查探测到物理专线连接故障时,如果云企业网实例中存在冗余的路由,健康检查则会立刻触发路由切换使用可用链路。若您取消选中 是,则表示不开启健康检查的路由切换功能,健康检查仅执行链路探测功能。若健康检查探测到物理专线连接...

GTM实现跨网访问加速与故障切换

概述 方案介绍 大部分企业的应用服务都会使用多个运营商的IP地址,因此可能会存在跨网延迟、丢包、故障不可用等问题,而全局流量管理产品方案可以根据用户请求源地址的运营商,解析就近的应用服务器IP地址,实现就近接入、访问加速、故障...

本地IDC通过主备冗余专线连接上云

阿里云按照您配置的健康检查的发包时间间隔探测主用线路连通性,当探测到主用线路故障时,自动将流量切换至备用线路,保证您的业务不受影响。场景示例 本文以下图场景为例介绍本地IDC如何通过主备冗余专线方式接入阿里云。某企业在上海拥有...

专线连接类

本文介绍物理专线连接的常见问题。通过物理专线接入阿里云之后,是否可以访问不同地域?阿里云支持哪些类型的物理专线?物理专线支持的最大带宽是多少?物理专线是否支持动态路由协议?物理专线是否支持多条专线链路的容灾?如何实现物理...

功能特性

防护配置 入侵防御 漏洞防护 失陷感知 日志分析 提供7天日志审计功能,便于您进行事件回溯、故障排查等。支持审计的日志类型 事件日志:记录经过云防火墙的流量匹配到访问控制策略的事件情况。支持查看流量的时间、威胁类型、源IP、目的IP...

基本概念

本文列举并说明使用弹性伸缩过程中常见的概念。常见概念 概念 说明 相关文档 弹性伸缩 弹性伸缩是根据业务需求和策略自动调整计算能力(即实例数量)的云服务。您可以指定实例的类型,即ECS或ECI实例。在业务需求增长时,弹性伸缩自动增加...

服务支持

NLP自然语言处理 常见问题 调用异常自助排查(错误码汇总)服务协议 NLP自学习平台 常见问题 实体抽取项目常见问题 故障排除 私有化部署 企业智能搜索 错误码对照表 常见问题

常见问题-FAQ

重要 标准版最快可在4分钟左右准确发现故障并切换 故障发现时间:GTM可保障故障发现时间,目前默认的健康检查配置可以在故障的4分钟左右准确发现故障并切换;全网生效时间:GTM无法保障全网的最终生效时间,因受限于全国各地运营商的TTL...

FAQs

重要 故障发现时间:GTM可保障故障发现时间,目前默认的健康检查配置可以在故障的4分钟左右准确发现故障并切换;DNS切换同步时间:GTM无法保障全网的最终生效时间,因受限于全国各地运营商的TTL缓存设置以及网络环境不同,所以全网生效时间...

Pod异常问题排查

本文目录 类别 内容 诊断流程 诊断流程 常见排查方法 检查Pod的状态 检查Pod的详情 检查Pod的配置 检查Pod的事件 检查Pod的日志 检查Pod的监控 使用终端进入容器 Pod故障诊断 常见问题及解决方案 常见的Pod异常状态及处理方式 Pod OOM异常...

Pod异常问题排查

本文目录 类别 内容 诊断流程 诊断流程 常见排查方法 检查Pod的状态 检查Pod的详情 检查Pod的配置 检查Pod的事件 检查Pod的日志 检查Pod的监控 使用终端进入容器 Pod故障诊断 常见问题及解决方案 常见的Pod异常状态及处理方式 Pod OOM异常...

NAT边界访问控制策略迁移指导

将私网ACL迁移 NAT边界 页面后(包含自行创建和由云防火墙技术支持批量迁移),您需要 访问控制>NAT边界 页面检查私网ACL是否符合业务逻辑和安全逻辑。如果迁移后的私网ACL不符合要求,您需要自行修改私网ACL配置。具体操作,请参见 NAT...

代码评审报告

边界检查 代码中对于边界值的处理是否正确。例如最近30天包含今天但不包含第前30天的。例如日期筛选是否为双闭区间。是 过滤条件完整性 过滤条件是否完整。例如筛选当前有效会员需要加上会员状态的限制。是 指标间逻辑检查 同表字段间...

执行演练

在执行故障演练过程中,您可以实时查看演练进度、每个演练活动的运行状态及结果,同时也能够随时结束演练,进行恢复阶段的活动,清除故障演练影响。背景信息 一次完整的故障演练包括以下四个...后续步骤 停止演练 常见问题 故障演练常见问题

应用故障自动诊断

常见故障自动诊断场景 RT突增 下游业务导致的本应用的RT突增,您可以联系下游业务的负责人进行排查。应用变更导致的RT突增,您可以查看此次变更的具体变更进行排查。应用的某个服务导致RT突增,可以排查以下情况:服务是否在此时有发生...

虚拟机场景

本文列出了虚拟机常见故障演练场景。JvmCodeCache满 制造JVM CodeCache区域满的故障,CodeCache区域满会直接导致JIT编译关闭,从而引起业务系统性能下降。一般用于验证业务系统在高并发且系统性能下降的情况下,是否能够通过限流、快速扩...

什么是故障

包括根因检查点(如故障原因、最近活动、注入方式、恢复方式等)、故障变更检查、监控检查,并需要对每一个故障明确责任人及团队;故障改进:支持对故障制定明确的改进及验收措施、责任人及完成时间,确保每个深度复盘后的故障都能对业务...

故障演练

常见故障类型都可以映射到这个故障模型中,模拟故障的演练系统及方案也可以基于该模型进行设计。在设计演练方案的过程中,可以考虑在模型中每个环节进行故障注入,验证故障应急方案。不同演练类型和目标 根据演练过程对线上业务的影响,...

远程桌面无法连接到Windows实例的快速排查方法

步骤一:使用管理终端登录实例 步骤二:登录密码检查 步骤三:端口及安全组检查 步骤四:远程桌面服务检查 步骤五:网络检查 步骤六:检查CPU负载、带宽及内存使用情况 步骤七:防火墙配置检查 步骤八:系统的安全策略设置 步骤九:远程...

故障排查与常见问题

控制台访问集群异常问题排查 组件异常问题排查 ACK Serverless集群 故障排查 常见问题索引 集群类型 相关文档 托管版与专有版容器集群ACK 常见问题 ACK Serverless集群 常见问题 分布式云容器平台ACK One 常见问题 容器服务ACK发行版 常见...

故障管理

故障管理概述 故障管理是源于ITIL的一个概念,在IT企业或者互联网企业进行故障管理的目的是当生产环境出现重大宕机时尽快恢复正常的服务运营,将组件失败对业务所造成的负面影响降到最低,从而确保满足事先与业务客户之间所约定的服务级别...

新手指引

模块问题 计费常见问题 数据库常见问题 流量统计常见问题 网站管理常见问题 管理控制台常见问题 网站耗资源(客户程序故障常见问题 更多常见问题,请参见 常见问题和故障排除汇总。反馈与建议 在使用阿里云云虚拟主机时,如果有任何疑问...

组件检查项错误修复

组件检查常见错误说明及其修复方法。错误及其修复方法 错误消息示例:[镜像检查结果]chart中使用的 docker.io/library/nginx 镜像,未包含在component.yaml中[helm lint结果][INFO]Chart.yaml:icon is recommended[helm template结果]...

RDS连接失败的排查方法

详细信息 您可以从以下五个方面排查问题:检查实例状态和实例连接信息(常见检查白名单设置正确(常见检查数据库性能(常见检查客户端 ECS实例无法通过内网访问RDS实例 排查流程图 步骤一:检查实例状态和实例连接信息 登录 云数据库...

故障演练

ADP提供基于线下交付经验设计的丰富故障演练场景,对基础设施、底座、中间件的常见故障场景进行覆盖,涵盖了集群级别的大规模故障以及节点、pod级别的资源故障。部分演练场景为破坏性场景(如机器重启、网卡损坏),可能导致环境状态异常、...

健康检查

在将边界路由器实例加载至云企业网实例后,您可以通过云企业网的健康检查功能监测物理专线的连通性。背景信息 健康检查会以一定的时间间隔向本地数据中心发送多个连续的探测报文,如果收到回复报文,则证明物理专线连接正常。如果在多个...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
数据库自治服务 云安全中心 负载均衡 弹性公网IP 短信服务 人工智能平台 PAI
新人特惠 爆款特惠 最新活动 免费试用