功能特性

高可用管理平台 HAS 定位于 IT 技术...故障演练平台支持触发 CPU 利用率升高、内存利用率升高、内存占用、网络丢包、容器宕机、物理机宕机等常见故障,并针对故障制定出详细的演练和恢复计划,保证用户能够有计划地测量和观测应用高可用能力。

sandboxed-container-controller

v1.0.3-e993d8f-aliyun registry.cn-hangzhou.aliyuncs.com/acs/sandboxed-container-controller:v1.0.2-8ac82bf-aliyun 2020年11月12日 因Docker不支持RuntimeClass特性,新增准入控制器PodEraseRuntimeclassRunc,当 pod.spec....

功能特性

终端访问控制系统基于三个主要步骤完成网络准入控制。身份设备识别 通过多因子身份识别,建立可信用户身份库;基于可信用户身份,绑定登记的可信设备,从而在日常IT运营过程,帮助管理员判断当前可信网络内的设备数量、类型、操作系统以及...

配置容器安全策略

Gatekeeper准入控制器使用开放策略(OPA)的策略,提供了更多符合K8s应用场景的安全策略规则。借助ACK集群引入的Gatekeeper组件,您可以在容器服务控制台启用或自定义安全策略,验证Pod的部署和更新是否安全可控。策略治理介绍 ...

使用 Capacity Scheduling

kubectl-n test get rs NAME DESIRED CURRENT READY AGE test-app-5ddc68c994 5 4 4 3m10s 查看 ReplicaSet 的 Event,可以发现新的 Pod 被 ResourceQuota 的准入控制器拦截了 k-n test describe rs test-app-5ddc68c994 Name:test-app-5...

Pod安全

更多信息,请参见 节点限制准入控制器。Pod安全配置建议 限制容器以特权模式运行 如前所述,以特权身份运行的容器继承了分配给主机上root的所有Linux capabilities。大多数场景下,容器并不是必须拥有这些权限才能保证业务运行。您可以通过...

NAT网关故障排查指南

本文介绍NAT网关的常见故障及排查方案。流量不通类故障排查:ECS实例配置DNAT条目后无法被公网访问 VPC内新建交换机的ECS无法通过SNAT访问公网 VPC内存在多个NAT网关时,某交换机的ECS实例不能访问公网 访问流量异常类故障排查:客户端访问...

高性能版实例

以下内容为 AnalyticDB PostgreSQL版 实例常见故障场景中高性能版和高可用版的对比:恢复(Recovery)模式 根据以往 AnalyticDB PostgreSQL版 运行情况,故障最大的场景为恢复模式,故障概率远大于另外两种场景(计算节点故障和计算节点宿...

kube-apiserver组件监控

准入控制器和Webhook 可观测性展示 功能解析 名称 PromQL 说明 准入控制器时延[admit]histogram_quantile($quantile,sum by(operation,name,le,type,rejected)(irate(apiserver_admission_controller_admission_duration_seconds_bucket{...

新手指引

模块问题 计费常见问题 数据库常见问题 流量统计常见问题 网站管理常见问题 管理控制常见问题 网站耗资源(客户程序故障常见问题 更多常见问题,请参见 常见问题和故障排除汇总。反馈与建议 在使用阿里云云虚拟主机时,如果有任何疑问...

服务支持

NLP自然语言处理 常见问题 调用异常自助排查(错误码汇总)服务协议 NLP自学习平台 常见问题 实体抽取项目常见问题 故障排除 私有化部署 企业智能搜索 错误码对照表 常见问题

ADP底座介绍

常见故障场景自动诊断:内置长期经验沉淀的运维知识库,自动识别常见故障问题,并提供故障处置建议。自动化巡检和告警通知:内置基础告警策略并可灵活配置,可对接多种告警通知方式,定期巡检,及时感知问题。业务数据的存储备份及还原:...

服务支持

云消息系列 RocketMQ 版常见问题 产品功能常见问题 客户端连接常见问题 售卖、计费和实例升降配常见问题 控制常见问题 消息发送常见问题 消息消费常见问题 相关协议 阿里云产品服务协议(通用)云消息队列 RocketMQ 版服务等级协议

强弱依赖治理最佳实践

接入探针后,Kubernetes中打标签为 app=的Pod将显示在AHAS控制故障演练的治理应用中。单击 下一步,进入 依赖分析,注入流量。由于依赖关系的准确识别是需要流量的,如果在流量不足的测试环境中接入,则需要您手动提供流量。推荐使用PTS...

读多写少型业务场景多活实践

导购链路对商品应用是强依赖,强依赖故障将导致业务不可用,因此故障的爆炸半径应该控制在单元内。创建故障演练。创建杭州单元商品中心故障的演练,具体操作,请参见 创建演练。故障注入。在多活容灾的 监控大盘 页面 异地双活 区域,查看...

SA混合云存储阵列

控制故障时,支持在线故障切换,业务连续性不受影响。阿里云混合云存储阵列将云存储的高性价比和可扩展性与本地数据中心架构相结合,帮助客户轻松实现数据在本地数据中心和公共云之间的无缝流动。产品规格 阿里云 SA混合云存储阵列 ...

执行演练

在执行故障演练过程中,您可以实时查看演练进度、每个演练活动的运行状态及结果,同时也能够随时结束演练,进行恢复阶段的活动,清除故障演练影响。背景信息 一次完整的故障演练包括以下四个...后续步骤 停止演练 常见问题 故障演练常见问题

本地过程控制

对于自动化领域来说,近端边缘层可以对传感器数据进行处理或纠正,对传感器的故障进行预判断、预处理,完成对现场的控制故障诊断,同时将经过修正的数据实时上传到云端进行计算,完成一个立体分层式的数据处理过程。本文中以LightSensor...

虚拟机场景

本文列出了虚拟机常见故障演练场景。JvmCodeCache满 制造JVM CodeCache区域满的故障,CodeCache区域满会直接导致JIT编译关闭,从而引起业务系统性能下降。一般用于验证业务系统在高并发且系统性能下降的情况下,是否能够通过限流、快速扩...

故障演练

常见故障类型都可以映射到这个故障模型中,模拟故障的演练系统及方案也可以基于该模型进行设计。在设计演练方案的过程中,可以考虑在模型中每个环节进行故障注入,验证故障应急方案。不同演练类型和目标 根据演练过程对线上业务的影响,...

常见问题

本文汇总了使用 云消息队列 RocketMQ 版 时的常见问题。产品功能常见问题 消息队列RocketMQ版5.x系列相比4.x系列实例有什么优势?消息队列RocketMQ版5.x系列实例兼容哪些版本客户端?消息队列RocketMQ版支持哪些语言客户端?消息队列...

故障排查与常见问题

控制台访问集群异常问题排查 组件异常问题排查 ACK Serverless集群 故障排查 常见问题索引 集群类型 相关文档 托管版与专有版容器集群ACK 常见问题 ACK Serverless集群 常见问题 分布式云容器平台ACK One 常见问题 容器服务ACK发行版 常见...

常见问题

本文汇总了使用 云消息队列 RocketMQ 版 时的常见问题。产品功能常见问题 云消息队列 RocketMQ 版5.0系列相比4.0系列实例有什么优势?云消息队列 RocketMQ 版5.0系列实例兼容哪些版本客户端?云消息队列 RocketMQ 版支持哪些语言客户端?云...

云防火墙常见问题

本文介绍了使用云防火墙的常见问题及其解决方案。售前常见问题 功能特性相关 为什么使用云防火墙需要授予服务关联角色(AliyunServiceRoleForCloudFW)?云防火墙最多支持几个跨账号部署?金融云基础版云防火墙与其他版本有哪些差异?云...

故障演练

ADP提供基于线下交付经验设计的丰富故障演练场景,对基础设施、底座、中间件的常见故障场景进行覆盖,涵盖了集群级别的大规模故障以及节点、pod级别的资源故障。部分演练场景为破坏性场景(如机器重启、网卡损坏),可能导致环境状态异常、...

ADP底座/本地运维控制台

针对常见故障场景,提供修复方案和处理建议。组件运维操作可视化:本地运维控制台新增以下几项白屏化运维操作 prometheus、loki、local:新增水平扩容、垂直扩容、PVC存储扩缩容 所有谐云中间件:新增水平扩容、垂直扩容、PVC存储扩缩容、...

如何管理事件

故障状态:处理中(升级时故障还在处理中),输入发现故障的时间、已恢复(升级时故障已恢复),输入故障生成的时间和故障恢复的时间;所属服务:升级故障所属的 服务;影响服务:选择 影响服务(可多选);进展摘要:处理人将事件升级为...

步骤六:启动复制

保护组初始化完成后,您就可以启动保护组复制。启动复制就是将生产站点所有数据复制到容灾站点,此时会在容灾站点自动...后续步骤 步骤七:故障切换 常见问题 ECS容灾云盘异步复制型启动复制时,控制台提示容灾站点实例规格异常,如何处理?

控制台常见问题排查

本文介绍一些常见控制台问题及解决方案,帮助您自助解决问题。物理专线 接入的物理专线条数超过默认条数,如何提升配额 每个账号在同一个接入点支持接入的物理专线条数默认为2条。您可以通过以下任意方式自助提升配额:前往 配额管理页面...

步骤六:启动复制

保护组初始化完成后,您就可以启动保护组复制。启动复制就是将生产站点所有数据复制到容灾站点,此时会在容灾站点自动...后续步骤 步骤七:故障切换 常见问题 ECS容灾云盘异步复制型启动复制时,控制台提示容灾站点实例规格异常,如何处理?

步骤六:启动复制

保护组初始化完成后,您就可以启动保护组复制。启动复制就是将生产站点所有数据复制到容灾站点,此时会在容灾站点自动...后续步骤 步骤七:故障切换 常见问题 ECS容灾云盘异步复制型启动复制时,控制台提示容灾站点实例规格异常,如何处理?

步骤六:启动复制

本文介绍跨可用区容灾启动复制的操作步骤。保护组初始化完成后,您就可以启动保护组复制。启动复制就是将生产站点所有...后续步骤 步骤七:故障切换 常见问题 ECS容灾云盘异步复制型启动复制时,控制台提示容灾站点实例规格异常,如何处理?

诊断决策树

对于未知的故障,您可以依据运维经验,编排出常见的排查路径,辅助快速故障定位。新建诊断决策树 登录高可用管理控制台。在左侧导航栏上,单击 故障诊断>诊断决策树。单击 新建,在 创建诊断决策树 页面,配置诊断决策树信息,包括决策树...

EMR Kafka ECS磁盘事件处理

如果ECS修复磁盘事件流程中,要求重启ECS,则可以按照如下步骤重启:在EMR控制台停止故障Broker节点服务。重启故障ECS实例。在ECS修复磁盘事件流程中,单击 重启。在EMR控制台启动故障Broker节点服务。观察Broker节点状态是否处于正常状态...

流水单据型业务场景多活实践

验证爆炸半径是否控制故障单元内:预期:UserID为2000的用户路由到杭州单元,不受北京单元故障的影响。结果:下单正常,符合预期。切流恢复 验证故障场景下的容灾恢复能力。在北京单元发生故障的情况下,可以使用MSHA切流功能将受影响的...

应用故障自动诊断

常见故障自动诊断场景 RT突增 下游业务导致的本应用的RT突增,您可以联系下游业务的负责人进行排查。应用变更导致的RT突增,您可以查看此次变更的具体变更进行排查。应用的某个服务导致RT突增,可以排查以下情况:服务是否在此时有发生...

售前常见问题

本文介绍使用云防火墙前的常见问题解决方案。功能特性相关 为什么使用云防火墙需要授予服务关联角色(AliyunServiceRoleForCloudFW)?云防火墙最多支持几个跨账号部署?金融云基础版云防火墙与其他版本有哪些差异?云防火墙是否有抗APT...

安全体系概述

运行时监控和告警 当容器应用通过API Server的认证鉴权和准入控制校验成功部署后,在云原生应用零信任的安全原则下,还需要在容器应用的运行时刻提供相应的安全监控和告警能力。因此,阿里云容器服务和云安全中心深度集成了告警处理和漏洞...

GTM如何实现异地容灾

概述 方案介绍 异地容灾是指应用服务部署在不同地域时,当其中一地出现故障时,全局流量管理(简称GTM)可以将出现故障地域的用户访问流量,调度至异地灾备中心,保障用户访问连续不间断。本文将以两地三中心灾备架构为读者讲解异地灾备的...

故障排查

本文介绍微服务引擎MSE在使用过程中常见问题的故障分析和排查流程。微服务注册配置中心问题排查 在浏览器中输入 XXX:8848/nacos,访问MSE的Nacos注册中心时返回404错误。具体操作,请参见 通过“XXX:8848/nacos”访问MSE的Nacos注册中心时...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
访问控制 数据库自治服务 智能语音交互 负载均衡 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用