产品简介

故障诊断 ACS提供一键故障诊断能力,包括Pod、Service、Ingress的诊断。更信息,请参见 使用集群诊断。安全中心 审计 ACS提供API Server的审计日志功能,可以帮助集群管理人员记录或追溯不同用户的日常操作。更信息,请参见 使用集群...

ADP底座/本地运维控制台

针对常见故障场景,提供修复方案和处理建议。组件运维操作可视化:本地运维控制台新增以下几项白屏化运维操作 prometheus、loki、local:新增水平扩容、垂直扩容、PVC存储扩缩容 所有谐云中间件:新增水平扩容、垂直扩容、PVC存储扩缩容、...

步骤六:启动复制

保护组初始化完成后,您就可以启动保护组复制。启动复制就是将生产站点所有数据复制到容灾站点,此时会在容灾站点自动...后续步骤 步骤七:故障切换 常见问题 ECS容灾云盘异步复制型启动复制时,控制台提示容灾站点实例规格异常,如何处理?

步骤六:启动复制

保护组初始化完成后,您就可以启动保护组复制。启动复制就是将生产站点所有数据复制到容灾站点,此时会在容灾站点自动...后续步骤 步骤七:故障切换 常见问题 ECS容灾云盘异步复制型启动复制时,控制台提示容灾站点实例规格异常,如何处理?

如何管理事件

故障状态:处理中(升级时故障还在处理中),输入发现故障的时间、已恢复(升级时故障已恢复),输入故障生成的时间和故障恢复的时间;所属服务:升级故障所属的 服务;影响服务:选择 影响服务(可选);进展摘要:处理人将事件升级为...

步骤六:启动复制

本文介绍跨可用区容灾启动复制的操作步骤。保护组初始化完成后,您就可以启动保护组复制。启动复制就是将生产站点所有...后续步骤 步骤七:故障切换 常见问题 ECS容灾云盘异步复制型启动复制时,控制台提示容灾站点实例规格异常,如何处理?

步骤六:启动复制

保护组初始化完成后,您就可以启动保护组复制。启动复制就是将生产站点所有数据复制到容灾站点,此时会在容灾站点自动...后续步骤 步骤七:故障切换 常见问题 ECS容灾云盘异步复制型启动复制时,控制台提示容灾站点实例规格异常,如何处理?

词汇表

全局流量管理 全局流量管理GTM(Global Traffic Manager)可以帮助企业实现用户访问应用服务的就近接入、高并发负载均摊、应用服务的健康检查,并能够根据健康检查结果实现故障隔离或流量切换,方便企业灵活快速地构建同城活和异地容灾...

产品简介

当前事件:当发生涉及区域性或产品的故障时,阿里云健康看板会在页面头部重点显示事件信息。事件详情:每个事件都会尽可能详细的描述(受影响产品、受影响地域,事件进展、问题报告等),以帮助客户理解其对自身应用程序和服务的影响程度...

合理利用存储备份保障业务数据可还原

背景 容器场景下,应用本身大多是无状态化的,凭借K8s提供的故障重启、自动注册和发现机制,在实例部署的场景下,能够较大程度地保障业务的高可靠,但对于有状态服务,如中间件等,为了保障持久稳定的运行,需要考虑业务数据在问题场景下...

网络资源

容灾:建立容灾和高可用的系统架构,将系统部署在个地理位置或数据中心,并使用负载均衡和故障切换技术,以确保即使发生网络分区,系统仍然可以继续提供服务。网络闪断故障 指网络连接在短时间内频繁中断和恢复,造成网络连接不稳定的...

K8s应用运维管理最佳实践

在Java类型应用中,如果出现故障Pod实例,可以借助Arthas诊断,排查Pod故障点。相关文档,请参见 Arthas诊断。如果应用无法正常启动,可以将启动命令修改为 sleep,再通过 kubectl exec 手动启动进程,观察输出并分析原因。相关文档,请...

常见问题

云数据库Redis版是否支持主从节点的故障切换?云数据库Redis版是否支持全球活形态?Redis CSRF漏洞分析及云数据库Redis版安全措施介绍 云数据库Redis集群版与原生Redis集群版有什么区别?网络与连接 如何获取Redis实例的连接地址和实例ID...

HDFS Web UI介绍

本文为您介绍如何访问HDFS Web界面,包括获取NameNode服务地址、浏览NameNode UI首页,并提供有关启动NameNode UI的相关说明。访问HDFS Web UI 您可以...相关文档 如果在使用HDFS过程中遇到任何问题或故障,详情请参见 常见问题和故障诊断

配置网络

交换机所在的子网故障或子网中的IP地址已用尽,您可以在配置VPC时提供两个或者个交换机ID,如果一个可用区出现故障,您的函数可以在其他可用区运行,提高容错能力。安全组配置错误,请您按照以下要求配置安全组。需要设置VPC中的安全组的...

离线同步数据质量排查

本文将为您列举一些常见数据质量方面的场景,方便您排查是否存在符合的场景,根据对应解决方案解决数据同步质量问题。背景信息 讲述数据集成数据同步的原理机制,理解数据同步的过程,进而对数据同步的执行效果有判断能力,判断数据同步...

配置网络

交换机所在的子网故障或子网中的IP地址已用尽,您可以在配置VPC时提供两个或者个交换机ID,如果一个可用区出现故障,您的函数可以在其他可用区运行,提高容错能力。安全组配置错误,请您按照以下要求配置安全组。需要设置VPC中的安全组的...

监控报警概述

实时监控提供终端用户登录云电脑的实时数据(例如用户在线数量、在线时长的前十用户、平均登录时间和云电脑网络延迟分布情况)以及相关故障预警信息,以便快速准确定位,迅速处理故障,避免因资源、网络问题或者外部操作原因造成不必要的...

基于Kubernetes容器集群的容灾架构与方案

在进行系统架构设计时,您必须考虑到信息系统和基础设施可能遇到的各种潜在威胁,例如:硬件故障、软件系统崩溃、人为操作失误、安全攻击、自然灾害等。为了确保系统能够在各种异常故障场景下快速恢复并保持业务连续性,您必须为系统设计...

托管节点池节点自动恢复

故障:当前节点发现故障。恢复失败:当前节点无法恢复。当节点的运行状态发生变化并持续一段时间后,ACK将判定该状态符合故障状态,存在节点故障。当发现节点故障时,ACK会根据故障原因触发对应恢复任务,并记录相应的事件。当恢复任务完成...

故障协同处理(基于钉钉)

故障协同处理使用步骤 说明 以下步骤为已开通移动应用(钉钉),且服务组关联的webhook群为企业内部群。1.事件升级故障 H5界面:事件已响应 消息卡片点击 详情 按钮进入 事件详情 H5界面,可点击 更-升级故障 按钮实现事件升级故障的操作...

主备方案介绍

灾备方案 说明 单可用区高可用方案 主备节点部署在同一可用区中的不同机器上,当任一节点发生故障时,由高可用HA(High Availability)系统监控主备节点的健康状态并自动执行故障切换,避免单点故障引起的服务中断。同城容灾方案 主备节点...

故障止损恢复

故障初因定位 集成企业内部可利用的所有稳定性相关数据(变更事件,数据库、MQ等中间件异常事件),以及集成各业务自建的定位工具能力,并在故障及风险预警的应急过程中进行可疑原因定位,帮助促进故障及风险预警初因定位的时长缩短。...

更换实例所属的可用区

当可用区资源不足无法升级实例规格、需要提高容灾...Redis 实例部署在两个或个可用区,具备跨可用区容灾的能力,即一个可用区故障,另一个 Redis 还可以继续提供服务。怎样查看迁移可用区的进度?您可以在控制台 任务中心 查看迁移进度。

更换实例所属的可用区

当可用区资源不足无法升级实例规格、需要提高容灾能力...Tair 实例部署在两个或个可用区,具备跨可用区容灾的能力,即一个可用区故障,另一个 Tair 还可以继续提供服务。怎样查看迁移可用区的进度?您可以在控制台 任务中心 查看迁移进度。

自动/手动主备切换

当系统发生故障时,PolarDB 集群会自动进行主备切换。您也可以手动进行主备切换,指定一个只读节点为新的主节点。注意事项 不论是自动切换还是手动切换,当只读节点未开启热备时,主备切换过程中可能会出现20~30秒左右的闪断,因此切换前请...

单节点架构

注意事项 单节点架构的故障恢复时间较长,无SLA保障。使用限制 目前不是所有地域和可用区都支持部署单节点实例,各地域和可用区的支持情况,请参见 支持的地域和可用区。仅MongoDB 4.0和MongoDB 3.4版本支持单节点架构,您可以根据业务需求...

云数据库RDS简介

阿里云关系型数据库RDS(Relational Database Service)是一种安全稳定可靠、高性价比、可弹性...常见问题和故障处理 使用RDS时遇到的各类问题,例如CPU过高、实例锁定等,您可以在 Q&A 或 常见问题 内搜索查看,可以解决您的绝大部分问题。

集群管理FAQ

当Kubernetes集群出现问题或者节点异常时,您可通过容器服务ACK提供的一键故障诊断功能,辅助您定位集群中出现的问题,详情请参见 使用集群诊断。如果集群诊断功能无法满足需求,您需要分别在Master节点和异常的Worker节点上收集Kubernetes...

监控服务概览

OpenAPI访问监控数据 OSS服务的相关监控指标数据可以通过云监控提供的OpenAPI访问,使用方法请参见:云监控SDK参考 访问监控数据 监控、诊断故障排除 监控诊断故障排除 通过详细介绍以下各个方面的内容帮助您更好地了解OSS服务的运行...

分片集群实例连接说明

您可以选择以下任意一种方法登录:通过DMS连接MongoDB分片集群实例 通过Mongo Shell连接MongoDB分片集群实例 通过程序代码连接MongoDB分片集群实例 常见的连接场景 如何通过公网连接MongoDB实例 不同网络类型的ECS实例与MongoDB实例如何...

AIOps套件概述

集群诊断 集群诊断提供一键故障诊断能力,辅助您定位集群中出现的问题,包括Pod诊断、节点诊断、Service诊断、Ingress诊断、内存诊断。诊断项 说明 Pod诊断 涵盖了常见的Pod问题,例如Pod启动失败、Pod镜像拉取失败、Pod运行异常等,并在...

Linux系统的ECS实例系统无响应,系统日志中出现“BUG:...

BUG:soft lockup-CPU#0 stuck for 61s 问题原因 该问题通常是由于ECS实例中,系统内核长时间占用CPU资源导致出现软死锁(soft lockup)故障,内核长时间占用CPU资源可能有以下原因:系统负载过高 内核死循环或死锁 内核调度问题 内核出现...

AIOps套件概述

集群诊断 集群诊断提供一键故障诊断能力,辅助您定位集群中出现的问题,包括Pod诊断、节点诊断、Service诊断、Ingress诊断、内存诊断。更信息,请参见 使用集群诊断。诊断项 说明 Pod诊断 涵盖了常见的Pod问题,例如Pod启动失败、Pod镜像...

什么是应用安全

ARMS应用安全是一款基于RASP...更应用安全相关常见问题,请参见 应用安全常见问题。联系我们 若您对应用安全有任何相关问题,除了参考帮助文档外,也欢迎您加入应用安全答疑钉钉群(群号:34833427)与产品经理和安全专家一起交流。

存储资源

存储资源是指用于存储和管理数据的硬件和软件资源,包括节点的本地磁盘、分布式文件存储、数据库和缓存...可以使用自动检测与恢复、依赖降级、故障迁移、多级缓存、配置验证与回滚、读写分离、分库分表、副本等容错策略分别应对以上风险点。

副本集实例连接说明

您可以选择以下任意一种方法登录:通过DMS连接MongoDB副本集实例 通过Mongo Shell连接云数据库MongoDB副本集实例 通过程序代码连接MongoDB副本集实例 常见的连接场景 如何通过公网连接MongoDB实例 不同网络类型的ECS实例与MongoDB实例如何...

云盘异步复制容灾常见问题

ECS容灾中云盘异步复制容灾的常见问题。ECS容灾云盘异步复制型,支持哪些实例规格?云盘有限制?IP地址有限制吗?在可用地域、可用区、云盘规格、ECS网卡、配置额度均存在限制。支持绝大多数实例规格。仅支持ESSD云盘(不含entry和autoPL)...

ECS容灾常见问题

ECS容灾中云盘异步复制和连续复制型容灾的常见问题。ECS容灾云盘异步复制型,支持哪些实例规格?云盘有限制?IP地址有限制吗?在可用地域、可用区、云盘规格、ECS网卡、配置额度均存在限制。支持绝大多数实例规格。仅支持ESSD云盘(不含...

常见问题旧版索引

本文介绍容器服务ACK的常见问题。您在使用容器服务ACK时如果收到容器服务ACK返回的错误信息,可查阅 容器服务ACK错误码 匹配解决方案。如果您没有收到具体的错误信息,可根据以下问题分类匹配问题场景和解决方案。入门FAQ 方案规划 容器...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
物联网无线连接服务 短信服务 共享流量包 负载均衡 弹性公网IP 人工智能平台 PAI
新人特惠 爆款特惠 最新活动 免费试用