重启集群

当 云数据库 SelectDB 版 集群出现异常情况,无法提供服务时,您可以重启该集群。本文介绍如何在 云数据库 SelectDB 版 实例中重启集群。前提条件 已创建 云数据库 SelectDB 版 实例。实例中存在目标集群。目标集群的状态为运行中。操作...

在程序中通过AnalyticDB MySQL版Client...数据到2.0集群

setRetryTimes(int retryTimes)设置提交时写入 AnalyticDB MySQL版 2.0集群出现异常时重试的次数,默认为0。setRetryIntervalTime(long retryIntervalTime)设置重试间隔的时间,单位是ms,默认为0。setCommitSize(long commitSize)设置自动...

将报警配置功能接入注册集群

event node-ip-pressure sls.app.ack.ip.not_enough pod-exceptions集群容器副本异常报警规则集 集群容器副本OOM 集群容器副本Pod或其中进程出现OOM(Out of Memory)。event pod-oom sls.app.ack.pod.oom 集群容器副本启动失败 集群容器...

容器服务报警管理

报警配置功能提供统一管理容器报警场景的功能,包括容器服务异常事件报警、集群相关基础资源的关键指标报警、集群核心组件及集群中应用的指标报警。支持在创建集群时默认开启报警功能。容器服务的报警规则支持通过集群内部署CRD的方式配置...

集群状态

您可以在EMR on ECS页面查看集群的状态。本文为您介绍EMR on ECS集群的...终止失败 释放集群过程中出现异常。您可以在EMR on ECS页面,单击 状态 列的问号,查看异常原因,出现此状态时需要您重新单击集群操作列中的释放按钮,释放该集群

集群变更概述

功能 使用场景 重启实例或节点 阿里云Elasticsearch提供了集群及节点重启功能,当集群状态出现异常,您可以根据集群的健康状态对集群进行重启或强制重启操作。更多内容请参见 重启实例或节点。升降配实例 当集群的配置无法满足您的业务需求...

集群监控概述

功能 使用场景 配置自定义报警策略 为避免出现集群状态异常、节点磁盘使用率过高等问题而影响Logstash服务,建议您进行监控报警配置,实时监控集群状态、节点磁盘使用率等信息,及时查收报警短信,提前做好防御措施。目前,Logstash支持在...

ack-node-repairer

rules.detector.conditionType是集群出现异常Condition。当设置rules.detector.paused为 true 时,此问题的自愈功能将被关闭。至此,当集群节点上有NTP服务异常时,ACK的自愈框架将会通过 OOS 到节点上执行 systemctl restart chronyd....

重启实例或节点

当您需要修改实例或节点的配置,或者遇到集群或节点出现异常等情况时,可能需要重启阿里云Elasticsearch实例或节点。本文介绍如何通过控制台重启阿里云Elasticsearch实例或节点。前提条件 确保实例的 状态 为正常(绿色)、索引至少包含1个...

边缘节点FAQ

当 ACK Edge集群 的节点出现异常时,您可以参见以下步骤收集集群节点的诊断信息,以供数据分析使用。登录到 ACK Edge集群 的异常节点。执行如下命令,下载诊断脚本。curl-o/usr/local/bin/diagnose_edge_node.sh ...

智能边缘一体机用户手册

运维管理 3.1应用运维 应用部署与升级中出现异常或需要对应用进行日常运维,您可以单击 实例管理>管理 在此页面进行操作,应用运维功能包括:日志、终端、扩容、升级等,如下图所示:3.2控制台管理 单击 组件管理>访问入口 复制IP+端口号,...

客户端访问Elasticsearch FAQ

如果出现集群状态不健康、节点失联等问题,需要先解决这些集群层面的问题,详细信息请参见 指标含义与异常处理建议。判断客户端是否有网络拦截策略。您可以分别在用户侧、Elasticsearch服务端、SLB端抓包进行排查,如果这些都没有异常,还...

安装脚本配置说明

可选值:true false isComputeNode true 是否计算节点,可选值:true false 异常处理 创建集群时可能会出现异常,常见异常说明如下:如果集群创建过程中出现异常,导致集群创建失败,则不会执行安装脚本。如果集群创建成功,但是单个计算...

网络管理FAQ

Kubernetes集群中Pod出现网络异常 如何确认Kubernetes集群内应用的出网地址 Kubernetes集群中访问LoadBalancer暴露出去的SLB地址不通 如何提升Linux连接跟踪Conntrack数量限制?Service FAQ SLB相关 创建Service时,Local和Cluster两种外部...

使用Prometheus配置报警规则的最佳实践

报警规则说明 ACK从集群稳定性、集群节点异常集群节点水位、应用容器副本异常、工作负载异常、存储异常、网络异常等多个方面,通过集群、应用的运维经验沉淀,总结梳理出以下Prometheus重要报警规则配置。报警规则包含容器副本异常、工作...

查看集群信息

异常:当前集群异常集群资源使用量 显示集群的CPU和内存信息。说明 如果您想查看组件的资源消耗,请前往容器服务ACK控制台查看相应Pod的资源使用情况。所属ACK集群 ACK集群的名称。命名空间 ACK集群的命名空间。创建时间 显示集群创建的...

查看集群信息

异常:当前集群异常集群资源使用量 显示集群的CPU和内存信息。说明 如果您想查看组件的资源消耗,请前往容器服务ACK控制台查看相应Pod的资源使用情况。所属ACK集群 ACK集群的名称。命名空间 ACK集群的命名空间。创建时间 显示集群创建的...

集群管理FAQ

当Kubernetes集群出现问题或者节点异常时,您可通过容器服务ACK提供的一键故障诊断功能,辅助您定位集群出现的问题,详情请参见 使用集群诊断。如果集群诊断功能无法满足需求,您需要分别在Master节点和异常的Worker节点上收集Kubernetes...

缩容集群数据节点

常见问题 缩容集群数据节点时,出现“该操作会导致当前集群资源(Disk/CPU/Memory)不足或shard分配异常”的报错,如何处理?缩容集群数据节点时,出现集群当前状态异常或有未完成任务”的报错,如何处理?缩容集群数据节点时,出现...

基础资源监控

配置报警规则时,选择 资源范围 为 集群 或 节点,配置以整个集群集群任一节点出现指标异常时的报警规则。选择节点时配置 全部 节点,则当该集群的任一节点出现规则描述中的指标异常时,将触发报警。异常容器水位状况,以对应集群下的任...

阿里云Elasticsearch实例FAQ

缩容集群数据节点时,出现“该操作会导致当前集群资源(Disk/CPU/Memory)不足或shard分配异常”的报错,如何处理?缩容集群数据节点时,出现集群当前状态异常或有未完成任务”的报错,如何处理?缩容集群数据节点时,出现“保留节点数需...

故障排查与常见问题

故障排查索引 集群类型 相关文档 托管版与专有版容器集群ACK 使用OpenAPI诊断工具进行故障排查 Service异常问题排查 Nginx Ingress异常问题排查 DNS解析异常问题排查 使用DNSTAP Analyser诊断异常 Pod异常问题排查 节点异常问题排查 存储...

事件监控

您可以通过使用NPD结合SLS的Kubernetes事件中心、配置NPD集群检查项以及异常事件离线功能、使用钉钉、使用SLS离线Kubernetes事件及使用EventBridge离线Kubernetes事件,实时监控集群异常与问题。费用说明 ACK事件监控功能默认上报集群...

PolarDB代理配置与流量异常

PolarDB 集群支持读写分离方式接入业务,但在实际业务场景中,经常出现节点上流量负载不均,可能导致单节点承担大量的流量从而被拖垮,最终造成整个集群雪崩。本文主要描述 PolarDB 代理的配置方法以及流量不均时如何定位处理。数据库代理...

集群检查项及修复方案

索引 集群检查项 集群升级检查 集群迁移检查 组件检查 异常检查项修复方案 废弃API说明 集群检查项 集群升级检查 Kubernetes自身的复杂性,以及升级K8s版本时引入的运行时变更、API废弃、特性变更等操作,导致集群升级存在较高操作风险。...

集群防御规则可拦截状态异常排查

集群防御规则的可拦截状态为异常或正常待确认时,该集群防御规则无法对访问该集群异常流量进行告警或者拦截。本文介绍如何处理集群防御规则的可拦截状态为异常或正常待确认的问题。前提条件 已为该集群创建了防御规则。创建防御规则的...

2022-05-16版本

配置开发测试环境(Session集群)JM异常智能分析 当Flink作业运行发生异常时,TM的异常会被JM收集到日志中,通常通过作业探查中的异常日志,就可以查看到这部分信息。但是这部分信息仅会被保存比较短的时间。因此,当作业连续失败时,真正...

控制台访问集群异常问题排查

当前集群APIServer请求异常 ErrorQueryClusterNamespace 或 APIServer.500 问题现象 当您在控制台访问集群资源时,出现报错“当前集群APIServer请求异常”,错误码:ErrorQueryClusterNamespace 或 APIServer.500。问题原因 由APIServer...

故障排查

分类 相关文档 集群资源和集群组件异常问题排查 集群检查项及修复方案(包括升级集群、迁移集群、安装组件、升级组件过程中出现异常以及解决方案)Pod异常问题排查 Pod诊断 Service异常问题排查 Service诊断 Ingress异常问题排查 Ingress...

集群检查项及修复方案

索引 集群检查项 集群升级检查 集群迁移检查 组件检查 节点池检查 异常检查项修复方案 废弃API说明 集群检查项 集群升级检查 Kubernetes自身的复杂性,以及升级K8s版本时引入的运行时变更、API废弃、特性变更等操作,导致集群升级存在较高...

配置专属集群告警

参数 说明 集群异常状态通知 选择集群处于异常状态时,是否需要发送告警。打开:发送告警。关闭:不发送告警。DU使用率(集群级别)设置集群的DU使用率,取值范围为1%~200%,默认为80%。当集群的DU使用率达到该值时,发送告警。说明 当前只...

调优集群性能

当您发现监控指标存在异常时,可以参考本文排查出现异常的原因。查看集群监控指标的方法,请参见 查看监控信息。集群资源指标 CPU使用率指标 云原生数据仓库 AnalyticDB MySQL 版 的CPU使用率会展示各节点的CPU最大使用率和CPU平均使用率。...

扩容

集群扩容 当您的集群出现数据业务瓶颈时可以选择扩容操作,当前集群只支持水平扩容。首先进入 集群管控页,点击集群管理>选择相应的集群>点击右上角“扩容”按钮。在扩容详情页面,从新增资源下拉选项框选择需要增加的Broker数量。首先勾选...

历史功能发布记录(2021年)

全部 创建节点池 ACK新配额管理 ACK加强配额展示和申请功能,细化增加了ACK托管集群、ACK专有集群、ACK Serverless集群、ACK Edge集群、注册集群等各项配额在控制台的展示以及在配额中心的申请入口。全部 使用限制 ACK Serverless集群 支持...

查看集群列表信息

本文介绍如何查看已创建集群的详情。前提条件 已创建集群,详情请参见 创建集群。操作步骤 使用阿里云账号登录 Databricks数据洞察控制台。在Databricks数据洞察控制台页面,选择所在的地域(Region)。创建的集群将会在对应的地域内,一旦...

RecoverCluster-重置并修复集群

调用RecoverCluster重置并修复异常集群。接口说明 仅当集群状态为 exception(异常)时,才能调用该接口重置并修复集群。您可以通过调用 ListClusters 获取集群 ID 及集群状态。建议您操作前导出所有作业数据。重置并修复集群会有以下影响...

查看集群信息

ACS集群提供集群信息页面,展示集群的基本信息、巡检信息、相关云资源、集群资源监控等。本文介绍如何查看集群信息以及集群信息项。前提条件 已 创建ACS集群。操作步骤 登录 容器计算服务管理控制台,在左侧导航栏选择 集群。在 集群 页面...

管理事件

操作事件 操作事件指的是在您自行操作触发的过程中出现失败等异常状态变化的事件,用于展示当前集群操作的风险和异常情况。对于这类事件,您需前往集群实例的操作历史页面查看操作失败原因,并进行相应的处理,以避免对下一次操作产生影响...

启用集群检查

索引 集群检查介绍 操作步骤 查看检查结果 集群检查介绍 容器服务平台提供了丰富的集群检查能力,包括集群升级检查、集群迁移检查、组件安装检查、组件升级检查、节点池检查。正式执行集群升级、集群迁移、组件安装、组件升级、节点池升级 ...

使用集群检查

索引 集群检查介绍 操作步骤 查看检查结果 集群检查介绍 容器智能运维平台 提供丰富的集群检查能力,包括集群升级检查、集群迁移检查、组件安装检查、组件升级检查、节点池检查 等。正式执行集群升级、集群迁移、组件安装、组件升级、节点...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
物联网无线连接服务 云数据库专属集群 云解析DNS Web应用防火墙 云数据库 Redis 版 弹性公网IP
新人特惠 爆款特惠 最新活动 免费试用