安全体系概述

事件监控审计:基于事件的监控可以帮助您通过事件获取,实时诊断集群异常和安全隐患。更多信息,请参见 事件监控。Secret落盘加密 Kubernetes原生的Secret模型在etcd落盘时只经过了Base64编码,为了保护Secret中敏感数据的落盘安全性,在...

安全体系概述

事件监控审计:基于事件的监控可以帮助您通过事件获取,实时诊断集群异常和安全隐患。更多信息,请参见 事件监控。Secret落盘加密 Kubernetes原生的Secret模型在etcd落盘时只经过了Base64编码,为了保护Secret中敏感数据的落盘安全性,在...

新功能发布记录

2023-08-29 创建集群模板 通过集群模板创建集群 新增集群资源概览 弹性伸缩模块新增集群资源概览内容,该内容能够分析用户集群资源利用情况,并为符合条件的集群推荐弹性伸缩规则。用户可以使用该功能开启弹性伸缩,以提升集群资源的弹性...

查询集群信息

取值如下:CREATING:集群创建中 CREATE_FAILED:集群创建失败 RUNNING:运行中 IDLE:集群空闲 RELEASING:集群释放中 RELEASE_FAILED:集群释放失败 RELEASED:集群已释放 WAIT_FOR_PAY:待支付 ABNORMAL:集群状态异常 ...

故障排查

ACK集群异常 添加Kubernetes集群节点的常见问题 容器镜像仓库构建服务失败问题排查 容器镜像服务源码绑定失败问题排查 Kubernetes集群如何指定安全组 Kubernetes集群网络异常的排查方法 容器服务ACK应用故障排查 如何升级集群?排查故障的...

DNS解析异常问题排查

升级CoreDNS后Headless类型域名无法解析 StatefulSets Pod域名无法解析 按解析异常出现频次排查 完全无法解析 CoreDNS Pod运行状态异常 PrivateZone域名解析异常 安全组、交换机ACL配置错误 集群外部域名解析异常 新增Headless类型域名无法...

DNS解析异常问题排查

升级CoreDNS后Headless类型域名无法解析 StatefulSets Pod域名无法解析 按解析异常出现频次排查 完全无法解析 CoreDNS Pod运行状态异常 PrivateZone域名解析异常 安全组、交换机ACL配置错误 集群外部域名解析异常 新增Headless类型域名无法...

历史功能发布记录(2020年及之前)

Prometheus提供,NPD组件(node-problem-detector)是Kubernetes节点诊断的工具,可以将节点的异常,例如,Docker EngineHang、Linux Kernel Hang、网络出网异常、文件描述符异常转换为Node的事件,并可在ACK集群管理页面 事件列表 页签中...

安全概览

例如,下图节点漏洞中,从风险视角看,该集群出现5个高危风险,从资产视角看,该集群共有2个节点池,该高危风险存在1个节点池中。类别 说明 集群安全风险 展示集群整体安全状态。节点漏洞 展示节点漏洞风险,默认开启。容器镜像风险 用于...

安全概览

例如,下图节点漏洞中,从风险视角看,该集群出现5个高危风险,从资产视角看,该集群共有2个节点池,该高危风险存在1个节点池中。类别 说明 集群安全风险 展示集群整体安全状态。节点漏洞 展示节点漏洞风险,默认开启。容器镜像风险 用于...

ES节点连接报错|ES集群状态异常

问题描述 同VPC下的客户端连接ES服务报错No alive nodes found in your cluster 问题原因 1、集群读写QPS较大,各个节点负载较高,load的指标已经超过了当前集群规格的负载能力,导致集群异常无法连接。2、集群可以正常连接,但是查询或者...

调度集群管理概述

Dataphin支持连接不同调度集群,并将所有集群可用于调度的资源进行统一管理,使每个租户可以使用不同集群的资源用于创建自定义资源组,从而解决跨Region数据传输以及资源隔离等问题。使用限制 当前仅支持基于最新架构部署的客户使用调度...

集群异常状态

异常状态影响 计费影响 集群处于“不活跃(inactive)”或“不可用(unavailable)”状态时,仍会继续收取相关集群管理费用和云产品资源费用。计费详细说明,请参见 产品计费。集群操作限制 集群处于“不活跃(inactive)”或“不可用...

2021-9 AppStack 上线公测

缺陷修复 部署中进行回滚偶发异常问题 导入集群安装Agent异常问题 环境列表中当前版本数据缺失问题 未部署环境无创建人信息,且无法跳转编排和变量组问题 集群状态异常时,导入资源时报错不可读问题 修改编排提交修改日志自动填写 ACK的...

历史功能发布记录(2022年)

全部 创建集群 ACK Serverless支持集群故障诊断和集群巡检 ACK Serverless集群 巡检可以定时扫描集群运行状况,发现集群中潜在的风险,如云资源配额余量、Kuberrnetes集群关键资源水位等。ACK Serverless集群 故障诊断包括Pod诊断、网络...

扩容混合云集群

注意 若选择自定义镜像,则该自定义镜像必须是基于计算节点创建而成,使用登录节点或管理节点创建的自定义镜像,扩容时会出现异常。镜像 选择扩容节点的镜像,该镜像需满足以下条件:选择的镜像的操作系统应与集群中节点的操作系统保持一致...

Persistent Buffer Pool

Persisted Buffer Pool(PBP)特性能够帮助您在集群异常退出或者重新启动时,仍然可以使用集群退出前的Shared Buffer Pool。前提条件 支持的 PolarDB PostgreSQL版 的版本如下:PostgreSQL 14(内核小版本14.5.2.0及以上)PostgreSQL 11...

Persistent Buffer Pool

Persisted Buffer Pool(PBP)特性能够帮助您在集群异常退出或者重新启动时,仍然可以使用集群退出前的Shared Buffer Pool。前提条件 支持的 PolarDB PostgreSQL版(兼容Oracle)的版本如下:Oracle 2.0(内核小版本2.0.14.2.0及以上)说明...

ZKFC Mismatched address异常

本文介绍当高可用集群中的ZKFC(ZooKeeper Failover Controller)日志出现 Mismatched address stored in ZK 异常时,导致HDFS无法选出Active NameNode问题的原因及解决方案。具体报错 java.lang.RuntimeException:Mismatched address ...

2022年度更新日志

部署运维:支持在提交部署单时修改部署策略,可选策略为滚动升级和分批部署 资源管理:支持展示 Agent 的安装日志,以及幂等地重新安装 Agent 缺陷修复 修复删除应用后再次创建同名应用出现异常数据的问题 修复 YAML 文件语法错误导致部署...

节点诊断

ECS实例网卡链路层状态 检查ECS实例网卡链路层是否出现异常。ECS实例未正常启动或网络配置有问题,您可以尝试通过重启实例进行恢复。ECS实例启动状态 检查ECS实例的boot操作是否能正常执行加载。ECS实例无法正常启动,您需要创建一个新的...

Pod诊断

诊断流程 集群诊断收集部分集群 和节点 信息并识别其中的异常,然后根据识别到的异常进行深入的异常诊断。诊断融合了基于专家经验和AI智能诊断两种诊断模式,进一步深入定位问题根因。发起诊断后,诊断会按照异常识别、数据采集、检查项...

配置默认告警

本文介绍如何配置默认告警。...在 实例列表 页面,单击目标实例操作列下的 更多>配置默认告警。在 配置默认告警 对话框,选择 告警联系人...网关自定义插件出现异常,已经自动恢复 网关自定义插件异常,已自动恢复 插件崩溃,请检查插件逻辑。

数据湖集群

数据湖集群的创建以及扩容的过程中,会评估ECS的健康状况,从而避免异常ECS加入集群;同时EMR管理器会自动识别在集群后期运行过程中出现的磁盘损坏和长时间不可读写等极端情况的问题,并启动补偿机制。灵活性 调整数据湖集群的所有服务为可...

Hadoop DistCp介绍

Hadoop DistCp(分布式复制)是一个用于大型集群间或集群内数据复制的工具,通过MapReduce实现复制过程中数据的分发、错误处理、恢复及报告。本文为您介绍Hadoop DistCp与Jindo DistCp的区别、Hadoop DistCp使用方法以及常见问题。说明 ...

配置集群报警

为避免出现集群状态不正常、节点磁盘使用率过高等问题影响Elasticsearch服务,强烈建议您配置监控报警,实时监控集群状态、节点磁盘使用率等信息,及时查收报警通知,提前做好防御措施。本文介绍如何为Elasticsearch实例配置报警,包括一键...

系统概述

本文介绍集群管理系统(Lindorm Insight)的结构与功能。通过集群管理系统,您可以查看集群的...流量诊断 异常流量检测 查看指定分组中所有表的流量检测结果、表的状态、表出现异常的原因、高流量表的请求量/请求数据量和响应请求的平均时间。

CLB健康检查FAQ

重要 如果关闭健康检查,当后端某个服务器健康检查出现异常时,负载均衡还是会把请求转发到该异常的ECS实例上,造成部分业务不可访问。如果您的业务对负载敏感性高,高频率的健康检查探测可能会对正常业务访问造成影响。您可以结合业务情况...

Pod诊断

诊断流程 集群诊断收集部分集群信息并识别其中的异常,然后根据识别到的异常进行深入的异常诊断。诊断融合了基于专家经验和AI智能诊断两种诊断模式,进一步深入定位问题根因。发起诊断后,诊断会按照异常识别、数据采集、检查项评估以及根...

Pod诊断

诊断流程 集群诊断收集部分集群信息并识别其中的异常,然后根据识别到的异常进行深入的异常诊断。诊断融合了基于专家经验和AI智能诊断两种诊断模式,进一步深入定位问题根因。发起诊断后,诊断会按照异常识别、数据采集、检查项评估以及根...

CLB健康检查工作原理

开启健康检查功能后,当某台后端服务器健康检查出现异常时,负载均衡会自动将新的请求分发到其他健康检查正常的后端服务器上;而当该后端服务器恢复正常运行时,负载均衡会将其自动恢复到负载均衡服务中进行流量转发。健康检查机制提高了...

迁移上云操作

读流量访问源集群 写流量访问源集群 写源集群冗余读 读流量同时访问目标集群和源集群 写流量还是访问源集群 写目标集群冗余读 读流量同时访问源集群和目标集群 写流量从源集群切换至目标集群 此阶段目标集群会同时有消息生产和消息消费流量...

使用集群诊断

警告:需要确认,引起集群异常的情况需要处理。异常:尽快处理,避免集群无法正常工作。未知:未正常完成检查或结果未知。Pod诊断包括 Pod、ClusterComponent 检查项。通过Pod状态、集群组件状态综合判定Pod异常原因。在诊断详情页面,可以...

全增量数据同步

任务异常阻塞 注意事项 迁移前请确认目标集群的HDFS容量,防止迁移过程中出现容量写满的情况。增量同步提交前,推荐修改一下源集群的日志保留时间,给增量同步出错预留一些处理的时间(hbase-site.xml 的 hbase.master.logcleaner.ttl 调...

查看集群信息

异常:当前集群异常。集群资源使用量 显示集群的CPU和内存信息。说明 如果您想查看组件的资源消耗,请前往容器服务ACK控制台查看相应Pod的资源使用情况。所属ACK集群 ACK集群的名称。命名空间 ACK集群的命名空间。创建时间 显示集群创建的...

查看集群控制面组件监控大盘

本文介绍如何查看 ACK集群Pro版 的控制面组件监控大盘及组件访问的最佳实践。前提条件 控制面组件监控功能仅适用于 ACK集群Pro版,且集群版本不低于1.16。已开通ARMS。具体操作,请参见 开通ARMS。已安装ack-arms-prometheus组件。具体操作...

控制集群API Server的公网访问能力

注意事项 集群绑定EIP后,请确保您的EIP实例状态正常,请勿随意释放,否则会造成集群公网访问异常。创建集群时绑定EIP 警告 如需使用EIP,请您在创建 ACK Edge集群 时配置EIP。集群创建成功后,无法重新绑定EIP。您可以在创建集群的时候...

修复集群

集群或者集群节点处于异常状态时,可对集群进行修复操作。本文介绍如何修复集群。前提条件 修复集群功能默认关闭,如需使用,请 提交工单。已导出作业数据。注意事项 修复集群会对集群产生一定影响,具体说明如下:集群修复过程中,集群...

查看集群信息

异常:当前集群异常。集群资源使用量 显示集群的CPU和内存信息。说明 如果您想查看组件的资源消耗,请前往容器服务ACK控制台查看相应Pod的资源使用情况。所属ACK集群 ACK集群的名称。命名空间 ACK集群的命名空间。创建时间 显示集群创建的...

AIOps套件概述

集群诊断 集群诊断提供一键故障诊断能力,辅助您定位集群出现的问题,包括Pod诊断、节点诊断、Service诊断、Ingress诊断、内存诊断。诊断项 说明 Pod诊断 涵盖了常见的Pod问题,例如Pod启动失败、Pod镜像拉取失败、Pod运行异常等,并在...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
云原生数据仓库AnalyticDB MySQL版 云数据库 Redis 版 云数据库专属集群 云解析DNS Web应用防火墙 弹性公网IP
新人特惠 爆款特惠 最新活动 免费试用