在Kubernetes集群中部署SchedulerX

日志服务 使用SchedulerX调度Pod或者Job时,无需额外开通日志服务,就可以自动采集Pod运行的日志。如果Pod运行失败,您可以直接在SchedulerX控制台排查Pod执行失败的原因。监控大盘 您可以通过SchedulerX自带的任务监控大盘实时观察您的...

在Kubernetes集群中部署SchedulerX

日志服务 使用SchedulerX调度Pod或者Job时,无需额外开通日志服务,就可以自动采集Pod运行的日志。如果Pod运行失败,您可以直接在SchedulerX控制台排查Pod执行失败的原因。监控大盘 您可以通过SchedulerX自带的任务监控大盘实时观察您的...

应用安全常见问题

说明 自动升级场景是指可以通过重启应用或Pod等操作自动升级探针版本的场景。更多信息,请参见 升级ARMS探针。其他手动升级场景要求版本需为v2.7.1.3或以上。没有产生真实有效的攻击行为。与传统防火墙不同,应用安全仅记录真实有效的攻击...

配置连接池实现熔断功能

DestinationRule metadata:name:circuit-breaker-sample-server spec:host:circuit-breaker-sample-server trafficPolicy:connectionPool:tcp:maxConnections:5 http: http1MaxPendingRequests: 1 重启客户端Pod,避免统计结果出现偏差,并...

接入应用安全

说明 自动升级场景是指可以通过重启应用或Pod等操作自动升级探针版本的场景。更多信息,请参见 升级ARMS探针。其他手动升级场景要求版本需为v2.7.1.3或以上。您可以登录 ARMS控制台,在 应用监控>探针管理 页面查看已接入应用的探针版本。...

大规模ACK Pro集群使用建议

Pending Pod的数量 Pending Pod数量过多时,新提交的Pod可能会长时间处于等待状态,无法被调度到合适的节点上。在此过程中,如果Pod无法被调度,调度器会周期性地产生事件(event),继而可能导致事件泛滥(event storm)。将Pending Pod的...

Fluid监控大盘参数说明

历史Dataset控制器重启次数 表示集群当前Dataset Controller Pod的历史总重启次数。Runtime控制器就绪副本数 表示集群当前处于Running状态的Runtime Controller Pod数量。历史Runtime控制器重启次数 表示集群当前Runtime Controller Pod的...

查看Prometheus监控指标

该仪表板展示的监控指标主要包括:Pod基本信息:Pod IP地址、Pod状态、Pod容器、容器重启次数。总体使用量信息:例如Pod CPU使用率、Pod内存使用率。CPU信息:例如Pod CPU使用率、全部进程CPU使用率。内存信息:例如Pod内存使用率、全部...

Kubernetes集群配置自动伸缩组件失败

cluster-autoscaler Pod一直处于失败重启的状态,无法正常运行。查看该Pod日志,确认包含如下类似错误信息。问题原因 配置RAM Role角色和权限出错,包含如下几种可能:对应的ECS的RAM Role不存在。对应的授权策略配置异常。对应的信任策略...

升级ACK Edge集群

建议Pod采用多副本模式,将Pod分散到不同的节点上,以确保在某个节点重启期间仍有足够的可用Pod。kubectl ACK Edge集群 升级后,请同步升级您本地的kubectl版本。如果未及时升级,在使用本地kubectl的过程中可能会因为与集群API Server版本...

使用ack-descheduler组件对Pod进行调度优化

RemovePodsHavingTooManyRestarts 此策略可确保从节点中删除重启次数过多的Pod。查看调度策略修改前的调度效果。部署测试Deployment。nginx.yaml的命令示例如下所示。apiVersion:apps/v1#for versions before 1.8.0 use apps/v1beta1 kind:...

AGS帮助示例

apiVersion:v1 data:config:|containerRuntimeExecutor:k8sapi kind:ConfigMap 执行 kubectl delete pod命令,重启Argo Controller。说明 这里的 podName 为workflow所在的Pod的名称。创建并拷贝内容到 arguments-workflow-eci.yaml 文件中...

手动升级集群

建议Pod采用多副本模式,将Pod分散到不同的节点上,以确保在某个节点重启期间仍有足够的可用Pod。kubectl 集群升级后,请同步升级您本地的kubectl版本。如果未及时升级,在使用本地kubectl的过程中可能会因为与集群API Server版本不同,...

使用容器垂直伸缩(VPA)

更新正在运行的Pod资源配置会导致Pod的重建和重启,且有可能会被调度到其他节点上。VPA动态更新现有Pod的资源Request时,支持无需重启的更新机制,但此机制仍处于测试阶段。VPA不会驱逐没有在副本控制器(Replication Controller)管理下的...

列表信息

表 4.Pod详情说明 Pod详情 说明 信息 命名空间(Namespace)该Pod所在的命名空间。状态 该Pod的状态。运行中(Running)等待中(Pending)正常退出(Succeeded)非正常退出(Failed)未知(Unknown)创建时间(Uptime)该Pod创建的时间。...

Kubernetes监控视图

表 1.Pod详情说明 Pod详情 说明 信息 命名空间(Namespace)该Pod所在的命名空间。状态 该Pod的状态。运行中(Running)等待中(Pending)正常退出(Succeeded)非正常退出(Failed)未知(Unknown)创建时间(Uptime)该Pod创建的时间。...

网络管理FAQ

出现net::ERR_HTTP2_SERVER_REFUSED_STREAM错误 出现报错“The param of ServerGroupName is illegal”创建Ingress时报错“certificate signed by unknown authority”其他故障相关 Ingress Pod健康检查失败导致重启 添加TCP、UDP服务 ...

管理告警规则

设置完成后的格式为:message:{{$labels.pod_name}}重启}}告警信息,例如 message:{{$labels.pod_name}}重启。后续操作 您在监控中创建的告警规则均会显示在 MSE告警列表 页面中。在 MSE告警列表 页面,选中告警规则,在 操作 列中按需对...

管理告警规则

设置完成后的格式为:message:{{$labels.pod_name}}重启告警信息,例如 message:{{$labels.pod_name}}重启。后续操作 您在监控中创建的告警规则均会显示在 MSE告警列表 页面。在 MSE告警列表 页面,您可以在 操作 列中按需对目标报警规则...

管理告警规则

设置完成后的格式为:message:{{$labels.pod_name}}重启告警信息,例如 message:{{$labels.pod_name}}重启。后续操作 您在监控中创建的告警规则均会显示在 MSE告警列表 页面。在 MSE告警列表 页面,您可以在 操作 列中按需对目标报警规则...

alicloud-monitor-controller

未发现,重启未恢复 工单内附完整alicloud-monitor-controller日志。上传日志详情压缩包 云监控应用分组无数据 请按照以下方式进行预检查。检查应用分组中实例名称是否与应用的Pod名称相对应:如果实例名称异常,请按照上述云监控无应用...

创建定时任务工作负载CronJob

并行运行的Pod数 超时时间 重试次数 重启策略 标签和注解 Pod标签 为Pod设置标签的名称和值。说明 标签名称长度为1~253字符,只能包含大小写字母、数字、短划线(-)、下划线(_)和小数点(.)。Pod注解 为Pod设置注解的名称和值。说明 ...

创建定时任务工作负载CronJob

并行运行的Pod数 超时时间 重试次数 重启策略 标签和注解 Pod标签 为Pod设置标签的名称和值。说明 标签名称长度为1~253字符,只能包含大小写字母、数字、短划线(-)、下划线(_)和小数点(.)。Pod注解 为Pod设置注解的名称和值。说明 ...

通过DaemonSet-控制台方式采集Kubernetes容器标准输出

由于在Kubernetes管控类资源(例如Deployment)运行时更改Label,不会重启具体的工作资源Pod,因此Pod无法感知此变更,可能导致匹配规则失效。设置K8s Label黑白名单时,请以Pod中的Kubernetes Label为准。关于Kubernetes Label的更多信息...

使用云盘静态存储卷

如果误升级,重启挂载XFS文件系统的Pod会报错,对其他文件系统无影响,请 提交工单 处理。如需将CSI组件升级至v1.26.4版本,您需要将CSI provisioner和CSI plugin同时升级至该版本。通过控制台的方式使用云盘静态存储卷 步骤一:创建PV ...

使用云盘静态存储卷

如果误升级,重启挂载XFS文件系统的Pod会报错,对其他文件系统无影响,请 提交工单 处理。如需将CSI组件升级至v1.26.4版本,您需要将CSI provisioner和CSI plugin同时升级至该版本。通过控制台的方式使用云盘静态存储卷 步骤一:创建PV ...

GPU Device-Plugin相关操作

GPU Device-Plugin重启 在ACK的独占GPU调度场景下,节点上GPU的设备上报的Device Plugin默认以一个Static Pod的形式部署,所以重启过程需要在目标节点上进行。具体操作如下:mv/etc/kubernetes/manifests/nvidia-device-plugin.yml/etc/...

ASM网关概述

增强ASM网关高可用性 ASM网关在缩容或滚动重启时,会删除网关Pod而导致少量流量损失。启用优雅下线功能后,即使删除网关Pod,现有连接在一定时间内仍能正常传输,避免流量损失。使用优雅下线功能避免流量损失 ASM网关支持同时部署在多个...

使用优雅下线功能避免流量损失

ASM网关在缩容或滚动重启时,会删除网关Pod而导致少量流量损失。启用优雅下线功能后,即使删除网关Pod,现有连接在一定时间内仍能正常传输,流量将不会有损失。本文介绍如何使用优雅下线功能。前提条件 已创建ASM实例,且版本为企业版或...

使用优雅下线功能避免流量损失

ASM网关在缩容或滚动重启时,会删除网关Pod而导致少量流量损失。启用优雅下线功能后,即使删除网关Pod,现有连接在一定时间内仍能正常传输,流量将不会有损失。本文介绍如何使用优雅下线功能。前提条件 已创建ASM实例,且版本为企业版或...

通过巡检工具问题排查

检查节点是否正常 节点kubelet不正常 节点docker不正常 磁盘压力 CPU压力 人为误删除 该节点无法正常使用 该节点已有应用可能会被驱逐到其他节点 检查node的cpu、内存、磁盘是否满 可尝试重启kubelet(高危,不建议直接操作)检查异常Pod ...

手动扩容云盘数据卷

umount/mnt/disk 步骤四:重启应用 执行以下命令,将Pod扩容为2个副本。kubectl scale sts mysql-replicas=2 预期输出:statefulset.apps/mysql scaled 执行以下命令,查看Pod是否恢复。kubectl get pod|grep mysql 预期输出:NAME READY ...

手动扩容云盘数据卷

umount/mnt/disk 步骤四:重启应用 执行以下命令,将Pod扩容为2个副本。kubectl scale sts web-replicas=2 预期输出:statefulset.apps/web scaled 执行以下命令,查看Pod是否恢复。kubectl get pod|grep web 预期输出:NAME READY STATUS ...

授予自建Kubernetes集群ALB Ingress Controller权限

kubectl apply-f文件名称>重启load-balancer-controller的Pod,使配置生效。执行以下命令,获取load-balancer-controller的Pod名称。kubectl get pod-n kube-system|grep load-balancer-controller 执行以下命令,删除load-balancer-...

配置eci-profile

在eci-profile中,您可以自定义selector,selector可以根据Pod的Label或者Pod所属Namespace的Label来筛选Pod,满足selector筛选条件的Pod会自动调度到ECI。ECI Effect 对于ECI的一些功能特性,例如指定ECS实例规格,启用镜像缓存,设置NTP...

配置eci-profile

在eci-profile中,您可以自定义selector,selector可以根据Pod的Label或者Pod所属Namespace的Label来筛选Pod,满足selector筛选条件的Pod会自动调度到ECI。ECI Effect 对于ECI的一些功能特性,例如指定ECS实例规格,启用镜像缓存,设置NTP...

配置eci-profile

在eci-profile中,您可以自定义selector,selector可以根据Pod的Label或者Pod所属Namespace的Label来筛选Pod,满足selector筛选条件的Pod会自动调度到ECI。ECI Effect 对于ECI的一些功能特性,例如指定ECS实例规格,启用镜像缓存,设置NTP...

使用配置巡检检查集群工作负载

示例:livenessProbeMissing 通过检查Workload的Pod Spec中是否未配置 livenessProbe,检查是否未配置检测容器内应用是否出现异常需要重启容器的探针。如果未配置,存在容器内应用异常需要重启容器才能恢复时未及时重启导致业务异常的风险...

使用配置巡检功能检查注册集群Workload安全隐患

示例:livenessProbeMissing 通过检查Workload的Pod Spec中是否未配置 livenessProbe,检查是否未配置检测容器内应用是否出现异常需要重启容器的探针。如果未配置,存在容器内应用异常需要重启容器才能恢复时未及时重启导致业务异常的风险...

集群高可用架构推荐配置

您可以通过在Pod配置中添加相应的探针和重启策略来进行配置。示例如下。apiVersion:v1 kind:Pod metadata:name:app-with-probe spec:containers:name:app-container image:app-image livenessProbe:httpGet:path:/health port:80 ...
共有157条 < 1 2 3 4 ... 157 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
弹性公网IP 短信服务 人工智能平台 PAI 金融分布式架构 对象存储 物联网平台
新人特惠 爆款特惠 最新活动 免费试用