基于eGPU优化套件的ResNet50模型训练和推理

本文以卷积神经网络模型ResNet50的训练和推理为例,为您介绍如何通过DockerKubernetes使用eGPU优化套件,进行GPU容器虚拟化和资源共享。本实践中的ResNet50模型基于NVIDIA官方开源代码DeepLearningExamples实现。步骤一:准备模型和数据...

如何选择Docker运行时、Containerd运行时、或者安全...

删除容器 docker rm crictl rm ctr-n k8s.io c del 查看镜像列表 docker images crictl images ctr-n k8s.io i ls 查看镜像详情 docker inspect crictl inspecti 无 拉取镜像 docker pull crictl pull ctr-n k8s.io i pull 推送镜像 docker...

如何选择Docker运行时、Containerd运行时、或者安全...

删除容器 docker rm crictl rm ctr-n k8s.io c del 查看镜像列表 docker images crictl images ctr-n k8s.io i ls 查看镜像详情 docker inspect crictl inspecti 无 拉取镜像 docker pull crictl pull ctr-n k8s.io i pull 推送镜像 docker...

升级GPU节点的Docker

VERSION=19.03.5 URL=http://aliacs-k8s-cn-beijing.oss-cn-beijing.aliyuncs.com/public/pkg/docker/docker-${VERSION}.tar.gz sudo curl-ssL$URL-o/tmp/docker-${VERSION}.tar.gz sudo cd/tmp sudo tar-xf docker-${VERSION}.tar.gz sudo...

将节点容器运行时从Docker迁移到containerd

Kubernetes v1.24将不再支持将Docker作为内置容器运行时,为了将ACK升级到Kubernetes v1.24及更高版本,您需要将节点容器运行时从Docker迁移到containerd。本文介绍如何在ACK管理控制台将节点容器运行时从Docker迁移到containerd。前提条件...

通过巡检工具问题排查

kubelet-evict 检查环境中是否有被驱逐的pod,检查kubelet是否有pressure check-kube-proxy-pod 检查kube proxy的管控pod是否健康 check-k8s-namespace 检查k8s namespace是否正常 check-k8s-node 检查k8s node是否正常 check-k8s-pod 检查...

自建Kubernetes集群迁移镜像及应用至ACK

若您期望将底层的IAAS基础设施和K8s的基础PASS能力交给阿里云来管理,可以使用image-syncer、velero来将自建的K8s镜像和应用迁移至阿里云容器镜像服务和ACK。场景描述 本最佳实践构建以下场景:以河源ECS构建Harbor仓库,模拟IDC的镜像仓库...

Docker运行时发布记录

Docker运行时为您提供了Pod中容器的基础运行环境。本文为您介绍Docker运行时的最新动态。背景信息 关于Docker运行时与其他运行时的对比详情,请参见 如何选择Docker运行时、Containerd运行时、或者安全沙箱运行时?2021年05月 版本号 变更...

启用集群API Server审计功能

certificates.k8s.io"-group:"extensions"-group:"networking.k8s.io"-group:"policy"-group:"rbac.authorization.k8s.io"-group:"settings.k8s.io"-group:"storage.k8s.io"#Default level for known APIs-level:RequestResponse ...

DNS FAQ

问题现象 执行集群升级前置检查时,发现用户代理(UserAgent)为 coredns 的客户端正在访问已弃用的 discovery.k8s.io/v1beta1 Kubernetes API,其API路径为/apis/discovery.k8s.io/v1beta1。问题原因 CoreDNS使用 discovery.k8s.io/v1beta...

使用Kubernetes事件中心监控GPU异常

本文介绍如何通过Kubernetes...通知方式配置完成后,在 全部告警事件 页面右上角单击 修改,选择 K8s GPU Xid告警,并在 K8s GPU Xid告警 下拉框中选择 短信。在 全部告警事件 页面,单击 保存。触发告警后,您会收到阿里云发出的告警短信。

ECI Platform Version兼容矩阵

ECI Platform Version版本 兼容的Kubernetes版本 1.1.0 1.12、1.14、1.16、1.18、1.20、1.22、1.24、1.26 1.0.0 1.12、1.14、1.16、1.18、1.20、1.22、1.24 空(k8s.aliyun.com/eci-platform-version 的Annotation不存在)1.12、1.14、1.16...

MSE Ingress高级用法

在Kubernetes集群中,MSE Ingress对集群服务(Service)中的外部可访问的API对象进行管理,提供七层负载均衡能力。本文介绍MSE Ingress的高级用法,方便您对集群入口流量进行治理。灰度发布 MSE Ingress提供复杂的路由处理能力,支持基于.........

MSE Ingress高级用法

在Kubernetes集群中,MSE Ingress对集群服务(Service)中的外部可访问的API对象进行管理,提供七层负载均衡能力。本文介绍MSE Ingress的高级用法,方便您对集群入口流量进行治理。灰度发布 MSE Ingress提供复杂的路由处理能力,支持基于.........

【产品变更】ACK关于K8s Dashboard功能下线公告

阿里云容器服务ACK从K8s 1.18版本开始,已不再支持K8s Dashboard功能。如果您需要继续使用Dashboard功能,建议您在应用目录中安装kubernetes-dashboard应用。登录 容器服务管理控制台 安装kubernetes-dashboard。

ECI Platform Version兼容矩阵

ECI Platform Version版本 兼容的Kubernetes版本 1.1.0 1.12、1.14、1.16、1.18、1.20、1.22、1.24、1.26 1.0.0 1.12、1.14、1.16、1.18、1.20、1.22、1.24 空(k8s.aliyun.com/eci-platform-version 的Annotation不存在)1.12、1.14、1.16...

ack-kubernetes-webhook-injector

组件介绍 ack-kubernetes-webhook-injector是一款可以从多种阿里云产品白名单中动态加入或移出Pod IP的K8s组件,免去手动配置Pod IP到云产品白名单的操作。ack-kubernetes-webhook-injector组件架构如下图所示:使用说明 关于ack-...

【已弃用】使用Pod安全策略

Kubernetes的Pod安全策略(Pod Security Policy)准入控制组件会基于您定义的规则验证在集群上创建和更新Pod的请求。如果创建或更新Pod的请求不符合定义的规则,系统将拒绝该请求并返回错误。本文将介绍如何在容器服务Kubernetes版ACK...

【已弃用】使用Pod安全策略

Kubernetes的Pod安全策略(Pod Security Policy)准入控制组件会基于您定义的规则验证在集群上创建和更新Pod的请求。如果创建或更新Pod的请求不符合定义的规则,系统将拒绝该请求并返回错误。本文将介绍如何在容器服务Kubernetes版ACK...

Kubernetes和日志服务配置Log4JAppender

本示例创建一个名为k8s-log4j、与Kubernetes集群位于同一地域(华东 1)的Project。具体操作,请参见 创建Project。说明 在配置时,一般会使用与Kubernetes集群位于同一地域的日志服务Project。因为当Kubernetes集群和日志服务Project位于...

ACK发布Kubernetes 1.26版本说明

Kubernetes 1.25版本,容器镜像仓库k8s.gcr.io迁移到registry.k8s.io,流量也将重定向到registry.k8s.io。更多信息,请参见 k8s.gcr.io Redirect to registry.k8s.io。在Kubernetes 1.25版本,网络策略中的EndPort字段处于GA阶段。如果...

ALB Ingress服务高级用法

配置健康检查的YAML示例如下所示:1.19及之后版本集群 apiVersion:networking.k8s.io/v1 kind:Ingress metadata:name:cafe-ingress annotations:alb.ingress.kubernetes.io/healthcheck-enabled:"true"alb.ingress.kubernetes.io/...

MSE Ingress FAQ

云原生网关遵循K8s Ingress的规范要求,Ingress Annotation(注解)kubernetes.io/ingress.class 的优先级高于 Ingress Spec.IngressClassName。问题三:云原生网关是否同时支持手动管理流量规则和Ingress资源自动管理流量规则两种方式?...

ALB Ingress服务高级用法

配置健康检查的YAML示例如下所示:1.19及之后版本集群 apiVersion:networking.k8s.io/v1 kind:Ingress metadata:name:cafe-ingress annotations:alb.ingress.kubernetes.io/healthcheck-enabled:"true"alb.ingress.kubernetes.io/...

【产品变更】从Docker Hub拉取镜像速度变慢的公告

近期由于运营商网络问题导致从Docker Hub拉取镜像速度变慢,建议您将镜像上传至ACR,或者订阅海外源镜像。具体操作如下:关于上传镜像至ACR的具体操作,请参见 使用企业版实例推送和拉取镜像。关于订阅海外源镜像的具体操作,请参见 订阅...

什么是容器服务 Serverless 版

设置RAM角色 k8s.aliyun.com/eci-use-specs 2-4Gi,4-8Gi,ecs.c6.xlarge ECI实例规格,支持指定多规格,包括指定vCPU和内存,或者ECS规格。多规格创建实例 k8s.aliyun.com/eci-spot-strategy SpotAsPriceGo 抢占式实例策略。取值范围:...

ALB Ingress服务高级用法

配置健康检查的YAML示例如下所示:1.19及之后版本集群 apiVersion:networking.k8s.io/v1 kind:Ingress metadata:name:cafe-ingress annotations:alb.ingress.kubernetes.io/healthcheck-enabled:"true"alb.ingress.kubernetes.io/...

升配Worker节点的资源

随着Kubernetes集群负载的增加,用户常常面临资源不足...在目标实例右侧 操作 列,选择 更多>实例状态>启动,在 启动实例 对话框单击 确定 后,等待升配的worker-k8s-for-cs节点自动加入集群且状态变成 运行中 即可完成Worker节点的资源升配。

为Pod配置QoS

Annotation Mean k8s.aliyun.com/network-priority: "guaranteed" 延迟敏感业务 k8s.aliyun.com/network-priority: "best-effort" 普通业务 k8s.aliyun.com/network-priority: "burstable" 大带宽业务 通过以下配置启用优先级控制策略。...

自定义Kubernetes授权策略

apiVersion:rbac.authorization.k8s.io/v1 kind:Role metadata:name:test-role namespace:default rules:apiGroups:""resources:pods verbs:create-delete-deletecollection-get-list-patch-update-watch ClusterRole:集群维度 如果您需要...

舰队管理概述

应用场景 ACK One 舰队管理适用于以下场景:多集群舰队控制面基于K8s控制面构建,提供标准Kubernetes API。多集群舰队可以接入多个K8s集群,非容器服务ACK集群,可以先通过注册集群接入。GitOps应用分发:托管开源ArgoCD,实现GitOps多集群...

使用集群API Server审计功能

level:Request verbs:["get","list","watch"]resources:group:""#core-group:"admissionregistration.k8s.io"-group:"apps"-group:"authentication.k8s.io"-group:"authorization.k8s.io"-group:"autoscaling"-group:"batch"-group:...

使用集群API Server审计功能

level:Request verbs:["get","list","watch"]resources:group:""#core-group:"admissionregistration.k8s.io"-group:"apps"-group:"authentication.k8s.io"-group:"authorization.k8s.io"-group:"autoscaling"-group:"batch"-group:...

ACK One概述

多集群舰队控制面基于K8s控制面构建,提供标准Kubernetes API。多集群舰队可以接入多个K8s集群,非容器服务ACK集群,可以先通过注册集群接入。GitOps应用分发:托管开源ArgoCD,实现GitOps多集群应用分发。流量管理:集成MSE云原生网关,...

调度负载至FPGA节点

在使用Kubernetes集群实现FPGA计算时,为了有效利用FPGA设备,可根据需要将应用调度到具有FPGA设备的节点上。本文介绍根据FPGA节点标签...type=ecs.f3-c4f1.xlarge beta.kubernetes.io/os=linux failure-domain.beta.kubernetes.io/region=...

使用须知

产品变更 产品维护 K8s版本 组件升级 系统恢复【CVE安全】漏洞修复公告 产品发布记录 容器服务 Serverless 版 的产品功能、Kubernetes版本、操作系统镜像、组件等的发布记录。功能发布记录 Kubernetes版本发布记录 操作系统镜像发布记录 ...

采集指定虚拟节点的Metrics

regex:(.*)target_label:job replacement:${1} action:replace-source_labels:[_meta_kubernetes_service_label_k8s_app]separator:;regex:(.+)target_label:job replacement:${1} action:replace-separator:;regex:(.*)target_label:...

使用须知

产品变更 产品维护 K8s版本 组件升级 系统恢复【CVE安全】漏洞修复公告 产品发布记录 容器服务ACK的产品功能、Kubernetes版本、操作系统镜像、运行时、组件等的发布记录。功能发布记录 Kubernetes版本发布记录 操作系统镜像发布记录 运行时...

采集指定虚拟节点的Metrics

regex:(.*)target_label:job replacement:${1} action:replace-source_labels:[_meta_kubernetes_service_label_k8s_app]separator:;regex:(.+)target_label:job replacement:${1} action:replace-separator:;regex:(.*)target_label:...

漏洞CVE-2020-8562公告

影响范围 以下枚举的Kubernetes集群版本所安装的kube-apiserver均存在该漏洞:Kubernetes≤v1.21.0 Kubernetes≤v1.20.6 Kubernetes≤v1.19.10 Kubernetes≤v1.18.18 K8s社区尚未发布针对该漏洞的修复版本。防范措施 遵循权限最小化原则,...
共有152条 < 1 2 3 4 ... 152 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
容器服务 Kubernetes 版 ACK Serverless 应用引擎 服务网格 弹性公网IP 短信服务 人工智能平台 PAI
新人特惠 爆款特惠 最新活动 免费试用