[帮助文档] 升级共享GPU调度组件ack-ai-installer

当您的集群已经安装共享GPU调度组件,但节点GPU驱动版本与集群中已存在的cGPU版本不兼容,或者节点操作系统版本与集群中已存在的cGPU版本不兼容时,您需要将共享GPU调度组件升级到最新版本。

[帮助文档] Knative常见问题及解决方案

本文介绍在ACK集群中使用Knative时可能遇到的常见问题及对应的解决方案。

容器应用的高弹性架构

9 课时 |
31 人已学 |
免费

容器应用更新与灰度发布

9 课时 |
47 人已学 |
免费

Serverless容器入门和实践案例

1 课时 |
41 人已学 |
免费
开发者课程背景图

[帮助文档] 通过阿里云日志服务SLS采集Kubernetes容器日志的步骤和详细信息

容器计算服务ACS集成了阿里云日志服务SLS。您可在创建集群时启用日志服务,快速采集Kubernetes集群的容器日志,包括容器的标准输出以及容器内的文本文件。本文介绍如何通过AliyunLogConfig CR采集应用日志。

[帮助文档] ACK Eege集群Pro版的资源调度方式

ACK Edge集群Pro版的调度能力基于容器服务 Kubernetes 版,受边缘节点本身限制,ACK Edge集群Pro版支持部分调度功能,包括适用于批量计算任务的Gang scheduling、Capacity Scheduling、Kube Queue,以及适用于CPU、GPU等异构资源的共...

[帮助文档] 如何基于角色访问控制RBAC自定义Kubernetes的授权策略

角色访问控制RBAC(Role-Based Access Control)的Kubernetes对象Role和ClusterRole中包含一组代表相关权限的规则。Role总是用来在某个命名空间内设置访问权限,而ClusterRole是为集群范围的资源定义访问权限。本文介绍如何自行编写Kubernet...

阿里云容器服务团队实践——Alluxio优化数倍提升云上Kubernetes深度学习训练性能

阿里云容器服务团队实践——Alluxio优化数倍提升云上Kubernetes深度学习训练性能

AI训练新趋势:基于Kubernetes的云上深度学习 作者简介 车漾,阿里云高级技术专家,从事Kubernetes和容器相关产品的开发。尤其关注利用云原生技术构建机器学习平台系统,是GPU共享调度的主要作者和维护者。 顾荣,南京大学副研究员,Alluxio项目核心开发者,研究方向大数据处理,201...

从美图容器优化实践谈Kubernetes网络方案设计

本文通过介绍美图线上容器化的实践经验,包括线上遇到的实际问题,来探讨 Kubernetes 环境下的网络方案设计。值得正在转型 K8S 的架构师学习和借鉴。 李连荣,美图高级系统研发工程师,曾建立支持千万的长连接服务,从零开始在建立美图的容器化服务,并主导完成美图容器化的网络方案。在网络、存储方面有...

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

社区圈子

阿里云容器服务 ACK
阿里云容器服务 ACK
云端最佳容器应用运行环境,安全、稳定、极致弹性
234772+人已加入
加入
相关电子书
更多
多租户Kubernetes实践:从容器运行时到SDN
workshop专场--容器、消息&IoT专场-开发者动手实践营-容器、消息和IoT-PouchContainer + Kubernetes 云原生业务支持实践
容器加速业务创新,serverless kubernetes解读
立即下载 立即下载 立即下载