[帮助文档] 配置MLflow模型仓库

MLflow是一个开源的机器学习生命周期管理平台,可以用来追踪模型训练信息、管理和部署机器学习模型。本文介绍如何为模型管理功能配置MLflow模型仓库。

[帮助文档] 在ACK集群部署多租户任务调度管理

在ACK集群中,企业可以通过AI套件中的任务管理工具Arena、队列调度管理系统Kube Queue、配额管理工具ElasticQuotaTree以及Prometheus监控打造企业级任务调度系统。本文将从实际案例出发自底而上地介绍如何基于ACK集群构建一个任务调度系统。

容器应用的高弹性架构

9 课时 |
31 人已学 |
免费

容器应用更新与灰度发布

9 课时 |
47 人已学 |
免费

Serverless容器入门和实践案例

1 课时 |
41 人已学 |
免费
开发者课程背景图

[帮助文档] 利用DCGM实现GPU的性能分析

NVIDIA GPU上存在一些硬件计数器,这些计数器可以用来收集一些设备级别的性能指标,例如GPU利用率、内存使用情况等。借助NVIDIA提供的NVML(NVIDIA Management Library)库或DCGM(Data Center GPU Manager)工具能够查询这些硬件层提供的指标...

[帮助文档] 使用抢占式实例弹性训练以降低AI模型的训练成本

为降低使用AI模型训练成本,云原生AI套件推出基于抢占式实例的弹性训练解决方案,该方案可以将AI模型训练这种有状态类型的工作负载运行在抢占式实例上,几乎可以做到在不影响训练作业成功率的情况下降低训练成本。

《云原生机密计算最佳实践白皮书》——06运行时底座——Inclavare Containers: 面向机密计算场景的开源容器运行时技术栈

《云原生机密计算最佳实践白皮书》——06运行时底座——Inclavare Containers: 面向机密计算场景的开源容器运行时技术栈

Inclavare Containers: 面向机密计算场景的开源容器运行时技术栈项目位置链接https://github.com/inclavare-containers技术自身介绍背景机密计算是一种能够通过软件加密算法和硬件HW-TEE保护用户数据和程序的技术。 在云原生场景中, 机密级算能够对...

《2023云原生实战案例集》——07 Landing Zone/咨询——商龙科技 容器化上云,保障业务稳定运行

《2023云原生实战案例集》——07 Landing Zone/咨询——商龙科技 容器化上云,保障业务稳定运行

 客户简介天津市神州商龙科技股份有限公司是一家专为餐饮行业提供数字化整体解决方案及咨询 业务的高新技术企业,提供智慧餐厅管理、客户关系管理、供应链管理以及企业经营决 策分析系统的一站式闭环解决方案的产品体系。客户痛点•缺乏云上整体规划:商龙需要上云的业务系统较为复杂,不同的业务会分布在不同...

云原生生态周报 Vol. 16 | CNCF 归档 rkt,容器运行时“上古”之战老兵凋零

作者列表:木苏,临石,得为,等等 业界要闻 1.安全漏洞 CVE-2019-9512 CVE-2019-9514 http2 的 DOS 漏洞,一旦攻击成功会耗尽服务器的 cpu/mem,从而导致服务不可用。相关链接:https://discuss.kubernetes.io/t/security-...

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

社区圈子

阿里云容器服务 ACK
阿里云容器服务 ACK
云端最佳容器应用运行环境,安全、稳定、极致弹性
234772+人已加入
加入
相关电子书
更多
微服务×容器Meetup:云原生架构与应用专场PPT合辑
云原生架构容器&微服务优秀案例集
阿里云总监课第五期第三节:从容器到云原生–极致弹性
立即下载 立即下载 立即下载