[帮助文档] AI通信加速库Deepnccl的架构、性能以及优化原理

Deepnccl是为阿里云神龙异构产品开发的一种用于多GPU互联的AI通信加速库,在AI分布式训练或多卡推理任务中用于提升通信效率。本文主要介绍Deepnccl的架构、优化原理和性能说明。

AI 编程如何颠覆生产力 | 参与体验免费领取 ArchSummit 架构师峰会专属门票

AI 编程如何颠覆生产力 | 参与体验免费领取 ArchSummit 架构师峰会专属门票

Sora 的初现,已经震惊了整个行业,正在慢慢的颠覆一些垂直行业。在惊叹之余,估计大部分人都在思考如何顺应潮流,驾驭趋势。 InfoQ 正在筹备 2024 年 6 月 14-15 日深圳 ArchSummit 架构师峰会,阿里云云原生应用平台负责人丁宇受邀在会议上演讲,他的演讲会围绕 AI 颠覆程序...

容器应用的高弹性架构

9 课时 |
31 人已学 |
免费

高可用应用架构

9 课时 |
121 人已学 |
免费

微服务架构与混沌工程介绍

1 课时 |
60 人已学 |
免费
开发者课程背景图

[帮助文档] 如何使用CADT进行AI加速场景架构部署

本场景架构适用于AI加速应用场景。在线下IDC训练加速业务中,经常遇到计算和通信的瓶颈,本方案为您介绍如何借助阿里云上的优势,来支持客户业务,并且基于CADT快速部署进行POC,模板验证后可以直接转生产,大大提升工作效率。

清华大学尹首一:AI芯片计算架构创新是实现AIoT的必然途径 | AIoT+智慧城市峰会

12月20日,雷锋网主办的AIoT+智慧城市峰会在深圳举行,峰会上清华大学微纳电子系副主任、微电子学研究所副所长尹首一教授分享了他对AI算法如何在物联网设备上实现AI功能的看法以及超高能效AI芯片的最新进展。尹教授认为,未来计算架构的创新将是实现无处不在的AIoT的必然途径。 IoT AI芯片需要解...

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

社区圈子

金融级分布式架构
金融级分布式架构
SOFAStack™(Scalable Open Financial Architecture Stack)是一套用于快速构建金融级分布式架构的中间件,也是在金融场景里锤炼出来的最佳实践。
122+人已加入
加入
相关电子书
更多
PolarDB分布式版架构介绍
Kubernetes与AI相结合架构、落地解析
Kubernetes 与AI 相结合架构、落地解析(从0到1
立即下载 立即下载 立即下载