[帮助文档] 如何基于ECI运行弹性推理服务
模型训练完成后,通常会被部署成推理服务。推理服务的调用量会随着业务需求动态变化,这就需要服务器能弹性扩缩容来节省成本。在大规模高并发的节点需求情况下,常规的部署方案无法满足此类需求。阿里云提供了基于弹性容器实例ECI(Elastic Container Instance)的运行工作负载能力,满足推理...
kubernetes 运行AI任务实践 资料下载
分享嘉宾 徐晓舟 2015年加入阿里巴巴基础产品事业部-容器平台-容器服务高级开发工程师多年容器平台产品开发经验目前主要负责参与Kubernetes专有云与Kubernetes深度学习解决方案的研发工作 主题介绍 Kubernetes与深度学习介绍 阿里云的Kubernetes深度学习解决方案 Ku...
如何让手机快速运行AI应用?这有份TVM优化教程
本文来自AI新媒体量子位(QbitAI) 在移动设备上部署深度神经网络的需求正在快速增加。 和桌面平台类似,GPU也能在移动平台加速推理速度、降低能耗。但问题是,大多数现有深度学习框架并不能很好的支持移动GPU。 为什么会这样?因为移动GPU和桌面GPU在架构上存在差异。 所以想要利用移动GPU,还...
本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。