人工智能AI

本文列举了AI推理、AI训练、AI加速的最佳实践案例及人工智能AI的解决方案。AI推理 基于弹性计算的AI推理 AI训练 超级计算集群结合ACK快速实现NLP训练 基于机器学习PAI的云原生AI训练 GPU AI模型训练 基于NAS部署可更换模型的FC Stable ...

AI加速概述

PAI-AI加速器主要用于训练加速和推理加速,它通过数据集加速、计算加速、优化算法、调度算法和资源优化技术等多种手段,提高了AI训练和推理的速度、易用性和稳定性,全面提升了AI计算的效率。本文为您介绍AI加速器的功能亮点。AI加速器功能...

PAI使用引导

AI加速 模型开发者使用AI加速器完成训练加速和推理加速,全面提升AI加速效率,详情请参见 AI加速概述。管理AI资产 PAI支持将数据集、模型、镜像和代码等作为AI资产进行管理。在模型开发过程中,模型开发者可以根据使用场景创建AI资产,并对...

ACK集群实现弹性裸金属AI训练

本方案使用了SCC超级计算集群,采用弹性裸金属GPU服务器、并行文件系统CPFS、RDMA网络、阿里云容器服务Kubernetes版和飞天AI加速训练工具,提供性能稳定的训练环境,保障业务能力。解决问题 搭建AI图片训练基础环境。使用CPFS存储训练数据...

01-AI加速场景架构部署

本场景架构适用于AI加速应用场景。在线下IDC训练加速业务中,经常遇到计算和通信的瓶颈,本方案为您介绍如何借助阿里云上的优势,来支持客户业务,并且基于CADT快速部署进行POC,模板验证后可以直接转生产,大大提升工作效率。

ACK集群实现GPU AI模型训练

本文介绍GPU AI模型训练的场景描述、解决问题、架构图及操作参考链接。场景描述 本方案适用于AI图片训练场景...使用飞天AI加速训练工具加速训练。使用Arena一键提交作业。架构图 参考链接 有关GPU AI模型训练的详情,请参见 GPU AI模型训练。

什么是Deepytorch

Deepytorch是阿里云自研的AI加速器,为生成式AI和大模型场景提供训练和推理加速功能。在训练方面,Deepytorch在保障精度的前提下实现端到端训练性能的显著提升,可降低训练成本,提升迭代速度。在推理方面,Deepytorch通过即时编译技术对...

ACK集群实现基于弹性计算的AI推理

本文介绍基于弹性计算的AI推理的场景描述、解决问题、架构图及操作参考链接。场景描述 本方案适用于使用GPU进行AI在线...使用飞天AI加速推理工具加速推理。架构图 参考链接 有关基于弹性计算的AI推理的详情,请参见 基于弹性计算的AI推理。

什么是计算优化编译器AIACC-AGSpeed

AIACC-AGSpeed(AIACC 2.0-AIACC Graph Speeding)是阿里云推出的一个基于PyTorch深度学习框架研发的计算优化编译器,用于优化PyTorch深度学习模型在阿里云GPU异构计算实例上的计算性能,相比原始的神龙AI加速引擎AIACC,AIACC-AGSpeed是...

阿里云异构计算产品总览

神行工具包主要包括以下几个组件:神龙AI加速引擎AIACC:基于阿里云IaaS资源推出的AI加速引擎,用于优化基于AI主流计算框架搭建的模型。更多信息,请参见 什么是神龙AI加速引擎AIACC。AI分布式训练通信优化库AIACC-ACSpeed:是阿里云推出的...

云产品依赖与授权:DatasetAccelerator

使用大部分AI加速功能时,您仅需拥有对应模型开发、训练、推理的子产品操作权限即可,无需额外授权。仅使用数据集加速时,您需要购买数据集加速资源实例。此时资源购买的操作账号只能使用阿里云主账号,您可以为RAM用户授权数据集加速器的...

产品优势

神龙AI加速引擎AIACC 神龙AI加速引擎AIACC作为阿里云自研的AI加速器,在训练及推理场景下具有其显著的性能优势,能够提高计算效率同时降低使用成本。统一加速 提供对TensorFlow、Caffe、MXNet和PyTorch多种人工智能框架的统一加速。性能...

什么是GPU云服务器

AI加速器Deepytorch 阿里云自研的AI加速器,为生成式AI和大模型场景提供训练和推理加速功能。什么是AI通信加速库Deepnccl 阿里云开发的一种用于多GPU互联的AI通信加速库,在AI分布式训练或多卡推理任务中用于提升通信效率。什么是推理引擎...

AI加速使用案例汇总

本文为您介绍AI加速使用案例相关文档入口链接汇总。数据集加速器使用案例 案例名称 描述 在PAI平台使用数据集加速器 介绍如何在创建DSW实例或提交训练任务时直接使用已开启加速的数据集。分布式训练加速使用案例 案例名称 描述 NLP:...

创建及管理数据集加速实例

在左侧导航栏,单击 AI加速>数据集加速器。在 加速实例 页签,单击 创建实例。在 AI数据集加速器(预付费)页面,配置参数。参数 描述 地域 参考界面提示选择数据集加速实例所属地域。数据源类型 支持进行数据加速的数据源类型。容量 数据...

创建及管理数据集加速

在左侧导航栏,单击 AI加速>数据集加速器。在 加速槽 页签中,单击 创建加速槽。方式二:在加速实例详情页面创建加速槽。说明 使用该方式创建加速槽时,所属实例 为当前加速实例,不支持选择其他加速实例。在左侧导航栏,单击 AI加速>数据...

在PAI平台使用数据集加速

在 PAI 平台创建数据集时,支持开启AI加速:数据集加速功能。您可以在创建DSW实例或提交训练任务时,直接使用已开启加速的数据集,提升数据读取效率。本文为您介绍如何在PAI平台使用数据集加速器。前提条件 已创建数据集加速实例,具体操作...

什么是Deepytorch Inference(推理加速

Deepytorch Inference介绍 Deepytorch Inference作为阿里云自研的AI加速器,提供了推理加速能力。针对PyTorch框架下的深度学习模型,在无需指定精度和输入尺寸的情况下,通过即时编译技术对该模型进行推理优化,从而实现高效、快速的推理...

蓝牙辅助配网开发

蓝牙辅助配网的Wi-Fi部分是基于生活物联网平台设备端SDK的,移植详细说明请参见 Wi-Fi芯片移植 中“HAL移植”与“Wi-Fi和配网移植”的内容。用户编程接口指南 基于已移植好的BLE和Wi-Fi的协议栈后,生活物联网平台的SDK向上层应用开发提供...

数据集加速器概述

数据集加速器(DatasetAccelerator,简称DatasetAcc)依托于阿里云构建的Paas服务,主要解决云上AI加速-数据集加速的场景。在机器学习训练场景下,通过对客户训练的数据集进行预分析和处理,为各种云原生的训练引擎提供统一的数据集访问...

开通并授权依赖的阿里云产品

使用PAI进行AI开发过程中,不同的开发场景下需要联合使用一些其他阿里云产品,如OSS、MaxCompute等,因此在正式开始AI开发前,您需要根据场景提前开通好对应的其他云产品并做好授权,以保障后续的开发工作可以顺利进行。本文介绍各场景下...

PAI灵骏智算服务概述

产品架构 PAI灵骏 是软硬件一体化设计的算力集群服务,硬件涵盖了服务器、网络、存储以及集群的整体交付管理等,软件包括算力资源管控运维、AI加速套件、云原生任务管理,以及完善的AI开发作业平台,支持Pytorch、TensorFlow等常见AI框架。...

基于eRDMA增强型实例部署AI训练集群

更多信息,请参见 什么是神龙AI加速引擎AIACC。说明 aiacc-nccl-plugin组件已经默认集成在eRDMA驱动中,如果已安装eRDMA驱动,就可以直接使用,无需再重复安装aiacc-nccl-plugin。AIACC环境支持的版本及操作系统如下:nccl2.8.x~2.16.x的...

GPU计算型

基于第三代神龙架构,通过CIPU云处理器进行云端资源管理,提供稳定可预期的超高计算、存储和网络性能 采用NVIDIA A16 GPU计算加速器提供GPU加速能力,支持图形加速、硬件转码和AI业务 说明 每块NVIDIA A16卡包含4个GA 107处理芯片。...

GPU虚拟化型

GPU虚拟化型实例具有高性能图形处理和GPU加速计算能力,适用于图形加速/渲染场景或通用计算业务场景。本文介绍为您介绍云服务器ECS GPU虚拟化型实例规格族的特点,并列出了具体的实例规格。GPU虚拟化型实例规格族sgn7i-vws(共享CPU)GPU...

GPU计算型和GPU虚拟化型实例概述

本文介绍云服务器ECS GPU计算型和GPU虚拟化型实例规格族的特点,并列出了具体的实例规格。推荐 GPU虚拟化型实例规格族sgn7i-vws(共享CPU)GPU虚拟化型实例规格族vgn7i-vws GPU计算型实例规格族gn7e GPU计算型实例规格族gn7i GPU计算型实例...

神行工具包(DeepGPU)计费

神行工具包中的组件主要包括 AI训练加速器Deepytorch Training、AI推理加速器Deepytorch Inference、AI通信加速库Deepnccl、推理引擎DeepGPU-LLM、AI分布式训练通信优化库AIACC-ACSpeed、AI训练计算优化编译器AIACC-AGSpeed、集群极速部署...

什么是Deepytorch Training(训练加速

Deepytorch Training是阿里云自研的AI训练加速器,为生成式AI和大模型场景提供训练加速功能。本文主要介绍Deepytorch Training在训练加速上的概念、优势及特性。Deepytorch Training介绍 Deepytorch Training面向生成式AI和大模型场景,...

JindoCache概述

JindoCache(原JindoFSx)是阿里云EMR提供的用于加速云原生数据...AI加速训练等场景,降低AI集群使用成本,提供更全面的能力支持。缓存策略 JindoCache支持数据缓存(包括分布式数据缓存、一致性哈希数据缓存和本地缓存)和元数据缓存功能。

JindoFS实战演示

通过JindoFS,您可以完成数据迁移、OSS访问加速、缓存加速AI训练加速和JindoTable计算加速。本文为您介绍JindoFS实战的详细文档和演示视频。注意 如果视频断链表明该视频已过时,且已被下线。由于产品在不断更新迭代,请以官方控制台操作...

异构计算产品最佳实践概览

神龙AI加速引擎AIACC 使用AIACC-Training(AIACC训练加速)加速BERT Finetune模型 适用于自然语言训练场景,使用GPU云服务器和极速型NAS进行BERT Finetune模型训练,使用AIACC-Training(AIACC训练加速)可以有效提升多机多卡的训练效率。...

什么是AI通信加速库Deepnccl

说明 如需了解Deepytorch的更多信息,请参见 什么是AI加速器Deepytorch。Deepnccl通信加速 接口层 在接口层,通过DeepncclWrapper封装nccl-base函数,提供了对通信算法的通用支持。支持的NCCL通信算法包括allreduce(全局归约)、reduce-...

应用场景

神行工具包(DeepGPU)应用场景 神行工具包中的组件主要包括神龙AI加速引擎AIACC(AIACC-Training和AIACC-Inference)、AI分布式训练通信优化库AIACC-ACSpeed、AI训练计算优化编译器AIACC-AGSpeed、集群极速部署工具FastGPU以及GPU容器共享...

Wi-Fi模组移植

芯片厂商 芯片型号 天猫精灵 TG7100C 翱捷科技 ASR5501 ASR5502 展锐 RDA5981X 博通集成 BK7231 BK7231S BK7231U 瑞昱 RTL8710BN 庆科 MOC108 MX1101 模组移植 获取含AliOS Things的SDK。请参见 获取SDK。业务代码存放到SDK相应的目录下。...

云原生AI套件开发者使用指南

背景信息 云原生AI套件包括一系列可单独部署的组件(K8s Helm Chart),辅助AI工程加速。云原生AI套件的用户角色包括:管理员和开发者。管理员:负责管理用户及其权限,分配集群资源,配置外部存储,管理数据集,并通过集群大盘观测集群...

云原生AI套件管理员运维指南

步骤一:安装云原生AI套件 云原生AI套件作为一款插件化的工具集,包括任务弹性、数据加速AI任务调度、AI任务生命周期管理、集群运维控制台、端到端研发控制台等组件。您可以根据实际需要自由选择安装。部署云原生AI套件 登录 容器服务...

Wi-Fi芯片移植

在Wi-Fi芯片移植含AliOS Things的SDK主要包括以下工作:内核移植 HAL移植 Wi-Fi HAL和配网移植 LwIP协议栈移植 OTA移植 内核移植 AliOS Things中使用的内核为Rhino,详细介绍请参见 Rhino内核移植。本文以移植Rhino最小系统到STM32平台为...

什么是容器服务灵骏版

针对AI、HPC等任务特点,支持Gang、Capacity、Binpack等任务调度策略;还支持数据集编排和访问加速。核心优势 安全稳定 ACK灵骏托管版集群具备ACK Pro托管版集群的企业级特性,提供控制面托管和高可用,免去了繁琐的集群搭建和配置工作;...

在GPU集群中加速AI模型训练

使用飞天AI加速训练工具服务AI图片的加速训练,加速性能显著提升。使用Arena一键提交作业,简化了机器学习技术站的部署和使用复杂度。部署架构图 选用的产品列表 产品名称 说明 GPU云服务器 该服务提供了GPU算力的弹性计算服务,具有超强的...

什么是AI分布式训练通信优化库AIACC-ACSpeed

AIACC-ACSpeed(AIACC 2.0-AIACC Communication Speeding)是阿里云推出的AI分布式训练...联系我们 如果您有分布式训练相关的问题或需求,欢迎使用钉钉搜索群号 33617640 加入阿里云神龙AI加速AIACC外部支持群。(钉钉通讯客户端下载地址)
共有181条 < 1 2 3 4 ... 181 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
安全加速 SCDN (文档停止维护) 全球加速 视频点播 弹性公网IP 短信服务 人工智能平台 PAI
新人特惠 爆款特惠 最新活动 免费试用