[帮助文档] 使用Pai-Megatron-Patch优化PyTorch版Transformer模型训练

本文介绍如何使用Pai-Megatron-Patch优化PyTorch版Transformer模型训练。

[帮助文档] 使用Blade优化输入为DynamicShape的模型

常规推理优化普遍针对输入为Static Shape的模型,如果实际推理的模型Shape发生变化,推理优化效果就可能失效。在实际生产中,输入为Dynamic Shape的模型越来越多,因此对不同输入Shape的推理过程具有强烈的优化需求。本文介绍如何使用Blade优化输入为Dynamic Shape的...

阿里云人工智能工程师ACA认证(2023版)

41 课时 |
383 人已学 |
免费

人工智能训练师-智能客服课程

54 课时 |
165 人已学 |
免费

人工智能安全

10 课时 |
327 人已学 |
免费
开发者课程背景图

[帮助文档] 如何使用ACCL优化套件进行PyTorch分布式训练(BERT-Large模型为例)

本文以BERT-Large模型为例,介绍如何使用ACCL优化套件进行PyTorch分布式训练。

[帮助文档] 如何通过Docker或Kubernetes使用eGPU优化套件,进行GPU容器虚拟化和资源共享

本文以卷积神经网络模型ResNet50的训练和推理为例,为您介绍如何通过Docker或Kubernetes使用eGPU优化套件,进行GPU容器虚拟化和资源共享。本实践中的ResNet50模型基于NVIDIA官方开源代码DeepLearningExamples实现。

[帮助文档] 如何使用Blade优化基于TensorFlow的ResNet50模型

ResNet50作为一个广泛应用的经典结构网络,其优化在多种推理部署场景中都具有很高的实用价值。本文介绍如何使用Blade优化基于TensorFlow的ResNet50模型。

【人工智能】神经网络优化:复杂度学习率、激活函数、损失函数、缓解过拟合、优化器 2

【人工智能】神经网络优化:复杂度学习率、激活函数、损失函数、缓解过拟合、优化器 2

缓解过拟合欠拟合和过拟合欠拟合解决方法增加输入特征项增加网络参数减少正则化参数过拟合解决方案数据清洗增大训练集采用正则化增大正则化参数正则化缓解过拟合正则化在损失函数中引入模型复杂度指标,利用给W加权值,弱化训练数据的噪声(一般不正则化b)loss = loss(y与y_)+ REGULARIZER...

【人工智能】神经网络优化:复杂度学习率、激活函数、损失函数、缓解过拟合、优化器 1

【人工智能】神经网络优化:复杂度学习率、激活函数、损失函数、缓解过拟合、优化器 1

预备知识import tensorflow as tf import numpy as np import matplotlib.pyplot as plt import random import pandas as pd plt.rcParams['font.sans-serif']=['Sim...

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

相关电子书
更多
人工智能平台PAI的MaaS实践
阿里云人工智能平台 PAI年度发布
用搜索释放生成式人工智能的商业潜能
立即下载 立即下载 立即下载