有方式获取到机器学习PAI每个算子执行的状态吗?

有方式获取到机器学习PAI每个算子执行的状态吗?我在webui 上配置好了一套流程,然后提交到flink 上运行,有办法获取到各个节点的执行状态吗?就是这个文档说的这个功能

机器学习PAI现在带有all reduce 的算子是trace不出来的?结果会错?有办法绕过去吗?

机器学习PAI现在带有all reduce 的算子是trace不出来的?结果会错?有办法绕过去吗? 如果只想融合下算子 ,除了aot autograd,还有其他方式吗?

机器学习PAI你们有试过把resnet也放到张量切分里面吗?我自己尝试的时候发现里面的卷积算子某一层

机器学习PAI你们有试过把resnet也放到张量切分里面吗?我自己尝试的时候发现里面的卷积算子某一层的输出会对应不上下一层的输入,刚好几路张量并行就差几倍

请教一下机器学习PAI,我想把FastNN库里的bert改成算子拆分并行,有相关文档吗,我在模型定?

问题1:请教一下机器学习PAI,我想把FastNN库里的bert改成算子拆分并行,有相关文档吗,我在模型定义前加上了split的上下文,但是没有效果怎么办?问题2:我尝试跨节点跑张量切分的策略,发现节点之间不会互相传输算子互相放置,是因为epl目前还不支持吗?

请教一下机器学习PAI的问题,如何在baldeDISC设置某些算子不被替换

请教一下,如何在baldeDISC设置某些算子不被替换

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

相关电子书
更多
大规模机器学习在蚂蚁+阿里的应用
基于Spark的面向十亿级别特征的 大规模机器学习
基于Spark的大规模机器学习在微博的应用
立即下载 立即下载 立即下载

机器学习平台 PAI机器学习相关内容