创建集群

集群网段、互联网段、监控网络的专有网络VPC互相之间不能冲突,且监控网络的专有网络VPC不能和灵骏待连通的其他网络环境(如用户其他VPC网络、线下IDC网段)冲突。单击 专有网络(VPC)下拉列表和 交换机(vSwitch)下拉列表后的,选择相应...

数据安全

通过VPC的网络隔离能力,实现数据的传输安全。同时,EAS支持HTTPS加密传输,访问服务时,将访问地址中的 http 替换成 https 即可,无需其他配置。专有网络 VPC安全性说明请参见 安全体系概述。数据存储安全 PAI提供数据集管理模块,支持...

功能特性

同时,通过大规模RDMA网络部署实践,阿里云自主研发了基于端网协同的RDMA高性能网络协议和HPCC拥塞控制算法,并通过智能网卡实现了协议硬件卸载,降低了端到端网络延时,提升了网络IO吞吐能力,并有效规避和弱化了网络故障、网络黑洞等传统...

附录:ACCL环境变量

MP(推荐)RING_CHUNKED BRUCK ACCL_BROADCAST_TYPE 指定Broadcast算法 BN_TREE(默认)FULLMESH ACCL_NUM_QP RDMA网络连接QP数 支持的配置:1~16 推荐的配置:2 ACCL_NUM_SOCKETS TCP网络连接Socket数 支持的配置:1~16 推荐的配置:2 ...

PAI使用引导

本文为您介绍人工智能平台PAI的使用指引、操作账号及权限管控详情。使用指引 管理员通常参与以下模块:工作空间及成员管理 工作空间是PAI的顶层概念,为企业和团队提供统一的计算资源管理及人员权限管理能力。管理员可以创建及管理工作空间...

启动ACCL容器

本文为您介绍启动ACCL容器的命令示例。Docker启动ACCL容器命令示例 使用Docker启动ACCL容器时,推荐使用的选项可参考如下命令:docker run-it-rm-...,使用RoCE网络配置容器使用宿主机网络栈...ipc=host ACCL利用共享内存进行控制信息交互、...

UpdateErAttachment-更新灵骏HUB网络连接

更新网络实例连接。调试 您可以在OpenAPI Explorer中直接运行该接口,免去您计算签名的困扰。运行成功后,OpenAPI Explorer可以自动生成SDK代码示例。调试 授权信息 当前API暂无授权信息透出。请求参数 名称 类型 必填 描述 示例值 ...

连接方式概述

连接方式优势对比 对比项目 直连方式 ProxyClient方式 资源依赖 专有网络VPC 需要用户提供。无需提供,使用PAI内部网络。公网NAT网关(可选)当需要开通公网访问方式时,需要提前购买公网NAT网关。无需提供,使用PAI内部网络。DNAT条目(可...

ResourceInstance

名称 类型 描述 示例值 object A short description ...cn-hangzhou-b ResourceId string 实例所属资源组 ID eas-r-xxxxx InstanceTenantIp string 实例专属网络 IP。192.168.xx.xx InstanceUsedGpuMemory string 实例已使用的显存大小。470M

CreateErAttachment-创建网络实例连接

创建网络实例连接。接口说明 调用该接口创建网络实例连接时,请注意:请确保您已创建灵骏 HUB 实例。请确保您有足够的网络实例连接配额。该接口属于异步接口,调用该接口后,系统将返回一个网络实例连接的 ID,此时网络实例连接实例可能...

智能设计(ArtLab)

智能设计(ArtLab)是人工智能平台PAI推出的为设计师提供自动化设计的工具。它集成了主流的文生图类型的AIGC大模型,提供批量自动化图片生产能力。背景 在大模型尤其是AIGC模型取得显著进展后,行业开发者迫切需要一个工具帮助他们利用AI和...

PAI接入ACS容器计算服务

PAI训练和推理可直接复用ACS容器计算服务的资源。...人工智能平台PAI-DLC训练以及PAI-EAS推理可直接使用ACS的资源进行任务和服务的拉起和调度。产品文档 https://help.aliyun.com/document_detail/2587773.html?spm=a2c4g.2587773.0.i0

基础设施安全

可用区间故障隔离 可用区是指在同一地域内,电力和网络互相独立的物理区域。在同一地域内,可用区与可用区之间内网互通。各可用区之间可以实现故障隔离,即如果一个可用区出现故障,不会影响其他可用区的正常运行。每个地域完全独立,不同...

授权信息

本文为您介绍 人工智能平台 PAI(PAI)为RAM权限策略定义的操作(Action)、资源(Resource)和条件(Condition)。人工智能平台 PAI(PAI)的RAM代码(RamCode)为 paiplugin,eas,paiworkspace,datasetacc,pai,支持的授权粒度为 RESOURCE...

镜像加速

DADI的Overlaybd镜像格式实现了基于网络的按需读取功能,相比于传统的分层tar包文件格式,实现了容器的快速启动。PAI集成了DADI,您可以在DSW或DLC中使用DADI加速镜像,来提升模型训练速度。本文为您介绍如何在DSW或DLC上按需使用DADI加速...

应用场景

超大规模GPU算力系统,全对等网络架构,全资源池化,可以搭配PAI(机器学习平台)使用,支持多种训练框架(Pytorch、TensorFlow、Caffe、Keras、Xgboost、Mxnet等),可以满足多种规模的AI训练和推理业务。AI基础设施。平滑扩容。满足不同...

公网连接及白名单配置

检查是否已创建专有网络,否则创建一个专有网络,详情请参见 步骤一:创建专有网络和交换机。在 弹性公网IP 页面,创建弹性公网IP,详情请参见 申请EIP。在 公网NAT网关 页面,创建NAT网关,并绑定弹性公网IP,详情请参见 使用公网NAT网关...

通用环境变量列表

公共环境变量 基于灵骏智算的环境变量,关于环境变量的说明,请参见 配置高性能网络变量。PyTorch环境变量 在PyTorch分布式训练框架中,Master和Worker扮演不同的角色并需要相互建立连接以进行通信。在DLC中,一系列环境变量被用于同步关键...

QueryInstanceNcd-查询实例网络通信距离

查询实例(灵骏节点、灵骏网卡)之间的网络通信距离(Network Communication Distance,NCD)。调试 您可以在OpenAPI Explorer中直接运行该接口,免去您计算签名的困扰。运行成功后,OpenAPI Explorer可以自动生成SDK代码示例。调试 授权...

使用限制

灵骏网络 限制项 限制 提升配额方式 单个账号在同一地域支持创建的灵骏网段数量 默认为8。具体操作,请参见 管理配额。单个灵骏网段支持创建的灵骏子网数量 默认为16。具体操作,请参见 管理配额。单个灵骏子网内的灵骏网卡数量 4000 无 ...

ListNodeInfosForPod-查询节点网络信息

查询节点网络信息。调试 您可以在OpenAPI Explorer中直接运行该接口,免去您计算签名的困扰。运行成功后,OpenAPI Explorer可以自动生成SDK代码示例。调试 授权信息 当前API暂无授权信息透出。请求参数 名称 类型 必填 描述 示例值 ...

人工设置

人工回复话术 您可以自定义提示话术,用于机器人提示用户,即将转接到人工客服 参数设置 转人工技能组:用于指定转人工后承接的技能组 自定义参数:您可以自定义参数,在转人工时传递给人工客服 客服工作台响应 1、当您使用阿里云云客服...

准备工作

灵骏连接用于实现灵骏与其他阿里云产品的网络连通,您可根据业务规划购买,计费详情请参见 产品计费。说明 灵骏连接的地域需要与灵骏计算节点的地域相同。目前只支持华北6(乌兰察布)。步骤三:开通必要的其他云产品 为更好的使用灵骏,您...

灵骏网络规划

灵骏网络包括灵骏网段、灵骏连接、灵骏HUB等基础组件。您可以根据业务需求创建灵骏网段及灵骏子网,在灵骏子网内部署灵骏节点,灵骏节点通过灵骏连接实现与云企业网或用户VPC网络的连通。不同灵骏网段之间、灵骏网段与灵骏连接之间可以通过...

DeleteEr-删除灵骏HUB

接口说明 调用该接口删除灵骏 HUB 时,请注意:删除前,请确保灵骏 HUB 实例下不存在网络实例连接。删除后,相关数据全部丢失且不可恢复,请谨慎操作。该接口属于异步接口,调用该接口后,灵骏 HUB 实例可能尚未删除完成,系统后台的删除...

管理灵骏HUB

灵骏HUB为用户提供不同灵骏网段之间互通、灵骏网段与灵骏连接之间互通的能力,帮助您按需轻松构建灵骏网络。本文为您介绍如何管理灵骏HUB。背景信息 灵骏HUB是地域范围内核心转发网元,可以转发同地域的网络实例间的流量。用户可以使用灵骏...

人工审核

内容安全人工审核有哪些类型,如何接入?内容安全人工审核的SLA是什么?内容安全人工审核功能的回调地址怎么设置?内容安全人工审核有哪些类型,如何接入?内容安全人工审核服务有如下两种类型:人机审核,根据机器识别的结果选择性进行...

ListInstancesByNcd-通过网络通信距离筛选实例

lni SourceInstanceId string 源实例 ID lni-1234*InstanceInfos object[]与源实例 ID 间网络通信距离不超过 maxNcd 的实例集合 InstanceId string 实例 ID lni-1235*Ncd integer 网络通信距离 2 示例 正常返回示例 JSON 格式 {"Code":0,...

GetNodeInfoForPod-查询节点网络信息详情

查询节点网络信息详情。调试 您可以在OpenAPI Explorer中直接运行该接口,免去您计算签名的困扰。运行成功后,OpenAPI Explorer可以自动生成SDK代码示例。调试 授权信息 当前API暂无授权信息透出。请求参数 名称 类型 必填 描述 示例值 ...

一键诊断

您可以使用 PAI灵骏智算服务 提供的一键诊断功能,检查灵骏节点的网络和硬件状态,基于多种通信库和通信模型进行网络测试。本文为您介绍灵骏的一键诊断功能。自助诊断 网络诊断 网络诊断功能分为 静态配置类检查 和 动态运行类检查,支持...

DeleteErAttachment-删除网络实例连接

删除某个网络实例连接实例,删除后相关数据丢失且不可恢复。接口说明 调用该接口删除网络实例连接时,请注意:删除前,请确保网络实例连接实例下不存在路由策略。删除后,相关数据全部丢失且不可恢复,请谨慎操作。该接口属于异步接口,...

接入人工审核服务

内容安全提供7*24小时的人工审核服务(人机审核和纯人工审核)。人机审核服务可返回机器识别结果,并根据机器识别的结果选择性进行人工审核。纯人工审核服务对全量的内容数据进行人工审核,仅返回人工审核的结果,不返回机器识别结果。前提...

EasyCKPT高性能CKPT发布

新增功能/规格 PAI-EasyCKPT是为PyTorch大模型训练场景而开发的高性能Checkpoint框架,通过异步化层次化保存、重叠模型拷贝和计算、网络感知异步存储的策略,实现近0开销的模型保存机制和大模型训练全过程精度无损的模型保存与恢复的能力。...

Tensorboard

重要 如果Tensorboard实例使用了需要配置专有网络的数据集(例如CPFS类型的数据集,或挂载点在专有网络内的NAS类型数据集等),则必须设置专有网络。前往Tensorboard页面查看分析报告。在工作空间页面的左侧导航栏选择 AI资产管理>任务。...

ListErs-查询灵骏HUB

er-kkop*InstanceId string 否 网络实例 ID。vcc-cn-209300q*InstanceType string 否 网络实例类型。取值:灵骏网段(VPD)灵骏连接(VCC)VCC PageNumber integer 否 当前页码。起始值:1。默认值:1。1 PageSize integer 否 每页显示的行...

访问DSW实例

相比远程连接而言,通过控制台访问DSW实例操作简单,无需处理复杂的网络和权限配置,同时能够利用DSW丰富的功能特性,如查看资源水位、浏览DSW Gallery等。访问步骤 登录 PAI控制台。在左侧导航栏单击 工作空间列表,在工作空间列表页面中...

人工审核

视频点播提供人工审核服务,针对短视频、传媒和视频平台,建议先通过智能审核进行初审,对于疑似违规视频结合人工复审。本文为您介绍人工审核的使用方式,如何查看审核历史。功能介绍 人工审核,即由您的审核人员专业地对音视频内容进行...

配置回调通知

背景信息 人工审核回调分为阿里云人工审核回调通知和复核人工审核回调通知:人工审核回调通知:内容安全人工审核团队完成人工审核后,服务端将识别的结果以POST请求的方式,发送到您设置的HTTP回调通知地址。复核人工审核回调通知:内容...

管理DSW实例

在 实例配置 页签,单击 变更配置,您可以修改资源信息、镜像信息、数据集配置和网络配置。在 事件 页签,查看DSW实例相关事件。在 生命周期 页签,DSW实例生命周期详情。您可以在区域③对目标DSW实例进行如下操作:打开DSW实例 单击 打开...

创建集群

集群网段、监控网络的专有网络VPC互相之间不能冲突,且监控网络的专有网络VPC不能和灵骏待连通的其他网络环境(如用户其他VPC网络、线下IDC网段)冲突。单击 专有网络(VPC)下拉列表和 交换机(vSwitch)下拉列表后的,选择相应的专有网络...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
弹性公网IP 负载均衡 高速通道 共享流量包 NAT网关 短信服务
新人特惠 爆款特惠 最新活动 免费试用