通用环境变量列表

DLC为TensorFlow训练配置的通用环境变量如下:环境变量名 描述 TF_CONFIG TensorFlow分布式网络拓扑信息,示例如下:{"cluster":{"worker":["dlc1y3madghd*-worker-0.t1612285282502324.svc:2222","dlc1y3madghd*-worker-1.t...

准备工作

提交分布式训练任务时支持选择的公共镜像列表如下:类型 框架 镜像 社区镜像 TensorFlow tensorflow-training:2.3-cpu-py36-ubuntu18.04 tensorflow-training:2.3-gpu-py36-cu101-ubuntu18.04 tensorflow-training:1.15-cpu-py36-ubuntu18....

混访混挂迁移示例

本文档介绍了如何使用混挂和混访方案将经典网络迁移至专有网络。前提条件 在开始使用混挂和混访迁移方案前,请确保满足以下条件:您已经注册了阿里云账号。如还未注册,请先完成账号注册。更多信息,请参见 账号注册。您已了解该迁移方案的...

定制排序模型开发指南

模型开发注意事项 variable 及权重 用户如果需要使用额外的 tf.Variable 或者用 contrib 之外的一些网络函数,注意把 variable 加到 MODEL_VARIABLES 这个 collection 里,我们会根据这个加载权重。请注意,需要在线加载权重的再加入,像 ...

灵骏智算资源组使用指南

TensorFlow环境变量 TensorFlow分布式作业通过TF_CONFIG环境变量来构建分布式的网络拓扑信息,对于TensorFlow,DLC设置了如下环境变量:环境变量名 描述 TF_CONFIG TensorFlow分布式网络拓扑信息,示例如下:{"cluster":{"worker":["dlc1y3...

CLB七层监听一键迁移ALB最佳实践

权重配置 页面,在 操作 列单击 开启权重,然后单击 设置权重权重配置的启用条件是域名下存在相同的主机记录、相同解析线路的多条A记录、CNAME记录、AAAA记录。在 设置权重 面板,分别为 CLB 和 ALB 实例的解析记录设置权重。将 CLB ...

在GPU实例上使用RAPIDS加速图像搜索任务

本文案例中,使用开源框架TensorFlow和Keras配置生产环境,然后使用ResNet50卷积神经网络完成图像的特征提取及向量化,最后使用RAPIDS cuML库的KNN算法实现BF方式的向量索引和检索。说明 BF(Brute Force)检索方法是一种百分百准确的方法...

命令行使用说明

vpc,-vpc,-vpc_name:指定私有网络名称。cuda,-install_cuda,-cuda_install:自动化安装CUDA。创建一个Ubuntu系统的实例,并指定实例名称和规格,同时自动安装CUDA:fastgpu create-name fastgpu_vm-np 1-instance_type ecs.gn6v-c8g1.16...

添加HTTPS监听

权重 列下,配置添加的后端服务器的权重。说明 权重越大ECS实例将被分配到更多的访问请求,默认为100。可通过单击 重置 修改 权重 为默认值。权重设置为0,该服务器不会再接受新请求。单击 添加,配置后端服务器用来接收请求的端口。...

通过ALB Ingress实现灰度发布

当服务迭代更新升级时,需要使用灰度发布来保证系统的稳定性。ALB Ingress支持使用canary注解实现基于Header、Cookie...如果集群配置完成后,集群网络存在问题,请根据文档排查解决。具体操作,请参见 Ingress FAQ、ALB Ingress异常问题排查。

通过ALB Ingress实现灰度发布

当服务迭代更新升级时,需要使用灰度发布来保证系统的稳定性。ALB Ingress支持使用canary注解实现基于Header、Cookie...如果集群配置完成后,集群网络存在问题,请根据文档排查解决。具体操作,请参见 Ingress FAQ、ALB Ingress异常问题排查。

消息 Mesh

消息 Mesh 简介 Service Mesh 作为云原生场景下微服务架构的基础设施(轻量级的网络代理),正受到越来越多的关注。Service Mesh 不仅负责在微服务架构的复杂拓扑中可靠地传递请求,也将限流、熔断、监控、链路追踪、服务发现、负载均衡、...

使用EAIS推理PyTorch模型(Python)

您可以在ECS实例(非GPU实例)上绑定一个...您也可以使用EAIS体验EAIS推理TensorFlow模型的完整使用流程,帮助您快速上手EAIS,具体操作,请参见 使用EAIS推理TensorFlow模型。说明 更多EAIS实例使用方法,请参见 使用EAIS实例 或 实践教程。

快速入门

步骤一:创建标准工作空间 工作空间(Workspace)本质上是“网络互通、安全策略一致、访问延时极小”的一组资源。您可以通过工作空间方便地将资源进行分组管理,例如:根据不同的研发交付需求,将工作空间划分为开发工作空间、测试工作空间...

使用EAIS推理PyTorch模型(C++)

您可以在ECS实例(非GPU实例)上绑定一个...您也可以使用EAIS体验EAIS推理TensorFlow模型的完整使用流程,帮助您快速上手EAIS,具体操作,请参见 使用EAIS推理TensorFlow模型。说明 更多EAIS实例使用方法,请参见 使用EAIS实例 或 实践教程。

ACK One概述

ACK One 可以连接并管理您任何地域、任何基础设施上的Kubernetes集群,并提供一致的管理和社区兼容的API,支持对计算、网络、存储、安全、监控、日志、作业、应用、流量等进行统一运维管控。本文介绍 ACK One 的产品优势、功能和应用场景。...

模型仓库(FastNN)

PAI模型仓库FastNN(Fast Neural Networks)是一个基于PAISoar的分布式神经网络仓库。目前FastNN已经支持了Inception、Resnet、VGG等经典算法,后续会逐步开放更多的先进模型。目前FastNN已经内置于 Designer 平台中,并且可以直接在该平台...

步骤二:部署vSGX端

本实践配置如下:sgx.protected_files.model="file:models/resnet50-v15-fp32/1/saved_model.pb"用户侧生成的加密模型文件和TLS配置文件后,通过网络传输放到TensorFlow_Serving目录下。sgx_default_qcnl.conf:配置阿里云PCCS访问地址 tf_...

PageRank

在这种人际网络模型中,边的权重反映了用户之间关系的亲密程度,被视作关系强度的指标。带链接权重的PageRank公式为:W(i):节点i的权重。C(Ai):链接权重。d:阻尼系数。W(A):算法迭代稳定后的节点权重,即每个用户的影响力指数。配置...

在ACK集群上使用eRDMA

弹性RDMA(Elastic Remote Direct Memory Access,简称eRDMA),是阿里云提供的低延迟、大吞吐、高弹性的高性能RDMA网络服务。eRDMA是基于第四代神龙系统架构和云上VPC网络、100%兼容RDMA生态、提供超大规模网络部署的ECS普惠RDMA服务。...

人工神经网络

人工神经网络有多层和单层之分,每一层包含若干神经元,各神经元之间用带可变权重的有向弧连接,网络通过对已知信息的反复学习训练,通过逐步调整改变神经元连接权重的方法,达到处理信息、模拟输入输出之间关系的目的。计算逻辑原理 依据...

ResNet50优化案例:使用Blade优化基于TensorFlow的...

ResNet50作为一个广泛应用的经典结构网络,其优化在多种推理部署场景中都具有很高的实用价值。本文介绍如何使用Blade优化基于TensorFlow的ResNet50模型。背景信息 残差网络ResNet(Residual Network)作为计算机视觉任务主干经典神经网络的...

开源软件迁移

本文介绍Nginx、MySQL、Redis、TensorFlow、PyTorch等开源软件如何在倚天云服务上使用。Nginx Nginx是一个高性能的HTTP和反向代理Web服务器,同时也提供IMAP/POP3/SMTP服务。您可以直接在倚天云服务器上安装使用。sudo yum install nginx-y...

API概览

本产品(网络型负载均衡/2022-04-30)的OpenAPI采用 RPC 签名风格,签名细节参见 签名机制说明。我们已经为开发者封装了常见编程语言的SDK,开发者可通过 下载SDK 直接调用本产品OpenAPI而无需关心技术细节。如果现有SDK不能满足使用需求,...

概述

本文介绍如何基于安全增强型实例(Intel ® SGX)部署TensorFlow Serving在线推理服务的技术架构和使用流程。背景信息 TensorFlow Serving是Google开源的机器学习平台TensorFlow生态的一部分,它的功能是将训练好的模型运行起来,提供接口...

PAI-TF概述

背景 TensorFlow是Google最新的开源深度学习计算框架,支持CNN、RNN及LSTM等多种神经网络模型,对语音、图像及文本等领域的模型训练效率极佳。TensorFlow的功能丰富且强大,并拥有高度灵活的API,受到业界的高度关注。PAI-TF是人工智能平台...

在文件存储 HDFS 版上使用TensorFlow

本文介绍如何在 文件存储 HDFS 版 上使用TensorFlow。前提条件 已开通 文件存储 HDFS 版 服务并。具体操作,请参见 开通文件存储HDFS版服务。已完成创建文件系统、添加挂载点和挂载文件系统。具体操作,请参见 快速入门。已为Hadoop集群...

Tensorflow

tensorflow_cpu_2.7 Tensorflow 2.7 否 tensorflow_gpu_1.12 Tensorflow 1.12 是 tensorflow_gpu_1.14 Tensorflow 1.14 是 tensorflow_gpu_1.15 Tensorflow 1.15 是 tensorflow_gpu_2.4 Tensorflow 2.4 是 tensorflow_gpu_2.7 Tensorflow 2...

UpdateServerGroupServersAttribute-更新后端服务器...

更新网络型负载均衡服务器组中后端服务器的权重和描述信息。接口说明 UpdateServerGroupServersAttribute 接口属于异步接口,即系统返回一个请求 ID,但该后端服务器配置信息尚未添加成功,系统后台的添加任务仍在进行。您可以调用 ...

搭建TensorFlow

本文以一个Github上基于GPU的TensorFlow训练任务为例,介绍如何基于 ACK Serverless集群,使用ECI来运行训练任务。背景信息 近些年来,人工智能与机器学习已经被广泛应用到各个领域,各种各样的训练模型被提出,更多的训练任务运行到云上。...

TensorFlow(仅对存量用户开放)

Data Science集群内置Python 3的Tensorflow 1.15.0版本,可以直接使用。其中Master节点只支持购买CPU资源计算TensorFlow作业,Core节点支持购买CPU或GPU资源计算TensorFlow作业。本文主要介绍如何查看TensorFlow的版本、切换TensorFlow版本...

使用ECI运行TensorFlow任务

本文以一个Github上基于GPU的TensorFlow训练任务为例,介绍如何基于 ACK Serverless集群,使用ECI来运行训练任务。背景信息 近些年来,人工智能与机器学习已经被广泛应用到各个领域,各种各样的训练模型被提出,更多的训练任务运行到云上。...

使用GPU拓扑感知调度(Tensorflow版)

arena get tensorflow-topo-4-vgg16-type mpijob 预期输出:Name:tensorflow-topo-4-vgg16 Status:RUNNINGNamespace:default Priority:N/A Trainer:MPIJOB Duration:2m Instances:NAME STATUS AGE IS_CHIEF GPU(Requested)NODE-tensorflow-...

使用EAIS推理TensorFlow模型

def(graph_def,name='')with tf.Session()as sess:result=sess.run(.)如果您需要使用EAIS推理您的TensorFlow模型,请将源代码修改为如下内容:#导入tensorflow模块 import tensorflow as tf#导入eais tensorflow模块 import eais_...

开通读写分离(只读地址)

内网地址(专有网络):因为SQL Server 2017企业版和2019企业版只支持专有网络,因此内网地址的类型也是专有网络,只读地址只能用于专有网络内。外网地址:用于从外网对实例进行访问,由于外网网络易波动,建议在业务中使用内网地址进行...

附录:历史版本下载与安装

v3.27.0 Python包安装命令如下:CPU Tensorflow 1.15.0与PyTorch 1.6.0。pai_blade_cpu pip3 install pai_blade_cpu=3.27.0+1.15.0.1.6.0-f ...

使用SDK部署TensorFlow模型推理

前提条件 已使用PAI-Blade对TensorFlow模型进行了优化,详情请参见 优化TensorFlow模型。已安装SDK并获取鉴权Token,详情请参见 安装Blade。因为本文使用GCC 4.8,所以需要使用pre-cxx11 ABI的SDK。本文选用3.7.0版本的RPM包。说明 经过PAI...

创建TensorFlow任务

通过ACK One Fleet实例,您可以使用和单集群相同的方式创建TensorFlow任务。由Fleet实例根据TensorFlow任务需要的资源和关联集群的剩余资源,执行动态调度策略,选择适合的关联集群下发TensorFlow任务。本文介绍如何创建TensorFlow任务并...

在GPU实例上部署NGC环境

本文以搭建TensorFlow深度学习框架为例介绍如何在GPU实例上部署NGC环境。前提条件 打开 NGC网站,注册NGC账号。登录 NGC网站,获取NGC API Key并保存到本地。说明 登录NGC容器环境时需要验证您的NGC API Key。背景信息 NGC(NVIDIA GPU ...

安装Blade

您可以安装TensorFlow社区提供的包,安装命令如下:#GPU 版本的 Tensorflow pip3 install tensorflow-gpu=1.15.0#或者:pip3 install tensorflow-gpu=2.4.0#CPU 版本的 Tensorflow pip3 install tensorflow=1.15.0#或者 pip3 install ...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
NAT网关 共享流量包 弹性公网IP 高速通道 负载均衡 短信服务
新人特惠 爆款特惠 最新活动 免费试用