管理第三方库

更新第三方库 一些第三方库不支持卸载,比如 tensorflow-gpu,只能使用更新命令安装固定版本的 tensorflow-gpu,且新版本必须与CUDA版本(预付费实例的CUDA版本为10,后付费实例的CUDA版本为9)兼容。您可以使用以下命令更新已安装的第三方...

步骤一:部署客户端

r${CC_DIR}/Tensorflow_Serving/client/requirements.txt#您也可以通过使用阿里云pip源加快下载速度:#python3-m pip install-r${CC_DIR}/Tensorflow_Serving/client/requirements.txt-trusted-host mirrors.cloud.aliyuncs....

GPU节点卡型属性标签

展开查看YAML文件详细信息 apiVersion:batch/v1 kind:Job metadata:name:tensorflow-mnist spec:parallelism:1 template:metadata:labels:app:tensorflow-mnist spec:nodeSelector:aliyun.accelerator/nvidia_name:"Tesla-V100-SXM2-32GB"#...

AI加速:使用EPL实现AI训练加速

您也可以使用EPL代码示例快速开始分布式TensorFlow训练,本方案使用ResNet-50训练数据配置代码集,您可以使用该代码集提交TensorFlow训练任务,且每次进行模型训练时会自动克隆最新的版本,关于如何配置代码集,具体操作步骤如下所示。...

量化优化

PAI-Blade支持TensorFlow和PyTorch模型在GPU硬件、端侧设备的INT8量化。本文主要介绍在GPU硬件上,如何使用PAI-Blade量化优化。背景信息 量化是模型压缩常用手段之一,通过将原始的全精度32位浮点数分桶量化为位宽更小的定点整数,可以达到...

查看弹性任务

您可以在AI运维控制台中查看Arena提交的弹性任务。本文介绍如何在AI运维控制台上查看弹性任务详情。...arena submit tf \-name=tf-git \-gpus=1 \-image=tensorflow/tensorflow:1.5.0-devel-gpu \-sync-mode=git \-sync-source=...

应用场景

推荐搭配使用:云服务器 ECS/GPU 服务器 EGS/高性能计算服务(Alibaba Cloud HPC)+容器服务+对象存储 OSS/文件存储 NAS/CPFS 相关文档:PyTorch分布式训练 TensorFlow分布式训练 微服务架构 实现敏捷开发和部署落地,加速企业业务迭代...

开启集群GPU监控

GPU监控2.0基于NVIDIA DCGM构建...apiVersion:batch/v1 kind:Job metadata:name:tensorflow-benchmark spec:parallelism:1 template:metadata:labels:app:tensorflow-benchmark spec:containers:name:tensorflow-benchmark image:registry....

AI任务概述

TensorFlow单机训练 TensorFlow分布式训练 PyTorch单机训练 PyTorch分布式训练 弹性训练 DeepSpeed分布式训练 模型管理 您可以关联和管理训练任务及其产出的模型。模型管理 模型评测 您可以通过Arena提交模型评测任务,对模型准确率、召回...

ImageItem

名称 类型 描述 示例值 object Docker Image 详情 ImageTag string Docker 镜像的 Tag tensorflow-training:2.3-cpu-py36-ubuntu18.04 ImageUrl string 镜像 URL 地址 registry....registry-vpc....

TensorFlow服务请求构造

本文为您介绍如何为基于通用Processor的TensorFlow服务构造请求数据。输入数据 EAS 预置了TensorFlow Processor,为保证性能,其输入输出为ProtoBuf格式。调用案例 EAS 在华东2(上海)的VPC环境中部署了一个Public的测试案例,其服务名称...

安装AIACC-Training

AIACC-Training支持基于主流人工智能(包括PyTorch、TensorFlow、MXNet、Caffe等)搭建的模型进行分布式训练。在接口层面上,目前AIACC-Training兼容了PyTorch DDP以及Horovod的API,对于原生使用上述分布式训练方法的训练代码,可以做到无...

使用EAS Python SDK部署模型

import tensorflow as tf import tensorflow_datasets as tfds(ds_train,ds_test),ds_info=tfds.load('mnist',split=['train','test'],data_dir='./cached_datasets',shuffle_files=True,as_supervised=True,with_info=True,)def normalize...

使用Kubernetes默认GPU调度

本文以运行GPU的TensorFlow任务为例,介绍如何快速部署一个GPU应用。注意事项 针对纳入K8s集群管理的GPU节点,建议您按照本文示例中标准的K8s扩展资源申请方式为应用申请GPU资源。为业务应用申请和使用GPU资源时,请关注以下注意事项。请勿...

步骤三:远端访问

TensorFlow Serving启动成功后,您可以将数据发送到运行在vSGX机密计算环境中的推理服务。推理完成后,得到返回结果。操作步骤 登录客户端ECS实例。具体操作,请参见 连接方式概述。说明 本示例将客户端作为远端进行访问。安装所需的mesa-...

高级配置:模型服务预热

对于部分TensorFlow模型,初次调用时需要将模型相关文件或参数加载到内存中,该过程可能要耗费较长时间,从而导致前几次请求模型服务的RT较长,甚至出现408超时或450等情况。因此,EAS 提供了模型预热功能,即模型服务上线之前对模型服务...

常见问题

本文汇总了使用轻量应用服务器时的常见问题。远程连接和计费问题 远程连接FAQ 计费常见问题 服务器管理问题 轻量应用服务器在哪些地域部署?轻量应用服务器存在哪些状态?轻量应用服务器是否可以升级配置?轻量应用服务器是否支持过户?轻...

功能特性

轻量应用服务器 轻量应用服务器(Simple Application Server)是可以快速搭建且易于管理的轻量级云服务器,面向单台服务器提供了一键部署应用、一站式域名解析、安全管理以及运维监控等服务。轻量应用服务器操作简单便捷,能让您快速上手...

访问ECS实例异常时的问题排查和指引

所有服务器访问目标服务器均存在异常 如果所有服务器访问目标服务器均存在异常,则推断是目标服务器归属安全组或服务器内部自身存在异常所致,需要做进一步排查分析查看服务器内部访问是否正常,即通过 使用管理终端连接Linux实例 登录...

查看服务器信息

当您创建服务器后,可以通过管理控制台查看服务器的资源配置、到期时间、资源使用情况等详细信息。本文介绍如何通过管理控制台查看服务器的相关信息,并提供示例操作供您参考。背景信息 在管理控制台的不同界面,查看到的服务器信息也有所...

新手指引

什么是轻量应用服务器 轻量应用服务器的产品优势 轻量应用服务器的应用场景 轻量应用服务器支持的镜像 轻量应用服务器的使用限制 轻量应用服务器与云服务器ECS对比 快速使用流程 轻量应用服务器快速使用流程如下图所示。准备工作 您需注册...

最佳实践概览

轻量应用服务器提供了部分最佳实践,包括搭建环境、搭建网站、数据传输、迁移服务器以及高可用架构等。您可以根据实际需求,参考相应文档完成服务器的搭建。搭建环境 阿里云轻量应用服务器提供了多种镜像,您可以通过应用镜像快速部署应用...

通用环境变量列表

DLC为TensorFlow训练配置的通用环境变量如下:环境变量名 描述 TF_CONFIG TensorFlow分布式网络拓扑信息,示例如下:{"cluster":{"worker":["dlc1y3madghd*-worker-0.t1612285282502324.svc:2222","dlc1y3madghd*-worker-1.t...

远程连接Linux服务器

您可以通过轻量应用服务器管理控制台或者第三方客户端工具远程连接Linux服务器。本文主要介绍如何远程连接Linux服务器。前提条件 待连接的Linux轻量应用服务器的状态为 运行中。如果您需要使用密码的方式远程连接服务器,确保已设置服务器...

ResNet50优化案例:使用Blade优化基于TensorFlow的...

本文介绍如何使用Blade优化基于TensorFlow的ResNet50模型。背景信息 残差网络ResNet(Residual Network)作为计算机视觉任务主干经典神经网络的一部分,堪称图像领域深度学习模型实战的"Hello World。ResNet使用卷积层提取图像的特征,并...

远程连接FAQ

本文介绍在远程连接轻量应用服务器过程中可能存在的问题、排查思路和相应的解决方案。排查思路 如果无法远程连接轻量应用服务器时,阿里云推荐您按照以下思路排查问题。以下排查思路根据原因的出现概率进行排序,建议您从高频率原因往低...

Arena在多用户场景下的最佳实践

本文通过实现五个目标任务举例说明如何在多用户场景下使用Arena。操作视频 前提条件 请确保您已完成以下...arena submit tf \-name=tf-git-bob-01 \-gpus=1 \-image=tensorflow/tensorflow:1.5.0-devel-gpu \-sync-mode=git \-sync-source=...

轻量应用服务器之间的数据迁移

如果轻量应用服务器无法通过升级配置满足当前业务需求或者需要将轻量应用服务器迁移至其他地域,您可以将同一阿里云账号下待迁移服务器中的网站数据迁移至同地域或者其他地域。本文介绍同地域和跨地域下,迁移轻量应用服务器的操作。前提...

TensorFlow Serving镜像部署

TensorFlow Serving是一个适用于深度学习模型的推理服务引擎,支持将TensorFlow标准的SavedModel格式的模型部署为在线服务,并支持模型热更新与模型版本管理等功能。本文为您介绍如何使用镜像部署的方式部署TensorFlow Serving模型服务。...

BERT模型优化案例:使用Blade优化基于TensorFlow的...

本文主要介绍如何使用Blade优化通过TensorFlow训练的BERT模型。使用限制 本文使用的环境需要满足以下版本要求:系统环境:Linux系统中使用Python 3.6及其以上版本、CUDA 10.0。框架:TensorFlow 1.15。推理优化工具:Blade 3.16.0及其以上...

创建轻量应用服务器

创建轻量应用服务器时,您需要配置地域、镜像、套餐以及购买时长等信息,您可以根据业务需要进行个性化配置。本文介绍如何创建一台轻量应用服务器。背景信息 如果您部署的应用访问量较高,可以使用轻量应用负载均衡将流量分发到后端不同的...

AI加速使用案例汇总

BERT模型优化案例:使用Blade优化基于TensorFlow的BERT模型 介绍如何使用Blade优化通过TensorFlow训练的BERT模型。ResNet50优化案例:使用Blade优化基于TensorFlow的ResNet50模型 介绍如何使用Blade优化基于TensorFlow的ResNet50模型。...

远程连接Windows服务器

您可以通过轻量应用服务器管理控制台或本地Windows系统自带的远程桌面连接工具连接Windows轻量应用服务器,本文为您提供具体的操作指引。前提条件 待连接的Windows服务器的状态为 运行中。已设置服务器密码。具体操作,请参见 设置或重置...

部署高可用架构应用集群

步骤四:修改数据库服务器中数据库的权限 当前已成功创建两台应用服务器服务器A 与 服务器B),为确保应用服务器与数据库服务器进行数据传输时的安全性,建议您将数据库服务器C中的MySQL访问权限,由 所有人 修改 指定IP,并指向两台应用...

新功能发布记录

2022-04-24 查看服务器信息 修改服务器名称 升级配置 续费服务器 增加轻量应用服务器介绍视频 增加轻量应用服务器介绍视频,您可以通过视频快速了解轻量应用服务器。2022-04-21 什么是轻量应用服务器 视频专区 2022年03月 功能名称 功能...

修改服务器名称

轻量应用服务器支持手动修改服务器的名称,便于您区分和管理不同的服务器。本文介绍如何修改服务器名称。操作步骤 登录 轻量应用服务器管理控制台。在左侧导航栏,单击 服务器。将鼠标悬浮在服务器卡片中的服务器名称上,单击 图标。说明 ...

迁移概述

本文介绍如何将基于x86平台的应用迁移到基于阿里云倚天实例的服务器上使用。迁移背景 倚天云服务介绍 云服务器ECS实例包含了x86 CPU架构和倚天710 ARM CPU架构(下文简称为 倚天实例)。基于倚天实例的云服务器(即 倚天云服务器),通过...

管理快照

快照是某一时间点磁盘数据状态的备份文件,常用于日常数据备份、服务器数据误操作恢复、网络攻击恢复、制作自定义镜像等场景。本文介绍如何通过管理控制台创建、删除快照以及使用快照回滚磁盘、创建自定义镜像。使用限制 说明 轻量应用...

服务器迁移至轻量应用服务器

服务器迁移中心支持将其他厂商轻量服务器(腾讯云轻量应用服务器、AWS Lightsail Instance和华为云云耀云服务器)、IDC服务器、虚拟机和其他云平台的云主机迁移至阿里云轻量应用服务器。本文介绍如何将其他厂商轻量服务器迁移至轻量应用...

私网传输迁移

操作场景 场景一:源服务器迁移上云,但没有公网访问能力 您需要通过VPN网关、高速通道物理专线、智能接入网关将源服务器和云上VPC打通,并为源服务器设置代理服务器,然后通过代理服务器访问SMC实现私网迁移源服务器。场景二:源服务器...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
轻量应用服务器 云服务器 ECS Web应用防火墙 负载均衡 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用