如何降低云服务器ECSRDS PostgreSQL间的网络延迟

如果您的业务是建立在云服务器ECS上,并且通过内网连接RDS PostgreSQL数据库,在正常使用中发现延迟升高异常时,请参考本文指导降低云服务器ECSRDS PostgreSQL间的网络延迟。查看内网延迟 登录 ECS实例列表,在上方选择地域,单击目标...

续费ECS实例

除了通过ECS控制台或售卖页进行云服务器续费外,阿里还支持直接通过API进行续费查询和续费管理。背景信息 对于包年包月的云服务器,生命周期非常重要。如果云服务器资源不能按时续费,将可能导致服务器被锁定甚至被释放,从而影响业务...

GPU实例上使用RAPIDS加速机器学习任务

背景信息 RAPIDS(全称Real-time Acceleration Platform for Integrated Data Science)是NVIDIA针对数据科学和机器学习推出的GPU加速库。更多信息,请参见 RAPIDS网站。RAPIDS预装镜像已经发布到阿里镜像市场,创建GPU实例时,您可以在...

使用共享GPU调度(eGPU)

但目前由于eGPU对H800的灵骏机型上的能力暂不支持,所以该机型的GPU显存算力隔离能力暂时无法正常使用。如您需要使用GPU显存算力隔离能力,请使用其他机型的灵骏节点。步骤一:开启GPU共享调度能力 为灵骏节点开启GPU共享调度能力的...

Tesla或GRID驱动安装指引

GPU实例本身并未配备相关驱动,只有安装了驱动的GPU实例,才能实现计算加速或图形渲染等功能。根据不同GPU实例规格安装之匹配的Tesla或GRID驱动,...如果GPU实例安装驱动后,在使用过程中遇到黑屏或其他问题,请参见 GPU云服务器常见问题。

【公告】GRID驱动变更通知

尊敬的阿里用户,NVIDIA将于2023年7月31日后不再对FLS GRID License提供技术支持,且阿里采购的FLS GRID License也将于2023年9月底到期,为了您的业务不受GRID驱动变更影响,建议您尽快将目前使用的GPU图形加速驱动(采用FLS GRID ...

如何解决Linux系统的ECS服务器CPU负荷过高

概述 本文主要介绍如何解决Linux系统的ECS服务器CPU负荷过高。详细信息 如果在ECS服务器系统内无法通过top和htop等命令查询到消耗CPU资源的具体进程,可以查询异常时间节点和连接情况进而确定问题的原因。查看ECS实例的监控数据。检查系统...

卸载GRID驱动

警告 GPU实例必须配备了相关驱动才可以正常使用,如果您因某种原因需要卸载当前驱动,请务必再安装您实例规格及操作系统相匹配的正确驱动,否则会因GPU实例安装的驱动不匹配而造成业务无法正常进行的风险。在Windows操作系统中卸载GRID...

真机性能报告

nonFragmentUtilization 非片段着色(顶点着色,细分着色,计算着色)耗费 GPU 时间占渲染耗费 GPU 时间的比例。tilerUtilization Tiler 渲染计算占用的时间比例。gpuCycles GPU 单位时间平均 GPU counters。fragmentCycles ...

使用实时性能功能

nonFragmentUtilization 非片段着色(顶点着色,细分着色,计算着色)耗费 GPU 时间占渲染耗费 GPU 时间的比例。tilerUtilization Tiler 渲染计算占用的时间比例。gpuCycles GPU 单位时间平均 GPU counters。fragmentCycles ...

安装共享GPU调度组件

ACK Pro集群的实例规格架构设置为 GPU云服务器。其他配置,请参见 创建ACK集群Pro版。已获取集群KubeConfig并通过kubectl工具连接集群。使用限制 请勿将共享GPU调度的节点的CPU Policy设置为 static。cGPU服务的隔离功能不支持以UVM的方式...

ECS经典网络专有网络VPC特点介绍

本视频描述了云服务器ECS两种不同网络类型的特点。云服务器ECS的网络类型包括经典网络和专有网络VPC。经典网络采用三层隔离,所有经典网络类型实例都建立在一个共用的基础网络上。专有网络VPC采用二层隔离,相对经典网络而言,VPC具有更高...

云服务器服务条款

云服务器服务条款最新内容,请参见 轻云服务器服务协议。

安全组指定协议不允许对全部网段开启风险端口

云服务器ECS安全组入网网段设置为0.0.0.0/0时,指定协议的端口范围不包含指定风险端口,视为“合规”;当云服务器ECS安全组入网网段未设置为0.0.0.0/0时,使指定协议的端口范围包含指定的风险端口,视为“合规”;当检测到云服务器ECS...

通过OSS URL自定义节点GPU驱动

如果您上传自己的GPU驱动到OSS中,使用自定义的GPU节点驱动方式,可能引发GPU驱动操作系统版本、ECS实例类型、Container Runtime等不兼容,继而导致添加GPU节点失败。ACK无法保证节点添加的成功率,请您自行验证。机型ecs.gn7.xxxxx和ecs...

创建智能阈值报警规则

当您需要监控各产品资源的使用情况时,针对CPU类、请求数类、流量类、耗时类和消费数的监控指标,推荐您创建智能阈值报警规则。如果资源的监控指标达到报警条件,监控自动发送报警通知,帮助您及时得知异常监控数据并快速处理。前提...

服务关联角色

云服务器ECS使用服务关联角色获取其他云服务或资源的访问权限。通常情况下,服务关联角色是在您执行某项操作时,由系统自动创建。在自动创建服务关联角色失败或云服务器ECS不支持自动创建时,您需要手动创建服务关联角色。阿里访问控制...

基本概念

服务器迁移 可将服务器、虚拟机、云服务器的业务迁移到阿里,提高业务迁移到阿里的效率。更多信息,请参见 各源环境迁移至阿里。VMware无代理迁移 通过VMware Agentless无侵入式迁移技术,可将VMware虚拟机的业务迁移到阿里,提高...

通过阿里客户端管理轻量应用服务器

您可以在本地安装阿里客户端来便捷地对云服务器ECS、弹性容器实例ECI、轻量应用服务器SWAS和阿里托管实例进行浏览查询、远程连接等。本文为您介绍通过本客户端管理轻量应用服务器的方法,主要包括查看、连接和管理轻量应用服务器。前提...

GPU实例上使用RAPIDS加速图像搜索任务

本文以使用RAPIDS加速图像搜索任务为例,介绍如何在预装镜像的GPU实例上使用RAPIDS加速库。前提条件 使用本教程进行操作前,请确保您已经注册了阿里账号。如还未注册,请先完成 账号注册。背景信息 RAPIDS(全称Real-time Acceleration ...

ACK集群实现GPU AI模型训练

场景描述 本方案适用于AI图片训练场景,使用CPFS和NAS作为共享存储,利用容器服务Kubernetes版管理GPU云服务器集群进行图片AI训练。解决问题 搭建AI图片训练基础环境。使用CPFS存储训练数据。使用飞天AI加速训练工具加速训练。使用Arena一...

安装AIACC-Training

前提条件 已创建阿里云GPU实例,且GPU实例需满足以下要求:操作系统为Alibaba Cloud Linux、CentOS 7.x或Ubuntu 16.04以上版本。已安装NVIDIA Driver和CUDA 10.0或以上版本。背景信息 本文以安装AIACC-Training 1.5.0版本为例,您可以根据...

GPU调度概述

普通GPU调度 申请Kubernetes GPU集群后,通过运行TensorFlow的GPU实验环境,关于如何使用Kubernetes默认调度独占GPU,请参见 使用Kubernetes默认GPU调度。您也可通过使用GPU节点标签自定义调度,具体操作,请参见 使用节点标签自定义GPU...

管理块网关

本文介绍如何在阿里云云存储网关控制台上管理块网关,包括创建块网关、删除块网关、修改块网关名称等操作。前提条件 已注册阿里云账号,并完成实名认证,详情请参见 注册阿里云账号。说明 建议您使用RAM账户登录云存储网关控制台进行相关...

通过CEN实现ECS和无影电脑网络互通

如果因为业务要求,需要云服务器ECS和无影云电脑之间网络互通,您可以通过阿里云云企业网CEN实现。本文以同地域的云服务器ECS和无影云电脑为例指导您如何通过CEN及其企业版转发路由器实现网络互通。背景信息 云服务器ECS(Elastic Compute ...

支持的云服务

服务名称 其他服务的关系 相关文档 云服务器ECS 迁移服务器时,先通过快照将源服务器生成云服务器镜像,然后通过云服务器镜像创建ECS实例。快照概述 镜像概述 使用自定义镜像创建实例 标签 迁移源和迁移任务可通过标签分组管理,便于搜索...

查看智能测试报告

nonFragmentUtilization 非片段着色(顶点着色,细分着色,计算着色)耗费 GPU 时间占渲染耗费 GPU 时间的比例。tilerUtilization Tiler 渲染计算占用的时间比例。gpuCycles GPU 单位时间平均 GPU counters。fragmentCycles ...

终端节点策略

私网连接(PrivateLink)支持设置终端节点策略,您可以将其绑定到VPC终端节点来控制哪些阿里主体能使用终端节点访问阿里云服务,从而增强网络安全性,保护敏感数据,满足特定的安全需求。终端节点策略类型 终端节点策略不会覆盖或取代...

通过指定版本号自定义节点GPU驱动版本

对于已经安装GPU驱动、NVIDIA Container Runtime等GPU组件的自定义操作系统镜像,ACK无法保证其提供的GPU驱动ACK其他GPU组件兼容(例如监控组件等)。通过节点池标签指定节点池中GPU节点的驱动版本时,由于安装驱动的过程是在添加节点时...

集群扩容

选择已有云服务器:勾选要添加的 ECS。单击 下一步,填写以下实例信息。数据盘挂载:设置是否将容器和镜像存储在数据盘。说明 如果 ECS 已挂载数据盘,且最后一块数据盘的文件系统未初始化,系统会自动将该数据盘格式化为 ext4,用来存放...

使用监控功能监控网站环境(部署于ECS实例)

设置站点监控 在云服务器外层的监控服务,站点监控主要用于模拟真实用户访问情况,实时测试业务可用性,有助于排查处理故障。如果以上监控选项不能满足您的实际业务监控需求,您可以使用自定义监控。更多信息,请参见 概览。

搭建Windows环境GRID驱动的License Server

步骤六:测试网络连接和访问 以下操作以创建一台Windows操作系统的GPU虚拟化实例vgn6i为例,您也可以直接应用您已创建的GPU实例。创建一台GPU实例。具体操作,请参见 创建未配备驱动的GPU实例。本示例选择的实例规格为GPU虚拟化实例vgn6i,...

指定GPU规格创建实例

默认情况下,多个容器可以共享使用GPU,配置时需确保单个容器内配置的GPU个数不超过指定的GPU规格所具备的GPU个数。OpenAPI 调用CreateContainerGroup接口创建ECI实例时,在通过InstanceType参数指定ECS GPU实例规格的基础上,必须通过容器...

共享GPU调度

容器服务 Kubernetes 版 ACK(Container Service for Kubernetes)开源了GPU共享调度之后,您能在阿里、AWS、Google Compute Engine和自己数据中心的容器集群上通过GPU共享调度框架实现多个容器运行在同一个GPU设备上的目标。ACK开源GPU...

开启集群GPU监控

新一代NVIDIA支持使用数据中心GPU管理DCGM(Data Center GPU Manager)来管理大规模集群中的GPUGPU监控2.0基于NVIDIA DCGM构建功能更强大的GPU监控体系。DCGM提供了种类丰富的GPU监控指标,有如下功能特性:GPU行为监控 GPU配置管理 ...

Serverless GPU概述

Serverless GPU是一种新兴的计算GPU服务,它采用了服务器无感知计算的理念,通过提供一种按需分配的GPU计算资源,有效地解决原有GPU长驻使用方式导致的低资源利用率、高使用成本和低弹性能力等痛点问题。本文介绍Serverless GPU的详细...

Serverless GPU概述

Serverless GPU是一种新兴的计算GPU服务,它采用了服务器无感知计算的理念,通过提供一种按需分配的GPU计算资源,有效地解决原有GPU长驻使用方式导致的低资源利用率、高使用成本和低弹性能力等痛点问题。本文介绍Serverless GPU的详细...

搭建Linux环境GRID驱动的License Server

步骤七:测试网络连接和访问 以下操作以创建一台Windows操作系统的GPU虚拟化实例vgn6i为例,您也可以直接应用您已创建的GPU实例。创建一台GPU实例。具体操作,请参见 创建未配备驱动的GPU实例。本示例选择的实例规格为GPU虚拟化实例vgn6i,...

集成简介

工作流 支持阿里多个云服务进行集成,允许您在流程中调用这些云服务的API进行相关资源的操作,完成业务流程构建。本文介绍 工作流 的服务集成类型和集成模式等。集成类型 工作流 与云服务的集成类型包括普通集成和优化集成。普通...

集成的云服务

ADP集成了弹性计算、网络和数据等一系列云服务。弹性计算 云服务器ECS 容器服务 网络 专有网络 VPC 负载均衡 弹性公网IP 数据库 数据库 RDS 数据库 Redis 版
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
GPU云服务器 云服务器 ECS 负载均衡 轻量应用服务器 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用