Windows系统实例的宕机问题排查

定位宕机原因 您可以通过以下方式,定位ECS实例发生宕机的具体原因。方式一:(推荐)通过自助诊断工具定位 登录 ECS管理控制台,左侧导航栏单击 自助问题排查。单击 实例问题排查 页签。选择 实例无法连接或启动异常>实例出现宕机,然后...

什么是AI分布式训练通信优化库AIACC-ACSpeed

优化方法 相比较传统的ring-allreduce算法,ACSpeed设计的hybrid-allreduce算法实现了单机和多机的分层训练,充分利用单机内部高速带宽同时降低多机之间低速网络的通信量,并且针对阿里云不同机型的网卡和GPU距离的拓扑特点,实现多种不同...

设置宕机自动迁移

为了降低物理故障对业务的影响,阿里云为您提供专有宿主机DDH宕机自动迁移的功能。本章节介绍在创建DDH后如何开启或者关闭宕机自动迁移。背景信息 宕机自动迁移开启后,当DDH因故障停机时,会自动迁移至健康的DDH。若您未开启宕机自动迁移...

堡垒无法连接ECS排查步骤

问题描述 堡垒机调用ECS失败 可能原因【可能原因一】堡垒机到ECS服务器的网路端口通信失败【可能原因二】堡垒机的相关配置影响【可能原因三】ECS 系统自身的相关策略影响 解决方案【可能原因一】堡垒机到ECS服务器的网路端口通信失败【解决...

什么是AI通信加速库Deepnccl

scatter等算法,Hybrid+算法支持单机和多机的分层通信,充分利用单机内部高速带宽的同时降低了多机之间的通信量,通信算子编译优化方案相比NCCL原生在性能上提升了50%以上。通信多流优化:通常情况下,因网络带宽没有被充分利用,会导致...

什么是Deepytorch Training(训练加速)

scatter等算法,Hybrid+算法支持单机和多机的分层通信,充分利用单机内部高速带宽的同时降低了多机之间的通信量,通信算子编译优化方案相比NCCL原生在性能上提升了50%以上。通信多流优化:通常情况下,因网络带宽没有被充分利用,会导致...

主备方案介绍

故障自动容错原理:单机宕机和集群宕机测试结果如下。以下是单机宕机吞吐对比图和单机宕机平均响应对比图。以下是集群宕机吞吐对比图和集群宕机平均响应对比图。主备容灾原理介绍 当云数据库HBase实例因不可预料的原因(例如设备故障、机房...

经典网络和专有网络互通

确保和经典网络ECS实例通信的交换机的网段在10.111.0.0/16内。192.168.0.0/16 该VPC中不存在目标网段为10.0.0.0/8的自定义路由条目。需要在经典网络ECS实例中增加192.168.0.0/16指向私网网卡的路由。您可以使用提供的脚本添加路由,下载 ...

系统设置

网络设置 启用网络通信:设置指令系统与授权主机之间的通信状态,启用网络通信服务。授权地址:设置网络通信后端服务地址。服务主机:设置网络通信后端服务主机。服务路径:网络通信后端服务路径。消息设置 启用消息通信:启动网络消息通信...

云边通信组件Raven概述

为提升云边运维和监控能力,ACK Edge集群 引入了云边通信组件Raven。本文介绍Raven组件的基本概念、工作原理以及功能说明。云边协同架构的 跨地域网络通信 ACK Edge集群 采用中心云管理边缘IDC以及边缘设备的云边协同架构。分散在边缘侧的...

常见问题

否则说明事务云服务已宕机或者网络已中断。分布式事务 SDK 与事务云服务网络连接正常,但是通信失败,是什么原因?TCP 连接正常,说明事务云服务启动正常。分布式事务 SDK 与事务云服务通信返回失败消息,说明 SDK 发送给事务云服务的消息...

网络最大传输单元MTU

因此为了更好的性能,建议在MTU不匹配的通信场景下,通过 ModifyInstanceAttribute 接口关闭巨型帧,并重启ECS实例生效。ECS实例响应PMTUD机制依赖操作系统支持,要求操作系统支持且打开了PMTU响应(例如在Linux系统中,/proc/sys/...

数据类型

3.0 DingRtcUserOfflineReason 用户退出频道的原因。3.0 DingRtcVideoStreamType 相机流类型。3.0 DingRtcAudioTrack 音频流类型。3.0 DingRtcNetworkQuality 网络质量类型。3.0 DingRtcRenderMode 渲染模式。3.0 DingRtcRenderMirrorMode ...

功能发布记录

全部 ACK Edge发布Kubernetes 1.26版本说明 云边通信方案升级 从v1.26起,ACK Edge集群 新增支持云边节点池维度的网络通信,相比于原有方案实现了高可用、弹性伸缩能力,提供云边容器级别监控运维。新方案中由Raven组件负责云边通信,可...

交换机开通IPv6

如果交换机有和其他专有网络的交换机或本地数据中心通信的需求,请确保交换机的网段和要通信的网段不冲突。交换机网段不能与所属VPC路由表中路由的目标网段范围相同或大于该范围。重要 交换机创建后,不能再修改网段。IPv6网段 交换机的IPv...

SDK相关FAQ

一键登录和本号码校验相关FAQ 问题概览 首次取号时,App网络通信正常,但号码认证一直失败的原因?checkEnvAvailable函数返回false?Android双卡手机一键登录过程中,使用哪张移动数据卡进行认证?若终端使用的是中国联通SIM卡的5G移动...

VPC开通IPv6

如果交换机有和其他VPC的交换机或本地数据中心通信的需求,请确保交换机的网段和要通信的网段不冲突。交换机网段不能与所属VPC路由表中路由的目标网段范围相同或大于该范围。重要 交换机创建后,不能再修改网段。IPv6网段 配置交换机的IPv6...

搭建IPv6专有网络

如果交换机有和其他VPC的交换机或本地数据中心通信的需求,请确保交换机的网段和要通信的网段不冲突。说明 交换机创建后,不能再修改网段。IPv6网段 配置交换机的IPv6网段。交换机的IPv6网段的掩码默认为/64,您可以输入十进制数字0~255,...

搭建IPv6专有网络

如果交换机有和其他VPC的交换机或本地数据中心通信的需求,请确保交换机的网段和要通信的网段不冲突。说明 交换机创建后,不能再修改网段。IPv6网段 配置交换机的IPv6网段。交换机的IPv6网段的掩码默认为/64,您可以输入十进制数字0~255,...

搭建IPv4专有网络

如果交换机有和其他VPC的交换机或本地数据中心通信的需求,请确保交换机的网段和要通信的网段不冲突。说明 交换机创建后,不能再修改网段。IPv6网段 为交换机开启IPv6网段并配置交换机的IPv6网段。说明 如果您的VPC已分配IPv6网段,则需要...

M2M设备间通信

M2M(即Machine-to-Machine)是一种端对端通信技术。本章节以智能灯和手机App连接为例,分别使用规则引擎数据流转和Topic消息路由来实现M2M设备间通信,主要介绍如何基于物联网平台构建一个M2M设备间通信架构。智能灯与手机App的连接和通信...

创建和管理专有网络

如果交换机有和其他VPC的交换机或本地数据中心通信的需求,请确保交换机的网段和要通信的网段不冲突。说明 交换机创建后,不能再修改网段。IPv6网段 为交换机开启IPv6网段并配置交换机的IPv6网段。说明 如果您的VPC已分配IPv6网段,则需要...

支持IPv6专有网络下的资源访问IPv6互联网

如果交换机有和其他VPC的交换机或本地数据中心通信的需求,请确保交换机的网段和要通信的网段不冲突。说明 交换机创建后,不能再修改网段。IPv6网段 配置交换机的IPv6网段。交换机的IPv6网段的掩码默认为/64,您可以输入十进制数字0~255,...

查询网络通信距离(NCD)

使用NCD的原因 存在的问题 在特定物理网络拓扑下,不同GPU节点之间的通信时延和可能产生的跨多跳交换转发引发的哈希不均,都可能导致不同GPU节点之间的通信性能存在较大差异,进而进一步影响模型训练的吞吐差异。解决方法 如上图所示,...

路由表概述

一个交换机只能绑定一张路由表,交换机的路由策略由其关联的路由表管理。多个交换机可以绑定同一张路由表。交换机创建后,该交换机默认与系统路由表绑定。如果您需要将交换机绑定的自定义路由表更换成系统路由表,直接将自定义路由表与交换...

基于eRDMA增强型实例部署AI训练集群

主流AI框架底层通过多种不同的通信后端进行多或多卡通信,例如:MPI/Gloo后端多用于CPU的控制流通信。NCCL是由NVIDIA开源的GPU多多卡实现,旨在提供高效的大数据流通信。因此,它在性能优化方面具有得天独厚的优势,被广泛应用于主流AI...

产品优势

需自行发现宕机并完成迁移,迁移时服务会中断。稳定性无法保障。简单易用 一站式网络管理、实时管理覆盖区、无缝连接阿里云产品与物联网平台,用户搭建灵活简便。需要购买服务器搭建负载均衡分布式架构,需要花费大量人力物力开发“接入+...

通信消息相关问题

本文介绍设备与物联网平台和物联网平台与服务器端的通信相关问题和解决方法。类目 问题 上下行消息 设备重复收到消息,如何去重?设备使用MQTT协议接入物联网平台后,接收不到通信数据,怎么办?物联网平台发送消息比较慢,存在超时情况,...

API概览

通信监测 API 描述 DescribeCallList 分页查询时间范围内创建的通信信息。DescribeCall 获取单次通信详情。DescribeQoeMetricData 获取单次通信中用户的下行体验质量指标。DescribePubUserListBySubUser 根据订阅端获取通信中发布端用户...

统计分析

统计分析功能可以查询指定AppID下的活跃用户、频道、并发频道峰值及并发通信峰值,方便您监控和分析应用的使用情况。通过阅读本文,您可以了解统计分析的查询方法。操作步骤 登录 音视频通信RTC控制台。在左侧导航栏选择 统计分析,进入...

统计分析

统计分析功能可以查询指定AppID下的活跃用户、频道、并发频道峰值及并发通信峰值,方便您监控和分析应用的使用情况。通过阅读本文,您可以了解统计分析的查询方法。操作步骤 登录 音视频通信RTC控制台。在左侧导航栏选择 统计分析,进入...

ModifyInstance

Parameter.2.Code String 是 NetworkType 堡垒机的第2组属性的Code配置,设置为 NetworkType,表示设置堡垒机的网络。Parameter.2.Value String 是 vpc 堡垒机的第2组属性的Value配置,设置为 vpc,表示堡垒机实例采用VPC网络类型。...

修改主机的服务端口

目前堡垒对于服务器的RDP和SSH协议使用的是默认端口(RDP协议默认使用3389端口,SSH协议默认使用22端口),如果您在主机中自定义了端口,需要在服务端口中做相应修改。本文档介绍如何修改主机的服务端口。前提条件 在您修改服务端口前,...

清除主机指纹

当原主机指纹不适用时,比如经过系统重装操作导致主机指纹发生变化,您需要在堡垒中清除主机指纹,否则将无法通过堡垒进行正常运维。本文介绍清除主机指纹的具体操作。背景信息 堡垒通过主机指纹可以唯一识别一台Linux主机。清空主机...

通信监测

通信体验 根据默认规则或您单独配置的通信体验规则显示的通信体验评价。SDK 用户使用音视频通信SDK版本号。平台 用户使用音视频通信SDK平台。网络 通信时所在网络,包括WLAN、WiFi、4G。体验视图 可以打开或关闭体验视图。操作 端到端数据...

CreateInstance

Parameter.2.Code String 是 NetworkType 堡垒机的第2组属性的Code配置,设置为 NetworkType,表示设置堡垒机的网络。Parameter.2.Value String 是 vpc 堡垒机的第2组属性的Value配置,设置为 vpc,表示堡垒机实例采用VPC网络类型。...

DescribeCallList-分页查询时间范围内通信信息

调用DescribeCallList分页查询时间范围内创建的通信信息。接口说明 使用说明 本接口用于查询时间范围内创建的通信信息。例如:您可以查询通讯时长、状态、用户数等信息。QPS 限制 本接口的单用户 QPS 限制为 5 次/秒。超过限制,API 调用会...

通信监测

通信体验 根据默认规则或您单独配置的通信体验规则显示的通信体验评价。SDK 用户使用音视频通信SDK版本号。平台 用户使用音视频通信SDK平台。网络 通信时所在网络,包括WLAN、WiFi、4G。体验视图 可以打开或关闭体验视图。操作 查看端到端...

SFTP协议运维

输入堡垒机的运维地址、端口号(60022)和用户名,单击 OK。选择新建的堡垒机,单击 Connect。输入RAM用户名和密码,单击 OK。可选:如果RAM用户开启了MFA二次验证,需要输入从已绑定的MFA设备(即阿里云App)中获取的安全码,单击 OK。...

V3.2.20版本升级通知

尊敬的阿里云用户,您好:为了给您提供更优质的服务,我们计划从2021年07月12日开始逐步推送堡垒机的V3.2.20版本。V3.2.20版本在V3.2.18版本基础上,进行了更全面的功能优化,并且新增了多个功能模块,欢迎您升级体验。升级内容 堡垒机V3.2...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
短信服务 云数据库 Redis 版 运维安全中心(堡垒机) 物联网无线连接服务 边缘网络加速 弹性公网IP
新人特惠 爆款特惠 最新活动 免费试用