什么是AI分布式训练通信优化库AIACC-ACSpeed

优化方法 基于上述问题,ACSpeed充分利用高带宽的nvilnk互联来实现AllReduce算法(例如GPU0与GPU3等),可以在单机通信出现瓶颈时,额外带来性能增益。针对上述V100实例的nvlink组合,ACSpeed实现一套n-trees算法,扩展单机内部不同tree的...

查询网络通信距离(NCD)

使用NCD的原因 存在的问题 在特定物理网络拓扑下,不同GPU节点之间的通信时延和可能产生的跨多跳交换机转发引发的哈希不均,都可能导致不同GPU节点之间的通信性能存在较大差异,进而进一步影响模型训练的吞吐差异。解决方法 如上图所示,...

使用ping命令丢包或不通时的链路测试方法

当客户端访问目标服务器或负载均衡,使用ping命令测试出现丢包或网络不通时,可以通过链路测试工具进行链路测试来判断问题来源。本文介绍如何使用链路测试工具进行链路测试。链路测试流程 通常情况下,链路测试流程如下图所示。链路测试...

常见问题

本文介绍在使用ossfs时遇到的一些问题案例及解决...ossfs在使用libcurl进行HTTPS通信出现问题,可能是由于libcurl依赖的NSS(Network Security Services)库版本过低导致的。解决方案:使用以下代码,升级NSS库至最新版本。yum update nss

Ark 服务通信

为了解决 Biz 之间的通信问题,SOFAArk 引入了 SOFABoot 提供的 SofaService/SofaReference 编程界面,本文介绍它的使用方法。说明 如果要解决 Plugin 和 Biz 的通信问题,可发布和引用插件服务。操作方式,请参见 Ark 服务机制。引入依赖 ...

发布日志

增加音频焦点事件通知,解决外部通话等操作导致音量异常的问题。增加推流之后客户端手动横竖屏切换能力。修复yuv输入视频推流crash问题。修复支持外部视频输入的渲染模式设置不生效问题。V1.17@2020-03-07 支持RACE美颜输出。音视频数据回...

Linux系统常用内核网络参数介绍与常见问题处理

本文介绍常见的Linux系统内核网络参数及常见问题解决方案。注意事项 在修改内核参数前,您需要注意以下几点:从实际需求出发,尽量有相关数据的支撑,不建议您随意调整内核参数。了解参数的具体作用,需注意不同类型或版本的环境中,内核...

发布日志

V2.5.5@2021-12-06 解决断网重连后稳定性的问题。V2.5.4@2021-12-02 新增支持G.711音频编码格式。V2.5.3@2021-09-23 优化首帧耗时。新增支持三百人大方会议能力。修复突发低带宽收敛过程中语音优先失效问题。完善埋点日志。新增支持动态...

功能发布记录(2.0)

V2.5.5@2021-12-06 解决断网重连后稳定性的问题。V2.5.4@2021-12-02 新增支持G.711音频编码格式。V2.5.3@2021-09-23 优化首帧耗时。新增支持三百人大方会议能力。修复突发低带宽收敛过程中语音优先失效问题。完善埋点日志。新增支持动态...

IPsec-VPN连接常见问题

本文汇总了建立IPsec-VPN连接时出现协商失败、流量不通现象的常见原因并提供了相应的解决方案。常见问题快捷链接 IPsec-VPN连接协商问题 IPsec连接状态为“第一阶段协商失败”怎么办?IPsec连接状态为“第二阶段协商失败”怎么办?IPsec...

使用Spark on MaxCompute访问Lindorm时...超时的解决方法

使用Spark on MaxCompute访问Lindorm实例时可能会出现Connection Timeout的报错,这可能涉及Spark on MaxCompute的网络架构和数据通信方式等方面的影响。本文介绍出现Connection Timeout报错的原因和解决方法。问题描述 使用Spark on ...

网络FAQ

网络性能问题 不同地域内的ECS实例通过公网通信通信丢包概率如何?如果相同地域下的ECS实例通过内网通信,网络延迟性能如何?没有明确标注连接数规格的实例,如何保障连接数性能?在ECS实例上UDP PPS测试或者TCP带宽测试时性能不稳定,...

常见问题

本文汇总云企业网产品的常见问题。常见问题快捷链接 问题分类 快捷链接 基本问题 云企业网支持同地域跨账号VPC实例互通么?云企业网支持同账号跨地域VPC实例互通么?一个地域只能创建一个转发路由器实例么?云企业网与(高速通道)VBR上连...

Kubernetes集群网络异常的排查方法

问题描述 在Kubernetes集群内,某个节点上的Pod出现网络访问异常,具体现象如下所示:Pod访问外网异常。Pod访问其他Service异常。Pod访问其他节点上的Pod异常。问题原因 集群内ECS的安全组配置错误或者冲突。集群内VPC的路由表条目配置错误...

Ark 服务机制

SOFAArk 定义了两种服务类型,用于解决应用和插件、应用和应用之间的通信问题。本文将分别介绍这两种服务类型。插件服务 SOFAArk 允许在 Plugin 通过 PluginContext 发布和引用服务,也可以使用注解@ArkInject 引用服务。为了方便开发高级...

云边通信组件Raven概述

为了解决上述问题,v1.26.3及以上版本的 ACK Edge集群 提供了Raven组件,以实现云边运维以及容器网络通信。工作原理 以下图为例,列出了典型的云边协同场景。节点池A:云节点池。所有节点在一个VPC内,选择一个主机作为网关节点(图例为...

Nginx Ingress异常问题排查

排查思路 问题现象 解决方案 访问不通 集群内部Pod到Ingress访问不通 集群内访问集群LoadBalancer暴露的SLB地址不通 Ingress访问自己不通 无法访问Ingress Controller自己 无法访问TCP、UDP服务 添加TCP、UDP服务 HTTPS访问出现问题 ...

Nginx Ingress异常问题排查

排查思路 问题现象 解决方案 访问不通 集群内部Pod到Ingress访问不通 集群内访问集群LoadBalancer暴露的SLB地址不通 Ingress访问自己不通 无法访问Ingress Controller自己 无法访问TCP、UDP服务 添加TCP、UDP服务 HTTPS访问出现问题 ...

运行日志

广播通信功能的例程运行后,您可以在设备端 和物联网平台 查看日志信息。前提条件 已配置C Link SDK的广播通信功能的例程,详细信息,请参见 使用示例。...后续步骤 运行日志中出现的错误信息,请参见 常见错误码,根据提示解决问题

私域运营

每个云电脑内登录一个微信,无需重复购买硬件 纯净系统更流畅:精简云电脑系统,内部仅允许安装微信及可需工具,随时保持云电脑使用流畅 云电脑协同提效:云电脑出现问题时,管理员远程协助快速解决;需要同事协助时,发送请求同事协同操作...

Tunnel命令常见问题

本文为您介绍使用Tunnel命令过程中的常见问题问题类别 常见问题 Tunnel Upload Tunnel Upload是否支持通配符或正则表达式?Tunnel Upload对文件大小是否有限制?记录大小是否有限制?是否要使用压缩?同一个表或分区是否可以并行上传数据...

常见问题

本文介绍在使用ossutil时可能出现问题及处理方法。说明 本文各命令行示例均基于Linux 64位系统,其他系统请将命令开头的./ossutil64 替换成对应的Binary名称。详情请参见 命令行工具ossutil命令参考。低频存储或标准存储的文件是否支持...

共享内存通信(SMC)常见问题

问题原因 某些服务器实现上没有严格准守TCP规范,在处理TCP options时,可能重放TCP options,导致SMC协议识别出现问题。说明 A TCP implementation MUST(MUST-6)ignore without error any TCP Option it does not implement,assuming that...

写入与查询

本文介绍 AnalyticDB MySQL 中写入与查询的常见问题解决方法。说明 当常见问题场景中未明确产品系列时,表明该问题仅适用于 AnalyticDB MySQL 数仓版(3.0)。常见问题概览 湖仓版(3.0)集群是否支持通过JDBC方式查询Hudi表的数据?湖仓...

常见问题

任务运行常见问题 如果在迁移运行过程中出现问题,您可以先查看任务运行日志。单机部署:运行日志的文件路径为 logs/ossimport2.log。分布式部署:运行日志的文件路径为 logs/import.log。执行任何命令均报错 UnsupportedClassVersionError...

异地双活切流

说明 单元(地域)间通信出现故障,将流量,主数据库全部切换到主单元(地域)。a.MSHA会自动将备单元的流量切零。b.单击 下一步,进入 容灾切换预览,在预览页,可以看到单元前后比例的对比,和 当前切流服务,如果和您预期不符,请返回 ...

什么是Topic

在发布/订阅消息的MQTT协议中,Topic用于定义消息传输的通道和路径,设备通过Topic将消息发布到物联网平台,物联网平台将消息发送给订阅Topic的设备。为方便海量设备基于...常见问题 物模型相关问题 消息通信相关问题 Link SDK运行相关问题

常见报错

如果出现节点失联或者无法分配分片的情况,需要先解决这些问题,具体操作如下:登录Kibana控制台。查看未分配的分片。GET/_cluster/allocation/explain 说明 如果集群中没有未分配的分片,则返回error。重新分配失败的分片。POST/_cluster/...

Windows实例通过外部访问网络不通的处理

从公网客户端访问到阿里云ECS会经过多跳网络链路,此类网络不通有非常多的可能原因,此处介绍如下几种可能。公网客户端的自身网络问题。公网ISP运营商的管控。公网客户端访问的异常行为触发Windows实例的安全组策略导致网络管控。Windows...

设备未上线问题

本文主要描述Link IoT Edge专业版和标准版的边缘实例中,子设备未上线时的定位问题思路及解决方法。设备接入到网关后称为网关子设备,若子设备显示未激活、离线或禁用等状态时,请根据如下步骤定位并处理问题。步骤一:确保安装并启动Link ...

Link Visual SDK更新记录

解决设备录像点播在P2P下可能出现的花屏及问题 2023-6-1 Link Visual视频Media SDK LinkVisual视频Media SDK iOS 2.4.1-ilop 支持低帧率(如1fps)数据源的播放 解决按时间回放设备录像高倍数抽帧播放时可能存在的画面静止一段时间的...

连接问题

本文介绍使用3.x和2.3.0版本的C Link SDK接入设备时,可能遇到的问题解决方法。背景信息 如果您尚未接入物联网平台,推荐使用最新版本的SDK。更信息,请参见 概述。为什么SDK传入的心跳间隔时间和MQTT Connect包的连接参数不一致?SDK...

浏览器兼容性和已知问题

Webkit issue iOS15.x使用蓝牙耳机播放音频时有概率失真,建议增加提示使用用户蓝牙耳机可能会出现问题,或升级系统版本。Webkit issue iOS 15.0 至 15.3 上的浏览器及内嵌 WKWebView 的应用听到远端音频音量低,建议升级系统版本。Webkit ...

NFS v4.x版本中可能存在的已知问题

由于该问题出现概率极低,您可根据实际需要按照以下步骤升级内核版本修复该问题。重要 升级内核版本可能会导致系统无法开机等风险,请谨慎操作。升级内核前,请确保您已创建快照或自定义镜像备份数据。具体操作,请参见 创建一个云盘快照 ...

出现OOM Killer的原因及解决方案

解决方案 请您结合实际出现的OOM Killer场景,按照以下步骤排查并解决问题:子cgroup或 父cgroup 内存不足 建议您自行评估实例内当前占用内存的进程情况,及时清理不需要的进程,以释放内存。如果您的业务所需的内存较大,当前实例规格不...

RDMA:使用高性能网络进行分布式训练

NCCL_DEBUG 通常将日志级别设置为INFO,这样可以获得更NCCL相关的日志输出,有助于定位和解决潜在问题。NCCL_IB_HCA 需要指定RDMA通信的网卡。在不同的算力节点下IBdev的数量和命名规则有所区别,若未配置或配置错误可能会导致性能受损。...

OSS存储卷FAQ

类型 问题 挂载问题 OSS存储卷挂载时间延长 OSS存储挂载权限问题 OSS静态卷挂载失败 使用问题 OSS静态卷访问Bucket过慢 OSS控制台看到文件大小为0 文件目录挂载后,显示为文件对象 OSS服务端监控到大量异常请求流量 通过OSS存储卷写入的...

SSL-VPN连接常见问题

本文汇总了建立SSL-VPN连接时出现客户端连接失败、流量不通现象的常见原因并提供了相应的解决方案。常见问题快捷链接 客户端连接问题 客户端连接失败怎么办?客户端之前连接成功,但间歇性中断下线怎么办?仅部分客户端连接成功怎么办?SSL...

通信消息相关问题

本文介绍设备与物联网平台和物联网平台与服务器端的通信相关问题解决方法。类目 问题 上下行消息 设备重复收到消息,如何去重?设备使用MQTT协议接入物联网平台后,接收不到通信数据,怎么办?物联网平台发送消息比较慢,存在超时情况,...

ALB健康检查异常排查方法

健康检查参数设置错误 监听端口问题 如果您是配置成功后健康检查出现异常,主要原因是后端服务器出现问题。可以通过以下三类原因进行排查。安全类防护软件问题 路由配置错误问题 后端服务器负载过高 解决方案 首次配置健康检查出现异常 ...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
音视频通信 商标服务 边缘网络加速 短信服务 物联网无线连接服务 弹性公网IP
新人特惠 爆款特惠 最新活动 免费试用