如何收集操作系统宕机后的内核转储信息?

背景信息 阿里云技术支持人员可以通过在转储文件中找到对应的信息,从而分析操作系统宕机的原因,并同步给用户。说明 您也可以通过Windows平台的 WinDbg 工具和Linux平台的 crash 工具来检查操作系统内核的转储文件。Linux实例 远程连接ECS...

Windows系统实例的宕机问题排查

定位宕机原因 您可以通过以下方式,定位ECS实例发生宕机的具体原因。方式一:(推荐)通过自助诊断工具定位 登录 ECS管理控制台,左侧导航栏单击 自助问题排查。单击 实例问题排查 页签。选择 实例无法连接或启动异常>实例出现宕机,然后...

主机选项说明

开启会话备注 登录主机时需要写明登录主机的原因或目的才可登录,便于事后审计。开启历史会话审计 表示允许堡垒对运维会话内容进行审计,关闭后会产生会话记录,但没有具体内容。开启实时会话监控 表示管理员可以对主机进行实时监控,...

系统管理

网络配置 可管理边缘一体机的有线网络和蜂窝网络配置。详细操作和说明,请参见 网络配置。运维配置 登录边缘一体管理控制台。在左侧导航栏单击 系 统管理,然后单击 运维配置 页签。您可以重新启动边缘一体,或者恢复边缘一体到出厂...

设置宕机自动迁移

为了降低物理故障对业务的影响,阿里云为您提供专有宿主机DDH宕机自动迁移的功能。本章节介绍在创建DDH后如何开启或者关闭宕机自动迁移。背景信息 宕机自动迁移开启后,当DDH因故障停机时,会自动迁移至健康的DDH。若您未开启宕机自动迁移...

堡垒无法连接ECS排查步骤

问题描述 堡垒机调用ECS失败 可能原因【可能原因一】堡垒机到ECS服务器的网路端口通信失败【可能原因二】堡垒机的相关配置影响【可能原因三】ECS 系统自身的相关策略影响 解决方案【可能原因一】堡垒机到ECS服务器的网路端口通信失败【解决...

主备方案介绍

故障自动容错原理:单机宕机和集群宕机测试结果如下。以下是单机宕机吞吐对比图和单机宕机平均响应对比图。以下是集群宕机吞吐对比图和集群宕机平均响应对比图。主备容灾原理介绍 当云数据库HBase实例因不可预料的原因(例如设备故障、机房...

什么是AI通信加速库Deepnccl

scatter等算法,Hybrid+算法支持单机和多机的分层通信,充分利用单机内部高速带宽的同时降低了多机之间的通信量,通信算子编译优化方案相比NCCL原生在性能上提升了50%以上。通信多流优化:通常情况下,因网络带宽没有被充分利用,会导致...

什么是Deepytorch Training(训练加速)

scatter等算法,Hybrid+算法支持单机和多机的分层通信,充分利用单机内部高速带宽的同时降低了多机之间的通信量,通信算子编译优化方案相比NCCL原生在性能上提升了50%以上。通信多流优化:通常情况下,因网络带宽没有被充分利用,会导致...

经典网络和专有网络互通

确保和经典网络ECS实例通信的交换机的网段在10.111.0.0/16内。192.168.0.0/16 该VPC中不存在目标网段为10.0.0.0/8的自定义路由条目。需要在经典网络ECS实例中增加192.168.0.0/16指向私网网卡的路由。您可以使用提供的脚本添加路由,下载 ...

系统设置

网络设置 启用网络通信:设置指令系统与授权主机之间的通信状态,启用网络通信服务。授权地址:设置网络通信后端服务地址。服务主机:设置网络通信后端服务主机。服务路径:网络通信后端服务路径。消息设置 启用消息通信:启动网络消息通信...

在经典网络中使用SSL-VPN

确保和经典网络ECS实例通信的交换机的网段在10.111.0.0/16内。192.168.0.0/16 该VPC中不存在目标网段为10.0.0.0/8的自定义路由条目。需要在经典网络ECS实例中增加192.168.0.0/16指向私网网卡的路由。您可以使用提供的脚本添加路由,下载 ...

单机旁挂动态路由上云

配置OSPF动态路由协议,建立智能接入网关设备和三层交换机的网络通信通道。在 设备管理 页签左侧区域,单击 路由管理。在 OSPF协议配置 区域,单击 编辑。在 配置OSPF路由协议 页面,输入规划好的IP地址信息,然后单击 确定。参数 说明 ...

云边通信组件Raven概述

为提升云边运维和监控能力,ACK Edge集群 引入了云边通信组件Raven。本文介绍Raven组件的基本概念、工作原理以及功能说明。云边协同架构的 跨地域网络通信 ACK Edge集群 采用中心云管理边缘IDC以及边缘设备的云边协同架构。分散在边缘侧的...

常见问题

否则说明事务云服务已宕机或者网络已中断。分布式事务 SDK 与事务云服务网络连接正常,但是通信失败,是什么原因?TCP 连接正常,说明事务云服务启动正常。分布式事务 SDK 与事务云服务通信返回失败消息,说明 SDK 发送给事务云服务的消息...

告警规则指标说明

JVM实例数 无 是 当前实时运行的Java虚拟机实例数量,常用于服务宕机告警配置。节点机发送的字节数 无 不是 节点机通过网络连接发送的数据量,其中包括应用程序发送的数据、系统消息和错误信息等。节点机发送的报文数 无 不是 节点机通过...

网络最大传输单元MTU

理论上MTU越大,可在单个数据包中传递的数据越多,网络通信越高效。本文介绍巨型帧相关功能以及如何修改ECS实例网卡的MTU。巨型帧(Jumbo frames)巨型帧是指有效负载超过IEEE 802.3标准所限制的1500字节的以太网帧,增大的有效载荷百分比...

隔离VPC使用共享服务

您的VPC网络实例所在的地域和交换机的可用区支持企业版转发路由器。关于企业版转发路由器支持的地域和可用区信息,请参见 企业版转发路由器支持的地域和可用区。配置流程 步骤一:创建云企业网实例 在您连接网络实例前,您需要先创建一个云...

DescribeDedicatedHosts-查询专有宿主机详细信息

ddh.g5 LockReason string 否 专有宿主机被锁定的原因。取值范围:financial:因欠费被锁定。security:因安全原因被锁定。financial PageNumber integer 否 响应信息的页码数。默认值:1。1 PageSize integer 否 响应信息的每页行数。最大...

在容器(Docker)中配置eRDMA

eRDMA(Elastic Remote Direct Memory Access)是一种高性能网络通信技术,将eRDMA功能引入容器(Docker)环境可以实现容器应用程序绕过操作系统内核直接访问主机的物理eRDMA设备,从而提供更快的数据传输和通信效率,适用于在容器中需要大...

蓝牙设备端开发

阿里云IoT生活物联网平台对低功耗蓝牙通信类型(BLE)的设备,提供了Breeze协议接入方案,可以便捷实现App-设备-云的完整链路。背景介绍 本文主要介绍在具备低功耗蓝牙(BLE)能力的设备端上,如何集成Breeze协议,并与手机端App建立连接、...

功能发布记录

全部 ACK Edge发布Kubernetes 1.26版本说明 云边通信方案升级 从v1.26起,ACK Edge集群 新增支持云边节点池维度的网络通信,相比于原有方案实现了高可用、弹性伸缩能力,提供云边容器级别监控运维。新方案中由Raven组件负责云边通信,可...

SDK相关FAQ

一键登录和本号码校验相关FAQ 问题概览 首次取号时,App网络通信正常,但号码认证一直失败的原因?checkEnvAvailable函数返回false?Android双卡手机一键登录过程中,使用哪张移动数据卡进行认证?若终端使用的是中国联通SIM卡的5G移动...

交换机开通IPv6

如果交换机有和其他专有网络的交换机或本地数据中心通信的需求,请确保交换机的网段和要通信的网段不冲突。交换机网段不能与所属VPC路由表中路由的目标网段范围相同或大于该范围。重要 交换机创建后,不能再修改网段。IPv6网段 交换机的IPv...

VPC开通IPv6

如果交换机有和其他VPC的交换机或本地数据中心通信的需求,请确保交换机的网段和要通信的网段不冲突。交换机网段不能与所属VPC路由表中路由的目标网段范围相同或大于该范围。重要 交换机创建后,不能再修改网段。IPv6网段 配置交换机的IPv6...

什么是AI分布式训练通信优化库AIACC-ACSpeed

优化方法 相比较传统的ring-allreduce算法,ACSpeed设计的hybrid-allreduce算法实现了单机和多机的分层训练,充分利用单机内部高速带宽同时降低多机之间低速网络的通信量,并且针对阿里云不同机型的网卡和GPU距离的拓扑特点,实现多种不同...

搭建IPv6专有网络

如果交换机有和其他VPC的交换机或本地数据中心通信的需求,请确保交换机的网段和要通信的网段不冲突。说明 交换机创建后,不能再修改网段。IPv6网段 配置交换机的IPv6网段。交换机的IPv6网段的掩码默认为/64,您可以输入十进制数字0~255,...

搭建IPv6专有网络

如果交换机有和其他VPC的交换机或本地数据中心通信的需求,请确保交换机的网段和要通信的网段不冲突。说明 交换机创建后,不能再修改网段。IPv6网段 配置交换机的IPv6网段。交换机的IPv6网段的掩码默认为/64,您可以输入十进制数字0~255,...

搭建IPv4专有网络

如果交换机有和其他VPC的交换机或本地数据中心通信的需求,请确保交换机的网段和要通信的网段不冲突。说明 交换机创建后,不能再修改网段。IPv6网段 为交换机开启IPv6网段并配置交换机的IPv6网段。说明 如果您的VPC已分配IPv6网段,则需要...

创建和管理交换机

如果交换机有和其他VPC的交换机或本地数据中心通信的需求,请确保交换机的网段和要通信的网段不冲突。说明 交换机创建成功后,不能再修改网段。IPv6网段 为交换机开启IPv6网段并配置交换机的IPv6网段。说明 如果您的VPC已分配IPv6网段,则...

M2M设备间通信

M2M(即Machine-to-Machine)是一种端对端通信技术。本章节以智能灯和手机App连接为例,分别使用规则引擎数据流转和Topic消息路由来实现M2M设备间通信,主要介绍如何基于物联网平台构建一个M2M设备间通信架构。智能灯与手机App的连接和通信...

创建和管理专有网络

如果交换机有和其他VPC的交换机或本地数据中心通信的需求,请确保交换机的网段和要通信的网段不冲突。说明 交换机创建后,不能再修改网段。IPv6网段 为交换机开启IPv6网段并配置交换机的IPv6网段。说明 如果您的VPC已分配IPv6网段,则需要...

支持IPv6专有网络下的资源访问IPv6互联网

如果交换机有和其他VPC的交换机或本地数据中心通信的需求,请确保交换机的网段和要通信的网段不冲突。说明 交换机创建后,不能再修改网段。IPv6网段 配置交换机的IPv6网段。交换机的IPv6网段的掩码默认为/64,您可以输入十进制数字0~255,...

准备工作

如果交换机有和其他专有网络的交换机或本地数据中心通信的需求,请确保交换机的网段和要通信的网段不冲突。说明 交换机创建后,不能再修改网段。可用IP数 显示可以使用的IP地址的数量。IPv6网段 交换机的IPv6网段。交换机的IPv6网段的掩码...

产品优势

需自行发现宕机并完成迁移,迁移时服务会中断。稳定性无法保障。简单易用 一站式网络管理、实时管理覆盖区、无缝连接阿里云产品与物联网平台,用户搭建灵活简便。需要购买服务器搭建负载均衡分布式架构,需要花费大量人力物力开发“接入+...

查询网络通信距离(NCD)

使用NCD的原因 存在的问题 在特定物理网络拓扑下,不同GPU节点之间的通信时延和可能产生的跨多跳交换转发引发的哈希不均,都可能导致不同GPU节点之间的通信性能存在较大差异,进而进一步影响模型训练的吞吐差异。解决方法 如上图所示,...

创建和管理路由表

您可以在 已绑定交换机 页签,在 交换机 列单击交换机的ID,跳转到交换机详情页面,然后单击 路由管理 页签,在 已绑定路由表 处,查看该交换机绑定的路由表为自定义路由表。解绑交换机和路由表 在路由表详情页面,单击 已绑定交换机 页签...

路由表概述

一个交换机只能绑定一张路由表,交换机的路由策略由其关联的路由表管理。多个交换机可以绑定同一张路由表。交换机创建后,该交换机默认与系统路由表绑定。如果您需要将交换机绑定的自定义路由表更换成系统路由表,直接将自定义路由表与交换...

通信消息相关问题

本文介绍设备与物联网平台和物联网平台与服务器端的通信相关问题和解决方法。类目 问题 上下行消息 设备重复收到消息,如何去重?设备使用MQTT协议接入物联网平台后,接收不到通信数据,怎么办?物联网平台发送消息比较慢,存在超时情况,...

基于eRDMA增强型实例部署AI训练集群

在NCCL底层通信链接上,有多种不同的传输方式,例如单机内部多卡P2P通信以及多上的传统socket通信(如VPC网络)和高性能的InfiniBand(IB)通信,其中eRDMA是一种基于RDMA的传输方式,具有极低的延迟,并且在性能上接近RDMA网络的优势。...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
短信服务 物联网无线连接服务 云数据库 Redis 版 运维安全中心(堡垒机) 边缘网络加速 弹性公网IP
新人特惠 爆款特惠 最新活动 免费试用