如何收集操作系统宕机后的内核转储信息?

背景信息 阿里云技术支持人员可以通过在转储文件中找到对应的信息,从而分析操作系统宕机的原因,并同步给用户。说明 您也可以通过Windows平台的 WinDbg 工具和Linux平台的 crash 工具来检查操作系统内核的转储文件。Linux实例 远程连接ECS...

Windows系统实例的宕机问题排查

定位宕机原因 您可以通过以下方式,定位ECS实例发生宕机的具体原因。方式一:(推荐)通过自助诊断工具定位 登录 ECS管理控制台,左侧导航栏单击 自助问题排查。单击 实例问题排查 页签。选择 实例无法连接或启动异常>实例出现宕机,然后...

什么是AI分布式训练通信优化库AIACC-ACSpeed

优化方法 相比较传统的ring-allreduce算法,ACSpeed设计的hybrid-allreduce算法实现了单机和多机的分层训练,充分利用单机内部高速带宽同时降低机之间低速网络的通信量,并且针对阿里云不同机型的网卡和GPU距离的拓扑特点,实现多种不同...

主备方案介绍

主备容灾:当云数据库HBase实例因不可预料的原因(例如设备故障、机房断电断等)发生故障,容灾机制可用于保障数据的一致性和业务可用性。功能优势 主备双活:请求低毛刺。故障自动容错。资源利用率高。主备容灾:支持云数据库HBase、EMR...

常见退信内容分析

是由对方邮件服务商的服务器宕机或网络互联质量不佳造成的。另外,系统对此类投递情况会自动尝试转由负责中继的万网海外邮局进行再投递,以提高投递的成功率。您可以稍后重新尝试此邮件的投递。Error in command/Syntax error 无法识别的...

ModifyInstance

Parameter.2.Code String 是 NetworkType 堡垒机的第2组属性的Code配置,设置为 NetworkType,表示设置堡垒机的网络。Parameter.2.Value String 是 vpc 堡垒机的第2组属性的Value配置,设置为 vpc,表示堡垒机实例采用VPC网络类型。...

客户端无法连接堡垒机的常见场景及解决方法

概述 在使用堡垒机的过程中,可能会出现配置完成后,客户端无法正常连接堡垒机的场景。本文主要介绍无法连接堡垒机的常见场景及解决方法。详细信息 以下为无法连接堡垒机的常见场景及解决方法,请根据现场情况选择以下对应的步骤。问题现象...

CreateInstance

Parameter.2.Code String 是 NetworkType 堡垒机的第2组属性的Code配置,设置为 NetworkType,表示设置堡垒机的网络。Parameter.2.Value String 是 vpc 堡垒机的第2组属性的Value配置,设置为 vpc,表示堡垒机实例采用VPC网络类型。...

边缘一体管理控制台简介

控制台介绍 边缘一体机管理控制台,是边缘一体机的本地管理控制台,可离线管理边缘一体机。边缘一体机管理控制台提供的功能如下表格所示。功能 说明 网络配置 在静态网络环境下,边缘一体机无法获取网络IP地址,从而无法激活和连接到云端。...

如何使用网络域功能

当您的服务器分布在不同网络环境中且与堡垒机所在专有网络(VPC)网络不互通,推荐使用堡垒机的网络域功能。您可以为这些服务器配置一台代理服务器,然后在堡垒机中创建网络域并成功连接到代理服务器,通过代理服务器运维其他服务器。

使用多机MPP对海量数据分析提速

判断某条SQL语句是否会通过列存索引的多机并行能力执行 当判断出某条SQL语句可以使用列存索引的并行执行能力后,您可以通过查看某条SQL语句的执行计划来查看是否会使用列存索引的多机并行能力。若执行计划中有 Exchange算子,则表示该SQL...

SAP HANA Scale-Out 部署指南

当您的 ECS 实例所宿的物理机由于底层性能出现异常,或者其他原因导致物理机宕机时,宕机迁移功能通过技术检测确认机器无法恢复之后,会立刻发送短信通知 ECS 实例拥有者。迁移完成后,阿里云会再次发送迁移完成的短信,且 ECS 实例的...

网站耗资源(客户程序故障)常见问题

由于我们是对主机服务器进行实时监控的,出现问题后必须马上采取措施,否则将会导致服务器宕机,所以发出此通知信的同时,已将您的网站暂停,希望您能理解,因此给您带来的不便向您表示深深的歉意,谢谢您的支持与理解。云虚拟主机会因为...

边缘计算一体部署实践

部署说明 为保障边缘计算一体正常运行,推荐以下部署实践:在激活边缘计算一体时,连网配置的网络部署在局域内,并且不要为边缘计算一体分配固定公网IP。在激活部署完边缘计算一体后,立即更改密码。登录边缘一体管理控制台 在...

使用实例时镜像相关问题

cd/root/rpmbuild/RPMS/aarch64 rpm-ivh kexec-tools-2.0.15-51.el7.aarch64.rpm 如果再次发生宕机,通过 ls-lh/var/crash 查询dump文件,可以正常生成 vmcore 文件,表示问题已解决。CentOS/RedHat 7.x升级Systemd重启进入救援模式如何...

VMware虚拟机无代理迁移

vCenter Server是一项服务,用于管理网络中连接的多个主机,并将主机资源池化。开源虚拟化格式OVF(Open Virtualization Format)文件是一种开源的文件规范,它描述了一个开源、安全、有效、可拓展的便携式虚拟打包以及软件分布格式,它...

如何解决实例迁移后的宕机问题?

因Xen环境裁撤项目、ECS过保迁移、经典网络迁移到VPC等涉及虚拟化环境迁移需求,可能会导致一部分实例系统在迁移后出现kernel panic宕机、蓝屏、找不到引导设备(INACCESSIBLE_BOOT_DEVICE)等问题。本文主要为您介绍这些问题的解决方案。...

常见问题

否则说明事务云服务已宕机或者网络已中断。分布式事务 SDK 与事务云服务网络连接正常,但是通信失败,是什么原因?TCP 连接正常,说明事务云服务启动正常。分布式事务 SDK 与事务云服务通信返回失败消息,说明 SDK 发送给事务云服务的消息...

ECS实例宕机并报错“Out of memory and no killable ...

如果您的ECS实例出现宕机,并且报错日志中存在 Out of memory and no killable processes 信息,则可以参考本文提供的方案解决问题。问题现象 ECS实例在运行过程中出现宕机,并且有类似于如下所示的调用栈:[28663.625353][pid]uid tgid ...

无法连接Windows实例

问题原因 无法连接Windows实例的原因,不同的问题原因均可能导致无法连接Windows实例。此处列举较为常见的问题原因,具体原因以现场排查结果为准。防火墙配置异常。远程访问端口的配置异常。CPU负载过高。安全组公网规则错误。修改管理...

网络域

如果您想统一运维分布在不同网络环境中或与堡垒机所在专有网络(VPC)网络不互通的服务器,推荐使用堡垒机的网络域功能。您可以为这些服务器配置一台代理服务器,然后在堡垒机中创建网络域并成功连接到代理服务器,通过代理服务器运维其他...

告警规则指标说明

JVM实例数 无 是 当前实时运行的Java虚拟机实例数量,常用于服务宕机告警配置。节点机发送的字节数 无 不是 节点机通过网络连接发送的数据量,其中包括应用程序发送的数据、系统消息和错误信息等。节点机发送的报文数 无 不是 节点机通过...

配置主机账户

信息,请参见 网络诊断。关于验证密码时报错的解决方法,请参见 堡垒新建主机账户验密报错,该如何解决?清除密码 定位到需要清除密码的登录名,单击 密码 列的 清除。设置SSH私钥认证 如果您运维的主机通过SSH密钥方式登录,可以...

设置宕机自动迁移

为了降低物理故障对业务的影响,阿里云为您提供专有宿主机DDH宕机自动迁移的功能。本章节介绍在创建DDH后如何开启或者关闭宕机自动迁移。背景信息 宕机自动迁移开启后,当DDH因故障停机时,会自动迁移至健康的DDH。若您未开启宕机自动迁移...

查询网络通信距离(NCD)

使用NCD的原因 存在的问题 在特定物理网络拓扑下,不同GPU节点之间的通信时延和可能产生的跨跳交换转发引发的哈希不均,都可能导致不同GPU节点之间的通信性能存在较大差异,进而进一步影响模型训练的吞吐差异。解决方法 如上图所示,...

更新故障详情

P1 故障等级 relatedServiceId Long Body 否 123 关联服务 progressSummary String Body 否 进展摘要xxxx 进展摘要 preliminaryReason String Body 否 原因是服务宕机 初步原因 mainHandlerId Long Body 否 678 主要处理人 feedback String...

硬件终端配置网络打印机

由于网络隔离的原因,直接选择网络连接可能无法正常探测到打印机,此处请选中 确定是否希望在不连接打印机的情况下安装软件。说明 若对应厂家的驱动程序无此选项,请检查是否有 自定义安装 等类似功能,如果没有,可采取Windows的 INF驱动...

基础设施安全

云企业是一种VPC互连的解决方案,可以实现企业内部个VPC之间的网络互通。通过云企业,可以将企业内部所有VPC互相连接起来,为您打造一张灵活、可靠、大规模的企业级云上网络。详细信息,请参见 什么是云企业。网关终端节点是一个...

功能发布记录

2019年09月 更新事项 描述 卫星及无人遥感影像分析产品公测发布 依托于阿里巴巴达摩院在深度学习,计算机视觉方向上的技术积累,采用基于深度学习的多尺度融合检测技术,实现了卫星及无人影像中的变化特征及建筑、土地、河流等多种目标...

使用限制

ECS实例 限制项 限制 向公共云迁移 仅支持将运作状态正常的ECS实例冷迁移至公共云,不支持将宕机的ECS实例迁移至公共云,迁移方式不支持热迁移。宕机迁移 当宕机的ECS实例数量大于云盒内对应实例规格可供创建的ECS实例数量时,不支持宕机...

Linux系统实例的宕机问题排查

定位宕机原因 您可以通过以下方式,定位发生宕机的具体原因。方式一:(推荐)通过自助诊断工具定位 登录 ECS管理控制台,左侧导航栏单击 自助问题排查。单击 实例问题排查 页签。选择 实例无法连接或启动异常>实例出现宕机,然后选择出现...

步骤三:部署CDR网关

在配置了高可用(HA)vSphere集群上,如果CDR网关所在的Esxi宕机,网关会在同集群其他Esxi服务器上运行起来,宕机时间取决于vSphere集群的HA配置。建议您提高网关虚机重启优先级,以尽量缩短虚机启动时间。对于vSphere 6.5以上版本,您可以...

清除主机指纹

当原主机指纹不适用时,比如经过系统重装操作导致主机指纹发生变化,您需要在堡垒中清除主机指纹,否则将无法通过堡垒进行正常运维。本文介绍清除主机指纹的具体操作。背景信息 堡垒通过主机指纹可以唯一识别一台Linux主机。清空主机...

使用限制

没有例外 自动宕机迁移 本地SSD型DDH不支持自动宕机迁移。没有例外 ECS实例使用的镜像限制 在中国内地以外的地域,ddh.c6s、ddh.g6s或ddh.r6s规格的DDH不支持使用Windows镜像创建ECS实例。没有例外 ECS实例数量限制 以下DDH规格单台DDH上最...

修改主机的服务端口

批量修改主机的服务端口 如果个主机的同一协议使用的是相同的端口号,您可以通过以下步骤批量修改主机的服务端口:登录堡垒系统,具体操作请参见 登录堡垒系统。在左侧导航栏单击 资产管理>主机。在 主机 页面,选中需要批量修改服务...

交换机开通IPv6

VPC 开通IPv6网段后,您还可以为同一VPC内的其他交换配置IPv6网段,使同一VPC下不同交换内的云资源能通过IPv6地址私通信。支持IPv6网关的地域 区域 地域 中国 华北1(青岛)、华北2(北京)、华北3(张家口)、华北5(呼和浩特)、...

步骤一:搭建云上专有网络

搭建云上专有网络(VPC)是开始利用...输入复制网络交换机的 名称,选择 可用区,IPv4网段 选择 10.0.3.0/24。重要 确保与恢复网络交换机位于同一个可用区。单击 确定。专有网络VPC实例与相关交换机创建成功。后续步骤 步骤二:创建容灾站点对

按用户授权主机

堡垒提供按用户授权主机的功能。当您新建用户之后,您可以为该用户授权主机。授权后该用户即可使用堡垒运维已授权的主机。本文介绍如何为用户授权主机。授权主机 为用户授权主机,具体操作请参见以下步骤:登录堡垒系统。具体操作,...

按用户组授权主机

堡垒提供按用户组授权主机的功能。当您新建用户组之后,您可以为该用户组授权主机。授权后用户组内的用户即可使用堡垒运维已授权的主机。本文介绍如何为用户组授权主机。授权主机 登录堡垒系统。具体操作,请参见 登录系统。在左侧...

虚拟机迁移

选择要运行虚拟机的 主机、集群、资源池 或 vApp,然后单击 NEXT。说明 兼容性问题将显示在“兼容性”面板中,解决“兼容性”问题后,再选择目标主机进行迁移,或者直接选择其它主机。为所有已连接到有效 源网络 的虚拟机网络适配器选择 ...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
云企业网 NAT网关 共享流量包 弹性公网IP 负载均衡 短信服务
新人特惠 爆款特惠 最新活动 免费试用