Windows系统实例的宕机问题排查

定位宕机原因 您可以通过以下方式,定位ECS实例发生宕机的具体原因。方式一:(推荐)通过自助诊断工具定位 登录 ECS管理控制台,左侧导航栏单击 自助问题排查。单击 实例问题排查 页签。选择 实例无法连接或启动异常>实例出现宕机,然后...

新建主机

导入或新建主机后,运维人员才可以通过堡垒运维管理该主机。导入阿里云ECS实例 您可以通过导入阿里云ECS实例方式批量导入当前阿里云账号中的ECS实例到堡垒。使用该功能前,请确保您已经创建了ECS实例,具体操作,请参见 连接方式概述。...

步骤1:同步阿里云ECS资产

登录堡垒系统。具体操作,请参见 登录系统。在左侧导航栏,选择 资产管理>主机。在 主机 页面,单击 导入ECS实例。在 选择区域 对话框中,选中需要同步的ECS实例所属的区域,单击 确定。在 导入ECS实例 对话框,选中需要导入的ECS实例,...

概览

本文将指导您在开通V3版本堡垒实例后,快速部署主机资产、堡垒用户、运维规则,并使用堡垒实现主机运维。在使用V3版本堡垒时,您可以按照以下步骤进行操作。任务 描述 步骤1:同步阿里云ECS资产 在使用堡垒进行主机运维前,管理...

步骤1:同步阿里云ECS资产

在使用堡垒进行主机运维前,管理员需要在堡垒实例中添加要管理的主机资产。本文将指导管理员在堡垒实例中导入当前阿里云账号下的ECS资产。前提条件 开通堡垒实例的阿里云账号下开通有ECS实例。关于如何开通ECS实例,请参见 创建ECS...

步骤1:同步阿里云ECS

在使用堡垒进行主机运维前,管理员需要在堡垒实例中添加要管理的主机资产。本文将指导管理员在堡垒实例中同步导入当前阿里云账号下的ECS资产。背景信息 除了同步阿里云ECS外,您还可以使用手动添加或批量添加的方式添加服务器。更多...

概览

本文将指导堡垒机管理员在开通V2版本堡垒实例后,快速部署主机资产、堡垒用户、运维授权,并使用堡垒实现运维和审计查询。使用限制 云盾堡垒系统支持通过SSH、SFTP、Windows远程桌面等协议的方式代理接入授权的服务器,并实现全程...

堡垒机管理员角色授权

重要 如果作为管理员角色的RAM用户需要导入阿里云资产或RAM用户,则至少需要给管理员授予对应资产或访问控制(RAM)的只读权限,例如,您要导入ECS资产时,管理员需要被授予ECS只读权限 AliyunECSReadOnlyAccess;您要导入RAM用户时,管理...

什么是AI分布式训练通信优化库AIACC-ACSpeed

如果机器本身是多卡或多机的加速比接近高线性度(即线性度接近于1),说明通信不是瓶颈,则ACSpeed的性能提升空间就会比较小。使用ACSpeed训练时,您需要了解以下特性含义。autotuner:ACSpeed默认开启autotuner功能,可以对通信算法进行自...

共享账户

新建共享账户 参照以下步骤新建共享账户:登录 云盾堡垒Web管理页。在左侧导航栏选择 资产>共享账户。在 共享账户 页面,单击 新建共享账户。在 新建共享账户 对话框中,输入 账户名称、登录名 和 密码,并选择 协议,完成创建共享账户。...

等保最佳实践

筛选状态异常用户 批量选择之后 删除、锁定用户 等 应授予管理用户所需的最小权限,实现管理用户的权限分离 堡垒机管理员角色支持管理员权限、审计员权限、只读权限和运维员权限,可以通过RAM授权配置多种管理权限。具体操作,请参见 堡垒...

告警规则指标说明

JVM实例数 无 是 当前实时运行的Java虚拟机实例数量,常用于服务宕机告警配置。节点机发送的字节数 无 不是 节点机通过网络连接发送的数据量,其中包括应用程序发送的数据、系统消息和错误信息等。节点机发送的报文数 无 不是 节点机通过...

常见问题

可能原因 您创建时选择的交换VSW使用了专有网络VPC的附加网段。CPFS不支持使用附加网段创建的交换。文件系统所在地域当前可用区储备已用尽,建议您更换可用区购买。解决方案 重新创建CPFS文件系统,并在选择交换或可用区时,更换可用...

步骤1:创建实例

同一地域不同可用区没有实质性区别,ECS实例访问同可用区Redis的性能比访问同地域其他可用区Redis更好,但差别较小。说明 选择 可用区类型 为 双可用区 时,您还需要指定 备可用区,且 备可用区 需要与 主可用区 不同。主备可用区共同组成...

主机管理

主机管理用于管理目标主机的IP、名称、协议、控制策略、添加、导入、导出、编辑等功能。新建主机 您可以 登录云盾堡垒Web管理页,在 资产>主机管理 页面创建主机,创建方式包括:手动创建、同步阿里云ECS、从本地文件导入。手动创建 单击...

压测Spring Cloud服务

背景信息 在大促活动中,应该准备多少实例资源才能满足大促吞吐量的要求,降低因大促活动带来的访问量暴增进而引发系统宕机的风险。此时需要合理地评估服务性能,避免流量冲击引发的故障,并降低运营使用成本。创建压测场景 登录 EDAS控制...

应用场景

​ 高可靠:在宕机、网络故障等情况下,严格保证数据一致性。节约成本:节省运维成本,避免了分布式场景下产生的数据异常。节省开发成本,像使用单机事务一样使用分布式事务。推荐搭配 ECS 和 MQ 使用。通用分布式事务管理 提供通用的分布...

产品优势

支持宕机迁移、数据快照备份和回滚、系统性能报警。容灾备份:每份数据多份副本,单份损坏可在短时间内快速恢复。安全性:支持配置安全组规则、云盾防DDoS系统、多用户隔离、防止密码破解。可控性:作为云服务器ECS用户,您拥有超级管理员...

托管密码概述

托管密码是密钥管理服务KMS(Key Management Service)提供的一项重要功能,助您在阿里云上轻松使用具有合规资质的硬件密码。硬件密码是一种执行密码运算、安全生成和存储密钥的硬件设备。通过将密钥托管在这些高安全等级的硬件设备...

开源对比

无法跳过有问题消息的消费处理,无法处理新生产的消息,从而会导致消息大量堆积引起内存问题,导致消息服务宕机。用户名、密码 通过阿里云访问控制(RAM)的AccessKey和AccessKey Secret生成用户名和密码,详情请参见 静态用户名密码管理。...

AIACC-ACSpeed性能数据

相比较通过原生DDP训练模型后的性能数据,使用AIACC-ACSpeed训练多个模型时,性能具有明显提升。本文为您展示了AIACC-ACSpeed的部分典型模型的训练性能数据。测试版本 ACSpeed版本:1.0.2 Cuda版本:11.1 torch版本:1.8.1+cu111 实例类型...

消息通知

堡垒提供消息通知功能,支持多种通知类型,您可以通过设置相关配置项,通过短信、邮箱、站内信向管理员或运维员发送消息通知,及时了解业务情况。本文介绍如何使用消息通知功能。登录 堡垒控制台,在顶部菜单栏,选择堡垒所在的地域...

登录实例

开通云盾堡垒机实例后,您需要启用并登录实例,才能使用指定实例下的服务。操作步骤 登录 云盾...在 管理 对话框中,选择 内网接入 或 公网接入,即通过内网还是公网连接云盾堡垒机的Web管理页面。执行结果 成功登录指定的云盾堡垒机实例。

管理资产组

您可以按照业务需要创建不同的资产组,然后将同一类型的主机添加到资产组,实现对主机的分类管理和批量操作。添加资产组 登录堡垒系统。具体操作,请参见 登录堡垒系统。在左侧导航栏,选择 资产管理>资产组。在 资产组 页面,单击 ...

HTTPS设置

重要 打开此开关后,由于施压有额外的性能开销,建议扩展施压IP数。扩展施压IP数的具体操作,请参见 扩展施压。SSL协议 SSL协议版本为客户端支持的最高SSL版本。PTS目前支持 TLSv1.2 与 TLSv1.3 协议版本,默认为 TLSv1.3。如果您...

扩展施压

扩展施压数量可以有效降低单台施压负载,避免施压成为性能瓶颈,确保压测结果准确可信。应用场景 施压网络带宽瓶颈 表现为单机流量在10 MB左右,并发和TPS没有达到目标且不再增加,同时RT值上升。常见于压测HTML、图片等静态资源或...

服务器管理

在云盾堡垒机的Web管理页面,您可以执行以下服务器相关的操作:添加、修改、移除等。添加服务器 您可以使用三种方式来添加服务器:同步阿里云ECS、手动添加、和批量添加。同步阿里云ECS 同步ECS云服务器指将您阿里云账号中的ECS实例列表...

HTTPS设置

在串联链路每一次循环执行时,会重新初始化SSL状态,即每次串联链路的执行都会重新完成SSL上下文配置,这样可以更准确模拟每次循环代表不同用户的压测场景,但同时需要您注意开启循环重置SSL状态后会导致施压额外的性能开销。使用场景 ...

扩展施压

扩展施压数量可以有效降低单台施压负载,避免施压成为性能瓶颈,确保压测结果准确可信。应用场景 施压网络带宽瓶颈 表现为单机流量在10 MB左右,并发和TPS没有达到目标且不再增加,同时RT值上升。常见于压测HTML、图片等静态资源或...

什么是AI通信加速库Deepnccl

scatter等算法,Hybrid+算法支持单机和多机的分层通信,充分利用单机内部高速带宽的同时降低了多机之间的通信量,通信算子编译优化方案相比NCCL原生在性能上提升了50%以上。通信多流优化:通常情况下,因网络带宽没有被充分利用,会导致...

产品优势

需自行发现宕机并完成迁移,迁移时服务会中断。稳定性无法保障。简单易用 一站式网络管理、实时管理覆盖区、无缝连接阿里云产品与物联网平台,用户搭建灵活简便。需要购买服务器搭建负载均衡分布式架构,需要花费大量人力物力开发“接入+...

什么是Deepytorch Training(训练加速)

scatter等算法,Hybrid+算法支持单机和多机的分层通信,充分利用单机内部高速带宽的同时降低了多机之间的通信量,通信算子编译优化方案相比NCCL原生在性能上提升了50%以上。通信多流优化:通常情况下,因网络带宽没有被充分利用,会导致...

管理实例权限

管理员或DBA需要细粒度地管理实例的性能查看、查询、导出或变更权限,则需要为实例开启安全托管功能。开启操作,请参见 开启安全托管。说明 安全协同实例默认已开启安全托管。操作步骤 登录 数据管理DMS 5.0。在顶部菜单栏中,选择 数据...

产品规格

为更好地匹配E-HPC的高性能计算特点,下文推荐了几种规格,建议您根据应用场景选择使用。关于ECS实例规格的更多信息,请参见 实例规格族 和 选型最佳实践。弹性裸金属服务器和超级计算集群(SCC)实例 如下实例无虚拟化损耗,同时提供VPC...

使用mount命令挂载ext4文件系统

当软件发生崩溃或者硬件发生宕机时,如果使用默认的挂载方式(不指定挂载参数)挂载文件系统,由于部分用户数据、文件系统元数据仍在内存中未写入硬盘,因此会有数据丢失的风险。如果使用本场景推荐的挂载参数,任何内存的修改都会同步写入...

产品优势

安全可靠 DTS底层为服务集群,如果集群内任何一个节点宕机或发生故障,控制中心都能够将这个节点上的所有任务快速切换到其他节点上,链路稳定性高。DTS内部对部分传输链路提供7×24小时的数据准确性校验,快速发现并纠正传输数据,保障传输...

概览

在 测试数据概览 中查看当前应用的 兼容测试、功能测试、远程真调试、性能测试、用例管理 和 脚本数量。测试/功能项 说明 操作入口 兼容测试 自动化兼容测试,Crash/ANR检测效果强大,能够快速检测出应用的潜在问题,并提供详细原因分析...

为什么选择安全沙箱?

本文介绍安全沙箱运行时的核心优势、适用场景,并对比容器服务Kubernetes版(ACK)安全沙箱和社区Kata Containers的性能,帮助您了解为什么选择安全沙箱运行时。背景信息 相比原有Docker运行时,安全沙箱为您提供了一种新的容器运行时选项...

性能数据

密钥管理服务KMS(Key Management Service)根据调用的API不同提供的性能数据不同,性能数据越高费用也越高。本文介绍KMS的具体性能数据。概述 KMS提供了两种API,KMS API和KMS实例API。需要注意的是,KMS API请求配额是针对每个阿里云账号...

集群性能监控概述

云数据库 OceanBase 为您提供集群实例的数据库性能和主机性能监控功能,可在 OceanBase 管理控制台中查看监控数据,还支持自定义监控能力,您可按需配置常用监控指标作为自定义监控面板。查看监控数据 进入 OceanBase 管理控制台。在左侧...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
运维安全中心(堡垒机) 轻量应用服务器 商标服务 云数据库 Redis 版 云安全中心 弹性公网IP
新人特惠 爆款特惠 最新活动 免费试用