自助诊断GPU节点问题

ACK集群提供节点级别的GPU诊断功能,供您进行部分GPU相关问题的故障排查。如果您在ACK Pro版集群中使用GPU节点时遇到问题,可以启用GPU节点自助诊断,采集GPU诊断的基础指标进行问题排查。本文介绍如何使用节点诊断功能,自助排查GPU节点...

网络架构容灾

网络是数字世界的基础设施,没有网络的联通,所有信息都无法交互,因此网络架构的设计在应用系统中至关重要,特别是针对网络架构的高可用及容灾能力的设计,是业务在异常发生时,实现快速恢复、降低业务损失的关键。云上网络规划设计 为...

通过SAG APP访问云手机(内网)

配置SAG APP,电脑、手机等终端可以通过SAG APP从本地远程访问云上VPC中部署的云手机。本文介绍如何通过SAG APP通过私网连接云手机。前提条件 已创建云手机并分配公网IPv4地址。具体操作,请参见 创建云手机。本示例以在华东1(杭州)...

基本概念

资源管理 资源管理,实现系统资产和配置管理功能,提供各类资源及其相关属性的维护管理,范围不仅包括设备、服务器和IoT之类物理资源,也包括IP地址、业务链路等逻辑资源。设备 一般指IP网数通类网络通信设备,比如交换机、路由器、防火墙...

地址池配置

永远在线:此工作模式系统将认为该IP地址永远处于正常状态,DNS解析始终向用户返回该IP地址,健康检查对永远在线的IP地址进行监控并告警,但是不执行告警的IP地址摘除、添加和故障切换动作。永远离线:系统认为该IP地址永远处于异常状态...

报警演练

容器演练中的报警演练功能通过触发模拟事件,验证集群监控报警设置是否开启,并统计报警成功率、以及事件触发到监控报警的平均延迟,从而验证Kubernetes集群监控报警系统的有效性。AHAS的报警演练支持批量触发报警和定时触发报警,本文介绍...

套餐定价

Linux操作系统的套餐 说明 Linux操作系统的套餐是指当您选择Linux系统的应用镜像,或者CentOS、Debian及Ubuntu等基于Linux的系统镜像,可以选用的套餐配置。套餐配置 24元/月的套餐 34元/月的套餐 67元/月的套餐 133元/月的套餐 256元/月...

ECS服务器的外网地址ping不通的排查方法

Windows系统:具体操作请参见 Windows实例ping外网地址提示“一般故障”。运营商问题:检查运营商是否存在网络问题,如公网运营商链路中断,路由震荡等。具体操作请参见 使用ping命令丢包或不通时的链路测试方法。相关文档 ECS实例间ping...

本地设备通过公网无法连接Redis的常见问题排查

返回结果图示 Linux Linux系统执行该命令将会持续发送Ping请求,您可以按下键盘上的Ctrl+C键停止执行并统计结果,如下图。Windows Windows系统会在4次Ping之后显示测试结果,如下图。如果返回信息类似 0 packets received,100.0%packet ...

实例的节点故障处理机制

当节点发生故障后系统会对故障节点进行检查与修复。节点故障期间实例的相关服务不可用。说明 单节点实例适用于测试、培训、非核心业务等场景,生产环境建议使用副本集实例或分片集群实例以保障服务的高可用性。副本集 图 1.副本集架构 ...

如何管理故障

更新故障通知:在故障处理的过程中,当故障进展发生变化,包括进度更新、影响恶化、故障等级变化、原因明确、根因定位等场景下,可更新故障过程中的内容,并在 故障详情 页点击更新故障通知,选择需要的故障通告类型,并最终确认发出故障...

AP在管理控制显示已注册但一直显示未激活

问题症状 云AP在购买后插上网线,但是在控制台上显示未激活。解决方案 AP已插好网线,并通电。这是客户经常反馈的问题,首先客户需要了解:AP完成注册,第一次成功上线,会激活。AP一直显示未激活,需要检查连接AP的网线是否能够访问云AP...

ECS无法连接Redis的常见问题排查

返回结果图示 Linux Linux系统执行该命令将会持续发送Ping请求,您可以按下键盘上的Ctrl+C键停止执行并统计结果,如下图。Windows Windows系统会在4次Ping之后显示测试结果,如下图。如果Ping不通,说明网络未连通。常见的原因和解决方法...

DT-PID V2.1.0

功能说明 PID控制器是最常见的单变量基础控制器,其算法简单、鲁棒性好和可靠性高,被广泛应用于工业过程控制,广泛适用于没有精确模型的控制系统,对于可建立精确数学模型的确定性控制系统也具有较好的精确控制能力。PID控制又称为比例、...

流水单据型业务场景多活实践

说明 基于MSHA流量监控或其他监控能力,确定业务稳态的监控指标,以便在故障发生时判断故障影响面以及在故障恢复判断业务的实际恢复情况。演练预期如下:下单链路对订单应用是强依赖,强依赖故障会影响业务不可用。故障爆炸半径控制在...

如何查看安全加速SCDN是否已生效

详细信息 在域名服务商添加完CNAME记录,不同的服务商CNAME生效的时间也不同,一般新增的CNAME记录会立即生效,修改的CNAME记录会需要较长时间生效。您可以 ping 或 dig 您所添加的加速域名,如果被转向*.*scdn*.com 的域名,即表示CNAME...

如何查看CDN节点是否生效

概述 本文主要介绍将源站业务配置到CDN,如何查看CDN节点是否生效。详细信息 可通过以下三种方法查看CDN节点是否生效,请根据现场实际情况,选择下列对应的步骤:方法一:通过ping或dig的方式查看所添加的加速域名 方法二:在CDN控制台中...

读多写少型业务场景多活实践

说明 基于MSHA流量监控或其他监控能力,确定业务稳态的监控指标,以便在故障发生时判断故障影响面以及在故障恢复判断业务的实际恢复情况。演练预期如下:导购链路对购物车应用是弱依赖(导购页会展示用户放入购物车的商品数量),弱依赖...

操作系统迁移(Linux)

控制台和目标操作系统显示一致 应用需要重新部署 系统盘数据不保留 ECS内执行迁移脚本★脚本操作,纯脚本日志 ECS内操作,有操作风险★需手动创建快照★迁移方案社区支持★控制台不感知ECS内部变化,控制台和目标操作系统显示不一致 同版本...

Linux系统ping默认DNS地址时出现“sendmsg:Operation ...

问题描述 访问网站慢,ping默认DNS地址显示如下。ping本地回环地址显示如下。ping:sendmsg:Operation not permitted 系统负载不高,网络线路通畅,资料库无死锁进程。系统日志出现大量信息,如下所示。kernel:printk:xxxx messages ...

灾备方案

图 1.Tair 容灾架构演进 灾备方案 灾备级别 说明 单可用区高可用方案★主备节点部署在同一可用区中的不同机器上,当任一节点发生故障时,由高可用HA(High Availability)系统自动执行故障切换,避免单点故障引起的服务中断。同城容灾方案...

灾备方案介绍

图 1.Redis容灾架构演进 灾备方案 灾备级别 说明 单可用区高可用方案★主备节点部署在同一可用区中的不同机器上,当任一节点发生故障时,由高可用HA(High Availability)系统自动执行故障切换,避免单点故障引起的服务中断。同城容灾方案...

进入Linux系统的单用户模式

在某些特殊场景下(例如排查Linux实例启动故障、修复系统异常、维护硬盘分区或root用户被锁定,需要修改密码),您可以通过Linux系统系统引导器(GRUB)进入单用户模式进行操作。在该模式下,只启动最基本的组件和服务,并且操作者拥有...

容灾预案

配置完成系统会假设在此配置的地址池故障,并按照您配置的访问策略执行切换。5.执行 创建容灾预案完成,您需要到容灾预案列表页,操作区域单击 执行 按钮。系统则会将故障地址池中的地址全部设置为 永远离线 的工作模式,地址池状态...

通过VPN网关实现本地数据中心访问阿里云NAS

确认ping,在本地数据中心的服务器上挂载VPC内的文件系统。具体操作,请参见 挂载文件系统。跨地域挂载文件系统至ECS 已部署一台VPN网关时跨地域挂载文件系统 此处以处于不同地域的VPC1和VPC2为例进行说明。创建文件系统和挂载点。登录...

日志管理

本文介绍如何在本地块网关控制台上传、下载日志。背景信息 本地网关控制台支持上传、下载日志。选择 下载日志,可将日志信息打包生成gz格式并下载到本地主机。选择 上传日志,可将日志上传至阿里云云存储网关服务器。如果发生故障,您可以...

接入ARMS监控

故障演练时通过接入应用实时监控服务ARMS(Application Real-Time Monitoring Service)可以对演练过程的指标进行监控,包含JVM内存、JVM线程数、JVMGC相关、网络出入口流量、磁盘、CPU等指标。本文介绍如何在故障演练中接入ARMS并监控演练...

智能接入网关vCPE FAQ

在宿主机部署完SAG vCPE,运行docker ps命令查看已有容器,控制显示离线状态,管控隧道状态为异常,怎么处理?部署SAG vCPE镜像时报错,怎么处理?当部署SAG vCPE镜像执行脚本出现访问被拒时,怎么处理?部署SAG vCPE镜像完成,序列...

日志管理

本文介绍如何在本地网关控制台上传、下载日志。背景信息 本地网关控制台支持上传、下载日志。选择 下载日志,可将日志信息打包生成gz格式并下载到本地客户机。选择 上传日志,可将日志上传至阿里云云存储网关服务器。如果发生故障,您可以...

智能接入网关App FAQ

智能接入网关App中有一条限制,当您本月在智能接入网关控制台进行删除账号操作,会先将底层数据删除,然后保留一条数据作为计费使用,页面当前显示的数据就是保留的统计计费所用的数据,这条数据会在下个月自动删除。阿里云网络客户端...

无法远程连接ECS实例

说明 如果您曾经通过安全组规则、访问控制系统内的防火墙等工具禁止ECS实例被ping通,则可以忽略此问题,继续执行 步骤二:检查远程连接的端口。步骤二:检查远程连接的端口 确认网络正常,执行如下命令,测试ECS实例远程连接端口的...

跨可用区容灾

当生产站点因为不可抗力因素(比如机房火灾、断电)或者设备故障(软、硬件破坏)导致应用在短时间内无法恢复时,ECS容灾服务支持业务的跨可用区(Availability Zone)的容灾能力,对整体的应用做容灾备份来应对单地区的故障,满足业务的...

AICS实现对SISO非积分对象的稳定控制

在IGate中建立MPC闭环控制系统的MV/CV/DV测点,存储下控制系统在辨识试验激励下运行产生的数据。下面以闭环系统辨识为例,介绍辨识工具使用过程。新增模型。进入 系统辨识 新增模型 页面,输入自定义的辨识模型名称并选择节点及字段,选中...

跨地域容灾

容灾系统部署在阿里云的两个地域中,当生产站点发生故障(例如海啸、地震)时,业务系统切换到容灾站点。生产站点和容灾站点部署在不同的地域,提供容灾即服务,RPO低至1分钟、RTO低至15分钟的高可靠的业务持续性保障,有效避免了地域性...

步骤五:应用容灾

当被保护的服务器完成阿里云复制服务(AReS)安装并重启,您就可以对受保护的服务器启动、停止容灾复制、故障切换、容灾演练等一系列的应用容灾操作。前提条件 已安装阿里云复制服务。更多信息,请参见 步骤四:安装阿里云复制服务。操作...

实例启动异常常见错误与对应解决方案

针对实例启动过程中因操作系统内配置异常、异常关机等问题导致操作系统无法正常启动的情况,您可以通过VNC登录实例发现的启动异常或者实例健康诊断工具返回的异常字段,在本文查看此类问题的解决方案。Windows 1662001135:Windows系统因...

SSL-VPN连接常见问题

客户端断开连接系统大约5分钟会释放资源。查看客户端连接信息,请参见 查看SSL客户端的连接信息。修改SSL服务端使用的 协议 为 TCP,然后重新下载安装SSL客户端证书。具体操作,请参见 修改SSL服务端 和 下载SSL客户端证书。使用UDP...

创建和管理VPC对等连接

创建了VPC对等连接,两个VPC之间可以实现私网互通。本文介绍如何创建和管理VPC对等连接。前提条件 您已创建需要建立VPC对等连接的VPC。如果需要创建跨账号VPC对等连接,需确保发起端和接收端账号均已创建VPC。具体操作,请参见 创建和...

配置健康检查

将边界路由器VBR(Virtual Border Router)连接至云企业网实例,您可以通过云企业网的健康检查功能探测VBR实例关联的物理专线的连通性。在云企业网和本地数据中心存在冗余路由的场景下,健康检查探测到物理专线故障后支持自动切换到可用...

跨地域容灾

容灾系统部署在阿里云的两个地域中,当生产站点发生故障(例如海啸、地震)时,业务系统切换到容灾站点。生产站点和容灾站点部署在不同的地域,提供容灾即服务,RPO低至1分钟、RTO低至15分钟的高可靠的业务持续性保障,有效避免了地域性...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
云消息队列 RocketMQ 版 云安全中心 文件存储NAS 负载均衡 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用