词汇表

高速通道的专线避免互联网网络质量稳定的问题,同时免去数据在传输过程中被窃取的风险。更多信息,请参见 什么是高速通道。可用区 可用区AZ(Availability Zone)是指在同一地域内,电力和网络互相独立的物理区域。例如,华北2(北京...

EasyCkpt:AI大模型高性能状态保存恢复

功能介绍 针对频繁故障的情况,PAI通过之前的故障失败场景总结出以下GPU和深度学习场景故障的功能特点:特点1:任务的故障是部分的。通常,故障的根因是一到两台机器的故障,这只会影响部分Worker。对于大规模分布式训练任务而言,不会所有...

使用说明

如果设备的业务程序与远程登录程序在同一进程,会导致设备不可使用远程登录功能。您可以将业务程序与远程登录程序进行进程隔离,以保证设备在故障时可以进行远程运维。流程图 说明 远程登录信息会过期,需要定期更新请求。业务进程和运维...

设备接入引导

当您希望将设备接入阿里云物联网平台,实现设备集中管理、收集和数据分析、远程控制、保障设备数据安全等能力时,请根据本文的设备接入流程引导,选择设备使用协议并进行云端和设备端开发。前提条件 开通 物联网平台服务。说明 免费开通后...

ECS灾备解决方案

同时云备份基于 云盘异步复制功能,还提供ECS跨地域、跨可用区容灾方案,具备多机一致性、多机编排能力,快速实现应用级别的故障切换、故障恢复等操作,保障用户业务的连续性。更多信息,请参见 ECS容灾(云盘异步复制型)。通过高可用...

CLB健康检查FAQ

重要 如果关闭健康检查,当后端某个服务器健康检查出现异常时,负载均衡还是会把请求转发到该异常的ECS实例上,造成部分业务不可访问。如果您的业务对负载敏感性高,高频率的健康检查探测可能会对正常业务访问造成影响。您可以结合业务情况...

GxP欧盟附录11标准合规包

13.1 应报告和评估所有事件,而仅仅是系统故障和数据错误。应确定重大事件的根本原因,并应成为纠正和预防行动的基础。使用云安全中心企业版 使用云安全中心企业版或者更高级别的版本,视为“合规”。1.1 风险管理应贯穿计算机化系统的...

附录:SOFAStack 产品目录

应用场景 传统应用微服务改造 通过微服务产品将传统金融业务系统拆分为模块化、标准化、松耦合、插拔、扩展的微服务架构,缩短产品面世周期,快速上架,抢占市场待机;不仅确保客户服务的效率,也降低了运营成本。高并发业务快速...

设备日志上报

物联网平台支持设备将本地日志上报到云端,在控制台进行查询和故障分析。说明 使用了以下Link SDK的设备端支持本地日志上报,您也可以自行开发带有本地日志上报功能的SDK。Android SDK C SDK:日志上报 您在 设备详情 页,开启 设备本地...

运维服务内容说明

因客户自身原因导致的问题故障属于阿里云运维服务范围。如客户有定期现场服务需求,按天购买运维专家现场服务。运维服务专家帮助客户进行疑难问题现场处理,故障现场救援,变更现场保障、现场运维培训等服务。运维专家现场服务需...

OTA升级概述

OTA(Over-the-Air Technology)即空中下载技术,基于无线网络对设备固件、软件或驱动进行更新。通过OTA升级,可以对物联网设备更新功能、修复漏洞、优化性能。本文介绍如何为接入物联网平台的设备进行OTA升级。使用限制 使用OTA功能的设备...

常见问题

产品系列 目标系列 集群版 单节点 高压缩引擎(X-Engine)源系列 集群版 无 支持 支持 单节点 支持 无 支持 高压缩引擎(X-Engine)支持 支持 无 Q:单节点 系列是如何保证服务可用性和数据可靠性呢?A:单节点 是基于单个计算...

配置健康检查

在云企业网和本地数据中心存在冗余路由的场景下,健康检查探测到物理专线故障后支持自动切换到可用路由,保障流量传输中断。背景信息 工作原理 在您为VBR实例配置健康检查后,阿里云默认每隔2秒从每个健康检查源IP地址向本地数据中心的...

常见问题

A:PolarDB 采用双活(Active-Active)的高可用集群架构,读写的主节点和只读节点之间自动进行故障切换(Failover),系统自动选举新的主节点。PolarDB 每个节点都有一个故障切换(Failover)优先级,决定了故障切换时被选举为主节点的...

故障演练常见问题

故障不生效的原因较多,可能是参数配置正确或无对应的请求命中,但故障规则已成功下发,故需要计费。刚刚购买的资源包为什么会被扣减次数?因为购买前已产生欠费,购买资源包后会先扣减所欠的次数。子账号的消费是否独立计费?不是,与主...

快照概述

如果您需要从ECS实例维度为该实例中的所有云盘创建快照,实现ECS整机备份或者整机克隆,您可以使用云备份的 ECS整机备份 功能。什么是快照 快照是某一时间点云盘数据状态的备份文件。云盘创建的第一份快照是创建时间点云盘上所有数据块的全...

专家成长计划技术培训课程

现场面授(特殊情况调整为线上钉钉群直播)阿里云云计算ACP认证技术详解 3天 30人 ECS\SLB\VPC\RDS\安全\ESS\OSS\CDN的概念、架构、原理、定义和操作使用,内容涵盖了ACP云计算认证的考试范围,但是并局限于ACP考试范围。现场面授...

节点异常问题排查

本文目录 类别 内容 诊断流程 诊断流程 常见排查方法 节点故障诊断 检查节点的详情 检查节点的状态 检查节点的事件 检查节点的诊断日志 检查节点的关键组件 检查节点的监控 检查节点的安全组 常见问题及解决方案 节点关键组件异常处理 ...

节点异常问题排查

本文目录 类别 内容 诊断流程 诊断流程 常见排查方法 节点故障诊断 检查节点的详情 检查节点的状态 检查节点的事件 检查节点的诊断日志 检查节点的关键组件 检查节点的监控 检查节点的安全组 常见问题及解决方案 节点关键组件异常处理 ...

存储类型

通用云盘 通用云盘兼容ESSD云盘的所有特性,基础能力与ESSD PL1云盘相同,在ESSD云盘的基础上提供了IO突发能力和IO加速能力:IO突发能力:使云盘的IOPS受限于最大IOPS,在业务波峰时提供更高的IO能力,满足突发业务需求。IO加速能力:...

存储类型

MySQL SSD云盘 SSD云盘,是基于分布式存储架构的弹性块存储设备,实现计算与存储分离。说明 SSD云盘分批下线中,建议使用ESSD云盘。更多信息,请参见【通知】部分RDS实例不再提供SSD云盘售卖。MySQL、PostgreSQL、SQL Server、MariaDB 通用...

远程配置

说明 远程配置功能是从产品维度修改设备配置,即从物联网平台上传的配置文件对所有设备生效,不可指定对单个设备生效。功能说明 物联网平台远程配置功能支持:开启或关闭产品的远程配置。在线编辑配置文件,并管理版本。从物联网平台推送...

概述

背景信息 远程配置功能是从产品维度修改设备配置,即从物联网平台上传的配置文件对所有设备生效,不可指定对单个设备生效。更多信息,请参见 远程配置。功能原理 应用程序通过调用C Link SDK的API,基于 MQTT协议的连接,主动获取物联网...

重启设备

网络故障时,重启设备可消除部分软件故障。背景信息 重启设备一般有两种方法:通过关闭或打开设备电源进行重启。通过智能接入网关控制台,远程重启设备。关闭或打开设备电源 警告 您通过关闭或打开设备电源进行重启时,请注意保存设备的...

DeviceLinkDown

告警信息 事件名称 事件级别 状态码 状态描述 DeviceLinkDown CRITICAL linkdown Device Link State Change 可能原因 用户侧交换机设备故障。用户侧交换机配置故障。用户侧交换机和设备的连线问题。处理方法 检查用户侧交换机。...

应用场景

场景一:面向大中型企业的多地容灾高可用网络架构 当本地数据中心的关键业务对可用性要求极高时,建议在多个接入点建立专线连接,该拓扑确保了因光纤切断、设备故障或接入点位置故障导致的连接故障的恢复能力。自主申请专线和共享合作伙伴...

DeviceSwitched

告警信息 事件名称 事件级别 状态码 状态描述 DeviceSwitched CRITICAL switched Device Role Changed 可能原因 智能接入网关主设备故障。智能接入网关主设备动态路由邻居故障。处理方法 无需处理。icmsDocProps={'productMethod':'created...

追加设备

已创建的拉取任务,如需进一步扩大终端设备的拉取范围,基于已有任务,以相同的方式指定追加的终端设备,无需重新创建拉取任务。前提条件 已创建拉取任务。具体操作请参见 新建任务。使用限制 拉取模式 为 智能拉取 的任务,无法追加设备...

远程登录

例如,实际业务场景中设备的业务功能和运维功能需彼此隔离,在业务功能异常的设备不在线时,继续远程管理该设备。设备端开发,请参见 设备主动开启远程登录示例。重要 物联网平台下发的SSH远程通道认证信息有效期为7天。请配置设备周期性...

设备多连接

如果设备消息的QPS(每秒消息量)超过平台的限制(30 QPS),会导致超出部分的消息不可达,物联网平台的单设备多连接能力可以提高设备消息的QPS上限。本文为您介绍物联网平台的单设备多连接能力。前提条件 已获取设备认证信息。已获取SDK。...

故障协同处理(基于钉钉)

2.故障应急场景群:事件升级故障后,群内推出 故障处理中 消息卡片,如果满足自动生成故障场景群的需求(下文详细介绍创建故障场景群逻辑),故障场景群内同时推出 故障处理中 消息卡片。本群故障消息卡片包含按钮:签到、签到记录、应急...

优势

管理简单 分钟级万台设备的监控部署能力,故障自动恢复,集群伸缩。自定义便捷配置 丰富的自定义产品配置功能,便捷、高效的完成产品配置、报警配置。可视化 丰富的可视化大盘,帮助您定制个性化的监控大盘。低资源占用 在完成大量监控...

什么是故障

包括根因检查点(如故障原因、最近活动、注入方式、恢复方式等)、故障变更检查、监控检查,并需要对每一个故障明确责任人及团队;故障改进:支持对故障制定明确的改进及验收措施、责任人及完成时间,确保每个深度复盘后的故障都能对业务...

新建任务

该选项取值能大于 拉取设备数,即拉取设备必须满足筛选条件。该选项取值能大于100,即最大支持拉取100台设备的日志。用户拉取 场景:a)设置过滤条件筛选设备:选项 说明 设备ID/名称 输入关键字,模糊匹配终端设备的ID/名称,筛选...

设备显示离线

可能原因 设备软件故障。设备到阿里云联网故障。解决方案 通过尝试在同一个运营商出口环境内 ping 其他知名网站,确认您的运营商网络正常。如果正常,请处理运营商网络问题。如果正常,请跳转至 步骤2。请检查设备本身是否上电。电源状态...

数据恢复

如果 云数据库ClickHouse 实例已经进行了数据备份,您可以通过数据...说明 克隆实例付费类型与源集群相同,且不可变更。单击 立即购买。购买成功后,您可以在 集群列表 页面查看克隆实例。说明 创建克隆实例一般需要10~15分钟,请耐心等待。

如何管理故障

对故障根因进行原因检查并结构化录入,检查点包括:故障原因、最近活动、注入方式、恢复方式等;关联故障期间的故障变更,新增故障改进措施等操作。故障状态 处理中:处理中仍未恢复的故障;已恢复:故障对处理中的故障做 恢复 操作后是...

功能介绍

目前组织绑定信息不可修改,如果需要修改,请联系阿里云售前工程师。小程序优势 通过在钉钉开通并配置 智慧立方,结合本地边缘一体机,实现即插即用,快速监控业务。一键开通:购买边缘一体机并完成部署后,可以一键开通和配置小程序,无需...

托管节点池节点自动恢复

当发现节点故障时,ACK会根据故障原因触发对应恢复任务,并记录相应的事件。当恢复任务完成后,故障状态解除,节点恢复正常状态。当恢复任务完成后,故障状态依然存在,节点会被置为恢复失败状态。说明 如果集群中存在多个节点池,节点池...

如何解决MSE Nacos实例域名无法解析的问题?

如果使用的是ACK,请 提工单 联系ACK技术支持协助排查CoreDNS故障原因。方案二:使用ping命令 使用 ping${mse.nacos.host} 指令尝试解析。如果提示 unknown host,则无法解析域名。如果提示 PING${mse.nacos.host}(xxx.xx.xx.xx)56(84)...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
商标服务 云服务器 ECS 轻量应用服务器 负载均衡 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用