诊断分析

序号 界面参数 说明 ① 异常数 当前诊断产品下所有设备产生的异常总数。② 诊断指标数 设备的诊断项目,包括设备离线异常、上行消息异常、下行消息异常、规则流转消息异常。③ Q7*Ki 当前诊断设备的DeviceName,可选择其他设备查看。④ ...

基本步骤

请参考具体章节查看详细信息:创建应用 runtime 与 agenthub 部署 启动应用 设置报警 观察监控指标 故障诊断 更新 runtime 版本

使用集群诊断

容器智能运维平台 提供一键故障诊断能力,包括Pod诊断、Service诊断、Ingress诊断,可以辅助您定位集群中出现的问题。本文介绍如何在ACS集群中使用集群诊断功能。前提条件 已创建ACS集群。具体操作,请参见 创建ACS集群。确保ACS集群运行...

产品架构

日常巡检、业务监控、故障诊断发现风险事件,并将其上报至风险管理中心,由风险管理中心进行统一调度,如触发故障诊断、应急预案等。运行总览集中展示整个平台的运行状态、风险情况。部署架构 HAS 部署时,需要依赖以下底层服务:数据库 ...

应用诊断

应用诊断是对应用的单独故障诊断,可以由链路诊断触发或人工触发。高可用管理平台通过应用诊断初步定位问题,锁定可疑应用,再通过 Arthas 和线程分析进一步确认问题。目前,应用诊断支持用户应用和蚂蚁应用。应用诊断是故障诊断的原子能力...

使用集群诊断

容器智能运维平台 提供一键故障诊断能力,包括节点诊断、Pod诊断、Service诊断、Ingress诊断、内存诊断、网络诊断,可以辅助您定位集群中出现的问题。本文介绍如何在ACK集群中使用集群诊断功能。前提条件 已创建Kubernetes托管版集群。具体...

应用故障自动诊断

如果发现问题,则会在应用总览页面上方闪现一个红色盾牌图标,单击该图标即可弹出故障诊断报告,故障报告上的故障定界和根因分析可以帮助您更好地发现和解决问题。常见的故障自动诊断场景 RT突增 下游业务导致的本应用的RT突增,您可以联系...

诊断报告

在左侧导航栏上,单击 故障诊断>诊断报告 进入 诊断报告 页面,您可以根据诊断任务名称、诊断结果、诊断状态或触发方式来筛选诊断运行记录及其诊断数据。查看诊断报告详情 在 诊断报告 页面,单击目标决策树 操作 列下的 详情,即可查看...

应用场景

物联网设备无时无刻不在产生海量的设备状态数据和业务消息数据,这些数据有助于进行设备监控、业务分析预测和故障诊断。背景信息 设备将原始数据通过 MQTT 协议发送到物联网平台,经由物联网平台将数据转发到消息服务系统,继而通过流计算...

DeviceSwitched

告警信息 事件名称 事件级别 状态码 状态描述 DeviceSwitched CRITICAL switched Device Role Changed 可能原因 智能接入网关主设备故障。智能接入网关主设备动态路由邻居故障。处理方法 无需处理。icmsDocProps={'productMethod':'created...

跨可用区容灾

当生产站点因为不可抗力因素(比如机房火灾、断电)或者设备故障(软、硬件破坏)导致应用在短时间内无法恢复时,ECS容灾服务支持业务的跨可用区(Availability Zone)的容灾能力,对整体的应用做容灾备份来应对单地区的故障,满足业务的...

DeviceLinkDown

告警信息 事件名称 事件级别 状态码 状态描述 DeviceLinkDown CRITICAL linkdown Device Link State Change 可能原因 用户侧交换机设备故障。用户侧交换机配置故障。用户侧交换机和设备的连线问题。处理方法 检查用户侧交换机。...

应用场景

场景一:面向大中型企业的多地容灾高可用网络架构 当本地数据中心的关键业务对可用性要求极高时,建议在多个接入点建立专线连接,该拓扑确保了因光纤切断、设备故障或接入点位置故障导致的连接故障的恢复能力。自主申请专线和共享合作伙伴...

诊断节点

在左侧导航栏上,单击 故障诊断>诊断节点。单击 新建,在 新建节点 页面,配置新节点的信息,包括节点名称、描述,选择节点类型、超时时间及标签。为该诊断节点绑定巡检规则,否则节点将无法执行。单击节点右侧 操作 列下的 详情 按钮。在...

故障诊断

功能概述 ADP底座提供的故障诊断引擎包含以下能力:对告警消息进行诊断并提供修复建议;对于组件整体提供诊断数据并分析根因;关联运维操作提供修复方案。接入流程 ADP-Local的故障诊断引擎,允许客户根据业务场景配置诊断规则,然后根据...

故障诊断

抓取性能数据 功能,如下图所示:一般来说,如果涉及到内存泄漏的,可以抓取 堆快照,如果是 CPU 异常飙高的,可以抓取 CPU Profile 数据,下面我们以一个 CPU 异常飙高和内存泄漏的例子来看下如何使用 Node.js 性能平台提供的故障诊断功能...

2023-01-17

查看使用文档 设备诊断功能上线 企业版实例设备诊断功能上线,需要手动开启后使用,提供诊断指标大盘、指标智能基线、设备离线分析和异常诊断报告等功能。查看使用文档 数据解析目的支持IoT孪生节点 数据解析任务的数据目的可配置为IoT孪生...

AIOps套件概述

集群诊断 集群诊断提供一键故障诊断能力,辅助您定位集群中出现的问题,包括Pod诊断、节点诊断、Service诊断、Ingress诊断、内存诊断。诊断项 说明 Pod诊断 涵盖了常见的Pod问题,例如Pod启动失败、Pod镜像拉取失败、Pod运行异常等,并在...

功能特性

产品主要功能包括风险管理、日常巡检、故障诊断、应急预案、故障演练等。风险管理 风险管理 是高可用管理平台核心,是风险事件汇集、处置的中枢平台,具体如下。风险事件 风险事件汇集:负责将监控、巡检、诊断产生的风险或告警信息进行...

阿里工业大脑服务等级协议

本服务等级协议(Service Level Agreement,以下简称“SLA”)规定了阿里云向客户提供的工业大脑产品的服务可用性等级指标及赔偿方案。特别提示您本服务等级协议仅适用于工业大脑产品。1.定义 1.1 服务周期:一个服务周期为一个自然月,如...

应用场景

设备维护成本降低 您可以使用工业大脑平台,预测设备故障并进行维护,具体应用场景如下。设备行业:企业使用物联网与算法模型技术提前预测风机故障。通过温度传感器对整个风机的温度测点进行实时监控,并对海量温度数据进行深度学习,构建...

什么是云服务诊断

同时云服务诊断基于阿里云技术服务团队的多年服务支持经验,提供了多种常见的异常场景诊断能力,您可以在遇到业务异常问题时选择合适的诊断场景发起自助诊断产品优势 资源状态一目了然 在概览页可直观的看到当前账户云资源的可用性状态,...

诊断规则

通过故障诊断平台,运维人员可以将诊断过程、排查顺序进行图形化编排与设计,即故障诊断决策树。而后,在实际故障发生时,即可执行自动化、标准化的故障排查,并直接输出诊断报告,反馈诊断结果。故障诊断功能有效提升了故障排查效率,实现...

响应云盒维修事件

涉及的流程如下:重要 硬件维修采用整机替换的方式现场更换硬件设备阿里云不在现场进行硬件故障诊断和排查。在您授权同意后,阿里云会按照约定的时间上门更换硬件设备,并将拆除的故障设备运送回阿里云工厂进行维修。具体维修流程,请...

如何使用远程助手?

远程助手(Remote Assistant,RA)提供远程诊断和协助服务,可以通过云端控制台下发指令诊断设备问题。在待诊设备页面(【远程助手 RA】->【待诊设备】)可以看到所选项目下连接了RA服务的设备列表:对于已经连接的设备,点击其所在行最右侧...

什么是高可用管理平台

高可用管理平台(High Availability Service,HAS)是基于蚂蚁多年技术风险防控理论和实践而衍生出的产品,是蚂蚁分布式架构 SOFAStack 的重要组成部分。高可用管理平台覆盖了应用运行风险事件事前、事中、事后的全流程管理。事前:通过...

产品优势

蚂蚁技术风险管理体系方法论+平台工具完整落地 通过高可用管理平台...技术风险防控内容库快速更新 阿里云、蚂蚁技术风险团队基于域内、域外技术风险防控经验,共建日常巡检、故障诊断、应急预案内容库,用户可享受最新的技术风险防控内容。

新功能发布记录

DirectMail:Doman ALIYUN:DirectMail:Ipfilter ALIYUN:KMS:Key ALIYUN:KMS:Secret ALIYUN:MNS:Queue ALIYUN:MNS:Topic ALIYUN:OOS:Parameter ALIYUN:OOS:SecretParameter ALIYUN:OOS:PatchBaseline ALIYUN:RAM:User ALIYUN:RAM:Group ...

产品优势

支持工业领域90%以上的设备与协议,无需改造工业设备与生产流程,产线数据即可实时接入工业大脑。数据管理能力 大工业云数据体系,云上结构化客户数据,原子化对象打散,灵活再造业务数据模型,帮助客户沉淀数据以及经验。算法优化能力 ...

故障处理流程

本文为您介绍智能接入网关设备故障处理流程。SAG-100WM故障处理流程说明 通过SAG-100WM访问阿里云,发现故障,请参见以下流程排查故障:用户收到告警信息或者发现应用不可用。登录智能接入网关控制台,查看设备状态。访问其他公共网站,...

2022-08-15

适用客户 适用于智能门锁、智能摄像头、智能手表、智能音箱、智能表计、支付POS终端、无人售货柜/箱、工业网关、边缘网关等智能终端(感知节点设备/边缘网关)的制造商,解决终端自身安全、数据在采集/处理/存储/传输/共享协作的安全问题。...

什么是设备诊断

设备诊断阿里云物联网平台针对设备运行数据提供的一系列运维场景智能服务,帮助您分析判断设备故障、探测设备潜在风险并及时预知业务异常。服务架构 服务优势 丰富的数据诊断指标 提供网络连接成功率、设备离线原因、云对接次数等丰富的...

整体介绍

灰度升级 升级支持的维度 型号(机型)版本号,支持版本的黑白名单 按设备,支持设备的黑白名单 自定义过滤条件(添加自定义kv)设备升级诊断 查看设备为什么没有查询到版本 查看设备升级进度 升级结果数据统计(待上线)升级成功设备数 ...

功能特性

提供故障诊断和运维监控,便于现场解决问题。与云端交付平台联动 线上集成、验证、出包,一步到位。柔性版本管理、故障回流差异。中间件统一供应 提供足够丰富的中间件(包括数据库),帮助产品加速实现完全容器化。对接入的中间件进行可运...

获取帮助信息

您可以通过 help 命令查看和了解如何使用阿里云CLI:获取阿里云CLI支持的选项和产品列表:aliyun help 获取某个产品的接口信息:aliyun<product>help 例如获取ECS的接口信息:aliyun ecs help 获取某个产品中某个接口所需的参数:aliyun...

查看历史系统事件

您可以查询过去一周内已处理的云服务器ECS系统事件,获取故障诊断和复盘分析数据。通过控制台查看 登录 ECS管理控制台。在左侧导航栏,单击 事件。在 事件 页面,您可以选择相应的事件类型查看不同地域下的系统事件,获取实例ID、事件类型...

故障演练

故障演练能力是ADP基于阿里故障演练产品AHAS提供的一项能力,在线上集成环节即可对线下交付中常见的各类故障场景下产品编排的容错性、可靠性和可恢复性进行演练,保障编排稳定可靠。在进行故障演练之前,需要进行以下步骤:创建产品;...

使用说明

背景信息 设备基于物联网平台的消息通信能力开展业务,由于不同设备业务的复杂性,以及业务需要定期变更升级,导致设备的业务程序容易出现故障,导致设备不可用。如果设备的业务程序与远程登录程序在同一进程,会导致设备不可使用远程登录...

应用场景

同时不断更新优化日常巡检、故障诊断、应急预案等内容的建设,不断丰富和完善应用技术风险防控体系,简化日常应用运维操作。故障演练 为不断提升产品高可用能力,通过高可用管理平台的故障演练模块,设计并规划演练计划和恢复方案,继而在...

1.1.4版本

2)优化物联网产品&设备查询和选择 3)支持对工业应用授权/取消授权访问业务资源 4)支持已经过期的工业应用的权限和菜单功能清理 区域/行业平台 1)运营后台门户站点搭建优化导航栏外部集成页面调用配置 2)运营后台门户站点搭建核心服务...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
数据库自治服务 数据库审计 应用实时监控服务 负载均衡 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用