应用场景

物联网设备无时无刻不在产生海量的设备状态数据和业务消息数据,这些数据有助于进行设备监控、业务分析预测和故障诊断。背景信息 设备将原始数据通过 MQTT 协议发送到物联网平台,经由物联网平台将数据转发到消息服务系统,继而通过流计算...

DeviceSwitched

告警信息 事件名称 事件级别 状态码 状态描述 DeviceSwitched CRITICAL switched Device Role Changed 可能原因 智能接入网关主设备故障。智能接入网关主设备动态路由邻居故障。处理方法 无需处理。icmsDocProps={'productMethod':'created...

配置设备级高可用

动态HA功能无需配置虚IP地址,系统会主动帮您探测设备状态,在主网关设备故障时,自动帮您切换流量。智能接入网关仅支持同一实例中的两台设备组建HA备份组,系统会指定默认的主设备和备设备,您可以登录智能接入网关管理控制台查看设备的...

故障止损恢复

故障初因定位 集成企业内部可利用的所有稳定性相关数据(变更事件,...通用垂直专项快恢能力:通过集成包括DB侧慢SQL限流、变更极速回滚、多活容灾切流快恢等通用的快恢能力,结合监控、日志等数据自动定位的故障原因进行对应的快恢方式推荐。

SubmitAssistReport

调用SubmitAssistReport提交远程诊断报告。说明 对于一次诊断,首次提交会创建一份报告,后续提交会更新报告内容。调试 您可以在OpenAPI Explorer中直接运行该接口,免去您计算签名的困扰。运行成功后,OpenAPI Explorer可以自动生成SDK...

什么是物联网平台

监控运维 提供实例级监控报警、运维大盘、全链路日志分析、设备OTA升级、远程登录、设备智能诊断和安全中心服务。增值服务 为不同类型的智能设备提供千里传音、寄雁传书、位置服务、声码服务、事件响应、数据智能等丰富的增值服务。您可...

远程调试

如果您想要远程诊断部署在 Serverless应用引擎SAE(Serverless App Engine)上的应用,可以使用 SAE 远程调试功能。本文介绍如何通过跳板机使用OpenSSH实现远程调试。前提条件 创建应用 背景信息 跳板机(Jump Server)是一台可以访问的...

功能特性

故障诊断 故障诊断 的核心能力是将在运维人员头脑中或在故障排查手册中的经验、排查过程通过工具平台进行沉淀和展示。运维人员通过决策树方式,图形化地编排故障诊断过程、设计排查顺序。继而在风险事件发生时,将例行化、程式化、标准化的...

在线调试

您也可以使用在线调试的远程登录服务,通过SSH协议的网络服务远程访问设备,在设备远程控制台输入设备的指令,进行调试和定位问题。本文介绍物模型功能调试 和远程登录 的操作步骤。前提条件 设备所属产品,已定义物模型功能。具体内容,请...

云盒计算资源配置最佳实践

由于这些冗余资源对于用户来说是可见资源,随时可以被用来创建ECS实例或其他云产品实例,因此该方式对于日常业务使用有一定的灵活性,但无法保证在硬件设备故障期间,一定存在可用的备机资源。购买 SLA增值服务包,为计算资源通过SLA保证。...

设备接入概述

功能 说明 相关文档 OTA 设备升级,提供设备远程固件升级的能力。OTA升级概述 远程登录 基于安全隧道,提供控制台通过SSH协议远程登录设备的能力。远程登录 日志上报 设备上报运行日志到物联网平台,通过该日志可进行设备问题排查。设备...

开启和关闭设备诊断

本文为您介绍如何开启或关闭设备诊服务下的诊断指标、智能基线、离线分析和诊断分析功能,以及如何查看各功能启用状态及数据处理单元(CU)用量。前提条件 已购买企业版实例。具体操作,请参见 购买企业版实例。使用说明 设备诊断服务于...

什么是故障

包括根因检查点(如故障原因、最近活动、注入方式、恢复方式等)、故障变更检查、监控检查,并需要对每一个故障明确责任人及团队;故障改进:支持对故障制定明确的改进及验收措施、责任人及完成时间,确保每个深度复盘后的故障都能对业务...

功能特性

实时数据集成(Flink版)可以将数据服务中产品属性时序表和产品事件表数据,集成到阿里云实时计算Flink版中计算和分析,帮助您实时分析和诊断设备的运行状况,实时检测运行故障等 设备划归 功能 说明 授权设备 将设备授权给其他阿里云账号...

故障复盘改进详情

0c4840fd3812 幂等校验token 返回数据 名称 类型 示例值 描述 requestId String 4361a0e1-6747-4834-96ce-0c4840fd3811 Id of the request data Object data problemId String 231231 故障ID problemReason String 故障的原因 故障原因 ...

2023-08-31

设备诊断功能正式上线 设备诊断功能正式上线,支持设备诊断指标、智能基线、离线分析和诊断分析,每项功能可分别开启和关闭,会根据诊断设备数量消耗对应额度的数据处理单元。自定义存储表支持归档存储 数据服务自定义存储表中的数据支持...

网络资源

网络闪断故障可能由多种原因引起,如网络设备故障、电力波动、通信线路故障等。网络闪断会导致数据传输中断,影响系统和应用程序之间的数据传输,频繁的网络闪断可能导致系统或应用程序无法正常运行。常使用的容错策略如下:设备冗余:使用...

设计方案

故障恢复 定位故障原因后,按照应急预案快速恢复业务,并在事后进行复盘总结。预案执行:在故障响应的过程中,需要按照事先制定的应急预案进行执行。应急预案包括了应急响应流程、各个岗位的职责、处理流程等。预案执行能够保证故障恢复和...

监控报警概述

故障预警 云电脑的故障信息、故障原因及故障时间等信息。使用场景 在日常业务运行的过程中,监控大盘帮助您及时了解账号下全部云电脑资源的全局情况,实时监控提供更详细的数据指标和故障预警信息,帮助您了解终端用户使用云电脑的情况,...

诊断服务端报错问题

步骤三:诊断异常出现的原因 掌握应用异常的统计信息还不足以诊断异常出现的原因。虽然日志中异常堆栈包含调用的代码片段,但并不包含这次调用的完整上下游信息和请求参数。ARMS探针采用了字节码增强技术,让您能够以很小的性能消耗捕获...

故障复盘

复盘文档一般包含以下内容:故障简述:故障概述、影响面、处理人等 故障背景:故障发生时的业务链路 故障时间线:着重强调故障引入、故障发生、故障发现、业务响应、恢复执行、故障恢复几个时间点 故障原因分析:建议先一句话总结,再进行...

设计原则

这样可以确保一台设备故障时,数据仍然可用;容灾计划:制定容灾计划,包括灾难恢复策略、应急响应流程和恢复时间目标(RTO)等。容灾计划应该经常进行测试和演练,以确保其可行性和有效性;数据备份与恢复:定期进行数据备份,并确保备份...

跨可用区容灾

当生产站点因为不可抗力因素(比如机房火灾、断电)或者设备故障(软、硬件破坏)导致应用在短时间内无法恢复时,ECS容灾服务支持业务的跨可用区(Availability Zone)的容灾能力,对整体的应用做容灾备份来应对单地区的故障,满足业务的...

ping不通云服务(SAG-100WM)

可能原因 终端到设备的链路故障设备到阿里云的VPN链路故障。目标ECS故障。运营商网络故障。解决方案 登录 智能接入网关控制台。单击智能接入网关实例ID,查看设备状态是否为 可用。如果离线,请参见 设备显示离线 处理。如果在线,请参见...

2023-01-17

查看使用文档 设备诊断功能上线 企业版实例设备诊断功能上线,需要手动开启后使用,提供诊断指标大盘、指标智能基线、设备离线分析和异常诊断报告等功能。查看使用文档 数据解析目的支持IoT孪生节点 数据解析任务的数据目的可配置为IoT孪生...

无法连接到同一个云连接网内的本地客户端

本文介绍SAG-1000设备无法连接到同一个云连接网内的本地客户端的原因和处理方法。问题现象 SAG-1000设备无法连接到同一个云连接网内的其他本地客户端。可能原因 终端到设备的链路故障设备到阿里云的VPN链路故障。目标PC环境的网络故障。...

ping不通云服务ECS(SAG-1000)

可能原因 终端到设备的链路故障设备到阿里云的VPN链路故障。目标ECS故障。运营商网络故障。解决方案 登录 智能接入网关控制台。单击智能接入网关实例ID,查看设备状态是否为 可用。如果离线,请参见 设备显示离线 处理。如果在线,请跳转...

产品架构

日常巡检、业务监控、故障诊断发现风险事件,并将其上报至风险管理中心,由风险管理中心进行统一调度,如触发故障诊断、应急预案等。运行总览集中展示整个平台的运行状态、风险情况。部署架构 HAS 部署时,需要依赖以下底层服务:数据库 ...

跨可用区容灾

当生产站点因为不可抗力因素(比如机房火灾、断电)或者设备故障(软、硬件破坏)导致应用在短时间内无法恢复时,ECS容灾服务支持业务的跨可用区(Availability Zone)的容灾能力,对整体的应用做容灾备份来应对单地区的故障,满足业务的...

什么是高可用管理平台

事前:通过应用巡检、故障诊断以及和监控平台的联动,实现应用运行风险的主动发现。事中:通过故障诊断、应急预案、容灾切换实现风险事件快速定位和恢复。事后:通过风险定级、回溯,实现风险事件的闭环管理。有效提升 IT 技术风险防御水平...

产品优势

自动化故障诊断和标准化应急预案快速定位并恢复故障,减少因故障引起的业务中断时间。故障演练主动检验应用高可用能力。支持蚂蚁产品双中心容灾切换,满足监管合规需求。技术风险防控内容库快速更新 阿里云、蚂蚁技术风险团队基于域内、...

自助诊断GPU节点问题

在 集群列表 页面,单击目标集群名称,然后在左侧导航栏,选择 巡检和诊断>故障诊断。在 故障诊断 页面,单击 节点诊断,然后在 节点诊断 页面的左上角,单击 诊断。在 选择节点 面板,选择 节点名称,仔细阅读注意事项后选中 我已知晓并...

诊断报告

在左侧导航栏上,单击 故障诊断>诊断报告 进入 诊断报告 页面,您可以根据诊断任务名称、诊断结果、诊断状态或触发方式来筛选诊断运行记录及其诊断数据。查看诊断报告详情 在 诊断报告 页面,单击目标决策树 操作 列下的 详情,即可查看...

查看运行分析

该指标协助您进行作业诊断,排查作业Task级别的故障原因。个 TM自JVM启动以来已加载的类总数(TM ClassLoader)TM自JVM启动以来已加载的类总数。JM所在的JVM创建后加载类的总数或卸载类的总数过大,会导致占用过大内存空间,从而影响作业...

EMR Kafka磁盘故障运维

当出现磁盘故障时,需要根据故障原因、故障影响程度、业务需求(是否接受数据丢失、是否允许服务较长时间不可用)、集群状态等综合考虑恢复采取的策略。如果业务优先保证服务可用,但允许丢失部分数据,则应考虑在可能会丢失数据的情况下,...

录制脚本

使用在线录制功能,通过Web页面在远程设备安装应用,录制操作步骤,并生成测试脚本。前提条件 已打开指定应用的 用例管理 页面。具体操作请参见 打开用例管理页面。安装应用 在指定应用的 用例管理 页签,选择 脚本管理 子页签。在 在线...

支持计划FAQ

服务支持计划服务范围包含:关于阿里云服务与产品功能、容量、架构的咨询 使用、配置阿里云产品的最佳实践 阿里云的产品相关的技术问题、故障诊断 阿里云API 和阿里云SDK问题的故障诊断 与阿里云资源相关的操作或系统问题的技术支持 与阿里...

使用集群诊断

在 集群列表 页面,单击目标集群名称,然后在左侧导航栏,选择 巡检和诊断>故障诊断,并按照对话框提示进行授权。在 故障诊断 页面,单击 Pod诊断。在 选择Pod 面板,选择 Pod命名空间 和 Pod名称,仔细阅读注意事项后选中 我已知晓并同意...

诊断节点

在左侧导航栏上,单击 故障诊断>诊断节点。单击 新建,在 新建节点 页面,配置新节点的信息,包括节点名称、描述,选择节点类型、超时时间及标签。为该诊断节点绑定巡检规则,否则节点将无法执行。单击节点右侧 操作 列下的 详情 按钮。在...

无影23.8寸一体机US01

新增 新增远程诊断功能。优化 优化云电脑连接体验。优化 优化ASP外设连接和安全功能。错误修复 修复已知问题,提升用户体验和安全能力。V1.3.0-2022年4月 变更类型 变更说明 新增 ASP协议的云电脑支持双屏显示。新增 ASP协议的云电脑支持...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
数据库自治服务 物联网平台 数据库审计 负载均衡 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用