离线分析

当设备发生离线事件时,需要线原因进行分析。根据离线发生的时间区间、设备的未重连时长来统计离线设备的特征,帮助您全面了解、分析设备离线原因。前提条件 设备已接入阿里云物联网平台。具体操作,请参见 设备接入。已开启设备诊断...

故障管理

故障管理概述 故障管理是源于ITIL的一个概念,在IT企业或者...故障复盘与改进措施 故障复盘信息同步,在故障结束后,对故障原因责任人等进行定位与定责。故障进行复盘后,需针对此次故障件进行针对性的改进,避免后续再次发生此类故障。

设计方案

为了更好地定位故障原因,需要各种告警信息进行关联分析。这样可以快速确定故障的范围和影响,并且能够帮助排查故障的根本原因。告警关联分析可以使用各种工具和算法,如事件关联分析、机器学习等。知识图谱:知识图谱是指通过将各种数据...

数字翻牌器

数据(分析模式)重要 在使用DataV数据集提供的BI分析功能之前,系统会对数字翻牌器进行以下变更。数据源 数字翻牌器数据接口 由静态数据切换至DataV数据集。更新DataV数据集配置(此操作不会使字段配置丢失)。BI分析数据配置面板中的详细...

单个添加物模型

例如:将已定义的属性 电压 作为出参,则设备上报该故障事件时,将携带当前设备的电压值,用于进一步判断故障原因。当接入网关协议为OPC UA时,需设置参数索引,用于标记参数的顺序。说明 不能用以下系统保留参数作为输出参数的标识符:set...

运维服务内容说明

1.服务概述 阿里云运维服务(Alibaba Cloud Managed Services),基于阿里巴巴数字化运维解决方案,提供专属运维服务专家,帮助企业客户做好云上运维管理,降低运维开销和风险,提升运维效率和业务连续性,增强系统安全性和合规性,助力...

混合云应用双活容灾最佳实践

越来越多的企业在数字化转型和上云进程中选择混合云的形态(云+自建IDC或云+其他厂商云)来进行容灾建设,一方面不会过度依赖单一云厂商,另一方面还能充分利用已有的线下IDC资源。MSHA云原生多活容灾解决方案,支持混合云多活容灾产品能力...

专家成长计划技术培训课程

1、网络安全产品攻击防护应用技巧(比如CC攻击防护)2、异常诊断分析(比如异常拦截原因分析及处理)3、产品使用技巧/最佳实践 现场面授(特殊情况可调整为线上钉钉群直播)云计算运维安全认证专家培训&CCSOP认证 4天 30人 本课程是云计算...

东软案例

业务要求与挑战 线上互联网化的信息服务繁荣发展为政府、企业数字系统运维应用稳定和客户数字体验保障提出了更高要求。在互联网服务场景下,运维监控数据量激增,采集监控的数据类型更加多样(时序指标、日志、代码链路等),现有运维系统...

三星堆大型沉浸式数字交互空间最佳实践

本文介绍阿里云云渲染平台支持央视沉浸式线上考古游戏的完整方案。法律声明 阿里云提醒您在阅读或使用本文档之前仔细阅读、充分理解本法律声明各条款的内容。如果您阅读或使用本文档,您的阅读或使用行为将被视为本声明全部内容的认可。...

什么是故障

包括根因检查点(如故障原因、最近活动、注入方式、恢复方式等)、故障变更检查、监控检查,并需要每一个故障明确责任人及团队;故障改进:支持故障制定明确的改进及验收措施、责任人及完成时间,确保每个深度复盘后的故障都能业务...

如何管理故障

故障根因进行原因检查并结构化录入,检查点包括:故障原因、最近活动、注入方式、恢复方式等;关联故障期间的故障变更,新增故障改进措施等操作。故障状态 处理中:处理中仍未恢复的故障;已恢复:故障处理中的故障做 恢复 操作后是...

更新故障复盘改进详情

problemReason":"故障原因A","recentActivity":"2","injectionMode":"1","recoveryMode":"2","discoverSource":1,"userReport":10,"monitorSourceName":"Zabbix","relationChanges":"关联变更","dutyUserId":1231,"replayDutyUserId":1213...

如何解决MSE Nacos实例域名无法解析的问题?

如果使用的是ACK,请 提工单 联系ACK技术支持协助排查CoreDNS故障原因。方案二:使用ping命令 使用 ping${mse.nacos.host} 指令尝试解析。如果提示 unknown host,则无法解析域名。如果提示 PING${mse.nacos.host}(xxx.xx.xx.xx)56(84)...

以太网接口频繁Up/Down

本文介绍以太网接口频繁Up/Down的原因和处理方法。问题现象 以太网接口频繁Up/Down。可能原因 线缆没有连接好。双绞线过长、光纤超长或链路损耗太大。接口、接口模块或设备故障。解决方案 检查本端和端设备线缆、模块是否插好。检查设备...

故障复盘改进详情

0c4840fd3812 幂等校验token 返回数据 名称 类型 示例值 描述 requestId String 4361a0e1-6747-4834-96ce-0c4840fd3811 Id of the request data Object data problemId String 231231 故障ID problemReason String 故障的原因 故障原因 ...

设备显示离线

本文介绍智能接入网关设备显示离线原因和处理方法。问题现象 登录 智能接入网关控制台,查看设备状态为 离线。可能原因 设备软件故障。设备到阿里云联网故障。解决方案 通过尝试在同一个运营商出口环境内 ping 其他知名网站,确认您的...

自建VPN无法连通

线下服务器(192.168.1.xxx)-ECS实例(网关)-其他ECS实例(172.xx.x.45)根据上面整理的信息,在网关的安全组所有地址放行后,其他ECS实例能连通线下服务器,说明本身路由等三层以下网络都是正常的,故判断还是安全层面的问题,并和系统内部...

以太网接口无法接通

本文介绍以太网接口没有接通的可能原因和处理方法。问题现象 以太网接口没有接通(物理上)。可能原因 设备没有连接电源或者以太网接口连接的线缆没有插好。光纤、双绞线过长或者链路损耗太大。接口、接口模块或者设备故障。解决方案 检查...

故障复盘

复盘文档一般包含以下内容:故障简述:故障概述、影响面、处理人等 故障背景:故障发生时的业务链路 故障时间线:着重强调故障引入、故障发生、故障发现、业务响应、恢复执行、故障恢复几个时间点 故障原因分析:建议先一句话总结,再进行...

边缘物业一体机离线排查

k8s 状态正常 上面每一个条件离线都会导致物业一体机离线,但个单独的离线对业务的影响不同,下面排查思路里面会具体说明 2.排查方案 2.1 局域网通信是否正常 如果本地局域网络出现异常,那对业务的影响是最大的;相当于子设备跟物业一体机...

通过一致性复制组实现容灾恢复

当您创建并启动一致性复制组后,如果生产站点中的云盘发生严重故障,您可以通过一致性复制组批量生产站点的云盘数据进行容灾恢复。本文主要介绍如何通过一致性复制组进行容灾恢复。背景信息 一致性复制组支持故障切换和反向复制功能,当...

通过异步复制功能实现容灾恢复

当您创建并启动云盘异步复制关系后,如果主盘发生故障,您可以通过异步复制功能主盘进行容灾恢复。本文主要介绍如何进行容灾恢复操作。前提条件 反向复制前,请确保源云盘(主盘)已经从对应的ECS实例上卸载,即主盘处于未挂载状态。具体...

AI助手使用说明

当发生故障或异常时,通过AI助手底层的告警系统可以自动和PAI进行交互,上报故障信息,并根据故障触发阶段和并行策略选择规避故障方法,对故障机自动进行隔离,并从Checkpoint快速恢复任务。AI助手提供的具体功能如下:异常采集和上报:...

ack-node-repairer

当Node Problem Detector(简称NPD)组件检测到节点上的故障并生成节点的事件(Event)或者Condition上报给集群时,ACK的自愈系统(ACK Node Repairer)会监听每个节点上的新故障事件,并根据配置对故障节点进行相应的修复操作。...

功能特性

此外,在数据库实例发生故障且无法定位原因时,可以利用克隆库复现故障场景,以便更好地定位故障原因。智能压测 搜索分析 查询并导出SQL语句对应的日志信息。搜索 SQL洞察 SQL洞察聚类分析,用作深度异常的排查。SQL洞察 安全审计 内置了...

自动故障剔除

自动故障剔除功能会自动监控 RPC 调用的情况,当某个节点出现故障时,可对故障节点进行权重降级,并在节点恢复健康时进行权重恢复。目前支持 Bolt 协议。配置方式 将自动故障剔除的参数配置到 SOFABoot 中的 application.properties 即可。...

如何配置流转规则

触发故障 确定 故障触发规则:设置触发的持续时长和次数对故障进行收敛降噪;如,某个规则在持续5分钟内触发3次才会触发故障,只要将时长和次数分别设置为5分钟和3次即可;影响服务:设置故障的 影响面;故障触发后,其同样存在影响的...

授权访问云资源

在数字证书管理服务控制台使用证书部署、证书托管等服务时,需要您对数字证书管理服务角色进行授权,允许证书相关服务访问您在其他云产品中的资源。RAM角色说明 RAM角色是一种虚拟用户,可以被授予一组权限策略。与RAM用户不同,RAM角色...

EMR Kafka磁盘故障运维

当出现磁盘故障时,需要根据故障原因、故障影响程度、业务需求(是否接受数据丢失、是否允许服务较长时间不可用)、集群状态等综合考虑恢复采取的策略。如果业务优先保证服务可用,但允许丢失部分数据,则应考虑在可能会丢失数据的情况下,...

数字人端渲染Android SDK

3600 lifecycle androidx.lifecycle.Lifecycle 是 绑定Activity生命周期,需要Activity继承自AppCompatActivity initConfig InitConfig 否 对数字人位置、角度、环境背景、播报音量、日志做初始化配置 true InitConfig说明 参数 类型 说明 ...

3D数字人视频合成用户指南

鼠标悬浮在某一形象上方,显示【形象配置】按钮,此时点击将前往资产中心-3D数字人资产,可在此页面对数字人形象进行配置,如发型、妆容、服装、声音等。2.2 声音 点击 声音,可选择数字人播报的音色并调整音色对应的音量、语速和音调,...

EDAS直播公告

安利的企业微服务架构转型之路 云途时代数字化转型实践 EDAS 3.0核心功能演示 2020-05-15 微服务治理实践之金丝雀发布 应用的有些故障是因为发布直接或间接引起的,因此提升发布的质量,减少错误的发生,是有效减少线故障的一个关键环节...

视频版一体机

产品架构 服务能力 视频功能 支持通过本地IP网络对数字化NVR和IPC进行上云进行摄像头管理,包含H264视频实时、历史(需对接NVR)视频拉流、云台(需设备支持GB协议上云台功能)、截图功能 性能 支持1000路摄像头接入,同时支持10路1080P...

授权信息

如果要允许 数字证书管理服务(原SSL证书)(SSLCertificatesService)(cas)的访问权限,请在策略语句中指定"Resource":"*。条件(Condition)数字证书管理服务(原SSL证书)(SSLCertificatesService)(cas)未定义产品级别的条件...

授权信息

如果要允许 数字证书管理服务(原SSL证书)(SSLCertificatesService)的访问权限,请在策略语句中指定"Resource":"*。条件(Condition)数字证书管理服务(原SSL证书)(SSLCertificatesService)未定义产品级别的条件关键字。如需查看...

故障基础数据管理

故障场景等级定义 日常运营中,除用户方环境或自身操作引起的问题外,无论什么原因导致的服务中断、服务品质下降或用户服务体验下降的现象,都称为故障对故障影响程度的划分就是故障等级定义。定义故障等级是为了指定故障等级定义作为各...

设置宕机自动迁移

为了降低物理故障对业务的影响,阿里云为您提供专有宿主机DDH宕机自动迁移的功能。本章节介绍在创建DDH后如何开启或者关闭宕机自动迁移。背景信息 宕机自动迁移开启后,当DDH因故障停机时,会自动迁移至健康的DDH。若您未开启宕机自动迁移...

什么是设备诊断

服务架构 服务优势 丰富的数据诊断指标 提供网络连接成功率、设备离线原因、云对接次数等丰富的数据诊断指标检测设备,帮助您全方位、多角度分析定位问题。自动拟合智能基线 无需手动配置设备指标异常的阈值,基于设备运行数据,通过机器...

实时分析链路数据

如果您的应用遇到流量不均、单机故障、慢接口治理、业务流量统计、灰度发布监控等问题,可以通过应用监控的调用链分析快速定位问题代码。本文介绍如何通过调用链分析快速定位五种经典线上问题,更直观地了解调用链分析的用法与价值。背景...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
数据库自治服务 云消息队列 RocketMQ 版 云解析DNS 负载均衡 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用