故障复盘

故障复盘规范 故障复盘作为故障体系中的重要一环,整体复盘流程包括故障处理过程、改进分析故障定责,基于包含标准化的复盘SOP、对应预防action推荐、问责管理机制,全面地回溯线上故障的发生,产出故障复盘报告和改进措施,避免故障重复...

什么是设备诊断

设备诊断是阿里云物联网平台针对设备运行数据提供的一系列运维场景智能服务,帮助您分析判断设备故障、探测设备潜在风险并及时预知业务异常。服务架构 服务优势 丰富的数据诊断指标 提供网络连接成功率、设备离线原因、云对接次数等丰富的...

功能特性

设备诊断 针对设备运行数据提供的一系列运维场景智能服务,帮助您分析判断设备故障、探测设备潜在风险并及时预知业务异常。查看运维大盘 展示设备的地区热力图分布,方便您直观、快速地了解所有设备的状态。在线调试 直接从物联网平台控制...

设备显示离线

可能原因 设备软件故障。设备到阿里云联网故障。解决方案 通过尝试在同一个运营商出口环境内 ping 其他知名网站,确认您的运营商网络正常。如果不正常,请处理运营商网络问题。如果正常,请跳转至 步骤2。请检查设备本身是否上电。电源状态...

主备方案介绍

主备容灾:当云数据库HBase实例因不可预料的原因(例如设备故障、机房断电断网等)发生故障,容灾机制可用于保障数据的一致性和业务可用性。功能优势 主备双活:请求低毛刺。故障自动容错。资源利用率高。主备容灾:支持云数据库HBase、EMR...

应用故障自动诊断

在EDAS中进入应用总览页面时,会按照您自定义的时间段对该应用的运行情况做一个自动诊断。...数据支持:这一部分包含了得到推测结论的数据支持,不同故障原因的诊断报告中包含的分析数据将不一样。图 1.故障诊断报告示例图-RT诊断

功能概览

LiveTail 在线上运维场景中,经常需要对日志队列中的数据进行实时监控,从最新的日志数据中提取出关键信息,以便快速分析出异常原因。提供日志数据实时监控的交互功能 LiveTail,针对线上日志进行实时监控分析,减轻运维压力。日志快照 ...

附录:SOFAStack 产品目录

SOFAStack 所有的产品技术均经过蚂蚁集团自身严苛的金融场景验证,为金融交易技术保证风险安全的同时,帮助业务需求敏捷迭代;同时满足异地容灾、低成本快速扩容的需求,能够解决传统集中式架构转型的困难,并通过打造大规模高可用分布式...

灾备方案

Tair 容灾架构演进 当 Tair 实例因不可预料的原因(例如设备故障、机房断电等)发生故障,容灾机制可用于保障数据的一致性和业务可用性。Tair 提供多种灾备方案供您选择,可满足不同的业务场景。图 1.Tair 容灾架构演进 灾备方案 灾备级别 ...

灾备方案介绍

云数据库Redis容灾架构演进 当云数据库Redis实例因不可预料的原因(例如设备故障、机房断电等)发生故障,容灾机制可用于保障数据的一致性和业务可用性。云数据库Redis提供多种灾备方案供您选择,可满足不同的业务场景。图 1.Redis容灾架构...

全链路专家服务内容说明

提供针对阿里云产品功能特性、架构设计、性能调优、疑难诊断等方面技术专场咨询,包括但不限于如下场景的综合技术咨询项:1、网络安全产品攻击防护应用技巧(如CC攻击防护)2、安全异常诊断分析(如异常拦截原因分析及处理)3、对象存储...

运维服务内容说明

1.服务概述 阿里云运维服务(Alibaba Cloud Managed Services),基于阿里巴巴数字化运维解决方案,提供专属运维服务专家,帮助企业客户做好云上运维管理,降低运维开销和风险,提升运维效率和业务连续性,增强系统安全性和合规性,助力...

数据类云产品专家服务

数据库问题专家诊断与调优 阿里云数据库专家结合丰富的云上实战经验和最佳实践,结合各项数据库指标,以及前后端的日志及各项应用指标,分析客户反馈的数据库所需分析诊断的问题点或故障,排查确定数据库问题的根本原因,提供针对性的解决...

功能介绍

背景信息 在物联网边缘计算业务中,由边缘一体机分析的告警事件、设备故障等消息,需要及时发送通知给特定的人员处理,避免出现安全风险或者业务停滞等情况。对此场景,物联网边缘计算研发了 智慧立方 钉钉小程序,您只需要配置小程序,...

查看数据报表

CloudLens for OSS提供丰富的可视化图表,从资源用量、访问分析、安全分析等维度展示Bucket日志的分析结果。前提条件 已开启访问明细日志的采集功能。...Object操作风险分析 Object操作风险分析 仪表盘展示OSS Bucket高危Object操作。

DeviceLinkDown

告警信息 事件名称 事件级别 状态码 状态描述 DeviceLinkDown CRITICAL linkdown Device Link State Change 可能原因 用户侧交换机设备故障。用户侧交换机配置故障。用户侧交换机和设备的连线问题。处理方法 检查用户侧交换机。...

离线分析

根据离线发生的时间区间、设备的未重连时长来统计离线设备的特征,帮助您全面了解、分析设备离线的原因。前提条件 设备已接入阿里云物联网平台。具体操作,请参见 设备接入。已开启设备诊断服务。具体操作,请参见 开启和关闭设备诊断。...

应用场景

场景一:面向大中型企业的多地容灾高可用网络架构 当本地数据中心的关键业务对可用性要求极高时,建议在多个接入点建立专线连接,该拓扑确保了因光纤切断、设备故障或接入点位置故障导致的连接故障的恢复能力。自主申请专线和共享合作伙伴...

DeviceSwitched

告警信息 事件名称 事件级别 状态码 状态描述 DeviceSwitched CRITICAL switched Device Role Changed 可能原因 智能接入网关主设备故障。智能接入网关主设备动态路由邻居故障。处理方法 无需处理。icmsDocProps={'productMethod':'created...

原因分析

原因分析时通过对通话内容的挖掘,分析出客户投诉或者问题未解决的具体原因分析客户投诉或问题未解决的热门、冷门原因、变化趋势、涨跌幅等情况。未解决原因分析 分析维度 未解决原因分析是以时间和数据来源的维度对未解决数据进行分析。...

更新故障复盘改进详情

problemReason":"故障原因A","recentActivity":"2","injectionMode":"1","recoveryMode":"2","discoverSource":1,"userReport":10,"monitorSourceName":"Zabbix","relationChanges":"关联变更","dutyUserId":1231,"replayDutyUserId":1213...

采集客户端数据的高可用方案

因此对于单硬件设备故障风险,日志服务天然具备了可用性特征。但是在一些相对极端的场景下,单集群可能由于一些预期外原因存在故障停服风险。针对该单集群故障风险,日志服务提供两种异地多活的客户端数据采集方案。方案比较 对比项 方案1...

如何解决MSE Nacos实例域名无法解析的问题?

如果使用的是ACK,请 提工单 联系ACK技术支持协助排查CoreDNS故障原因。方案二:使用ping命令 使用 ping${mse.nacos.host} 指令尝试解析。如果提示 unknown host,则无法解析域名。如果提示 PING${mse.nacos.host}(xxx.xx.xx.xx)56(84)...

DescribeSmartVerify

是 认证不通过,可能原因设备存在安全风险。211 安全策略风险。是 认证不通过,可能原因:用户的业务存在安全风险。ResultObject.MaterialInfo.riskInfo 补充说明 ResultObject.MaterialInfo.riskInfo包含风险分值(score)和风险标签...

DescribeSmartVerify

是 认证不通过,可能原因设备存在安全风险。211 安全策略风险。是 认证不通过,可能原因:用户的业务存在安全风险。ResultObject.MaterialInfo.riskInfo 补充说明 ResultObject.MaterialInfo.riskInfo包含风险分值(score)和风险标签...

Quick BI v4.7.4版本说明

性能诊断能力优化 提升判断报表性能风险分析能力。新增组件创建过多时,性能诊断优化建议提醒。数据门户权限申请链路体验优化。新增阿里云StarRocks数据源。变更内容 数据填报能力提升 移动端单选、多选、填报人等控件支持列表的展示形式。...

设计方案

为了更好地定位故障原因,需要对各种告警信息进行关联分析。这样可以快速确定故障的范围和影响,并且能够帮助排查故障的根本原因。告警关联分析可以使用各种工具和算法,如事件关联分析、机器学习等。知识图谱:知识图谱是指通过将各种数据...

功能特性

此外,在数据库实例发生故障且无法定位原因时,可以利用克隆库复现故障场景,以便更好地定位故障原因。智能压测 搜索分析 查询并导出SQL语句对应的日志信息。搜索 SQL洞察 SQL洞察聚类分析,用作深度异常的排查。SQL洞察 安全审计 内置了...

诊断网页加载过慢的问题

慢加载详情 页面顶部的 页面信息 区域展示了本次访问的客户端IP地址、浏览器、操作系统等信息,帮助您确认故障原因。慢加载详情 页面的 页面资源加载瀑布图 区域展示了页面静态资源加载的瀑布图,帮助您快速定位资源加载的性能瓶颈。慢加载...

配置设备级高可用

动态HA功能无需配置虚IP地址,系统会主动帮您探测设备状态,在主网关设备故障时,自动帮您切换流量。智能接入网关仅支持同一实例中的两台设备组建HA备份组,系统会指定默认的主设备和备设备,您可以登录智能接入网关管理控制台查看设备的...

云盒计算资源配置最佳实践

由于这些冗余资源对于用户来说是可见资源,随时可以被用来创建ECS实例或其他云产品实例,因此该方式对于日常业务使用有一定的灵活性,但无法保证在硬件设备故障期间,一定存在可用的备机资源。购买 SLA增值服务包,为计算资源通过SLA保证。...

DescribeSmartVerify

是 认证不通过,可能原因设备存在安全风险。211 安全策略风险。是 认证不通过,可能原因:用户的业务存在安全风险。ResultObject.MaterialInfo.riskInfo 补充说明 ResultObject.MaterialInfo.riskInfo包含风险分值(score)和风险标签...

应用场景

设备风险识别 设备风险识别产品适用于对移动APP上的恶意设备行为进行识别,可以应用到注册、登录、下单、领券等场景,通过传入设备信息,系统进行模拟器检测、恶意工具检测,返回设备风险信息。用户可以根据返回信息甄别模拟器、批量、多开...

阿里云风险识别和检测最佳实践

综合风险分析:分析信息系统及其关键资产将面临哪一方面的威胁及其所采用的威胁方法,利用了系统的何种脆弱性,对哪一类资产,产生了什么样的影响,并描述采取何种对策来防范威胁,减少脆弱性,同时将风险量化。风险评估原则 关键业务原则...

URL风险检测介绍及计费说明

服务说明 URL风险检测适用于对各种场景的URL链接进行检测,支持的服务(service)如下:服务(service)特性说明 适用场景 服务名称:URL风险检测 service:url_detection 基于系统标记的URL库和站点信息进行风险分析。该服务为同步检测...

设备风险识别事件及返回参数

设备风险识别产品主要适用于对移动App上,有效助力企业生成唯一性设备ID,甄别设备环境异常,包括:模拟器检测、多开检测、恶意工具检测、恶意篡改设备参数等。设备风险识别产品可以应用到注册、登录、下单、领券等业务场景,通过传入设备...

云平台及产品默认配置风险分析

云平台及产品的默认配置风险分析需要从以下几个维度考量。风险评估维度 说明 示例 身份认证 检查云平台及云服务的身份认证方式,密码复杂度,身份角色等 RAM密码策略可用于确保密码的复杂性。建议密码长度至少14-32位。授权管理 检查云平台...

风险评估服务

人工发现和工具扫描 服务流程 安全风险评估包含以下阶段:线上评估 主要完成线上评估工作的实施,即通过资产调查、安全基线扫描、漏洞扫描、人员访谈等方式,了解业务系统的安全现状,为风险分析提供资料。数据分析 主要对现场评估阶段采集...

风险审计报告

什么是风险审计报告 风险审计报告是基于实例维度,对实例(或实例中指定的库)进行风险分析诊断,供您参考(不会影响数据库实例)。目前已支持的风险评估项如下:风险评估项 说明 支持的数据库引擎 SQL审核 评估该实例在DMS平台发起的所有...

故障止损恢复

故障初因定位 集成企业内部可利用的所有稳定性相关数据(变更事件,...通用垂直专项快恢能力:通过集成包括DB侧慢SQL限流、变更极速回滚、多活容灾切流快恢等通用的快恢能力,结合监控、日志等数据自动定位的故障原因进行对应的快恢方式推荐。
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
风险识别 检索分析服务 Elasticsearch版 云安全中心 负载均衡 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用