多集群联邦发布容灾

背景信息 当站点因为不可抗力因素或者设备故障导致应用在短时间内无法恢复时,LHC 可提供多集群联邦发布容灾保护。当站点故障时,通过简单的配置,即可在容灾站点迅速恢复业务。容灾是一个范畴比较广泛的概念。广义上,容灾是一个系统工程...

访问策略

6.备用地址池是在默认地址池因故障原因不可用时,可以将用户的访问流量切换至备用地址池上。在 备用地址池 的下拉框中,选择已创建的地址池名称,最后单击 下一步。如果您还没有创建地址池,请参考 创建地址池 文档。注意:如未设置备用...

Spring Boot应用如何快速接入Prometheus监控

这里,为您提供以下两个Grafana社区中的开源大盘模板来构建您自己的业务监测模板。Spring Boot 2.1 Statistics JVM(Micrometer)借助以上模板以及 可观测监控 Prometheus 版 内置的Grafana服务,您可以根据自己的需求,将日常开发和运维过程...

Spring Boot应用如何快速接入Prometheus监控

这里,为您提供以下两个Grafana社区中的开源大盘模板来构建您自己的业务监测模板。Spring Boot 2.1 Statistics JVM(Micrometer)借助以上模板以及 可观测监控 Prometheus 版 内置的Grafana服务,您可以根据自己的需求,将日常开发和运维过程...

使用PTS监测日常业务

步骤二:配置压测量级 由于是业务监测,该示例中将每个接口的起始RPS设置为1。在 创建PTS场景 页面,输入压测配置信息。设置项 目标选项 压力来源 选择 国内公网 压力模式 选择 RPS模式(Requests Per Second)压测总时长 设置为 1 分钟 ...

故障复盘改进详情

0c4840fd3812 幂等校验token 返回数据 名称 类型 示例值 描述 requestId String 4361a0e1-6747-4834-96ce-0c4840fd3811 Id of the request data Object data problemId String 231231 故障ID problemReason String 故障的原因 故障原因 ...

网络资源

网络闪断故障可能由多种原因引起,如网络设备故障、电力波动、通信线路故障等。网络闪断会导致数据传输中断,影响系统和应用程序之间的数据传输,频繁的网络闪断可能导致系统或应用程序无法正常运行。常使用的容错策略如下:设备冗余:使用...

什么是应用实时监控服务ARMS?

在线业务监测。产品计费 Insights 对应用进行定时巡检的智能运维工具。针对巡检后发现的问题,Insights可以给出具体的根因分析和建议,同时支持订阅告警。根据调用链路的根因分析。免费公测中 告警管理 提供了可靠的告警收敛、通知、自动...

什么是消息演练

随着应用规模的扩大,系统变得越来越复杂,不可避免地会走向分布式化。各种中间组件会相继被引入系统,其中分布式消息服务更是系统中必不可少的一...需要注意的是演练场景仅是组件表象,其内部故障原因可能是多种多样的,需要进一步进行分析。

使用PTS监测日常业务

步骤二:配置压测量级 由于是业务监测,该示例中将每个接口的起始RPS设置为1。在 创建PTS场景 页面,选择 施压配置 页签。在 施压配置 页签,输入压测配置信息。设置项 目标选项 压力来源 选择 国内公网 压力模式 选择 RPS模式(Requests ...

故障管理

相关设备故障:包括UPS失效引起的电力中断。自然灾害,包括洪水、火灾、地震。这里以阿里集团为例。为降低故障的影响,阿里集团故障管理体系从整体体系化治理的角度出发,将影响真实业务的场景定义、发现和应急能力以及后续治理都纳入故障...

功能概览

跨可用区容灾 当生产站点因为不可抗力因素(比如机房火灾、断电)或者设备故障(软、硬件破坏)导致应用在短时间内无法恢复时,ECS容灾服务支持业务的跨可用区(Availability Zone)的容灾能力,对整体的应用做容灾备份来应对单地区的故障...

计费说明

经阿里云工作人员确认设备故障时,可提交设备更换申请。说明 仅支持更换同规格的设备。如需更换其他规格设备,请申请退还当前设备后,重新下单租用其他规格的设备。计费规则 按月出账,次月扣费。计费最少3个月起,租期少于3个月,剩余时长...

消息未到达设备原因

消息未到达设备原因 在对设备进行消息下发时,经常会碰到设备没有收到消息,一般有以下原因影响消息到达:设备在发送消息时没有在线,可在消息发送后,通过 CMNS-设备在线查询 进行确认设备是否在线。设备在消息有效期内都没有联网,可通过...

托管节点池节点自动恢复

当发现节点故障时,ACK会根据故障原因触发对应恢复任务,并记录相应的事件。当恢复任务完成后,故障状态解除,节点恢复正常状态。当恢复任务完成后,故障状态依然存在,节点会被置为恢复失败状态。说明 如果集群中存在多个节点池,节点池...

同城多活常见问题

资源双活在业务节点故障时,南北走向流量切走,东西走向流量仍旧持续进入,业务无法恢复,因此无法做到业务同城多活。和EDAS、MSE集群流量同可用区优先的差异和优势?类别 MSHA EDAS、MSE 微服务日常场景 面向可用区级别,解决RT问题。面向...

云端运行日志

通过日志记录的消息内容、业务类型、操作类型和状态码等信息,可以了解设备状态、通信情况,并定位操作失败的原因,帮助您监控和管理设备,进行故障排查。本文介绍如何查看云端运行日志,以及相关错误码和排错方法。日志业务类型说明 上行...

什么是物模型

例如,环境监测设备所读取的当前环境温度、智能灯开关状态、电风扇风力等级等。属性可分为读写和只读两种类型。读写类型支持读取和设置属性值,只读类型仅支持读取属性值。服务(Service)指设备可供外部调用的指令或方法。服务调用中可...

ping不通云服务(SAG-100WM)

可能原因 终端到设备的链路故障设备到阿里云的VPN链路故障。目标ECS故障。运营商网络故障。解决方案 登录 智能接入网关控制台。单击智能接入网关实例ID,查看设备状态是否为 可用。如果离线,请参见 设备显示离线 处理。如果在线,请参见...

无法连接到同一个云连接网内的本地客户端

本文介绍SAG-1000设备无法连接到同一个云连接网内的本地客户端的原因和处理方法。问题现象 SAG-1000设备无法连接到同一个云连接网内的其他本地客户端。可能原因 终端到设备的链路故障设备到阿里云的VPN链路故障。目标PC环境的网络故障。...

应用场景

物联网设备无时无刻不在产生海量的设备状态数据和业务消息数据,这些数据有助于进行设备监控、业务分析预测和故障诊断。背景信息 设备将原始数据通过 MQTT 协议发送到物联网平台,经由物联网平台将数据转发到消息服务系统,继而通过流计算...

ping不通云服务ECS(SAG-1000)

本文介绍SAG-1000设备无法ping通ECS实例的原因和处理方法。问题现象 终端无法连接到阿里云,例如ping不通同CEN的ECS。可能原因 终端到设备的链路故障设备到阿里云的VPN链路故障。目标ECS故障。运营商网络故障。解决方案 登录 智能接入...

EMR Kafka磁盘故障运维

当出现磁盘故障时,需要根据故障原因、故障影响程度、业务需求(是否接受数据丢失、是否允许服务较长时间不可用)、集群状态等综合考虑恢复采取的策略。如果业务优先保证服务可用,但允许丢失部分数据,则应考虑在可能会丢失数据的情况下,...

CLB访问日志功能简介

在使用CLB的七层负载均衡(HTTP/HTTPS监听)期间,如果您需要通过负载均衡日志进行业务开发测试、故障处理、客户端用户行为数据分析等,您可使用CLB访问日志功能分析负载均衡日志。CLB结合阿里云日志服务提供的访问日志功能,可帮助您大幅...

设备级高可用

在购买智能接入网关设备时,您可以选择购买两台设备,两台设备绑定到同一实例中,互为备份,在一台设备发生故障时进行设备切换,保障业务不中断。通过本文您可以在智能接入网关控制台查看设备级备份信息。前提条件 您购买的智能接入网关...

什么是用户体验监控

完整再现用户操作过程,从页面打开速度(测速)、请求服务调用(API)和故障分析(JS错误、网络错误等)稳定性(JS错误、崩溃、ANR 等)方面监测前端应用性能表现情况,并支持日志数据查询,帮助您快速跟踪定位故障原因,提升用户体验。...

名词解释

属性 设备的功能模型之一,一般用于描述设备运行时的状态,如环境监测设备所读取的当前环境温度等。属性支持GET和SET请求方式。应用系统可发起对属性的读取和设置请求。期望属性值 通过期望属性值功能,设置您希望的设备属性值。若设备在线...

功能特性

设备诊断 针对设备运行数据提供的一系列运维场景智能服务,帮助您分析判断设备故障、探测设备潜在风险并及时预知业务异常。查看运维大盘 展示设备的地区热力图分布,方便您直观、快速地了解所有设备的状态。在线调试 直接从物联网平台控制...

强弱依赖治理概述

故障根源定位:后台系统的故障,往往通过上一级的业务故障表现出来。故障处理讲究的是争分夺秒,良好的强弱依赖,对于系统自动化诊断有非常大的助力作用。依赖容量评估:正常调用链路下的系统容量需要评估。例如当某个弱依赖挂掉时,需要...

应用场景

设备维护成本降低 您可以使用工业大脑平台,预测设备故障并进行维护,具体应用场景如下。设备行业:企业使用物联网与算法模型技术提前预测风机故障。通过温度传感器对整个风机的温度测点进行实时监控,并对海量温度数据进行深度学习,构建...

归档存储服务等级协议

服务赔偿条款 2.13.1 赔偿范围:因阿里云设备故障、设计缺陷或操作不当导致用户所购买的归档存储服务无法正常使用,阿里云将对不可用时间进行赔偿,但不包括以下原因所导致的服务不可用时间:(1)阿里云预先通知用户后进行系统维护所引起...

设计原则

这样可以确保一台设备故障时,数据仍然可用;容灾计划:制定容灾计划,包括灾难恢复策略、应急响应流程和恢复时间目标(RTO)等。容灾计划应该经常进行测试和演练,以确保其可行性和有效性;数据备份与恢复:定期进行数据备份,并确保备份...

数据服务简介

数据智能 物联网平台中数据服务的数据智能提供了算法模板和算法实例,协助您更好的解读设备数据,及时地掌控设备运行状态或者监测设备状况。DataWorks离线数据集成 物联网平台数据服务中的平台系统表、产品属性时序表、产品事件表和自定义...

网络架构容灾

如果为了满足业务对延迟等需求,必须选择相同接入点,也必须保证两条专线在两个不同的接入设备上,这样即使有一台设备故障导致其中一条线路异常时,也可以保证另外一条线路正常运转。专线/VPN主备:在物理专线、IPSec-VPN连接、BGP动态路由...

订阅事件通知

数据传输服务DTS(Data Transmission Service)已接入云监控平台,您可以通过事件订阅对重要的事件设置定制化的报警通知,让您及时了解事件的发生与进展,帮助您实时掌握事件动态,便于您在业务故障时快速分析并定位问题。背景信息 云监控...

服务介绍

这些应用程序能够帮助用户实时监测设备业务状态,优化经营策略,延长设备寿命,并提高设备性能和效率等。使用限制 目前仅华东2(上海)和华北2(北京)地域的 企业物联网平台 形态的实例支持IoT孪生引擎服务,并提供试用版、企业版和旗舰...

数据智能概述

功能简介 算法实例 通过配置算法实例,来分析光伏电站运维数据或设备运行数据,使您能及时监测和掌控光伏电站或设备的运行状态和故障情况。算法模板 物联网平台提供算法模板供您使用,您可以查看算法模板的详情信息,如:算法详细介绍、...

使用云监控功能监控网站环境(部署于ECS实例)

设置合理的监控可以让您实时了解系统业务的运行情况,并能帮助您提前发现问题,避免可能会出现的业务故障。同时,告警机制能让您在故障发生后第一时间发现问题,缩短故障处理时间,以便尽快恢复业务。前提条件 在开始设置云监控前,您需要...

设备端开发

完成物联网平台控制台的配置工作后,您需要进行设备业务开发。本文通过Node.js脚本模拟设备业务行为,实现设备的MQTT建连和数据上报。操作步骤 在Windows系统或Linux系统 下载并安装Node.js。本文以Windows 10(64位)系统为例,下载安装...

源为PolarDB-X的功能规范和约束说明

在出现故障(如网络中断、机房批量设备故障或互联网数据中心IDC故障),且DTS任务存在延迟的情况下,此时如更新至目标库的最后一条数据的时间与故障发生时的时间之差小于RPO(如5分钟),则可以业务优先恢复为准则切流。切流后可能有5分钟...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
物联网无线连接服务 云数据库 Redis 版 云服务器 ECS 负载均衡 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用