设计原则

自动化监控与报警:通过自动化监控系统,实时监测云计算环境的状态,如网络、存储、计算资源等。当发生异常或故障时,及时发出警报并采取相应的响应措施;容灾演练:定期进行容灾演练,模拟灾难事件,并测试数据恢复的能力和容灾计划的有效...

概览

自定义监控为您提供了自由定义监控项的功能,您可以通过上报监控数据接口,将自己关心的业务指标上报至云监控,并进行集中监控。使用限制 上报监控数据的使用限制如下:华北2(北京)、华东2(上海)和华东1(杭州)地域的QPS限制为200,...

使用安全隧道远程访问设备

本文以Linux系统设备为例,为您介绍通过安全隧道实现远程访问设备的方案。本示例中的安全隧道通过控制台页面手动创建,您可以参考本文示例中安全隧道实现方式,基于实际业务需求,设计开发自己设备中本地服务的远程访问功能。设备端开发 ...

主机可观测

提供完善的上下游监控数据 为了实现一个系统级的、全面的可观测性,单一实体监控是不够的,需要整合不同维度的监控数据并构建全链路观测,确保监控系统能够反映出整个应用和服务生态的健康和性能。涵盖从底层硬件到应用层再到外部服务...

主机可观测

提供完善的上下游监控数据 为了实现一个系统级的、全面的可观测性,单一实体监控是不够的,需要整合不同维度的监控数据并构建全链路观测,确保监控系统能够反映出整个应用和服务生态的健康和性能。涵盖从底层硬件到应用层再到外部服务...

前端监控场景

现有的Server端监控系统相对已经很成熟了,而页面加载和页面运行时的状态监控一直比较欠缺。主要原因是对于前端监控的重视不足,认为服务端的监控可以部分替代前端监控,这种想法就导致系统在线上运行时,无法感知用户访问系统时的具体情况...

功能特性

终端管控 终端访问控制系统通过安装MDM证书来对企业办公终端进行统一管理,帮助IT管理员完成可信设备的登记、部署、系统配置管理及保障可信设备安全的设备全生命周期管理能力。UEM维护企业的可信设备列表,并通过OTA的模式来确保办公终端...

围绕混沌工程的平台实践

AHAS Chaos除了提供一些基础的系统指标如CPU、内存、网络、磁盘之外,还集成了阿里云的ARMS,如果您的应用已经接入ARMS就可以在AHAS Chaos里直接观测到对应的指标,后续也将会集成更多的监控系统,功能如下图所示。更多信息,请参见 创建...

国标协议介绍

报警事件通知和分发:应能实时接收报警源发送来的报警信息,根据报警处置预案将报警信息及时分发给相应的用户终端或系统设备。设备信息查询:应支持分级查询并获取联网系统中注册设备或系统的目录信息、状态信息等。状态信息报送:应支持...

设备接入概述

无操作系统设备接入 模组OpenCPU RTOS 基于ESP-IDF框架集成LinkSDK。乐鑫ESP32开发板移植 设备开发:连接与消息 物联网平台为满足不同的设备接入需求,支持多种协议和多种认证方式,下面介绍设备接入物联网平台的几种方案。功能 说明 相关...

基本概念

云原生中间件 物联网边缘计算在边缘一体机中集成的开源数据库、消息系统、监控系统等,统称为云原生中间件。二进制运行时 边缘一体机软件架构中的一种应用运行时,表示边缘一体机基于二进制运行。容器运行时 边缘一体机软件架构中的一种...

监控报警概述

故障预警 云电脑的故障信息、故障原因及故障时间等信息。使用场景 在日常业务运行的过程中,监控大盘帮助您及时了解账号下全部云电脑资源的全局情况,实时监控提供更详细的数据指标和故障预警信息,帮助您了解终端用户使用云电脑的情况,...

什么是应用实时监控服务ARMS?

应用实时监控服务(Application Real-Time Monitoring Service)作为一款云原生可观测产品平台,包含应用监控、前端监控、Prometheus监控、云拨测、Grafana服务、告警管理等一系列子产品。其覆盖浏览器、小程序、APP、分布式应用、容器等...

什么是ARMS前端监控

现有的服务器端监控系统相对已经很成熟,而页面加载和页面运行时的状态监控一直比较欠缺。例如:无法第一时间获知用户访问您的站点时遇到的错误。各个国家、各个地区的用户访问您的站点的真实速度未知。每个应用内有大量的异步数据调用,而...

如何使用Prometheus监控Nebula

每套完整的自建监控系统都需要安装并配置Prometheus、Grafana、AlertManager等,其过程复杂、实施周期长。缺少与阿里云ECS快速集成的服务发现(ServiceDiscovery)机制,因此无法根据ECS标签来灵活定义抓取Targets。如果自行实现类似功能,...

如何使用Prometheus监控Nebula

每套完整的自建监控系统都需要安装并配置Prometheus、Grafana、AlertManager等,其过程复杂、实施周期长。缺少与阿里云ECS快速集成的服务发现(ServiceDiscovery)机制,因此无法根据ECS标签来灵活定义抓取Targets。如果自行实现类似功能,...

如何使用Prometheus监控TiDB

每套完整的自建监控系统都需要安装并配置Prometheus、Grafana、AlertManager等,其过程复杂、实施周期长。缺少与阿里云ECS快速集成的服务发现(ServiceDiscovery)机制,因此无法根据ECS标签来灵活定义抓取Targets。如果自行实现类似功能,...

如何使用Prometheus监控TiDB

每套完整的自建监控系统都需要安装并配置Prometheus、Grafana、AlertManager等,其过程复杂、实施周期长。缺少与阿里云ECS快速集成的服务发现(ServiceDiscovery)机制,因此无法根据ECS标签来灵活定义抓取Targets。如果自行实现类似功能,...

响应云盒维修事件

当云盒中的硬件设备发生故障需要更换时,阿里云会向您发送云盒维修事件通知,您需要授权同意阿里云上门更换并维修硬件设备。本文为您介绍云盒维修相关的流程,以及如何响应云盒维修事件。背景信息 配置云盒计算资源时,您需要配置一定的...

使用示例

远程登录功能主要应用于设备发生故障导致设备不可用时,对设备进行远程运维。本文以C Link SDK中的Demo文件./demos/remote_access_basic_demo.c 为例,介绍如何调用Link SDK的API,帮助设备实现远程登录功能。背景信息 远程登录功能的更多...

常见问题

Linux系统的ECS中没有禁ping却ping不通的解决方法 当IIS搭建的网站显示“500-内部服务器错误”时如何查看真实报错信息 远程连接问题 无法远程连接Windows实例的处理方法 无法通过SSH远程登录Linux实例时的排查指引 如何查看和修改Windows...

故障复盘

复盘文档一般包含以下内容:故障简述:故障概述、影响面、处理人等 故障背景:故障发生时的业务链路 故障时间线:着重强调故障引入、故障发生、故障发现、业务响应、恢复执行、故障恢复几个时间点 故障原因分析:建议先一句话总结,再进行...

什么是业务实时监控

业务实时监控(Real-time Monitoring Service,简称 RMS)是一款具有...高可用:提供万台设备的分钟级监控部署能力,故障自动恢复,集群可伸缩。稳定高效的时序和数据存储:在线持续聚合数据,保证数据容量可控,提供智能分级存储、存放策略。

如何使用Prometheus监控SNMP

本文介绍如何使用Prometheus监控SNMP。前提条件 已创建 容器服务类型的Prometheus实例,具体操作,请参见 Prometheus实例 for 容器服务。使用限制 目前仅Prometheus实例 for 容器服务类型实例支持该组件接入。SNMP简介 SNMP系统组成 SNMP...

如何使用Prometheus监控SNMP

本文介绍如何使用Prometheus监控SNMP。前提条件 已创建 容器服务类型的Prometheus实例,具体操作,请参见 Prometheus实例 for 容器服务。使用限制 目前仅Prometheus实例 for 容器服务类型实例支持该组件接入。SNMP简介 SNMP系统组成 SNMP...

如何使用Prometheus监控Kafka

每套完整的自建监控系统都需要安装并配置Prometheus、Grafana、AlertManager等,其过程复杂、实施周期长。开源Kafka JMX Agent 在某些场景下占用CPU高,对自建Kafka业务有一定干扰。对于 阿里云消息队列Kafka(简称阿里云Kafka),自建...

如何使用Prometheus监控Kafka

每套完整的自建监控系统都需要安装并配置Prometheus、Grafana、AlertManager等,其过程复杂、实施周期长。开源Kafka JMX Agent 在某些场景下占用CPU高,对自建Kafka业务有一定干扰。对于 阿里云消息队列Kafka(简称阿里云Kafka),自建...

什么是云监控

监控(CloudMonitor)是一项针对阿里云资源和互联网应用进行监控的服务。云监控为云上用户提供开箱即用的企业级开放型一站式监控解决方案。云监控涵盖IT设施基础监控和外网网络质量拨测监控,是基于事件、自定义指标和日志的业务监控,为...

概览

智能阈值报警是针对云监控中的云资源实例的监控指标推出的智能报警功能,它自动适配并拟合监控指标的历史数据,展示报警阈值边界,发现监控指标突增或突降的异常行为,为您业务的稳定性提供保障。什么是智能阈值 智能阈值基于机器学习算法...

故障应急协同

故障通告及更新 基于7x24监控值班工作特性,对于业务异常达到故障等级时,以用户定制的(语音、短信、IM)的方式在约定时间内将故障影响信息以及处理进展通知给对应的接收人/组,并持续更新直至故障结束。故障应急协同群 故障发生后,可以...

如何通过阿里云注册集群和Prometheus...多云容器集群监控

Prometheus可有效监控系统层指标、应用层指标、业务层指标等,采集监控指标后进行存储,同时结合Grafana可实现监控指标的展示和告警等。Prometheus和Grafana结合的方案可有效进行容器集群监控指标采集、存储、展示、告警等,能够有效帮助...

如何通过阿里云注册集群和Prometheus...多云容器集群监控

Prometheus可有效监控系统层指标、应用层指标、业务层指标等,采集监控指标后进行存储,同时结合Grafana可实现监控指标的展示和告警等。Prometheus和Grafana结合的方案可有效进行容器集群监控指标采集、存储、展示、告警等,能够有效帮助...

Demo体验

阿里云提供Web版远程监考Demo供您体验。本文为您介绍远程监考方案的主要功能及Demo体验方式。前提条件 说明 您可以加入钉钉群44911608,咨询详细方案。您的体验环境,至少需要有一个PC浏览器端和一个移动浏览器端,其中:PC端浏览器:用于...

Demo体验

阿里云提供Web版远程监考Demo供您体验。本文为您介绍远程监考方案的主要功能及Demo体验方式。前提条件 说明 您可以加入钉钉群44911608,咨询详细方案。您的体验环境,至少需要有一个PC浏览器端和一个移动浏览器端,其中:PC端浏览器:用于...

监控、诊断和故障排除

相对于传统应用程序,开发云端应用虽然降低了用户在基础设施搭建、运维等方面的成本,但却增大了监控、诊断和故障排查的难度。OSS存储服务为您提供了丰富的监控和日志信息,帮助您深刻洞察程序行为,及时发现并快速定位问题。本文主要描述...

无法远程连接Windows实例的排查方法

无法远程连接Windows实例的原因较多,请您根据实际情况,通过相应的排查方法,排查并解决无法远程连接Windows实例的问题。本文主要介绍无法远程连接Windows实例的处理方法。快速登录Windows实例 如果您遇到紧急情况,需要尽快登录Windows...

使用系统事件报警

监控集中管理各云产品的系统事件和自定义事件。您可以为云产品的系统事件设置报警规则,当异常发生时,您可以及时收到报警通知,便于快速分析并定位问题。本文为您介绍创建和调试系统事件报警规则的方法。背景信息 云监控支持的事件类型...

插件概览

监控的主机监控服务通过在主机上安装云监控插件,为您提供主机的系统监控服务。插件版本 云监控插件共有三个版本,从前往后依次为Java、Go和C++版本,当前最新版本为C++版本。由于C++版本的云监控插件比Go和Java版本占用的CPU和内存资源...

使用自定义事件报警

监控集中管理各云产品的系统事件和自定义事件。您可以为云产品的系统事件设置报警规则,当异常发生时,您可以及时收到报警通知,便于快速分析并定位问题。本文为您介绍自定义事件报警规则的创建方法。前提条件 请确保您已上报自定义事件...

远程登录

您可使用远程登录功能,通过SSH协议的网络服务远程访问设备,在设备远程控制台输入设备的指令,进行调试和定位问题。本文介绍如何使用远程登录功能。前提条件 已获取设备认证信息。具体操作,请参见 获取设备认证信息。已下载C LinkSDK ...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
云监控 轻量应用服务器 视图计算 负载均衡 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用