如何使用Prometheus监控Cassandra

预置的Cassandra告警规则如下:指标分类 指标名称 指标含义 节点状态 集群中宕机的节点比例 若该指标大于10,表示集群中存在节点宕机。节点资源使用情况 节点的CPU使用率 若节点CPU使用率在过去5分钟内超过85%,表示CPU已达到瓶颈。节点的...

如何使用Prometheus监控Cassandra

预置的Cassandra告警规则如下:指标分类 指标名称 指标含义 节点状态 集群中宕机的节点比例 若该指标大于10,表示集群中存在节点宕机。节点资源使用情况 节点的CPU使用率 若节点CPU使用率在过去5分钟内超过85%,表示CPU已达到瓶颈。节点的...

堡垒无法连接ECS排查步骤

问题描述 堡垒机调用ECS失败 可能原因【可能原因一】堡垒机到ECS服务器的网路端口通信失败【可能原因二】堡垒机的相关配置影响【可能原因三】ECS 系统自身的相关策略影响 解决方案【可能原因一】堡垒机到ECS服务器的网路端口通信失败【解决...

远程文件系统

如果您的数据保存在远程文件系统(例如远程Windows文件系统远程Linux文件系统、NAS服务器)中,您需要将远程文件系统挂载至闪电立方设备上进行数据迁移。本文介绍配置业务IP地址,及挂载远程文件系统至闪电立方设备的操作步骤。前提条件 ...

远程文件系统

如果您的数据保存在远程文件系统(例如远程Windows文件系统远程Linux文件系统、NAS服务器)中,您需要将远程文件系统挂载至闪电立方设备上进行数据迁移。本文介绍配置业务IP地址,及挂载远程文件系统至闪电立方设备的操作步骤。前提条件 ...

Java应用监控和诊断方案

基于ARMS的应用监控方案 ARMS提供的 应用监控 功能,脱胎于阿里巴巴内部的分布式跟踪与监控系统(内部称为“鹰眼系统”),可以在不修改任何现有代码的情况下帮助网站开发人员和运维人员解决上述问题。调用拓扑图 您可以在ARMS中看到应用的...

什么是阿里云应用监控 eBPF 版

阿里云 应用监控 eBPF 版 是一套针对Kubernetes集群开发的一站式可观测性产品,基于Kubernetes集群下的指标、应用链路、日志和事件。阿里云 应用监控 eBPF 版 旨在为IT开发运维人员提供整体的可观测性方案。说明 应用监控 eBPF 版 目前正在...

错误码和状态码说明

说明 当探测成功或探测失败时,请您优先关注云监控自定义的错误码。如果因DNS或网络等原因造成探测失败,服务端不会返回响应结果,则不会有HTTP状态码。云监控自定义错误码说明 协议 错误码 含义 HTTP 610 探测超时或请求响应超时,包含TCP...

远程服务访问

远程运维包含了远程连接(SSH协议)、远程文件管理(SFTP协议)和其他基于TCP协议的网络服务远程访问。远程访问主机 远程访问主机基于SSH技术实现,方便您远程登录边缘一体进行设备控制和文件管理,其使用的用户名和密码是边缘一体上...

基础术语

中文 英文 定义 报表 Report 指包含单个或多个数据源的视图,集中展示各数据源的监控结果。大盘 Dashboard 指包含多个报表的一个页面。调用外部的服务 Service Access Layer(SAL)在一个面向服务架构(SOA)中,系统之间有复杂的服务依赖...

什么是可观测监控 Prometheus 版

阿里云 可观测监控 Prometheus 版 全面对接开源Prometheus生态,支持类型丰富的组件监控,提供多种开箱即用的预置监控大盘,且提供全面托管的Prometheus服务。说明 Prometheus是一套开源的监控报警系统。主要特点包括多维数据模型、灵活...

什么是可观测监控 Prometheus 版

阿里云 可观测监控 Prometheus 版 全面对接开源Prometheus生态,支持类型丰富的组件监控,提供多种开箱即用的预置监控大盘,且提供全面托管的Prometheus服务。说明 Prometheus是一套开源的监控报警系统。主要特点包括多维数据模型、灵活...

查看实例监控信息

实例是否安装云监控插件会导致在ECS管理控制台查看到的监控数据不同:实例已安装云监控插件:ECS管理控制台的监控项中,CPU、内存、系统负载数据为云监控的操作系统监控项,其他监控项与云监控的基础监控项一致。实例未安装云监控插件:在...

API概览

SendDryRunSystemEvent 调试云资源的系统事件 调用SendDryRunSystemEvent接口调试云资源的系统事件。自定义事件 自定义事件 DescribeCustomEventCount 查询自定义事件的统计结果 调用DescribeCustomEventCount接口查询自定义事件的统计结果...

版本说明

本文为您介绍云监控插件的版本...当系统负载较重或其他原因导致云监控插件的系统资源占用超过限制时,插件会自动退出。修复问题 解决Go版本的云监控插件自动修改系统时间等问题。早期版本 云监控插件的早期版本说明,请参见 早期版本说明。

监控添加进程监控报错:Add Task Error

本文为您介绍云监控添加进程监控报错的原因及解决方法。在云监控中添加进程监控的时候,遇到 Add Task Error:add error 的报错。原因:是由于服务器上没有安装安骑士(云盾客户端)。解决办法:请在服务器上安装安骑士(云盾客户端)。

通过IO HANG诊断并排查磁盘繁忙问题

系统稳定性角度来看,IO HANG可能会引起大量的进程进入等待状态,导致系统高负载,甚至系统夯住,shell命令无法执行,机器无法登录,最终必须重启系统。IO HANG诊断的作用 IO HANG诊断可用于检测当前系统中的IO HANG事件并确定问题边界,...

通过脚本录制断言特定业务逻辑的执行结果

您可以通过创建浏览器探测任务,模拟用户在不同地域、不同网络环境下通过浏览器访问探测目标,观测探测...对于错误的探测记录,您可以先单击其对应 操作 列的 详情,再在 详情分析 页面,单击 详细步骤 页签,查看具体操作步骤及其错误原因

Demo体验

阿里云提供Web版远程监考Demo供您体验。本文为您介绍远程监考方案的主要功能及Demo体验方式。前提条件 说明 您可以加入钉钉群44911608,咨询详细方案。您的体验环境,至少需要有一个PC浏览器端和一个移动浏览器端,其中:PC端浏览器:用于...

Demo体验

阿里云提供Web版远程监考Demo供您体验。本文为您介绍远程监考方案的主要功能及Demo体验方式。前提条件 说明 您可以加入钉钉群44911608,咨询详细方案。您的体验环境,至少需要有一个PC浏览器端和一个移动浏览器端,其中:PC端浏览器:用于...

使用Remote Read和Remote Write地址以实现开源与云上...

可观测监控 Prometheus 版 提供了Remote Write和Remote Read两个标准接口,您可以通过这两个接口远程存储 Prometheus 的监控数据。本文以开源 Prometheus 将监控数据写入阿里云 可观测监控 Prometheus 版 服务为例介绍如何使用Remote Read...

使用Remote Read和Remote Write地址以实现开源与云上...

可观测监控 Prometheus 版 提供了Remote Write和Remote Read两个标准接口,您可以通过这两个接口远程存储 Prometheus 的监控数据。本文以开源 Prometheus 将监控数据写入阿里云 可观测监控 Prometheus 版 服务为例介绍如何使用Remote Read...

JVM监控内存详情说明

直接缓冲区 Java中的直接缓冲区(Direct Buffer)是一种特殊类型的缓冲区,它直接在操作系统的内存中分配空间,而不是在Java虚拟机的堆内存中分配。直接缓冲区的主要特点是可以提供更快的I/O操作,并且可以避免内存复制的开销,因此在处理...

远程连接FAQ

本文介绍在远程连接轻量应用服务器过程中可能存在的问题、排查思路和相应的解决方案。排查思路 如果无法远程连接轻量应用服务器时,阿里云推荐您按照以下思路排查问题。以下排查思路根据原因的出现概率进行排序,建议您从高频率原因往低...

概述

ls/etc/ilogtail/telegraf 采集模式 使用Telegraf采集监控数据时,您可以选择如下两种采集方式:本机采集 使用Telegraf采集本机的监控指标,您机器组中的机器即为您采集的目标机器,配置页面中的服务器地址可填写为127.0.0.1。如果无特殊...

堡垒运维常见报错提示

如果仍然无法登录,请参考以下方法进行排查:情况一:检查Windows系统远程设置是否勾选“只允许通过网络级别身份验证”,若此项被勾选上,且满足以下三项之一,则通过堡垒自动登录Windows会报错。堡垒中未托管Windows的账号密码。未将...

实践教程

ARMS产品 文档 应用监控 调用链采样模式选择 诊断服务端报错问题 诊断应用卡顿问题 业务日志关联调用链的TraceId信息 通过错/慢调用链排查应用产生异常的原因 添加并使用标签 跨账号统一应用监控 其他更多操作请参见 应用监控最佳实践。...

通过PC端探测目标站点的网络质量

监控通过站点监控的探测点(请求方)模拟最终用户的访问行为,从而获得各地域探测点到目标地址(监控地址)的访问数据。当您希望通过阿里云网络、运营商网络和海外云服务提供商网络探测目标站点时,用PC端探测。前提条件 请确保您已创建...

全景监控

从应用视角提供平台内跨系统的从数据生产到业务应用的全链路监控能力,其提供的监控端可将多系统的状态信息进行上报汇总和集中推送。提供自定义监控链路配置能力,快速实现从数据生产到数据应用的全链路编排及溯源和监控节点的稳定性分析。...

功能简介

从应用视角提供平台内跨系统的从数据生产到业务应用的全链路监控能力,其提供的监控端可将多系统的状态信息进行上报汇总和集中推送。提供自定义监控链路配置能力,快速实现从数据生产到数据应用的全链路编排及溯源和监控节点的稳定性分析。...

功能简介

从应用视角提供平台内跨系统的从数据生产到业务应用的全链路监控能力,其提供的监控端可将多系统的状态信息进行上报汇总和集中推送。提供自定义监控链路配置能力,快速实现从数据生产到数据应用的全链路编排及溯源和监控节点的稳定性分析。...

概览

运维 云盾堡垒机的运维操作可以通过连接协议代理端口实现,现有规则表如下:运维协议 端口号 四层协议 SSH 60022 TCP Windows远程桌面 63389 TCP SFTP 60022 TCP FTP 60021 TCP VNC 5900 TCP Windows远程桌面网关 44300 TCP 您可以使用标准...

如何通过云监控查看指定日期的监控数据?

本文为您介绍如何通过云监控控制台查看指定日期的监控数据。操作步骤 登录 云监控控制台。在左侧导航栏,单击 主机监控。在 主机监控 页面,单击目标主机对应 操作 列的 监控图表。您可以选择指定日期查看监控数据。说明 目前云监控只支持...

通过移动端探测目标站点的网络质量

监控通过站点监控的探测点(请求方)模拟最终用户的访问行为,从而获得各地域探测点到目标地址(监控地址)的访问数据。当您希望通过蜂窝网络探测目标站点时,用移动端探测。前提条件 请确保您已创建报警联系人和报警联系人组。具体操作...

新功能发布记录

2021-07-30 全部地域 接入外部报警 2021年05月 功能名称 功能描述 发布时间 发布地域 相关文档 监控大盘 线下IDC、阿里云产品和其他云厂商产品的监控数据接入云监控后,您可以为监控数据创建监控大盘,通过监控大盘查看指定监控指标的监控...

CreateOrUpdateAlertRule-创建或修改告警规则

节点磁盘利用率-appstat.jvm.systemload:节点机系统负载-appstat.jvm.systemmemfree:节点空闲内存-appstat.jvm.systemmemusage:节点内存利用率-appstat.jvm.systemnetinerrs:节点接受错误报文数-appstat.jvm.systemnetouterrs...

等保最佳实践

在左侧导航栏,选择 运维审计>操作日志,可以查看用户登录堡垒机的操作记录。审计记录应包括事件的日期和时间、用户、事件类型、事件是否成功及其他与审计相关的信息 堡垒机审计信息包含日期和时间、用户、事件类型、运维协议、操作行为...

接入外部报警

接入外部报警是指外部系统(非云监控)通过云监控的报警渠道进行报警。您可以通过云监控提供的报警服务调用地址,实现该功能。前提条件 请确保您已创建报警联系组。具体操作,请参见 创建报警联系组。操作步骤 登录 云监控控制台。在左侧...

常用操作

重要 云监控仅支持通过管理员账号权限(Linux操作系统使用root用户,Windows操作系统使用Administrator用户)操作云监控插件。使用管理员账号具有一定风险,如果操作不当可能导致系统稳定性问题或数据安全问题,请谨慎操作。启用插件 ...

DescribeMonitoringAgentStatuses-查询云监控插件运行...

调用DescribeMonitoringAgentStatuses接口查询云监控插件运行状态。接口说明 本文将提供一个示例,查询实例 i-hp3dunahluwajv6f*的云监控插件的运行状态。返回结果显示云监控插件的运行状态为 running(运行中)。调试 您可以在OpenAPI ...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
云虚拟主机 云数据库 Redis 版 运维安全中心(堡垒机) 轻量应用服务器 短信服务 弹性公网IP
新人特惠 爆款特惠 最新活动 免费试用