[帮助文档] 为KServe配置Prometheus监控以监控模型服务的性能和健康状况

KServe提供了一套默认的Prometheus指标来帮助您监控模型服务的性能和健康状况。本文以Qwen-7B-Chat-Int8模型、GPU类型为V100卡为例,介绍如何为KServe框架配置Prometheus监控。

[帮助文档] 通过指标探索验证监控数据

在可观测监控 Prometheus 版控制台的指标探索页面,您可以通过选择指标或者编写PromQL查看、验证您的监控数据。

3天吃透Prometheus

11 课时 |
421 人已学 |
免费
开发者课程背景图

[帮助文档] 通过指标探索验证监控数据

在可观测监控 Prometheus 版控制台的指标探索页面,您可以通过选择指标或者编写PromQL查看、验证您的监控数据。

[帮助文档] 自监控查询

当需要查询指标采集任务的状态时,Targets信息是最直接的状态反馈。

[帮助文档] 配置自定义采集监控指定地址暴露的指标

通过配置自定义采集功能,您可以采集容器或ECS实例中指定地址所暴露的监控指标,使得Prometheus更加灵活、自动化和易于管理。本文档以容器为例进行说明。

Prometheus: ansible+consul自动发现,监控服务器

Prometheus: ansible+consul自动发现,监控服务器

一,安装部署ansible和准备hosts文件yum -y install ansible注: 我把Prometheus和grafana的目录都放在新建目录/opt/monitor中,为方便管理,在其目录下创建ansible目录,所需要的文件,脚本都放在ansible下cd /opt/monitor...

Prometheus+Redis_exporter基于consul动态发现实现redis多实例监控

Prometheus+Redis_exporter基于consul动态发现实现redis多实例监控

Redis exporter使用 Prometheus 进行 Redis 监控的都知道,Redis_exporter 是较常用的解决方案,但是在 redis_exporter 开始的版本中,并不支持一个 redis_exporter 实例监控多 Redis 实例,这样造成 exporter 实例的数...

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

相关电子书
更多
云原生可观测Prometheus:构建开放的全栈可观测能力
RocketMQ Prometheus Exporter 打造定制化 DevOps 平台
K8s监控神器——TSDB for Prometheus的入门与实践
立即下载 立即下载 立即下载