查看服务实例云监控事件

为方便您获取EAS服务实例级别的事件,EAS在云监控上定义了服务实例事件(ServiceInstance)类型。EAS事件控制器会实时推送EAS服务实例事件到云监控。您可以通过云监控控制台或API接口查看EAS服务实例事件,对事件进行运维、审计或报警设置...

配置项目监控报警规则

Dataphin支持项目级的监控报警,支持监控项目内全部任务或通过任务类型(任务类型+调度类型)批量配置,便于您及时发现并处理任务告警,同时提高任务监控报警配置的效率。本文为您介绍如何配置项目监控报警规则。使用限制 仅支持针对Basic...

管理监控指标

在 指标 监控管理页面,您可以查询、重命名、批量操作和删除监控指标。前提条件 您已配置了监控告警。请参见 配置监控告警。角色权限 不同角色 对应 指标监控 的权限有所不同,具体说明如下:有 报表查看权限 的用户,可以创建指标监控、...

GetJobMetrics-获取任务的监控数据

获取一个任务的监控数据,包括CPU、GPU、Memory的使用率、Network、Disk读写速率等。调试 您可以在OpenAPI Explorer中直接运行该接口,免去您计算签名的困扰。运行成功后,OpenAPI Explorer可以自动生成SDK代码示例。调试 授权信息 当前API...

配置项目监控报警规则

Dataphin支持项目级的监控报警,支持监控项目内全部任务或通过任务类型(任务类型+调度类型)批量配置,便于您及时发现并处理任务告警,同时提高任务监控报警配置的效率。本文为您介绍如何配置项目监控报警规则。使用限制 仅支持针对Basic...

配置实时监控报警规则

为了及时发现并处理任务运行过程中的异常,Dataphin支持批量为任务配置报警规则,便于您及时发现并处理异常,同时提高了为任务配置监控报警规则的效率。本文为您介绍如何为实时任务配置监控告警规则。背景信息 Dataphin支持批量配置监控...

添加及管理监控对象

您可在规则列表页面添加监控对象并执行查看、编辑、删除监控对象等操作。本文为您介绍如何添加及管理数据表质量规则。权限说明 超级管理员、质量管理员支持添加监控对象。使用说明 仅Dataphin数据表和全域数据表支持配置质量分权重。说明 ...

添加及管理监控对象

您可在规则列表页面添加监控对象并执行查看、编辑、删除监控对象等操作。本文为您介绍如何添加及管理数据表质量规则。权限说明 超级管理员、质量管理员支持添加监控对象。使用说明 仅Dataphin数据表和全域数据表支持配置质量分权重。说明 ...

QuerySlotMetrics-获取加速槽监控指标

查询并获取数据集加速槽监控指标信息。接口说明 请求参数的作用类似于一个过滤器,过滤器为逻辑与(AND)关系。如果某一参数为空,则过滤器不起作用。在查询时,管控层会将 SlotId 默认加入到筛选条件中,因此需要监控指标采集时关联到 ...

配置集成管道质量监控

通过离线集成管道质量监控,Dataphin会自动为您监控数据表的质量,如果数据表有质量风险,系统会自动报警,通知告警接收人,帮助您及时了解数据表质量状况。本文为您介绍如何配置质量规则。权限说明 项目开发者支持创建集成任务、配置质量...

运维监控概述

运维监控能够帮助您根据指定时间段内和指定项目下查看API在生产环境的调用情况,以便您及时发现并处理异常。权限说明 超级管理员 支持查看及管理所有数据服务项目的API调用情况。运维用户 支持查看和管理自己所负责的所有数据服务项目的API...

监控与日志

健康状态监控 建议实时了解云资源的健康状态,方便在有任何异常的情况下,您能及时采取相应的处理。关于健康状态的详细信息,请参见 阿里云健康状态首页。在 阿里云健康状态 页面中,您可以实时查看阿里云每个地域下云服务的状态是否有异常...

AIMaster:弹性自动容错引擎

本文为您介绍如何使用 DLC 提供的基于AIMaster的容错监控功能。背景信息 如今,深度学习已被广泛使用,随着模型和数据规模越来越大,常采用分布式方式运行深度学习任务。当同一个任务运行实例个数增大后,由于依赖的软件栈和硬件环境都有...

概述

监控指标用于监控图表中的指标,提供小时、日和月粒度的实时监控。您可以设置告警的接收方式,支持接收告警的方式有邮件、短信、钉钉工作通知、钉钉群、企业微信通知、企业微信群、飞书通知、飞书群和自定义渠道。当发生告警时,可以通过...

配置实时监控报警规则

为了及时发现并处理任务运行过程中的异常,Dataphin支持批量为任务配置报警规则,便于您及时发现并处理异常,同时提高了为任务配置监控报警规则的效率。本文为您介绍如何为实时任务配置监控告警规则。背景信息 Dataphin支持批量配置监控...

QueryInstanceMetrics-获取数据集加速实例监控指标

查询并获取数据集加速实例监控指标信息。接口说明 请求参数的作用类似于一个过滤器,过滤器为逻辑与(AND)关系。如果某一参数为空,则过滤器不起作用。在查询时,管控层会将 InstanceId 默认加入到筛选条件中,因此需要监控指标采集时关联...

指标监控权限

当您通过子账号登录召回引擎版控制台后,在某个实例下查看监控指标有如下报错:同时点击进行授权:提示“调用未被授权”:此时您需要 ...授权成功后,该主账号下的子账号均不需要再次授权即可访问监控指标大盘。授权成功后,可查看监控指标:

配置任务监控报警规则

Dataphin支持批量配置任务级和字段级的监控报警,任务级支持物理任务、逻辑表任务,字段级支持逻辑表字段,便于您及时发现并处理任务报警,同时提高任务监控报警配置的效率。本文为您介绍如何为任务和逻辑表字段配置监控报警规则。前提条件...

配置任务监控报警规则

Dataphin支持批量配置任务级和字段级的监控报警,任务级支持物理任务、逻辑表任务,字段级支持逻辑表字段,便于您及时发现并处理任务报警,同时提高任务监控报警配置的效率。本文为您介绍如何为任务和逻辑表字段配置监控报警规则。前提条件...

查看监控和日志

查看监控 TPP会为您的场景和实验自动创建业务监控。您的场景和实验正式接流后,就可以在监控中查询场景流量信息。1、登录阿里云控制台,进入 实例 详情,选择 场景管理,单击场景列表中待查看场景“详情”。2、页面自动跳转到 云监控,可...

在线使用&数据监控

在线使用 提供用户在线使用工具,支持已发布模板或已部署模型在线评测或在线...数据监控 提供用户数据监控工具,支持统计已开通模板任务或信息抽取任务的调用数据,包括在线评测/使用和API调用的累计统计量。支持多任务筛选和时间范围筛选。

指标监控

使用方法 当您通过子账号登录召回引擎版控制台后,在某个实例下查看监控指标有如下报错...授权成功后,该主账号下的子账号均不需要再次授权即可访问监控指标大盘。授权成功后,可查看监控指标:查询节点(Qrs)指标 数据节点(Searcher)指标

分布式训练产品DLC支持监控指标订阅和告警

PAI-DLC支持查看监控指标数据并订阅告警,帮助用户掌握资源状况。适用客户 对任务资源状况有监控告警需求的客户。新增功能/规格 PAI-DLC支持查看和监控任务资源状况,并提供了全面详细的监控指标,帮助用户更好地掌握资源负载情况。通过...

DLC 新增多个重点监控指标的订阅和告警

DLC新增卡维度、PCIe、NVLink、吞吐等重点监控指标的订阅告警。优化内容 PAI-DLC 新增多个监控指标,支持卡维度、PCIe、NVLink、吞吐等重点指标的订阅和告警,帮助用户更好地掌握资源负载情况。

调度运维权限列表

本文为您介绍运维调度和监控报警模块的操作权限。在运维大盘页面,如果您没有查看全局范围数据的权限,需要申请其功能权限,详情请参见 申请、交还功能权限。符号说明 Y 表示该角色有此功能权限;N 表示该角色无此功能权限;表示该角色与此...

监控报警

阿里云开放搜索,通过 云监控 对应用的存储容量、计算资源、查询QPS等指标进行监控。帮助用户监测应用的使用情况,并支持用户对监控项设置 报警规则。监控指标 监控项名称 监控项描述 存储容量 当前使用的存储总容量 存储容量使用率 存储...

指标监控授权

本文将介绍子账号如何查看向量检索版实例监控指标。当您通过子账号登录向量检索版控制台后,在某个实例下查看监控指标有如下报错:同时点击进行授权:提示“调用未被授权”:此时您需要 主账号 或者具有 ...授权成功后,可查看监控指标:

监控告警体验升级,让“数据追人”随时随地发生!

监控告警模块全面升级,为企业提供更贴合业务需求的指标监控服务。分步分区便捷创建监控任务 分三步创建监控指标,创建步骤清晰便捷。新增监控规则设置,支持对指标监控进行权限控制。灵活配置个性化监控能力 支持同步查询控件、过滤器中的...

指标监控

使用方法 依次点击实例管理—实例id—功能扩展—指标监控,用户首次使用指标监控功能时,需进行授权,否则会出现下图所示。2.点击“重新授权”后,新建标签页打开应用授权页面,需同时选择三项才算完成授权 3.授权成功页面如下:查询节点...

基于 SLS 监控报警

PAI-Rec Engine 引擎服务会部署在 EAS 上,在引擎服务过程中,会产生一系列日志,基于这些日志可以监控我们的引擎服务以及报警。这些功能是基于 SLS 实现的。服务部署在 EAS 有两种情况,使用公共资源组或者使用私有资源组。两种方式对于...

监控报警

阿里云开放搜索,通过 云监控 对应用的存储容量、计算资源、查询QPS等指标进行监控。帮助用户监测应用的使用情况,并支持用户对监控项设置 报警规则。监控指标 监控项名称 监控项描述 存储容量 当前使用的存储总容量 存储容量使用率 存储...

GetHotlineServiceStatistics-获取热线监控下服务统计...

获取热线监控下服务统计量。接口说明 QPS 限制 单用户调用频率:100 次/秒。API 频率:100 次/秒。说明 如果多个用户的总调用超过 API 频率也会触发流控。调试 您可以在OpenAPI Explorer中直接运行该接口,免去您计算签名的困扰。运行成功...

GetOnlineSeatInformation-获取在线监控下在线坐席...

获取在线监控下在线坐席信息数据。接口说明 QPS 限制 单用户调用频率:100 次/秒。API 频率:100 次/秒。说明 如果多个用户的总调用超过 API 频率也会触发流控。调试 您可以在OpenAPI Explorer中直接运行该接口,免去您计算签名的困扰。...

GetAgentBasisStatus-获取热线监控下坐席纬度状态量

获取热线监控下坐席纬度状态量。接口说明 QPS 限制 单用户调用频率:100 次/秒。API 频率:100 次/秒。说明 如果多个用户的总调用超过 API 频率也会触发流控。调试 您可以在OpenAPI Explorer中直接运行该接口,免去您计算签名的困扰。运行...

GetQueueInformation-获取在线监控下技能组纬度队列...

调用GetQueueInformation接口获取在线监控下技能组纬度队列信息。接口说明 QPS 限制 单用户调用频率:100 次/秒。API 频率:100 次/秒。说明 如果多个用户的总调用超过 API 频率也会触发流控。调试 您可以在OpenAPI Explorer中直接运行该...

概览

为了便于您全面了解和体验云监控的服务与能力,云监控针对部分付费...支持试用的功能 目前,云监控仅支持试用基础云监控中的智能阈值。关于如何开启试用智能阈值,请参见 试用智能阈值。关于智能阈值的试用规则,请参见 智能阈值试用规则。

秒级监控

企业云监控包括监控大盘、智能水位分析、秒级监控和实时数据导出。秒级监控的计费规则如下表所示。计费规则 说明 适用场景 应用于对云产品的指标有高精度要求的监控场景。计费周期 按日计费。计费公式 秒级监控费用=单日产生的秒级监控数据...

2023年

通过接入中心接入数据 Prometheus for 云服务实例支持阿里云智能计算灵骏监控集成 新增 提升Prometheus云服务组件的监控覆盖率。通过接入中心接入数据 Prometheus全局聚合实例在企业资源目录授权访问之外新增基于RAM进行多账号聚合查询 ...

实时数据导出

企业云监控包括监控大盘、智能水位分析、秒级监控和实时数据导出。计费规则 实时数据导出的计费规则如下表所示。计费规则 说明 适用场景 实时获取阿里云产品的监控数据。计费周期 按日计费。计费公式 实时数据导出费用=数据点数量×单价 ...

监控大盘

企业云监控包括监控大盘、智能水位分析、秒级监控和实时数据导出。计费规则 监控大盘的计费规则如下表所示。计费规则 说明 适用场景 监控大盘主要适用于以下业务场景:对监控数据的存储时长有更高要求的场景。一体化监控多云、混合云和跨...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
智能对话分析 云监控 视图计算 智能语音交互 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用