背景信息 云网管支持对设备SNMP自定义采集,一般出现数据异常有以下原因:SNMP配置监控项信息有误,主要配置信息是SNMP版本,Community、采集周期和解析模板。SNMP监控项未部署到设备,如厂商或者型号未勾选。设备端SNMP Community配置错误...
实例操作系统异常 实例操作系统出现了内核Panic、OOM异常或内部宕机等故障。检查该实例的操作系统(Guest OS)内部是否存在内核Panic、OOM异常或内部宕机等故障。此类故障可能是由于实例配置不当或用户空间的程序配置不当导致的,您可以...
更多参数配置:max_flush_exceptions:当写入数据出现异常时,设置最大重试次数,默认值100。skip_exception:设置是否跳过异常,默认为FALSE,表示出现异常时将重试直到到达最大重试次数 max_flush_exceptions,如果仍然失败,则同步程序...
错误码名 错误码值 描述 COMMIT_ERROR_DATA_LIST 101 commit中某些数据出现异常,会返回异常的数据。说明 通过 e.getErrData()即可获得异常数据List,此错误码在 addMap(s)、addRow(s)、commit 操作的时候都可能会发生,因此在这些操作的...
COMMIT_ERROR_DATA_LIST 101 提交中某些数据出现异常,会返回异常的数据,通过 e.getErrData()即可获得异常数据List。此错误码在 addMap(s)、addRow(s)和提交操作的时候都可能会发生,需要单独处理此错误码的异常。COMMIT_ERROR_OTHER 102 ...
实时多链路对比 高可用场景下,需要构建多条链路,以便数据出现异常时,能够及时切换。对于多链路之间的数据计算进度监控则可以发现一些数据滞留、统计偏差问题,提升实时数据质量。稳定性 实时统计值检测 实时数据为指标值或可统计数据时...
实时多链路对比 高可用场景下,需要构建多条链路,以便数据出现异常时,能够及时切换。对于多链路之间的数据计算进度监控则可以发现一些数据滞留、统计偏差问题,提升实时数据质量。稳定性 实时统计值检测 实时数据为指标值或可统计数据时...
数据库实例异常 是指数据库系统在运行过程中出现异常情况,导致数据库无法正常工作或提供服务的状态。可能原因包含数据库服务进程异常退出、数据库节点宕机、数据库网络异常等,常见的容错策略如下:自动重启:当数据库实例异常终止或崩溃...
以下两种情况下,设备立即上报网络状态数据:当网络出现异常时,设备采集到异常指标,会立即上报数据到云端。您设置了定时采集,设备会在指定时间采集数据,并立即上报数据。假设当前时间是2019-08-22 08:10:29,设备检测到网络问题,立即...
说明 设备采集到异常指标或根据您设定的时间采集数据后,会立即上报;日常诊断中,设备采集到网络正常的数据,可能不会立即上报。如果设备没有上报时间戳,则无时间展示。RSSI(dBm)信号接收强度。SNR(dB)无线信号信噪比。无线信号丢包...
重要 使用故障诊断功能时,系统将在您的集群节点上执行数据采集程序并收集检查结果。采集的信息包括系统版本,以及负载、Docker、Kubelet等运行状态及系统日志中关键错误信息。数据采集程序不会采集您的业务信息及敏感数据。诊断支持的异常...
及时发现数据库的异常问题是数据库日常运维的重点。数据库自治服务DAS提供异常检测功能,基于...相关文档 您可以利用DAS的自治功能,在数据库出现异常时进行自动处理。自动SQL限流 自动SQL优化 自动性能扩展 自动空间扩展 空间碎片自动回收
当问题数据采集过程中出现错误时,帮助您快速排查、定位问题。方式一:通过数据质量模块查看。您可在 数据质量>任务查询 页面,通过查看目标表数据质量监控规则的 执行日志,查看问题数据采集过程。详情请参见:查看监控任务。方式二:通过...
及时发现数据库异常是数据库日常运维的重要...当数据库出现异常情况或达到预设的告警阈值时,系统会立即通知设定的告警联系人,以帮助您及时发现数据库异常并维护数据库的稳定性。操作步骤 为实例配置警规则和告警模板,详情请参见 配置告警。
针对这些数据,可以根据业务的需求和环境,选择对应的方案进行数据采集并传输到Elasticsearch服务。本文对服务器数据采集方案进行了汇总。相关文档 方案描述 阿里云Elasticsearch数据采集解决方案 本文提供Beats、Logstash、语言客户端和...
当应用出现业务异常问题时,您可以分析业务日志,精准定位业务异常。本文介绍如何在调用链分析中关联日志服务SLS的日志。前提条件 已将应用数据上报至 可观测链路 OpenTelemetry 版,具体操作,请参见 接入指南。已创建Project。具体操作,...
自动化数据采集能力 CloudLens for EBS针对块存储资源提供了自动化数据采集能力,提升您对块存储资源运维管理的效率。计费 您可以免费使用CloudLens for EBS的相关功能。应用场景 适用于需要多维度监控存储性能、对数据安全有严格要求的...
节点内核版本 检查节点内核版本是否过低,内核版本过低可能造成系统异常。请尝试更换节点升级内核。更多信息,请参见 节点与节点池FAQ。集群DNS服务可用性 检查节点能否正访问集群kube-dns服务的Cluster IP,正常使用集群的DNS服务。请检查...
Alibaba Cloud Linux 3(内核版本 5.10.60-9.al8.x86_64 开始)增加了内核统一异常框架UKFEF(Unified Kernel Fault Event Framework),用于统计可能导致风险的系统异常事件,并以统一格式输出事件报告。本文主要介绍UKFEF所统计的事件、...
当数据库出现异常情况或达到预设的告警阈值时,系统会立即通知设定的告警联系人,以帮助您及时发现数据库异常并维护数据库的稳定性。操作步骤 登录 DAS控制台。在左侧导航栏中,单击 实例监控。找到目标实例,单击实例ID,进入目标实例详情...
配置故障诊断 重要 使用故障诊断功能时,系统将在您的集群上执行数据采集程序并收集检查结果。采集的信息包括系统版本、负载、容器组件等运行状态及系统日志中关键错误信息。数据采集程序不会采集您的业务信息及敏感数据。配置Pod诊断和...
当Logstore A出现异常时,您需要切换写入,将客户端上数据实时采集到Logstore B。由于Logstore A的数据通过数据加工实时写入Logstore B,正常情况下Logstore A和B的数据均实时可用。当Logstore A出现故障时,您需要将数据采集及时切换到...
升级风险 升级风险:本次升级到Helm 1.1.17/Agent v4.0.0为有损升级,按照集群监控数据采集量级的不同(Targets和Series的量级),存在监控数据断线的风险,预计断线时间在0~5分钟,不同集群可能存在一定的差异。升级前:建议您在升级前...
升级风险 升级风险:本次升级到Helm 1.1.17/Agent v4.0.0为有损升级,按照集群监控数据采集量级的不同(Targets和Series的量级),存在监控数据断线的风险,预计断线时间在0~5分钟,不同集群可能存在一定的差异。升级前:建议您在升级前...
建议不要删除或修改这3个文件中的内容,否则可能出现异常或者导致数据不正确。当出现问题时,您可以在 logs 目录下查看Beats日志来定位问题。在目标ECS实例上安装云助手和Docker服务。具体操作,请参见 安装云助手Agent 和 部署并使用...
将日志采集到日志服务后,您可以通过日志服务告警系统实现基于日志关键字的告警。背景信息 日志记录了系统的运行过程及异常信息,例如warning日志、error日志、Go语言中的panic错误日志、Java语言中的java.lang.StackOverflowError错误日志...
宕机时的处理 由于CheckPoint是定期保存,因此宕机恢复时将从上一个完整保存的CheckPoint开始恢复,可能导致数据采集重复。调整Checkpoint保存策略以减少数据被重复采集。Logtail采集配置 限制项 限制说明 配置更新生效的延时 从通过控制台...
宕机时的处理 由于CheckPoint是定期保存,因此宕机恢复时将从上一个完整保存的CheckPoint开始恢复,可能导致数据采集重复。调整Checkpoint保存策略以减少数据被重复采集。Logtail采集配置 限制项 限制说明 配置更新生效的延时 从通过控制台...
配置故障诊断 重要 使用故障诊断功能时,系统将在您的集群节点上执行数据采集程序并收集检查结果。采集的信息包括系统版本、负载、Docker、kubelet等运行状态以及系统日志中的关键错误信息。数据采集程序不会采集您的业务信息及敏感数据。...
优化 优化容器数据采集场景的CPU开销。0.16.50 新功能 支持运行时按需安装service_telegraf插件(仅限ECS用户)。0.16.48 优化 优化service_telegraf插件,支持单机多个配置。0.16.46 说明 如果您在杭州、上海、北京地域,升级Logtail至0....
在智能交通领域通过使用物联网、云计算、传感器、大数据、无线通信等技术对交通信息进行采集、存储、管理和分析,提供交通管理、指挥决策、交通信息服务等能力,能有效解决城市交通道路拥堵问题以及提高道路交通安全。车联网场景中涉及的...
当数据库出现异常情况或达到预设的告警阈值时,系统会立即通知设定的告警联系人,以帮助您及时发现数据库异常并维护数据库的稳定性。背景信息 了解以下概念,能帮助您更好地配置告警:告警规则:定义了触发告警的监控项、触发次数、告警...
应用场景 监听内核事件,出现异常时自动告警。采集所有系统日志,用于长期存储,减少磁盘空间占用。采集软件(Unit)的输出日志,用于分析或告警。采集所有Journal日志,可以从所有日志中快速检索关键词或日志,相比Journalctl的查询效率...
4002 远程调用业务系统异常 MGS 调用业务系统服务出现异常。专有云用户可以在服务端日志 gateway-error.log 中查看详细信息。4003 API 分组 HOST 异常 MGS 调用 HTTP 业务系统服务出现 UnknownHostException 异常。请检查 API 分组配置的...
重要 使用故障诊断功能时,系统将在您的集群执行数据采集程序并收集检查结果。采集的信息包括系统版本,以及负载、容器组件等运行状态及系统日志中关键错误信息。数据采集程序不会采集您的业务信息及敏感数据。诊断支持的异常场景 Pod诊断...
重要 使用故障诊断功能时,系统将在您的集群执行数据采集程序并收集检查结果。采集的信息包括系统版本,以及负载、Docker、Kubelet等运行状态及系统日志中关键错误信息。数据采集程序不会采集您的业务信息及敏感数据。诊断支持的异常场景 ...
是否误报:误报:例如 SQL 错误、数据错误或系统异常等,导致与核对预期不符的情况。非误报:指系统发现的差异数据确实为异常现象,符合核对预期的情况。是否资损:有资损:根据异常数据排查问题、分析原因,确定发生资金损失。无资损:...
离线表:选择用于核对的 ODPS 表(即选择 DataWorks 中通过数据采集在线表得到的离线表),例如“apply_order_delta”。单击 提交 完成数据节点的创建。上述操作完成后,可在数据节点列表页面,看到刚创建的节点 Demo_数据节点。步骤三:...
但是随着业务发展、架构的升级、数据量的增长,伊对需要寻找更强大的数据采集、处理和分析平台来满足运营团队日益增长的数据分析需求,保持伊对高速的用户增长率。业务痛点 伊对面临的主要挑战如下:数据来源分散 客户使用不同的计算存储...
Memcg残留 当内存控制组(Memory cgroup)由于系统异常,没有正常释放时,Memcg残留会影响系统性能。内存碎片化 内存碎片是指系统长时间远行后,由于空闲的连续内存区域太小,导致不能满足系统连续内存分配请求,从而出现内存分配延时,...