可观测性的设计原则

监控系统的指标可以让组织了解系统的健康状况和性能情况,以便在系统出现异常时快速发现问题。监控指标可以通过监控工具来实现,并允许在发生异常时发送警报。有很多监控工具可以使用,例如Prometheus、Grafana、Zabbix等,以及阿里云提供...

如何处理云监控识别多台相同镜像主机异常问题?

当您的阿里云主机采用镜像方式部署时,在安装云监控插件后,将自动生成序列号相关信息,会导致云监控识别多台相同镜像的阿里云主机时出现异常。不同操作系统主机的处理方法如下:Windows 在注册表中删除目录 计算机\HKEY_LOCAL_MACHINE...

HTTP(s)健康检查

当监控IP地址出现异常时,自动屏蔽异常IP地址,当IP地址恢复正常时,自动取消屏蔽设置。功能说明 检查协议 检查协议请选择HTTP(s),它是指对目标IP地址进行HTTP(s)监控,监控IP地址的Web服务器网络可达性、服务可用性、首包延时等指标...

HTTP(S)健康检查

当监控IP地址出现异常时,自动屏蔽异常IP地址,当IP地址恢复正常时,自动取消屏蔽设置。配置参数说明 检查协议 检查协议请选择HTTP(S),它是指对目标IP地址进行HTTP(S)监控,监控IP地址的Web服务器网络可达性、服务可用性、首包延时等...

健康检查(TCP)

连续失败次数 在执行TCP监控时,如果连续多次监控出现异常系统才将应用服务判断为异常,防止因为一些网络瞬间抖动等其他原因影响监控准确率。连续失败次数可选值为:1次、2次、3次。1次,即健康检查监控到一次报警,就将应用服务判断为...

TCP健康检查

连续失败次数 在执行TCP健康检查时,如果连续多次探测出现异常系统才将应用服务判断为异常,防止因为网络瞬间抖动等因素影响监控准确率。连续失败次数可选值为:1次、2次、3次。1次,即健康检查监控到一次报警,就将应用服务判断为异常。...

健康检查(PING)

连续失败次数 在执行PING监控时,如果连续多次监控出现异常系统才将应用服务判断为异常,防止因为一些网络瞬间抖动等其他原因影响监控准确率。连续失败次数可选值为:1次、2次、3次。1次,即健康检查监控到一次报警,就将应用服务判断为...

Ping健康检查

连续失败次数 在执行Ping监控时,如果连续多次监控出现异常系统才将应用服务判断为异常,防止因为一些网络瞬间抖动等其他原因影响监控准确率。连续失败次数可选值为:1次、2次、3次。1次,即健康检查监控到一次报警,就将应用服务判断为...

测试与验证

业务突变测试 业务突变测试主要考察当业务进行突变以后,系统是否出现异常情况,资源在突变前后变化情况。可靠性测试 可靠性测试主要是模拟各种故障(网络中断,服务异常、HA切换)下,系统是否能正确切换,处理能力是否有明显变化。测试...

配置熔断规则

常用场景2:异常熔断示例 例如第三方内容展示时,系统出现异常,当异常比例较高时,可以对其进行熔断操作,以保证更好的用户体验。在 新增熔断防护规则 对话框中配置以下示例规则信息。参数 示例值 描述 接口名称 test 接口名称。统计...

配置熔断规则

常用场景2:异常熔断示例 例如第三方内容展示时,系统出现异常,当异常比例较高时,可以对其进行熔断操作,以保证更好的用户体验。在 新增熔断规则 或 新增规则 对话框中配置以下示例规则信息。参数 示例值 描述 接口名称 test 接口名称...

流量防护

需设置异常的类名和异常文本,表示Rpc接口访问触发规则后系统会返回指定的异常信息。自定义返回/自定义异常 Rpc 限流处理策略 为 自定义返回 自定义返回类名 填写类名称路径。说明 自定义返回目前不支持对象类型中包含未确定类型的泛型,如...

光伏发电异常检测提效

例如:如下图所示:光伏发电系统的P-T曲线具有强烈的非线性,在光线充足、电池无故障的情况下,其几何形态近似于一个开口向下的马蹄形抛物线。该抛物线顶点对应的功率即为该日最大输出功率点。正常状态下P-T曲线:如下图所示:当出现外界...

Linux系统的ECS实例的系统、内存或进程出现异常,查看...

本文介绍Linux系统的ECS实例的系统、内存或进程出现异常,查看系统日志提示"page allocation failure"错误时的问题原因及解决方案。问题现象 Linux系统的ECS实例的系统、内存或进程出现异常,通过查看系统日志提示"page allocation failure...

使用ACK Net Exporter定位网络问题

在启动过程中,依赖于与操作系统内核关联的BTF文件(操作系统内核的调试信息元数据的文件)进行加载。如果没有适配的BTF文件,这部分功能将不可用。在高版本的操作系统中,一般都会内置BTF文件的支持。关于操作系统的更多信息,请参见 BPF ...

质量规则参数配置

跨数据源对比字段会被自动转换为string类型,部分特殊字段类型可能会出现异常情况。建议码表中的字段类型和校验字段类型都是string或其他相同类型。码表:选择目标码表。码表名称:输入码表名称,作为质量规则配置时的提示信息。码表参照...

质量规则参数配置

跨数据源对比字段会被自动转换为string类型,部分特殊字段类型可能会出现异常情况。建议码表中的字段类型和校验字段类型都是string或其他相同类型。码表:选择目标码表。码表名称:输入码表名称,作为质量规则配置时的提示信息。码表参照...

进入数据质量概览(新版)

质量问题表数 当日质量检测实例运行完成并出现非「通过」状态的表数,包含质量阈值校验不通过及系统校验异常情况。已检测表数:当日存在质量检测实例且实例运行已完成的表数量。运行完成包含质量校验通过、校验不通过和系统校验异常状态。...

内存诊断

Memcg残留 当内存控制组(Memory cgroup)由于系统异常,没有正常释放时,Memcg残留会影响系统性能。内存碎片化 内存碎片是指系统长时间远行后,由于空闲的连续内存区域太小,导致不能满足系统连续内存分配请求,从而出现内存分配延时,...

概览

(ECS)所有磁盘读取BPS(ECS)所有磁盘写入BPS(ECS)所有磁盘每秒读取次数(ECS)所有磁盘每秒写入次数 边界以外 连接数过高、连接数波动较大或连接数持续峰值 系统负载过高、TCP连接池不足、应用程序或者服务出现异常,某些应用程序或者服务在...

组件参考:所有组件汇总

推荐方法 FM算法 FM(Factorization Machine)算法兼顾特征之间的相互作用,是一种非线性模型,适用于电商、广告及直播的推荐场景。ALS矩阵分解 交替最小二乘ALS(Alternating Least Squares)算法的原理是对稀疏矩阵进行模型分解,评估...

节点异常问题排查

本文介绍关于节点异常问题的诊断流程、排查思路、常见问题及解决方案。本文目录 类别 内容 诊断流程 诊断流程 常见...解决方案 通过节点的监控查看CPU增长曲线,确认异常出现时间点,检查节点上的进程是否存在CPU占用过高的现象。具体操作,...

节点异常问题排查

本文介绍关于节点异常问题的诊断流程、排查思路、常见问题及解决方案。本文目录 类别 内容 诊断流程 诊断流程 常见排查...解决方案 通过节点的监控查看CPU增长曲线,确认异常出现时间点,检查节点上的进程是否存在CPU占用过高的现象。具体操作...

自助救治损伤的ECS实例Linux系统

适用的症状和原因 在某些情况下,Linux操作系统出现启动异常,此时,在阿里云ECS控制台显示的实例状态可能是运行中,但实例内的应用不可访问,实例内的网络不可达,既无法ping通,也无法通过workbench或者ssh建立连接。如果您在阿里云ECS...

使用快照创建自定义镜像

更多信息,请参见 使用自定义镜像创建VPC网络实例后网络出现异常。操作步骤 本操作以在快照页面创建自定义镜像为例,您也可以通过镜像页面(实例与镜像>镜像)和实例详情页面(实例与镜像>实例)的快照页签两个入口,使用系统盘快照来创建...

使用快照创建自定义镜像

更多信息,请参见 使用自定义镜像创建VPC网络实例后网络出现异常。操作步骤 本操作以在快照页面创建自定义镜像为例,您也可以通过镜像页面(实例与镜像>镜像)和实例详情页面(实例与镜像>实例)的快照页签两个入口,使用系统盘快照来创建...

为什么实例会发生主备切换?

宿主机下线或实例异常导致的主备切换会以站内信或邮件等形式通知到您,通知内容如下:【阿里云】尊敬的*:您的云数据库MongoDB实例:dds-bp*(名称:*)出现异常,高可用系统已经触发切换,确保实例稳定运行。请检查程序连接是否正常,建议...

挂载访问FAQ

现象描述 假设在Linux操作系统中通过挂载点A挂载文件系统,在未卸载的情况下,通过NAS控制台上删除了挂载点A,导致Linux系统出现执行命令卡顿、无响应等异常情况。解决方案 在服务器(如ECS Linux)中,按 Ctrl+C,中断命令的执行。执行 ...

HTTP批量推送模式

响应说明 响应样例 {"code":0,"msg":"接收成功"} 字段...若出现系统异常、消费失败等情况,建议HTTP响应码返回50X。重新推送 第一次推送失败后,间隔1分钟、5分钟、10分钟后会进行重推,直至推送成功为止。如果推送3次后仍失败,不再重试。

调用链采样配置最佳实践

对于绝大多数分布式系统,不是每一条调用链都值得被可观测平台记录,因为其中包含大量重复、低关注度信息。调整采样是目前解决这类问题最高效且主流的方式,但具体配置什么样的采样策略,能够在可控的资源开销和费用成本内,最大程度保证错...

MnsCardVender

请求样例[{"mobile":"1368745*","outId":"205101",...若出现系统异常、消费失败等情况,建议HTTP响应码返回50X。重新推送 第一次推送失败后,间隔1分钟、5分钟、10分钟后会进行重推,直至推送成功为止。如果推送3次后仍失败,不再重试。

SmsUp

请求样例[{"phone_number":"1381111*","send_time":"2017...若出现系统异常、消费失败等情况,建议HTTP响应码返回50X。重新推送 第一次推送失败后,间隔1分钟、5分钟、10分钟后会进行重推,直至推送成功为止。如果推送3次后仍失败,不再重试。

RPC 请求异常

如果通过 RPC 请求进行资源调用的过程中出现异常,请参考 无线保镖结果码说明 进行排查。

RPC 请求异常

如果通过 RPC 请求进行资源调用的过程中出现异常,请参考 无线保镖结果码说明 进行排查。

RPC 请求异常

如果通过 RPC 请求进行资源调用的过程中出现异常,请参考 无线保镖结果码说明 进行排查。

MSE事件中心概述

警告(WARN):系统运行正常或出现异常可自愈,对业务可能有影响需要用户关注的事件。严重(CRITICAL):系统运行异常无法自愈,导致业务无法正常工作的事件。时间 事件的触发时间。事件状态 事件的执行状态。完成 执行中 执行成功 失败 ...

事务执行状态说明

已回滚:事务结束,事务执行的数据变更已回滚 异常 提交异常:一阶段结束,二阶段处理提交操作时出现异常 回滚异常:一阶段结束,二阶段处理回滚操作时出现异常 回查异常:一阶段结束,二阶段处理回查业务接口时出现异常

RPC 请求异常

如果通过 RPC 请求进行资源调用的过程中出现异常,请参见 无线保镖结果码说明 或 网关结果码说明 进行排查。

异常类型说明

在预测某条时间序列时出现异常。您可以通过 result.error_type 和 result.error_msg 字段查看异常信息。tag_:_data_type_字段值为job_error_message。result.entity 和 result.metric 字段都为空。预测ID对应的那次预测出现异常。您可以...

在使用阿里云服务的过程中我应该避免哪些操作?

否则,阿里云可能无法解决由以下违规操作引起的问题:1)Windows系统中的PV Drivers 程序不可删除 PV Drivers程序为服务器虚拟化驱动程序,请不要针对该程序进行任何操作,如果删除会导致服务器出现异常。2)云服务器禁止更改网卡的MAC地址 ...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
DDoS防护 Web应用防火墙 负载均衡 云安全中心 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用