7)Linux系统下不能开启NetWorkManager服务 linux系统请不要开启NetWorkManager服务,该服务会跟系统内部网络服务出现冲突,导致网络异常。8)Windows系统中的shutdown.exe进程不可以结束 shutdown.exe进程是系统重要进程,如果结束该进程会...
返回码大于 当执行HTTP(S)监控时,根据Web服务器的返回码判断Web服务器是否正常工作,大于返回码报警阈值时,系统认为应用服务出现异常:大于400:Bad Request,即如果HTTP(S)请求携带了错误的请求参数,Web服务器将返回大于400的返回...
当您的集群中只有一个节点上的JournalNode服务出现异常时,可以尝试从其他节点恢复。本文介绍如何从其他节点恢复异常的JournalNode服务。操作步骤 找到健康状态的JournalNode。您可以通过HDFS WebUI查看JournalNode的状态,详细信息请参见 ...
设计思路 核心问题 运维场景下,故障处理的核心问题如下:服务出现异常如何预警并上报 出现异常问题如何快速定位 解决方案 云消息队列 RocketMQ 版 定义的Metrics、Tracing指标覆盖消息收发各阶段的状态信息、云消息队列 RocketMQ 版 服务...
4002 远程调用业务系统异常 MGS 调用业务系统服务出现异常。专有云用户可以在服务端日志 gateway-error.log 中查看详细信息。4003 API 分组 HOST 异常 MGS 调用 HTTP 业务系统服务出现 UnknownHostException 异常。请检查 API 分组配置的...
全面消除偶发问题引发的风险 依托于限流、降级、熔断、隔离等能力,可以在出现偶发的流量洪峰和依赖服务出现异常时,有效地限流保护、削峰填谷、隔离故障、降级保护。低成本实现微服务敏捷开发 依托于开发环境隔离能力,可以在不增加物理...
如果网卡配置文件存在错误,或者网卡对应的dhclient进程未运行可能引发Linux实例的DHCP服务出现异常,导致实例网络不通。具体操作,请参见 Linux实例中本地网卡的DHCP配置检查与修复。检查网络相关进程是否存在 Linux系统内对应的网络进程...
全面消除偶发问题引发的风险 依托于限流、降级、熔断、隔离等能力,可以在出现偶发的流量洪峰和依赖服务出现异常时,有效地进行限流保护、削峰填谷、隔离故障、降级保护。低成本实现微服务敏捷开发 依托于开发环境隔离能力,可以在不增加...
MissingParameter param fileSize must be not empty 文件大小不能为空 InnerError can not find any vendor 无法找到有效的供应商 InnerError save vendor resource fail 获取媒体资源服务出现异常 创建模板 错误码 错误描述 说明 ...
为避免在ECS实例上运行业务时出现数据不一致、安全漏洞及业务流程故障等问题,阿里云提供了时间同步服务以确保实例的时间准确。时间同步服务简介 时间同步服务用于与NTP服务器同步时间以确保ECS实例时间准确,它是基于网络时间协议...
CHUNK_TEXT_SERVER_INVOKE_ERROR(120005,"切分文本服务调用出现异常"),CHUNK_TEXT_READ_LAYOUT_ERROR(120006,"读取文件layout出现异常"),CHUNK_TEXT_PARSE_LAYOUT_ERROR(120007,"解析文件layout出现异常"),CHUNK_TEXT_PARSE_ERROR(120008,...
您需要报错信息先查找Alluxio服务异常的节点,找到异常信息,然后查看Alluxio服务的异常日志来确认问题。通常情况下,Alluxio服务的日志位于/mnt/disk1/log/alluxio/目录下。如何对OSS进行缓存加速?E-MapReduce默认使用HDFS作为Alluxio的...
本文介绍HBase出现HMaster服务异常的解决方案。具体报错 HBase 2.3.4版本的HMaster一直重启失败,错误日志如下所示。java.io.EOFException:Cannot seek after EOF at org.apache.hadoop.hdfs.DFSInputStream.seek(DFSInputStream.java:1447...
检查该实例底层虚拟化层核心服务是否出现异常。出现此类异常可能会导致实例崩溃或出现异常暂停,您可以尝试通过重启实例进行恢复。实例操作系统异常 实例系统出现了内核错误(kernel panic)、OOM(Out of Memory)异常或内部宕机等故障。...
1.问题背景 返回500错误码,说明API 后台依赖的HTTP 服务异常,这种情况分为2类:API 后台是阿里一方的代码或应用:如果一旦出现异常,那就是所有客户、所有应用都异常 客户在边缘物业一体机上托管应用,通过云边通道提供HTTP 服务;...
开启健康检查功能后,当后端某个ECS实例健康检查出现异常时,负载均衡会自动将新的请求分发到其他健康检查正常的ECS实例上,而当该ECS实例恢复正常运行时,负载均衡会将其自动恢复到负载均衡服务中。为了使健康检查功能正常运作,需要开启...
背景信息 在应用运行过程中,当出现服务调用异常或资源访问失败时,开发人员通常会选择断点调试来排查问题。但断点调试在某些场景下并不适用,可能存在如下问题:缺乏整体调用概况:上层服务收到请求后,往往会拆分成多个子请求,最后将...
开启健康检查功能后,当某台后端服务器健康检查出现异常时,负载均衡会自动将新的请求分发到其他健康检查正常的后端服务器上;而当该后端服务器恢复正常运行时,负载均衡会将其自动恢复到负载均衡服务中进行流量转发。健康检查机制提高了...
背景信息 在应用运行过程中,当出现服务调用异常或资源访问失败时,开发人员通常会选择断点调试来排查问题。但断点调试在某些场景下并不适用,可能存在如下问题:缺乏整体调用概况:上层服务收到请求后,往往会拆分成多个子请求,最后将...
背景信息 在应用运行过程中,当出现服务调用异常或资源访问失败时,开发人员通常会选择断点调试来排查问题。但断点调试在某些场景下并不适用,可能存在如下问题:缺乏整体调用概况:上层服务收到请求后,往往会拆分成多个子请求,最后将...
容器智能运维平台 提供Pod诊断功能,帮助您诊断异常的Pod信息。本文介绍Pod诊断的检查项以及对应的修复方案。容器智能运维平台 构建了基于专家经验的故障诊断系统,并基于海量数据训练了AI智能故障诊断模型。Pod诊断融合了基于专家经验和AI...
ECS实例网卡链路层状态 检查ECS实例网卡链路层是否出现异常。ECS实例未正常启动或网络配置有问题,您可以尝试通过重启实例进行恢复。ECS实例启动状态 检查ECS实例的boot操作是否能正常执行加载。ECS实例无法正常启动,您需要创建一个新的...
Spark服务日志 当出现Spark服务异常时,您可以查看Spark服务的日志。服务日志目录:EMR-3.40.0之后版本、4.10.1之后版本、5.6.0之后版本:/var/log/emr/spark EMR-3.40.0及之前版本、4.10.1及之前版本、5.6.0及之前版本:/mnt/disk1/log/...
登录Linux实例失败并报“login:Module is unknown”错误如何处理 Linux实例系统环境配置 Linux内的系统环境,例如中毒、账户配置、环境变量配置等,如果出现异常,也可能会导致SSH登录失败。根据不同报错信息,可参见如下常见案例进行解决...
避免局部不稳定因素(某个慢调用、异常服务)导致整体的雪崩,例如切断某个RT高的第三方服务调用,或针对某个ID的慢SQL访问进行熔断。配置熔断规则 热点防护规则 自动识别热点参数并控制每个热点值的访问频次或并发量,可以有效地防止过...
当业务数据库出现异常无法连接时,执行如下操作来恢复您的业务。暂停原实例。在 同步任务 列表页面,找到原实例。在目标实例右侧,选择>暂停任务。在弹出的 提示 对话框,单击 确定。在弹出的 暂停任务成功对话框,单击 确定。将业务切换至...
问题描述 CDN出现流量异常 解决方案 流量异常原因较多,需先分析流量异常产生的域名、时间段、以及来源,从而制定相应的防护措施。确认域名&时间段 流量异常的域名以及时间段可在CDN控制台-监控查询-实时监控中查看,如图。确认来源 确认...
指标异常原因 监控期间,当区间慢查询耗时,查询数量增大时,服务异常,常见原因如下:指标异常原因 说明 QPS 查询QPS 或 写入QPS 流量突增或波动较大,集群压力大,相对单条查询耗时久。有agg查询或者有脚本查询 聚合查询场景,需要耗用...
说明 如果出现网络异常、响应超时等情况,可能导致回执消息推送重复。HTTP批量推送模式的响应超时时间为700 ms。使用SDK拉取MNS消息,详情请参见 MNS消息队列消费模式。回执消息模式 接收回执消息的模式有MNS消息队列消费模式和HTTP批量推...
可继续对HiveMetaStore或者HiveServer2的日志进行排查,日志路径一般位于/mnt/disk1/log/hive/中,可逐步检查组件的.log、.err、.out 及GC等日志,判断HiveMetastore或者HiveServer2出现异常的真实原因。HiveMetaStore后端数据库问题 常见...
帮助您在加速域名访问出现异常时,快速定位是由于CDN服务本身出现的访问问题,例如源站访问出现故障,节点不可用等,还是由于终端用户的网络故障或地域特性等问题。CDN用户分析 统计用户访问信息,例如访问次数最高的用户等。帮助您更好的...
在生产环境中出现过多起这样的案例,比如因负载均衡配置错误,注册中心异常导致重启节点的服务无法上线,DHT哈希因子异常等。流量不均的最大风险在于能否及时发现“热点”现象。它的问题表象更多是服务响应变慢或报错,传统的监控无法直观...
日志拉取模块及下游消费SDK的高可用:DTS容灾系统一旦检测到日志拉取模块出现异常,就会在健康服务节点上断点重启日志拉取模块,保证日志拉取模块的高可用。DTS支持在服务端实现下游SDK消费进程的高可用。用户同时对一个数据订阅链路,启动...
当检测结果出现异常时,如果DNS服务商显示 未使用阿里云解析DNS,则需要联系您的DNS服务商进行排查与处理,阿里云DNS是不支持排查其他厂商的DNS状况。2、DNS服务商解析结果 DNS服务商解析结果是指通过dig 域名@权威DNS服务器的方法,来验证...
类似cookie异常,有些参数对于爬虫来说意义不大,缺失或者重复提交都不影响获取结果,这也可以作为同一类异常来处理。业务字段异常。例如邮箱、手机号、账户信息中包含某一些异常或不合理的关键字等。推荐您使用WAF日志服务进行日志查询,...
压测场景配置完成后,需要先对场景进行调试来验证配置场景是否合理。本文介绍如何进行场景调试。前提条件 创建PTS场景。具体操作,请参见 创建压测场景。操作步骤 登录 PTS控制台,在左侧导航栏选择 性能测试>场景列表。在目标场景的 操作 ...
排查场景:APM显示HTTPDNS服务质量有问题 当您接入了APM组件(即线上版端性能分析工具),APM组件中显示HTTPDNS服务出现无法连接的问题时 请提交HTTPDNS工单,并提供以下信息:APM系统截图:连接失败或返回错误时的URL地址、出现的错误信息...
主服务异常时,全局流量管理服务执行的健康检查失败指定的次数后,会自动将域名解析指向备服务,从而实现自动的主备切换。主服务故障期间,流量切换到了备服务,数据会记录在备服务的存储服务中。因此在故障恢复后,还需要将备地域的数据...
若出现OOM异常问题,登录 容器服务管理控制台,在Pod详情页面单击 事件 页签可看到OOM事件 pod was OOM killed。具体操作,请参见 检查Pod的事件。若集群配置了集群容器副本异常报警,则OOM事件出现时可收到相关报警。关于配置报警,请参见...
步骤十二:Windows注册表配置异常 步骤十三:Windows RDP自签证书到期 步骤一:使用阿里云Workbench工具测试远程登录 通过阿里云提供的Workbench工具进行远程登录,Workbench工具在远程登录出现异常时会返回具体的错误信息及解决方案。...