错误编码:HSF-0002

客户端或服务端偶然会出现Java GC问题:检查服务端和客户端Java GC日志,耗时很长的Java GC会导致超时,建议您优化业务代码的Java GC问题。客户端负荷高:使用增加客户端机器等方法,减轻客户端的负荷。适用于 企业级分布式应用服务EDAS

发布审核标准

我们将拒绝不完整的服务以及会出现明显错误问题服务。准确的元数据 请确保您的服务信息能够准确反映该服务的核心内容,以便客户准确地了解他们购买时所获得的服务。在您更新服务版本时,请同时更新服务信息以保持与服务版本相应的最新...

摘除离群实例

在微服务架构中,当服务提供者的应用实例出现异常,而服务消费者无法感知时影响服务的正常调用,并影响消费者的服务性能甚至可用。离群实例摘除功能检测应用实例的可用并进行动态调整,以保证服务成功调用,从而提升业务的稳定和...

使用前必读

网络相关 注册集群接入您自建或其他云厂商的Kubernetes集群时,请确保目标集群与阿里云之间的网络稳定,自建的Kubernetes集群通过公网访问阿里云资源时,可能会出现超时等不稳定性问题。注册集群不支持创建和使用LoadBalancer类型的服务...

服务管控和治理

服务治理 服务治理包含服务限流、服务路由、服务鉴权、服务熔断、故障注入、故障隔离、透明劫持、服务拓扑和实时监控相关服务治理。服务限流 在高并发场景下,为保证在现有资源条件下服务正常运行,您可以使用服务限流让请求和并发在应用可...

错误编码:HSF-0001

报错信息 HSFServiceAddressNotFoundException 未找到需要调用的服务目标地址。描述信息 需要调用的目标服务为:xxxx;组别为:xxxx。基本问题排查 服务本身的发布、调用是否正确。验证服务是否发布:在对应环境(日常、预发或线上环境)的...

上下文查询

开发人员无需登录服务器,在大量日志中通过关键字检索日志,日志服务支持通过控制台查看指定日志在原始文件中的上下文信息。前提条件 已通过Logtail采集到日志。具体操作,请参见 通过Logtail采集日志。重要 如果您使用了Logtail插件处理...

容灾恢复

集群中通常一个服务有多个服务提供者,其中部分服务提供者可能由于网络、配置、长时间 fullgc、线程池满、硬件故障等导致长连接还存活但是程序已经无法正常响应。单机故障剔除功能将这部分异常的服务提供者进行降级,使客户端的请求更多...

Windows系统的ECS实例ping外网地址提示“一般故障”...

如何通过使用NetShell实用程序重置TCP/IP Winsock分层服务提供程序可能导致SQL Server的网络或服务器稳定性问题 检查IP安全策略 远程连接ECS实例。具体操作,请参见 连接方式概述。选择 开始>运行,输入 secpol.msc,单击 确定,打开 ...

轻量应用负载均衡概述

该功能扩展了应用程序的吞吐能力,并且可以消除服务器的单点故障,提升应用程序的可用。功能架构如下图所示:功能组件说明:轻量应用负载均衡:提供七层流量负载均衡能力,操作简单,价比高。监听:默认采用HTTP协议,监听80端口。转发...

VPC授权连通测试

连通测试失败 当连通测试失败时,大部分情况会出现下述提示,表示API网关实例到您VPC授权中的服务的网络不连通。2.2.1.排错引导 对于上述网络不连通的情况,点击排错引导会出现一个问题排查弹窗,其中包含一系列步骤可以引导您进行问题...

如何确保在MNS中存储的数据的可靠

本文介绍阿里云如何确保 消息服务MNS 中数据可靠。...所有消息冗余地存储在多台服务器上,当某台服务器出现问题时,冗余数据将被自动拷贝至其他服务器;这意味着单台服务器不可用或网络故障都不会对队列中消息的可靠造成任何影响。

故障基础数据管理

故障场景等级定义 日常运营中,除用户方环境或自身操作引起的问题外,无论什么原因导致的服务中断、服务品质下降或用户服务体验下降的现象,都称为故障。对故障影响程度的划分就是故障等级定义。定义故障等级是为了指定故障等级定义作为各...

使用须知

本地盘实例可靠取决于宿主机可靠,当发生单点故障时,ENS进行同节点迁移帮助实例尽快恢复连通,不保证数据可靠。单个边缘节点无法连通时,ENS根据用户需求进行跨节点迁移帮助用户尽快恢复区域内连通,实例ID不变、实例IP改变,不...

常见问题

本文汇总您在使用 NIS 时可能遇见的常见问题,为您提供排查思路和解决方案。实例诊断 实例诊断是否支持诊断实例历史时间的状态?CLB实例的监听已经配置了健康检查,为什么诊断结果显示为状态异常?实例诊断功能是否能诊断具体的异常原因?...

使用说明

背景信息 设备基于物联网平台的消息通信能力开展业务,由于不同设备业务的复杂,以及业务需要定期变更升级,导致设备的业务程序容易出现故障,导致设备不可用。如果设备的业务程序与远程登录程序在同一进程,导致设备不可使用远程登录...

查看应用的网格拓扑

这种遥测技术提供了服务行为的可观察,使运维人员能够排查故障、维护和优化应用程序,而不会增加服务的开发人员的负担。通过网格拓扑图,运维人员可以全面掌握服务间的互动情况,从而对系统进行更有效的监控和管理。本文是ASM可观测的...

慢日志

慢日志问题极大地影响数据库的稳定,当数据库出现负载高、性能抖动等问题时,数据库管理员或开发首先查看是否有慢日志在执行。数据库自治服务DAS(Database Autonomy Service)支持慢日志分析功能,统计并分析数据库中执行时间超过...

慢日志

慢日志问题极大地影响数据库的稳定,当数据库出现负载高、性能抖动等问题时,数据库管理员或开发首先查看是否有慢日志在执行。数据库自治服务DAS(Database Autonomy Service)支持慢日志分析功能,统计并分析数据库中执行时间超过...

端云互联问题

说明 Cloud Toolkit 2020.9.1及以上版本中,增加端云互联一键诊断功能,可以提供诊断结果,帮助您排查etrans通道启动异常、服务连接不通以及其它可能出现问题。请您及时升级Cloud Toolkit。问题描述 当您使用端云互联时,注册中心拒绝...

慢日志

慢日志问题极大地影响数据库的稳定,当数据库出现负载高、性能抖动等问题时,数据库管理员或开发首先查看是否有慢日志在执行。数据库自治服务DAS(Database Autonomy Service)支持慢日志分析功能,统计并分析数据库中执行时间超过...

步骤五:应用容灾

故障恢复 本机出现故障后在云上拉起本地业务,待本地环境恢复后再将其恢复到本地。具体步骤如下:在 主站点管理 页签,单击+添加。在 添加计算平台 页面,填写计算平台 名称,选择 类型,填写 IP地址、用户名 和 密码。单击 创建。在连续...

服务实例隔离与诊断

服务实例隔离与诊断可以有效地应对线上故障(例如内存泄露),提升微服务系统整体稳定。当服务提供者的某些实例出现异常时,MSE治理中心将异常实例的流量隔离,并结合阿里云 应用实时监控服务 ARMS(Application Real-Time Monitoring ...

慢日志

慢日志问题极大地影响数据库的稳定,当数据库出现负载高、性能抖动等问题时,数据库管理员或开发首先查看是否有慢日志在执行。数据库自治服务DAS(Database Autonomy Service)支持慢日志分析功能,统计并分析数据库中执行时间超过...

实例的节点故障处理机制

当使用Connection String URI进行连接时,如果某个节点出现故障,不会因为节点的切换而影响应用的读写操作,详情请参见 副本集实例连接说明。分片集群实例 图 2.分片集群架构 分片集群实例的Shard节点和ConfigServer节点均采用三节点副本集...

慢日志

慢日志问题极大地影响数据库的稳定,当数据库出现负载高、性能抖动等问题时,数据库管理员或开发首先查看是否有慢日志在执行。数据库自治服务DAS(Database Autonomy Service)支持慢日志分析功能,统计并分析数据库中执行时间超过...

自动或手动主备切换

当主实例发生故障或不可用时(例如操作系统错误、硬件故障等),系统会自动触发主备切换,主实例和备实例将进行互换,切换后实例地址保持不变,应用程序会自动连接到新的主实例(原备实例),从而保障业务的连续和高可用。此外,您还...

封装模型镜像

因此首先需要您将模型和服务程序封装为Docker镜像。操作步骤 1.准备镜像内容,主要包括基础镜像、启动脚本、HTTP服务程序、算法包、Dockerfile 1)基础镜像 一般为包含NVIDIA CUDA的基础镜像,您可以使用自己已有的镜像,或者在VCS界面中...

如何处理HSF invalid call is removed问题

invalid call is removed because of connection closed 可能原因 网络闪断:客户端与服务端建立连接后,客户端发起调用请求,服务端仍在处理该请求且没有达到客户端超时,但因网络等各类问题导致客户端主动关闭连接,此时报错。服务端...

什么故障

定义 在日常运营中,无论什么原因导致业务服务中断、服务品质下降或用户服务体验下降的现象,称为故障,但不包括用户侧环境或用户自身操作引起的问题。“用户体验下降”说明故障的核心要关注用户感受,可通过客服渠道获知用户投诉,也可...

应用场景

传统型负载均衡CLB(Classic Load Balancer)的应用场景为高访问量的业务,提高应用程序的可用和可靠。应用于高访问量的业务 如果您的应用访问量很高,您可以通过配置监听规则将流量分发到不同的云服务器ECS(Elastic Compute Service...

业务连续

这样即使某个 ENS 实例出现故障,ELB 仍然可以将流量分配到其他 ENS 实例上,保障业务持续可用。跨地域主备容灾 应用的主备切换 为了避免地域级别的故障造成业务中断,在某个边缘节点上部署应用之外,还应该在其他边缘节点或公共云地域部署...

ack-node-repairer

当节点出现故障时,自愈系统自动对故障所在节点触发相应的修复操作。当故障被修复后,NPD修改故障状态,达到故障检测以及修复的闭环。运维人员也可以自定义需要采取修复操作的故障以及具体的修复操作。NPD是Kubernetes节点诊断的工具,...

什么是Anycast EIP

稳定可靠 Anycast EIP支持多个POP点同时接入服务,运营商线路出现故障时自动切换接入点,网络可靠更高。低抖动 通过Anycast EIP,客户端的公网访问请求可就近接入阿里云POP点,依托阿里云优质的BGP带宽和全球传输网络将访问流量直接送达...

自动或手动主备切换

RDS在发生异常触发高可用切换时,应用端长连接可能无法感知到连接状态变化,如果没有设置socket超时时间,应用程序会一直等待数据库返回结果,通常会等到几百秒后才会断连,期间数据库的部分连接无法正常工作,SQL会出现大量执行异常。...

什么是消息演练

这些消息服务之前并没有在系统中实际经历过真实流量考验,其中某些隐患或缺陷很难被发现,急需通过故障演练来评测高可用。AHAS提供了强大且高灵活度的故障演练功能,可以根据不同的场景注入对应的故障类型。为了使您的演练服务更便捷,...

路由方式概述

高可用部署 为了保证服务的可用服务可以部署在不同的K8s集群中,我们可以根据节点上与集群相关的元数据信息对服务所有实例按集群维度进行版本管理,并且可以调整分发到各个集群(各个服务版本)的流量权重。当某个集群出现故障时,设置...

路由方式概述

目前,云原生网关支持多种路由方式,包括单服务、多服务、标签路由、服务Mock和重定向。单服务路由 在该模式下,可以将请求转发到后端某个具体的服务。关于云原生网关服务的设置,请参见 管理服务。网关根据配置的路由规则进行匹配,例如:...

网站耗资源(客户程序故障)常见问题

什么会出现网站耗资源(客户程序故障)?常见的造成网站耗资源(客户程序故障)现象的原因如下所示:网站程序编写不合理,例如ASP程序变量没有清空。网站数据库调用频繁,例如当ACCESS数据库的容量比较大时(超过100 MB以上),性能可能...

自动恢复服务

服务或脚本在运行过程中可能程序异常、服务器重启、掉电等情况而停止运行,如果不能及时恢复运行,给线上业务造成损失。您可以通过云助手插件 ecs-tool-servicekeepalive,使服务或脚本在被中断时快速恢复运行,保障服务的可靠和...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
短信服务 商标服务 云服务器 ECS 轻量应用服务器 弹性公网IP 人工智能平台 PAI
新人特惠 爆款特惠 最新活动 免费试用