常见问题

警告 创建单节点地址后,当此节点故障时,该地址可能会出现最多1小时不可用的情况,请勿用于生产环境。Q:一个集群内最多允许创建多少个单节点地址?A:如果您的集群内有3个节点,则只允许为其中1个只读节点创建单节点地址;若集群内有4个...

Nginx Ingress异常问题排查

Nginx错误日志:一般在处理请求出现错误时产生,可以执行以下命令过滤出Nginx错误日志。kubectl logs<controller pod name>-n|grep error 在Controller Pod中手动访问Ingress和后端Pod 执行以下命令,进入Controller Pod。kubectl exec...

Nginx Ingress异常问题排查

Nginx错误日志:一般在处理请求出现错误时产生,可以执行以下命令过滤出Nginx错误日志。kubectl logs<controller pod name>-n|grep error 在Controller Pod中手动访问Ingress和后端Pod 执行以下命令,进入Controller Pod。kubectl exec...

如何排查Java场景下故障注入不生效的问题

在对Java进程注入故障时,可能会出现故障注入失败的情况。为解决此类问题,在创建或编辑演练时,您可以在故障执行阶段选择开启Debug模式,并通过相关的日志信息来了解故障注入失败的原因。开启Debug模式 在查看目标演练的故障注入日志前,...

主从(备)切换

注意事项 实例切换过程中会出现闪断,请确保您的应用程序具有自动重连机制。实例切换后,只读实例的数据会有几分钟的延迟,因为需要重建复制链路、同步增量数据等。手动切换主备实例 说明 仅 MyBase MySQL 高可用版实例支持主备切换。登录 ...

设置Pod故障处理策略

如果Pod status.reason为空(fail-fast一般不会出现该情况),可以查看Pod status condition,通过ContainerInstanceCreated的status确认调度状态。如果ContainerInstanceCreated为True,则表示ECI调度成功,是Sandbox创建异常。如果...

EDAS直播公告

2020-02-12 微服务治理实践之离群实例摘除 微服务架构中,由于服务集群中的某些实例出现故障,但仅仅因此而进行服务降级,对应用的伤害过大。是否可以通过自动地对故障实例进行短暂隔离,待实例恢复后再继续处理业务请求,以便保障服务的高...

坐席工作台

运营商对于同一号码的呼叫一般都有频次限制,如果您使用了该模式请联系运营商对于场外模式接听的电话进行加白处理,否则也造成场外模式接听坐席手机接不到电话的问题。点击以场内模式上线重新回到坐席工作台接听 三、错误反馈与帮助 1、...

坐席工作台

运营商对于同一号码的呼叫一般都有频次限制,如果您使用了该模式请联系运营商对于场外模式接听的电话进行加白处理,否则也造成场外模式接听坐席手机接不到电话的问题。点击以场内模式上线重新回到坐席工作台接听 三、错误反馈与帮助 1、...

常见问题

警告 创建单节点地址后,当此节点故障时,该地址可能会出现最多1小时不可用的情况,请勿用于生产环境。Q:一个集群内最多允许创建多少个单节点地址?A:如果您的集群内有3个节点,则只允许为其中1个只读节点创建单节点地址;若集群内有4个...

事件中心

该视图可以帮助您在应用出现故障时,快速排查关联的资源各自发生了什么问题。例如在大型企业中,由于某个员工的误操作,重启了生产环境的RDS,导致线上业务故障,利用该视图,可以快速的发现应用访问的RDS出现了重启操作。订阅规则 订阅...

K8s应用运维管理最佳实践

在Java类型应用中,如果出现故障Pod实例,可以借助Arthas诊断,排查Pod故障点。相关文档,请参见 Arthas诊断。如果应用无法正常启动,可以将启动命令修改为 sleep,再通过 kubectl exec 手动启动进程,观察输出并分析原因。相关文档,请...

常见问题

警告 创建单节点地址后,当此节点故障时,该地址可能会出现最多1小时不可用的情况,请勿用于生产环境。Q:一个集群内最多允许创建多少个单节点地址?A:如果您的集群内有3个节点,则只允许为其中1个只读节点创建单节点地址;若集群内有4个...

事件中心

该视图可以帮助您在应用出现故障时,快速排查关联的资源各自发生了什么问题。例如在大型企业中,由于某个员工的误操作,重启了生产环境的RDS,导致线上业务故障,利用该视图,可以快速的发现应用访问的RDS出现了重启操作。集群视图 集群...

测试指标

集群 对于使用集群方式的系统,主要通过以下方式考量其集群可靠性:集群中某个节点出现故障时,系统是否有业务中断情况出现。在集群中新增一个节点时,是否需要重启系统。当故障节点恢复后,加入集群,是否需要重启系统。当故障节点恢复后...

RDS术语

G 高可用系列 高可用系列实例有一个备实例,主实例的数据通过半同步的方式同步到备实例,当主实例出现故障无法访问时,自动切换到备用实例。更多信息,请参见 高可用系列。H 回收站 部分RDS实例在过期或释放后,进入回收站。您可以在...

应用FAQ

此问题是由于应用滚动更新时,Pod变更同步到CLB会存在秒级延迟,因此会出现 5XX 错误。您可以通过配置优雅中断等方式解决此问题,以实现K8s零中断滚动更新。具体操作,请参见 如何实现K8s零中断滚动更新?如何获取镜像?您可以使用容器镜像...

直播公告(2020~2022年)

MSE发布重要的功能后,通过直播的方式进行介绍,帮助您更好地了解和使用MSE。更多直播公告,请参见 直播公告(2023年)。单击直播主题所在列的具体链接,即可观看直播回放。MSE微服务引擎 直播主题 直播介绍 相关文章 直播时间 微服务...

客户案例

故障场景下恢复时间比较长,因此业务上通常实现一些高可用方案如Failover等等提高故障恢复时间,同时也引入了大量的复杂度。成本和性能,对于传统数据库而言,成本分为机器成本和许可证(license)成本。不同于传统的金融企业,...

网络架构容灾

不同部门和团队使用云产品时,一般会使用多个VPC把业务隔离,不同的VPC承载不同部门或团队的业务。但不同团队和部门间在特定场景下也需要互相访问双方的服务,这时就需要实现不同VPC间的互通。实现不同VPC之间的互通在阿里云上有两个主要...

自动故障转移和读写分离

libpq实现自动故障转移和读写分离 通过libpq函数连接多个数据库,当出现故障自动切换到可用的数据库。命令 postgresql:/[user[:password]@][netloc][:port][,.][/dbname]?param1=value1&.]示例 如下示例为连接1个RDS PostgreSQL主实例...

ZooKeeper的使用场景和MSE ZooKeeper的优势

节点故障自愈:依托于K8s的Liveness能力,在节点出现故障时,自动恢复故障节点,及时地保障服务的可持续性。数据安全:MSE ZooKeeper专业版提供了快照的备份能力,在集群出现非预期的情况时,能够快速重建恢复集群中的数据,保障数据的...

应用场景

如果现有计算资源突然出现故障导致业务受到影响,很难及时进行故障修复或者替换。您可以利用弹性伸缩的高可用优势,开启健康检查模式。阿里云自动检查实例的健康状态,当发现存在实例不健康时,自动增加实例替换不健康的实例,确保...

云解析DNS如何实现故障切换

全局流量管理支持IP地址健康检查功能,并根据健康检查的结果,来判断运营商IP地址是否出现故障,如果出现故障,则将域名解析切换到备份的运营商IP上,并最终帮用户实现自动故障转移的功效。请参阅 GTM实现跨网访问加速与故障切换 操作...

Windows系统的ECS实例ping外网地址提示“一般故障”...

本文介绍Windows系统的ECS实例ping外网地址提示“一般故障”的错误原因和解决方案。问题现象 Windows系统的ECS实例ping外网地址时提示“一般故障”错误。问题原因 出现该问题可能有以下原因:可能原因 排查方案 ECS实例中安装了第三方杀毒...

强弱依赖治理概述

如果商品详情页对下游依赖是强依赖,例如当下游依赖 库存、优惠、物流 出现故障的时候,将导致业务流程无法推进,会出现类似如下的说明,严重影响用户体验。如果商品详情页对下游依赖是弱依赖,例如当下游依赖 评价、店铺 等系统出现故障的...

无损上线

K8s 就绪检查前完成服务预热 在一些复杂的线上场景,可以将应用是否预热完成作为K8s就绪检查通过的衡量指标,以此来保障应用的预热效果,即当应用服务预热完成后,K8s才将应用置为就绪状态。具体配置如下:登录 MSE治理中心控制台,并在...

网站耗资源(客户程序故障)常见问题

什么会出现网站耗资源(客户程序故障)?常见的造成网站耗资源(客户程序故障)现象的原因如下所示:网站程序编写不合理,例如ASP程序变量没有清空。网站数据库调用频繁,例如当ACCESS数据库的容量比较大时(超过100 MB以上),性能可能...

在/var/log/messages日志中出现“INFO:task jbd2/vda1...

系统内核问题:当系统内核存在漏洞或者其他问题时,可能会出现hung task故障。系统资源紧张:ECS实例中应用或进程占用系统资源使用率(如CPU、内存等)过高时,可能会出现hung task故障。解决方案 出现hung task的原因比较复杂,您可以参考...

SDK相关FAQ

什么会出现内存泄漏?setSDKAuthSDKInfo的密钥如何获取?什么情况下会返回600005页面非法修改?当使用移动卡请求一键登录不成功,可能出现的报错日志及解决方法有哪些?若出现权限相关问题,该怎样做?检查App的权限是否可以正常申请。...

LTS(原BDS)服务介绍

使用指南 日志生命周期管理说明 开启日志订阅后,如果不消费数据,默认日志保留48小时,超时后订阅关系自动取消,保留的数据自动删除 什么场景导致“不消费数据”:没有终止任务的前提下直接释放LTS集群;同步任务暂停;使用日志订阅的...

路由方式概述

当某个集群出现故障时,设置分发到该集群的流量权重为0,即可达到流量切换目的。例如,以下应用系统中以K8s容器服务作为服务发现的用户服务,部署在两个不同的ACK集群中,集群A和集群B。对于/user 的路由请求流量,希望80%的流量转发至集群...

路由方式概述

当某个集群出现故障时,设置分发到该集群的流量权重为0,即可达到流量切换目的。例如,以下应用系统中以K8s容器服务作为服务发现的用户服务,部署在两个不同的ACK集群中,集群A和集群B。对于/user 的路由请求流量,希望80%的流量转发至集群...

异地双活切流

选择 故障单元,代表此时该单元当前出现故障,无法承接流量,MSHA自动将该单元的流量置0,将另一个单元置为100。b.单击 下一步,进入 容灾切换预览,在预览页,可以看到单元前后比例的对比,和 当前切流服务,如果和您预期不符,请返回 ...

LTS(原BDS)服务介绍

安全可靠:LTS充分考虑对源端和目标端系统在线影响最小化,以及兼容可能出现故障。在任务启动前有网络联通性、安全性等前置校验,运行过程中实时监控同步延迟、目标集群存储水位等并有相关的限速和报警,任务结束后还提供数据校验...

SQL版本说明

重要 在宽表引擎中使用 SELECT@VERSION 语句查询SQL版本时,可能会出现语句执行失败的情况。这是因为宽表引擎中搭载的SQL引擎在2.6.0版本对技术架构进行了升级,SELECT@VERSION 是新版本(即2.6.0及以上版本)支持的能力。因此,一些版本较...

高性能版实例

SQL崩溃时,主要会出现Coredump或Out of Memory等情况,使 AnalyticDB PostgreSQL版 进入恢复模式。恢复模式中,系统会对残留的锁和内存执行一些清理操作,并通过回放WAL文件来保证数据的完整性。恢复期间,实例会暂时无法服务,完成恢复后...

故障复盘

故障复盘规范 故障复盘作为故障体系中的重要一环,整体复盘流程包括故障处理过程、改进分析、故障定责,基于包含标准化的复盘SOP、对应预防action推荐、问责管理机制,全面地回溯线上故障的发生,产出故障复盘报告和改进措施,避免故障重复...

常见问题旧版索引

创建一个K8s集群,为什么会多出来两个SLB?Ingress组件需要安装吗?K8s的容器需要访问RDS实例,RDS白名单该如何设置?怎么把已经购买的ECS添加到K8s集群中?服务运行 如何部署集群的第一个应用?集群中的应用A如何访问应用B?如何将集群内...

常见问题

当您使用阿里云E-MapReduce(简称EMR)on ACK 时,可以根据本文...如果在绑定了Bucket A的EMR on ACK集群执行Spark作业尝试读写另一个Bucket B时,将会出现访问拒绝错误:“AccessDenied The bucket you access does not belong to you”。
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
数据传输服务 物联网无线连接服务 数据库自治服务 负载均衡 弹性公网IP 短信服务
新人特惠 爆款特惠 最新活动 免费试用