当节点出现故障时,自愈系统会自动对故障所在节点触发相应的修复操作。当故障被修复后,NPD会修改故障状态,达到故障检测以及修复的闭环。运维人员也可以自定义需要采取修复操作的故障以及具体的修复操作。NPD是Kubernetes节点诊断的工具,...
SLB和后端服务器的高可用架构满足业务高并发需求同时避免业务出现单点故障。上云价值 依托于EDAS平台提供的流控管理、弹性伸缩、服务监控等功能保障了业务系统面对大流量、高并发时能够平稳运行。2020年第二阶段消费券活动期间,使用EDAS后...
类型 问题 鉴权失败常见问题 控制台提示没有权限,报错详情:ForbiddenQueryClusterNamespace Forbidden query namespaces 控制台提示没有权限,报错详情:APISERVER_403 控制台提示子账号不具备授权管理权限 根据错误信息判断是RAM授权...
常数吞吐量定时器(Constant Throughput Timer)通常用于控制吞吐量,您可以根据压测脚本的业务目的,来选择不同的计算模式。若叠加上分布式施压源,您需要考虑脚本中的配置值及配置模式,以便匹配不同的压测目标模型。本文将从应用场景的...
常数吞吐量定时器(Constant Throughput Timer)通常用于控制吞吐量,您可以根据压测脚本的业务目的,来选择不同的计算模式。若叠加上分布式施压源,您需要考虑脚本中的配置值及配置模式,以便匹配不同的压测目标模型。本文将从应用场景的...
开启跨可用区自动切换后,如果 主可用区出现故障,集群将会自动切换至备可用区,如下图所示:(可选)开启 半同步模式进行跨可用区的数据复制。说明 半同步模式:在事务提交时,需要等待此次事务产生的redo日志在跨可用区备份节点完成持久...
修复并发更新Schema时会出现大量版本冲突的问题。修复Lindorm ML时序预测在预测条件为大于或小于某时间点时,拉取数据不足的问题。修复Lindorm ML时序异常检测ostl-ttest算法和ostl-esd在数据量较大时会报错的问题。优化Lindorm ML时序异常...
RDS PostgreSQL提供pg_concurrency_control插件,用于对SQL进行并发控制。前提条件 RDS PostgreSQL实例版本为PostgreSQL 10或11。参数说明 参数 默认值 说明 pg_concurrency_control.query_concurrency 0 设置Select类型SQL并发控制的排队...
您可通过PTS控制台快速实现UDP协议压测。本文介绍如何对UDP协议进行压测。功能入口 登录 PTS控制台,在左侧导航栏选择 性能测试>创建场景,然后单击 TCP/UDP压测。在 创建TCP/UDP场景 页面,填写 场景名,选择 协议类型 为 UDP。在 场景...
故障恢复 本机出现故障后在云上拉起本地业务,待本地环境恢复后再将其恢复到本地。具体步骤如下:在 主站点管理 页签,单击+添加。在 添加计算平台 页面,填写计算平台 名称,选择 类型,填写 IP地址、用户名 和 密码。单击 创建。在连续...
网络经过云防火墙时,可能会出现以下问题:无法登录服务器。无法访问服务器上的服务。服务器无法访问外网。出现上述问题,您需要从互联网边界防火墙和主机边界防火墙两个维度进行排查:互联网边界防火墙 确认资产是否开启了互联网边界防火...
隔离规则通过控制接口或依赖的并发线程数,来保证系统的稳定性。通常适用于应用内部或下游依赖出现不稳定的场景,例如慢SQL、下游应用响应时间变长等。本文介绍如何配置和管理隔离规则。前提条件 将应用接入AHAS应用防护,具体操作,请参见...
是 故障 稳定状态 DDH出现故障。您可以 提交工单 检查并处理问题。是 已过期 稳定状态 包年包月DDH到期时出现的状态。对DDH续费后,DDH的状态会变为 运行中。续费详情,请参见 手动续费DDH。是 已释放 稳定状态 包年包月DDH过期后自动释放...
当数据库存在突发流量导致SQL并发量急剧上升、部分SQL占用大量数据库资源、或者大量未创建索引的SQL被调用等问题影响正常业务时,需要限制问题SQL的并发度,保障大部分的业务正常运转。数据库自治服务DAS支持自动SQL限流,会自动提取SQL...
云消息队列 RocketMQ 版 支持PushConsumer和SimpleConsumer这两种类型的消费者,本文分别从使用方式、实现原理、可靠性重试和适用场景...如果业务经常会出现一些预期外的长时间耗时的消息,建议使用SimpleConsumer,并设置好消费不可见时间。
您可通过PTS控制台快速实现Redis压测。本文介绍如何对Redis进行压测。功能入口 登录 PTS控制台,在左侧导航栏选择 性能测试>创建场景,然后单击 Redis压测。在 创建Redis场景 页面,填写 场景名,然后配置Redis连接。相关配置 说明 阿里云...
您可通过PTS控制台快速实现流媒体HLS协议压测。本文介绍如何对流媒体HLS协议进行压测。背景信息 流媒体是一种新型的媒体传输技术,是指将一连串的视频、声音、文本、图像等流数据压缩后,经过网上分段发送数据的方式即时传输影音的过程;...
受服务构架限制,MaxCompute Tunnel服务在以下几种场景中会出现偶发的请求延迟问题(单次上传、下载10MB数据耗时从秒级增长到分钟级)。共享Tunnel服务资源用满(CPU/网络带宽)持续时间:几分钟~几小时。受服务架构限制无法避免,有强保障...
您可通过PTS控制台快速实现TCP协议压测。本文介绍如何对TCP协议进行压测。功能入口 登录 PTS控制台,在左侧导航栏选择 性能测试>创建场景,然后单击 TCP/UDP压测。在 创建TCP/UDP场景 页面,填写 场景名,选择 协议类型 为 TCP。在 场景...
您可通过PTS控制台快速实现RocketMQ压测。本文介绍如何对RocketMQ进行压测。功能入口 登录 PTS控制台,在左侧导航栏选择 性能测试>创建场景,然后单击 RocketMQ压测。在 创建RocketMQ场景 页面,填写 场景名,选择 消息队列类型 为 ...
为什么会出现网站耗资源(客户程序故障)?常见的造成网站耗资源(客户程序故障)现象的原因如下所示:网站程序编写不合理,例如ASP程序变量没有清空。网站数据库调用频繁,例如当ACCESS数据库的容量比较大时(超过100 MB以上),性能可能...
table.exec.sink.keyed-shuffle 为解决向带有主键的表中写入数据时出现的分布式乱序问题,您可以通过table.exec.sink.keyed-shuffle参数来进行Hash Shuffle操作,这将确保相同主键的数据被发送到算子的同一个并发,减少分布式乱序问题。...
但在某些场景下,重启过程中可能会出现访问超时,例如强制重启并发度高、集群负载很高并且已经存在集群访问不可用的情况、没有副本分片、在重启或强制重启过程中存在大量的写入和查询等场景,建议重启前先在客户端设计好重试机制并且在业务...
在控制台执行SELECT语句为什么会有Limit 500的限制?能够突破这个限制吗?阿里云子账号可以在哪里执行SQL?什么是异步执行?如何使用?控制台上异步执行如何拿到执行结果?多个Hint如何一起使用?虚拟集群管理相关问题 如何设置DLA Presto...
降配VPN网关实例SSL连接数规格的过程中,如果VPN网关实例已连接的客户端的数量超过了SSL连接数规格,有可能会出现连接中断,建议后端应用具备重连机制。生效时间 为VPN网关实例修改SSL连接数规格后会立即生效,但可能会因为网络等原因有...
外部系统故障或访问变慢时,会导致作业并发度增大,加重外部系统的压力,导致外部系统雪崩。常见的外部系统问题如下:数据总线DataHub分区不足或消息队列RocketMQ吞吐量不足。Sink性能问题。云数据库RDS死锁。智能调优和定时调优都支持基础...
问题类别 常见问题 小文件优化 MaxCompute什么情况下会产生小文件?如何解决小文件问题?作业诊断 执行并发插入操作报错,如何处理?运行作业时,报错ODPS-0130121,如何解决?创建的Shell任务执行失败,在ECS服务器执行显示成功,运维中心...
为什么要用云控制API管理云资源 随着云计算服务业务越来越丰富,很多云厂商为客户提供的相关的API数量也多达上万个。而在云服务被集成过程中,客户/伙伴面对上万单点API往往无从下手。从“找到正确API”到“了解使用方式”再到“弄清楚上...
您可通过PTS控制台快速实现Kafka压测。本文介绍如何对Kafka进行压测。功能入口 登录 PTS控制台,在左侧导航栏选择 性能测试>创建场景,然后单击 Kafka压测。在 创建Kafka场景 页面,填写 场景名。在 场景配置 页签下,单击+添加Kafka节点,...
DDL操作执行时需要修改表的元数据(metadata),有可能会遇到等待表元数据锁的情况(waiting for table metadata lock),该情况的处理方式请参见 解决MDL锁导致无法操作数据库的问题。Inplace和Copy Table是相反的2种处理方式;但即使DDL...
DDL操作执行时需要修改表的元数据(metadata),有可能会遇到等待表元数据锁的情况(waiting for table metadata lock),该情况的处理方式请参见 解决MDL锁导致无法操作数据库的问题。Inplace和Copy Table是相反的2种处理方式;但即使DDL...
会出现日志空间不足问题。会出现“Duplicated Key”错误。容易导致只读实例复制延迟。部分操作不支持并发DML。无法暂停。受MDL表元数据锁限制。RDS for MySQL Online DDL使用 RDS for MySQL表上Metadata Lock的产生和处理 Online DDL操作...
就是对系统并发的压力呈现阶梯性增加的过程,每个时间段并发数都要增加一个数量值,最终达到一个预期并发数,然后保持该并发数,持续运行一段时间。对应的 压力预估图 是阶梯形式的曲线图。固定压力值:并发数是固定的。对应的 压力预估图 ...
如果ECS修复磁盘事件流程中,要求重启ECS,则可以按照如下步骤重启:在EMR控制台停止故障Broker节点服务。重启故障ECS实例。在ECS修复磁盘事件流程中,单击 重启。在EMR控制台启动故障Broker节点服务。观察Broker节点状态是否处于正常状态...
购买完成后返回控制台,在 Quota管理 页面将会出现一个 Quota类型 为 传输服务 的Quota组,在该Quota组上可以进行 升级、降配 和 续费 操作,升级与降配的策略请参见 升级与降配。使用独享数据服务资源组 您可以选择在 项目级、任务级 或 ...
警告 故障切换操作适用于被保护服务器已经出现严重故障的情形,进行该操作会停掉实时复制流程。您需要重新启动复制,并完成一次全量复制才能对被保护服务器继续进行容灾保护。故障切换步骤如下:登录 混合云容灾管理控制台。单击 切换到...
running in Pipeline[basecommon_group_xxxxxxxxx]任务运行在独享数据集成资源上,日志中会出现如下信息。running in Pipeline[basecommon_S_res_group_xxx]任务运行在数据集成自定义资源组上,日志中会出现如下信息。running in Pipeline...
当生产站点因为不可抗力因素(比如机房火灾、断电)或者设备故障(软、硬件破坏)导致应用在短时间内无法恢复时,ECS容灾服务支持业务的跨可用区(Availability Zone)的容灾能力,对整体的应用做容灾备份来应对单地区的故障,满足业务的...
同时,您可以通过控制台的切流操作,将出现故障的可用区隔离,这时系统会自动在剩余的可用区中补充计算资源,满足业务对资源的需求。本文介绍如何部署和使用(切流和恢复)跨可用区实例。应用场景 跨可用区部署支持单可用区、跨2个可用区、...
解决方案:单个账号的总QPS为10,000,但在不同的读写方式下,实际能达到的值如下:顺序读写:2,000 如果您在上传大量文件时,在命名上使用了顺序前缀(如时间戳或字母顺序),可能会出现大量文件索引集中存储于存储空间中某个特定分区的...