管理集群

主机故障处理策略 主机故障时,系统的处理策略:自动替换主机:系统自动替换故障主机。说明 如果故障主机是云盘主机,云盘自动迁移计算资源以自动替换主机。如果故障主机是非云盘主机,则系统先将故障主机上的实例迁移走,然后自动...

异地双活切流

选择 故障单元,代表此时该单元当前出现故障,无法承接流量,MSHA自动将该单元的流量置0,将另一个单元置为100。b.单击 下一步,进入 容灾切换预览,在预览页,可以看到单元前后比例的对比,和 当前切流服务,如果和您预期不符,请返回 ...

EasyCkpt:AI大模型高性能状态保存恢复

在节点上,通常很难出现所有网卡都损坏的情况,即使节点出现故障,它通常仍然具备通信能力。特点3:模型的失败是部分的。在大规模模型训练中通常采用3D并行或ZeRO系列优化,大多数任务的数据并行副本数大于1,这使得模型训练参数在多个副本...

自动或手动主备切换

A:RDS在发生异常触发高可用切换时,应用端长连接可能无法感知到连接状态变化,如果没有设置socket超时时间,应用程序会一直等待数据库返回结果,通常会等到几百秒后才会断连,期间数据库的部分连接无法正常工作,SQL会出现大量执行异常。...

Windows系统的ECS实例ping外网地址提示“一般故障”...

然后重新ping外网地址,不再出现一般故障”错误时,表示该问题已解决。检查网卡配置信息 执行 ipconfig/all 或 route print 命令检查IP配置,查看路由配置是否存在问题。如果回显中显示了所有网卡信息,如下图所示,说明路由配置没有问题...

强弱依赖治理概述

如果商品详情页对下游依赖是强依赖,例如当下游依赖 库存、优惠、物流 出现故障的时候,将导致业务流程无法推进,会出现类似如下的说明,严重影响用户体验。如果商品详情页对下游依赖是弱依赖,例如当下游依赖 评价、店铺 等系统出现故障的...

概述

分布式链路跟踪具备以下特点:全链追踪:能够深入应用,服务,数据库,消息,捕获性能异常,识别出现故障的组件及服务。易于使用:可以与 SOFAStack 上的应用进行无缝对接,用户的业务代码无需任何修改即可轻松接入,实现性能可视化与问题...

回切至本地VMware

本文主要介绍如何利用阿里云连续复制型容灾(CDR)服务,在本地虚拟机出现问题后把云上恢复出来的ECS回切到云下VMware环境中。前提条件 已部署CDR网关。更多信息,请参见 步骤三:部署CDR网关。已在被保护的Windows服务器上安装阿里云复制...

云解析DNS如何实现故障切换

全局流量管理支持IP地址健康检查功能,并根据健康检查的结果,来判断运营商IP地址是否出现故障,如果出现故障,则将域名解析切换到备份的运营商IP上,并最终帮用户实现自动故障转移的功效。请参阅 GTM实现跨网访问加速与故障切换 操作...

行排序

如果一个 ORDER BY 项是一个单一名字并且匹配一个输出列名或者一个表表达式的列,仍然会出现混淆。在这种情况中输出列将被使用。只有在你使用 AS 来重命名一个输出列来匹配某些其他表列的名字时,这才会导致混淆。ORDER BY 可以被应用于 ...

PolarDB MySQL版5.6版本发布日志

修复RO节点的物理机出现故障时,RW节点在特殊情况下未将其复制关系中断,而引发的RW节点刷脏受阻的问题。修复在RW节点执行Degrade操作后,Standby节点丢失物理复制重连机制的问题。修复一键升级RDS MySQL至PolarDB MySQL版场景下,...

什么是云拨测

实时告警与通知:云拨测提供实时告警功能,当业务出现异常时,主动发送告警通知,快速响应并处理问题。数据可视化:通过直观的数据展示和报表,您可以轻松了解网络状况、性能以及故障分析。应用场景 网络性能监控:云拨测可以帮助企业和...

Linux系统的ECS实例系统无响应,系统日志中出现“BUG:...

soft lockup-CPU#0 stuck for 61s 问题原因 该问题通常是由于ECS实例中,系统内核长时间占用CPU资源导致出现软死锁(soft lockup)故障,内核长时间占用CPU资源可能有以下原因:系统负载过高 内核死循环或死锁 内核调度问题 内核出现故障 ...

迁移有潜在故障风险的DDH

如果一台DDH有潜在故障风险,其物理机处于可用状态,但随时可能出现故障,导致DDH中的ECS实例出现问题。您可以自主迁移有潜在故障风险的DDH到其他物理机,避免相关业务因DDH故障受到影响。前提条件 请先将DDH上的ECS实例全部停机,否则迁移...

自动或手动主备切换

RDS在发生异常触发高可用切换时,应用端长连接可能无法感知到连接状态变化,如果没有设置socket超时时间,应用程序会一直等待数据库返回结果,通常会等到几百秒后才会断连,期间数据库的部分连接无法正常工作,SQL会出现大量执行异常。...

远程连接FAQ

检查是否为海外服务器 中国内地访问其他国家和地区地域下的轻量应用服务器,可能会出现较大延迟和丢包,造成无法访问服务器的问题。该问题受国际运营商的影响,无法在服务器中修复。更多信息,请参见 远程连接非中国内地服务器时,提示连接...

常见问题

这种情况一般出现的日志如下:任务被kill有以下几种可能:任务运行时间过久,MaxCompute上单个SQL任务默认运行超过24小时被kill,您可以通过设置以下参数使SQL作业延长至72小时:set odps.sql.job.max.time.hours=72;集群负载过大,资源...

PolarDB MySQL版CPU使用率高

此类问题一般可以通过开启集群的thread_pool特性进行流控缓解,具体请参见 Thread Pool。如果活跃线程有所缓解,同时还要注意应用侧是否已经产生了业务堆积,如果CPU负载较高同时活跃线程依然高居不下,此时则同样要考虑是不是对集群进行扩...

2020年

DBLink概述 缺陷修复 修复部分场景下节点重启会出现卡顿的问题。修复部分场景下内存溢出导致的集群崩溃的问题。修复部分场景下只读节点崩溃的问题。修复执行 client_encoding=gbk 命令时,UTF8编码格式转换为GBK时报错的问题。修复NVL函数...

网站耗资源(客户程序故障)常见问题

什么会出现网站耗资源(客户程序故障)?常见的造成网站耗资源(客户程序故障)现象的原因如下所示:网站程序编写不合理,例如ASP程序变量没有清空。网站数据库调用频繁,例如当ACCESS数据库的容量比较大时(超过100 MB以上),性能可能...

管理主备切换

背景信息 自动切换:实例默认开启自动切换,当主实例出现故障无法访问时,自动切换到备实例。主备切换的触发时机,请参见 主备切换原因。手动切换:即使自动切换是开启状态,您也可以手动进行主备切换。手动切换可用于容灾演练或多可用区...

主备切换

RDS在发生异常触发高可用切换时,应用端长连接可能无法感知到连接状态变化,如果没有设置socket超时时间,应用程序会一直等待数据库返回结果,通常会等到几百秒后才会断连,期间数据库的部分连接无法正常工作,SQL会出现大量执行异常。...

充值常见问题

通过网银支付成功后,为什么收款方显示“支付宝(中国)网络技术有限公司”?网银支付接入的是支付宝的支付产品。支付宝为国内持有牌照的第三方支付公司,人行的监管规定,所有经支付宝支付提供的资金支付结算服务,都需先经过第三方支付在...

2023年

无 缺陷修复 修复智能诊断功能统计表大小时可能会出现数字溢出的问题,现已将统计表大小的列由integer数据类型修改为bigint数据类型。修复分区表UPDATE分布键列时出现 tuple already updated by self 错误信息的问题。修复Master节点不回收...

数据库代理常见问题

什么查询时会出现乱码?DDL操作是否会自动从主库同步到从库?什么是数据库代理?数据库代理是位于数据库服务端和应用服务端之间的网络代理服务,用于转发应用服务端访问数据库时的所有请求,提供自动读写分离、事务拆分、连接池、连接保持...

时序引擎版本说明

修复并发更新Schema时会出现大量版本冲突的问题。修复Lindorm ML时序预测在预测条件为大于或小于某时间点时,拉取数据不足的问题。修复Lindorm ML时序异常检测ostl-ttest算法和ostl-esd在数据量较大时会报错的问题。优化Lindorm ML时序异常...

Quick BI报表列汇总的总计值都显示为0

问题描述 Quick BI报表列汇总的总计值都显示为0是什么原因?问题原因 指标使用的是str类型,总计计算方式使用的SUM,导致文本类型指标求和为0值。解决方案 列汇总配置中,计算方式选择“自动”,则总计值汇总计算求计数总和。适用于 ...

常见网络问题

常见网络问题概览 问题 诊断工具检测 客户端日志 问题分析及排查方法 控制台显示 打开备份库失败 通过诊断工具检测,出现如下问题:i/o timeout An existing connection was forcibly closed by the remote host No connection could be ...

创建集群

主机故障处理策略 主机故障时,系统的处理策略:自动替换主机:系统自动替换故障主机。说明 如果故障主机是云盘主机,云盘自动迁移计算资源以自动替换主机。如果故障主机是非云盘主机,则系统先将故障主机上的实例迁移走,然后再替换...

创建集群

主机故障处理策略 主机故障时,系统的处理策略:自动替换主机:系统自动替换故障主机。说明 如果故障主机是云盘主机,云盘自动迁移计算资源以自动替换主机。如果故障主机是非云盘主机,则系统先将故障主机上的实例迁移走,然后再替换...

常见问题

本文汇总了 PolarDB 数据库代理相关的常见问题。读写分离 Q:为什么刚插入的语句,立即查的时候查不到?A:读写分离的架构下,主节点和只读节点之间复制有延迟,但 PolarDB 支持会话一致性,即同一个会话内保证能读到之前的更新,详情请...

故障演练

有损演练是指直接在线上真实业务环境注入异常进行演练,演练模拟的真实有效性高,为了平衡业务影响一般会选择最核心场景、在业务最低峰期做演练,而且演练频次相对较小,例如为了验证多活容灾能力的机房断网演练,一般是一个月一次的演练...

Queries语句

能产生更新事件的操作通常使用状态(State),我们一般将这类操作称为状态算子。值得注意的是,并非所有的状态算子都支持处理更新流,例如,Over聚合(Over Aggregation)和Interval Join目前还不支持将更新流作为输入。以下表格信息基于...

aggregate子句

子句说明 一个关键词查询后可能找到数以万计的文档,用户不太可能浏览所有的文档来获取自己需要的信息,有些情况下用户感兴趣的可能是一些统计的信息。子句语法 aggregate=group_key:field,range:number1~number2,agg_fun:func1#func2,...

服务管控和治理

您可以根据检测的情况调整您的应用,以减少应用在正式使用时出现的异常问题。更多信息,请参见 故障注入。服务鉴权 服务提供者提供服务后,您可以通过服务鉴权功能对服务调用方进行鉴权。更多信息,请参见 服务鉴权。故障隔离 某个服务故障...

aggregate子句

子句说明 一个关键词查询后可能找到数以万计的文档,用户不太可能浏览所有的文档来获取自己需要的信息,有些情况下用户感兴趣的可能是一些统计的信息。子句语法 aggregate=group_key:field,range:number1~number2,agg_fun:func1#func2,...

2023年

无 缺陷修复 修复带SORT KEY的内存攒批任务执行后可能会出现的查询报错问题。修复Serverless实例读取字符串类型数据可能出错的问题。修复WHERE子句中过滤条件过多可能出错的问题。修复SQL包含like语句时可能出现报错的问题。修复扩缩容等锁...

自助诊断GPU节点问题

ACK集群提供节点级别的GPU诊断功能,供您进行部分GPU相关问题故障排查。如果您在ACK Pro版集群中使用GPU节点时遇到问题,可以启用GPU节点自助诊断,采集GPU诊断的基础指标进行问题排查。本文介绍如何使用节点诊断功能,自助排查GPU节点...

常见问题

本文列举了 Web应用防火墙(Web Application Firewall,简称WAF)相关的常见问题。类型 问题列表 产品FAQ 售前咨询问题 非阿里云服务器能否使用WAF?WAF支持云虚拟主机吗?WAF是否支持防护HTTPS业务?WAF是否支持自定义端口?WAF是否对接入...

关联子查询

Scalar sub-query has returned multiple rows 原因:关联子查询返回结果有多行时,会出现该报错,若返回结果行数等于0或1时,不会报错。以如下代码为例,外部查询的WHERE子句中是等值条件,且子查询的返回结果为多行,出现报错。SELECT ts...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
负载均衡 Web应用防火墙 商标服务 弹性公网IP 短信服务 人工智能平台 PAI
新人特惠 爆款特惠 最新活动 免费试用