GPU FAQ

解决方案 如果出现上述问题,您可以参考如下情况描述和对应方法,结合自身业务要求,尝试解决。情况一:如果您的应用Pod申请GPU资源的方式是通过为容器设置环境变量NVIDIA_VISIBLE_DEVICES=all实现,您可以评估能否给该应用容器添加一个...

节点伸缩概述

基于以上问题,ACK通过 节点伸缩(资源层)和 工作负载伸缩(调度层)两层弹性模型来解决节点伸缩 基于资源的使用率来触发应用副本的变化,也就是调度单元的变化。以下介绍技术细节。如何判断节点的弹出?节点伸缩通过监听Pending状态的...

任务运行失败

本文汇总介绍任务运行失败的相关问题。通用参考 已配置失败重跑的任务在运行失败后未重跑,并报错 Task Run Timed Out,Killed by System!任务执行报错OSError:[Errno 7]Argument list too long.MaxCompute类型节点 ODPS-0420095:Access ...

变更Shard节点配置

当Shard节点无法满足存储需求或达到性能瓶颈时,您可以变配Shard节点规格或存储空间以解决上述问题。云数据库MongoDB分片集群实例支持对一个或多个Shard节点进行配置(例如规格和存储空间)变更。使用限制 变配时选择的存储空间需大于或...

启用节点自动伸缩

阅读前提示 为了让您更好地使用 节点自动伸缩 功能,建议您在阅读本文档前,已阅读 节点伸缩概述 并了解以下内容:节点自动伸缩 的工作原理与功能特性 哪些业务场景下,节点自动伸缩 可以满足您的业务诉求 使用 节点自动伸缩 前需要了解的...

重启实例或节点

当云数据库MongoDB单节点实例、副本集实例、分片集群实例、分片集群实例中指定节点(任意一个Mongos节点或Shard节点出现连接数满或性能问题时,您可以手动重启实例或指定节点。注意事项 重启实例期间会启停进程,系统会断开当前所有连接...

产品选型

云原生多模数据库 Lindorm 支持水平无限扩展,在访问比较均衡的情况下,如果出现高负载、高延迟、业务抖动等情况时,可以通过水平增加节点数量解决。但是当节点遇到瞬时的大请求或者偶发的热点流量时,单机的规格决定了抗热点的能力,此时...

主备切换

当 云数据库Redis版 监测到实例的主节点不可用时,会自动触发主备切换,将备节点提升为主节点,保障实例的高可用性。若您收到短信、邮件、控制台站内信等通知,告知您 Redis 实例已完成主备切换,您可以参考本文了解主备切换的原因、影响和...

主备切换

当 云原生内存数据库 Tair 监测到实例的主节点不可用时,会自动触发主备切换,将备节点提升为主节点,保障实例的高可用性。若您收到短信、邮件、控制台站内信等通知,告知您 Tair 实例已完成主备切换,您可以参考本文了解主备切换的原因、...

节点池部署集最佳实践

但当一台物理机出现问题时,会影响到应用的所有副本。为了解决这个问题,ECS提供了部署集功能。部署集内的所有ECS实例会在指定地域内严格分散在不同的物理服务器上,满足服务相互隔离的应用架构,大幅降低服务不可用的几率。关于部署集的更...

多可用区同时快速弹性扩容

解决方案 为了解决同时扩容多可用区节点问题,容器服务ACK引入了ack-autoscaling-placeholder组件,通过少量的资源冗余方式,将多可用区的弹性伸缩问题转变为并发节点池的定向伸缩问题。具体操作,请参见 基于ack-autoscaling-...

多可用区同时快速弹性扩容

解决方案 为了解决同时扩容多可用区节点问题,容器服务ACK引入了ack-autoscaling-placeholder组件,通过少量的资源冗余方式,将多可用区的弹性伸缩问题转变为并发节点池的定向伸缩问题。具体操作,请参见 基于ack-autoscaling-...

查看血缘关系

提升故障排查效率 当数据在处理过程中出现问题时,通过血缘关系,您可以追踪到问题的根源,快速定位和解决故障,避免业务损失和高昂的人力成本。提升数据分析效率 当数据资产变更或者出错的情况下快速定位所影响的线上作业,及时进行处理,...

常见问题

无法访问/访问异常 CDN回源时网站出现5xx报错的排查方法 使用CDN加速后网站无法访问 地域节点获取CDN节点文件异常或访问域名失败 使用CDN加速后访问URL时出现空白页面 定位访问异常是CDN节点问题还是源站问题 开通海外节点后没有提高海外...

01新建MaxCompute公共节点

公共节点2:节点名称/节点标识“ods_base_xykxfmx_demo_di”,公共节点描述为”信用卡消费“,节点SQL语句:insert overwrite table${ods_base_xykxfmx_demo_di} select t1.id,t1.cid,t1.xfrq,t1.rid,t1.xfje,t1.xflx from${stg_base_...

添加已有节点

如果购买ECS实例后需将该云服务器添加到ACK集群中作为Worker节点,或移除Worker节点后需将节点实例重新加入节点池,您可以在容器服务管理控制台自动添加或手动添加节点。添加前,请仔细阅读使用限制、注意事项等。前提条件 已创建...

指标含义与异常处理建议

集群的主要监控指标包含(实际以控制台为准):集群状态(value)集群写入QPS(Count/Second)集群查询QPS(Count/Second)节点CPU使用率(%)节点磁盘使用率(%)节点HeapMemory使用率(%)节点load_1m(value)FullGc次数(count)...

使用限制

重要 基础系列只有一个数据库节点,没有备节点作为热备份,因此当该节点变更配置时,会出现半小时或更长时间的中断。请在非高峰期内进行变更配置,避免影响业务。非基础系列在变更配置生效期间,可能会出现一次约30秒的闪断,虽然不影响...

0014-00000089

问题原因 您提交了PutBucketLifecycle请求,但是请求体XML中出现了多个重复节点,而接口要求该节点仅允许配置一个,导致请求错误。问题示例 例如,以下请求体XML中 Filter 节点中存在两个 Not 子节点,而接口要求 Not 节点仅允许配置一个。...

自助诊断GPU节点问题

ACK集群提供节点级别的GPU诊断功能,供您进行部分GPU相关问题的故障排查。如果您在ACK Pro版集群中使用GPU节点时遇到问题,可以启用GPU节点自助诊断,采集GPU诊断的基础指标进行问题排查。本文介绍如何使用节点诊断功能,自助排查GPU节点...

手动升级集群

您可以通过控制台升级集群的Kubernetes版本,也可以独立升级控制面和节点池,灵活控制升级节奏。本文介绍集群升级前后的注意事项、升级流程、操作步骤等。为什么需要升级 ACK保证Kubernetes最新3个 次要版本 的稳定运行。例如,支持...

Multi-Master基础架构

AnalyticDB PostgreSQL版 Multi-Master通过水平扩展Master节点突破了原架构单Master的限制,配合Segment节点(计算节点)的弹性,系统整体能力尤其是连接数及读写性能得到进一步提升,更好地满足实时数仓及HTAP等业务场景的需求。...

0042-00000209

解决方案 确保您请求中的XML内Part节点需要按照其PartNumber子节点值从小到大的顺序排列。可参考如下示例:POST/multipart.data?uploadId=0004B9B2D2F7815C432C9057C031*&encoding-type=url ...

调优集群性能

如下图所示,某张表是根据a字段进行分布,因为a字段本身比较均匀,所以数据均匀地分布在不同的存储节点上,当您使用了b字段进行分组(group by b),那么存储节点1会将b字段值为b1的数据行分发到计算节点1,为确保计算节点1具有所有b字段值...

一键MaxCompute Merge任务节点问题排查方案

本文为您介绍一键实时同步MaxCompute Merge任务节点失败后的排查与恢复方案。Merge任务说明 基本原理 一键实时同步MaxCompute运行时会先将源表存量数据通过离线同步至Base表中(目标表),同时启动实时同步任务读取源库增量变更日志,写到...

补数据

本文为您介绍补数据的相关问题。补数据功能说明 为什么小时分钟任务补数据选择了并行但实际不生效?为什么补数据选择业务时间后不运行,实例显示黄色,实例状态显示等待时间?为什么补数据选择业务时间昨天和今天,也会出现等待时间的情况...

OSS对象检查节点

DataWorks支持通过OSS对象检查节点检查OSS指定路径的文件是否存在,当下游任务需依赖该OSS文件时,您可使用此功能先检查文件是否存在。例如,同步OSS数据至DataWorks,需先检测出已经产生OSS数据文件,才可执行OSS同步任务。本文为您介绍...

PolarDB PostgreSQL版架构介绍

通过LogIndex解决了刷脏依赖 过去页面 的问题,也是将只读节点的回放转变成了Lazy的回放:只需要回放日志的meta信息即可。基于Shared-Storage的未来页面 在存储计算分离后,刷脏依赖还存在 未来页面 的问题。如下图所示:T1时刻,主节点对P...

PolarDB PostgreSQL版架构介绍

通过LogIndex解决了刷脏依赖 过去页面 的问题,也是将只读节点的回放转变成了Lazy的回放:只需要回放日志的meta信息即可。基于Shared-Storage的未来页面 在存储计算分离后,刷脏依赖还存在 未来页面 的问题。如下图所示:T1时刻,主节点对P...

回收磁盘碎片以提升磁盘利用率

在删除云数据库MongoDB实例的数据后,这些被删除数据使用的存储空间会被标记为空闲,随后写入的新数据可能会被直接存储到这部分空闲的存储空间中,也可能会先扩展文件的存储空间再存储...相关问题 解决因磁盘空间耗尽导致的锁定或无法写入问题

节点弹性大盘

节点弹性大盘使用方法 发现问题 是否存在异常节点:总节点数是否等于可用节点数,如果不等则说明可能有节点异常。集群容量规划是否合理:大多数的线上业务都存在业务高峰和低峰,在集群中使用自动伸缩的最重要目的之一就是让自动伸缩帮助...

多主集群(库表)商业化

汇聚库可使用多主集群(库表)下的全局只读节点,彻底解决聚合复制链路延迟问题,同时省去聚合库的额外存储和计算备份节点的成本,整体成本下降2/3。架构图 多主集群(库表)的架构图如下:发布时间 2022年09月30日。多主架构以多主集群...

技术面临的挑战与革新

在部分存储节点出现热点数据、资源紧张时,PolarDB会自动迁移部分数据到其他节点。采用独有的Parallel-Raft技术,每份数据会有三个副本,每次IO都保证至少有两个副本落盘,保障了RPO。由于是共享存储架构,节点间状态接近于完全同步,当...

通过巡检工具问题排查

修改后 Pod 重新创建后成功运行,问题解决。2)PLEG问题导致节点NotReady=适用版本:所有 关键词:节点NotReady、PLEG、PLEG is not healthy=发现有NotReady的Node 对应Node的kubelet日志中发现:kubelet.go:1794]skipping pod ...

灾备方案

Proxy会实时探测只读节点的状态,当出现下述情况时,Proxy会执行流量管控动作:只读节点处于异常状态:Proxy会降低该节点的服务权重,如果多次无法连接该节点,Proxy会停止该节点的服务(即不再将流量转发至该节点),待该异常被修复后重新...

扩缩容节点

容器服务ACK通过调整节点池的期望节点数实现节点池扩缩容,将节点数目维持在期望数量。扩容节点池保证节点数量足够支撑业务运行,缩容节省成本。扩缩容节点池均可自动化执行,提升了运维效率。本文介绍如何扩缩容节点池。前提条件 已创建...

灾备方案介绍

Proxy会实时探测只读节点的状态,当出现下述情况时,Proxy会执行流量管控动作:只读节点处于异常状态:Proxy会降低该节点的服务权重,如果多次无法连接该节点,Proxy会停止该节点的服务(即不再将流量转发至该节点),待该异常被修复后重新...

概述

整合了多项技术,来解决用户的痛点问题:引入全新的高可用模块Voting Disk(简称VDS),该模块基于共享存储架构,实现自治的集群节点管理,大幅降低故障检测和集群选主耗时;新增支持全局预热系统的热备节点,通过对存储引擎内部的多个模块...

开发PyODPS 2任务

DataWorks提供PyODPS 2节点类型,您可以在DataWorks上通过PyODPS语法进行PyODPS任务开发,PyODPS集成了MaxCompute的Python SDK。支持您在DataWorks的...PyODPS常见问题:您可了解PyODPS执行过程中的常见问题,便于出现异常时快速排查解决

开发PyODPS 2任务

DataWorks提供PyODPS 2节点类型,您可以在DataWorks上通过PyODPS语法进行PyODPS任务开发,PyODPS集成了MaxCompute的Python SDK。支持您在DataWorks的...PyODPS常见问题:您可了解PyODPS执行过程中的常见问题,便于出现异常时快速排查解决
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
物联网平台 边缘节点服务 ENS CDN 安全加速 SCDN (文档停止维护) 钉钉会议 弹性公网IP
新人特惠 爆款特惠 最新活动 免费试用