ACK One概述

智能调度 利用容器服务ACK调度,实现Gang Scheduling、CPU拓扑感知、ECI弹性调度等高阶调度能力。利用分布式缓存ACK Fluid应对存算分离场景,提升访问效率和减少带宽占用。注册集群相关文档,请参见 注册集群概述。多集群舰队 当您同时...

开启Fluid控制面组件监控

在 Fluid控制详细指标 区域,可查看Fluid控制组件闲忙程度、处理失败情况、Kubernetes API请求等信息。在 Fluid Webhook详细指标 区域,可查看Fluid Webhook组件资源使用、请求处理数量以及请求处理时延等信息。在 资源使用 区域,可...

重启实例或节点

当云数据库MongoDB单节点实例、副本集实例、分片集群实例、分片集群实例中指定节点(任意一个Mongos节点或Shard节点)出现连接数满或性能问题时,您可以手动重启实例或指定节点。注意事项 重启实例期间会启停进程,系统会断开当前所有连接...

常见问题

如果您有配置多Hive MetaStore、多MySQL的需求,或默认提供的连接不包含您想要使用的服务时,您可以使用EMR Trino提供的5个占位连接,即connector1~connector5,您可以选择其中任意一个,将其 connector.name 配置为hive或您所需要的...

云平台一键迁移

如果源服务器迁移至 云服务实例 和 轻量应用服务器 时,需注意:为避免迁移失败,迁移过程中请勿停止、启动、重启或者释放目标实例。迁移前建议您备份目标阿里云云服务实例,避免数据丢失。由于创建迁移任务后,目标阿里云云服务实例...

为什么不推荐使用Sarama Go客户端收发消息?

问题现象 所有Sarama Go版本客户端存在以下已知问题:当Topic新增分区时,Sarama Go客户端无法感知并消费新增分区,需要客户端重启后,才能消费到新增分区。当Sarama Go客户端同时订阅两个以上的Topic时,有可能会导致部分分区无法正常消费...

进入CentOS实例单用户模式的配置方法

由于阿里云服务是基于云上平台,所以进入单用户模式需要修改grub的参数才能成功进入,可参考以下步骤进行操作。说明:若您无法登录系统修改/etc/grub.conf 配置文件,您只能在重启ECS实例时,快速的通过VNC连接实例,然后按e键。本文相关...

使用前须知

您可以将网络质量分析的SDK插件集成到App中,实时感知所有App真实用户在线情况、访问互联网的网络质量情况。网络质量分析提供从在线终端设备发起到您目标服务器的网络质量探测分析,帮助终端用户进行网络问题排查诊断。应用场景 全局...

使用异常

无法连接 Broker 客户端启动失败,出现“Can not find name server with endpoint”报错 启动 Producer、Consumer 失败,Group ID 重复 主动订阅消息,获取队列列表失败 消息显示 Consumed,但消费端未感知到 无法连接 Broker 可能的原因:...

云监控主动报警的系统事件列表

云产品 事件类型 事件名称 事件含义 事件状态 事件等级 云服务ECS Exception Instance:SystemFailure.Reboot:Executed 实例重启结束(系统错误)Executed Critical StatusNotification Instance:AutoReactivateCompleted 完成自动重开机 ...

如何处理云监控插件心跳检查失败问题?

说明 如果启动或重启主机仍然不能解决问题,请根据云服务ECS的相关文档进行排查。更多信息,请参见 实例FAQ。检查主机的云监控插件是否正常运行。具体操作,请参见 安装和卸载C++版本插件。是:执行 3。否:请重启云监控插件。具体操作,...

动态修改Pod资源参数

ack-koordinator提供对Pod内存参数动态修改的能力,可以在不重启Pod的情况下,修改CPU、内存、磁盘IO等单机隔离参数。本文介绍如何使用ack-koordinator动态修改Pod资源参数。前提条件 已通过kubectl连接Kubernetes集群。具体操作,请参见 ...

动态修改Pod资源参数

ack-koordinator提供对Pod内存参数动态修改的能力,可以在不重启Pod的情况下,修改CPU、内存、磁盘IO等单机隔离参数。本文介绍如何使用ack-koordinator动态修改Pod资源参数。前提条件 已通过kubectl连接Kubernetes集群。具体操作,请参见 ...

告警触发器ACS:AlarmTrigger

用途 当包含告警触发的模板创建执行后,该执行初始为等待中状态。如果告警触发中设置的 监控项 达到告警阈值,执行状态则切换为运行中,并立即开始执行模板中定义后续任务,后续任务一般为自动解除告警的相关操作。应用场景举例,如当...

推空保护

目前Spring Cloud Gateway不支持动态感知某个服务完全移除后取消订阅,建议您重启Spring Cloud Gateway。强制进行推空保护的场景 MSE Nacos 2.1.0.2及以上版本,引擎对推空保护的逻辑进行了优化,仅在开启 ...

自适应优化

传统查询优化基于静态的统计...为了解决这些无法提前预料的变化因素可能导致的性能回退问题,PolarDB MySQL版 在查询优化中引入了自适应能力,可以通过动态感知环境和执行相关因素来调整执行计划,保证执行效率的最优性。自适应执行能力

创建订阅

从而保证用了“At Least Once”的消费语义,比如用户发现自己应用程序有个时间段消费的数据处理上存在问题,想重新消费,此时只需要将点位重置到对应的时间点,并且无须重启自己的应用程序,可以做到应用程序自动感知。创建订阅 需要确保...

ECS实例的状态显示为已停止

问题描述 在ECS管理控制台中,ECS实例的状态显示为已停止。问题原因 服务器负载过高或者启动实例之后,没有在ECS管理控制台中刷新实例列表页面所导致。解决方案 说明 如果您对实例或数据有修改、变更等风险操作,务必...适用于 云服务ECS

Linux实例重启后修改的系统时间未生效

说明 本文可能由社区贡献或涉及第三方产品信息,建议您访问社区或第三方产品的官方网站获取帮助与支持。第三方产品不在阿里云售后支持范围。本文仅供参考,阿里云不做任何暗示或其他...适用于 云服务ECS 说明 该操作只适用于海外服务器。

YARN资源配置

yarn-site.xml 集群 默认为32,如果集群确实需要提交单个容器比较大的作业时需要提高避免调度限制,过高的配置容易导致资源碎片,调整后需要重启ResourceManager组件生效。yarn.scheduler.minimum-allocation-vcores 调度中单个容器...

无损下线Dubbo应用

对于任何一个线上应用,如何在服务更新部署过程中保证客户端无感知是开发者必须要解决的问题,即从应用停止到重启恢复服务这个阶段不能影响正常的业务请求。在应用执行部署、停止、回滚、缩容、重置时,需要通过无损下线的配置来保证应用...

实时同步任务告警设置最佳实践

仅当实时任务重启脏数据策略改为容忍脏数据,用户需要感知脏数据发生时,设置此监控指标。修改脏数据策略会导致写入失败数据被舍弃,目标端数据与源端数据不一致,除非有明确原因不建议修改。告警接收方式 DataWorks对实时同步任务设置告警...

无损下线Spring Cloud应用

对于任何一个线上应用,重启、下线等操作不可避免,无损下线能够实现服务消费者无感知,保持业务连续无损。您无需对应用进行任何配置、也无需在EDAS控制台进行任何操作,EDAS默认支持Spring Cloud应用无损下线。为什么需要无损下线 无损...

错误码字典

尝试重启蓝牙开关后再重试。101617+61706 设备热点连接失败。手机网络情况不佳,导致添加失败,请重试。检查设备热点是否存在。检查配网入口是否选择正确。检查设备是否进入了配网模式。101617+61709 配网失败,如果手机端网络正常,则是...

步骤一:扩容云盘容量

本文为您介绍如何通过在线扩容(扩容完无需重启实例)和离线扩容(扩容完需要重启实例)两种方式扩容云盘容量。前提条件 请确保实例满足以下条件:在线扩容时,实例状态为 运行中(Running)。离线扩容时,实例状态为 运行中(Running)或 ...

应用采集常见问题

本文档介绍了您在使用应用采集过程中遇到的常见问题。端口9996被占用报错如何处理?分别修改collector/collector.config和javaagent/javaagent.config配置项。collector.listen.port=9996 profiler.collector.port=9996 找不到JAVA_HOME...

全方位安全服务

全方位安全服务解决方案 全方位安全服务是阿里巴巴集团多年来安全技术研究积累的成果,结合阿里云云计算平台强大的数据分析能力,为互联网用户提供DDoS防护、CC攻击防护、云服务入侵防护、Web攻击防护、弱点分析、安全态势感知、渗透测试...

什么是自动驾驶开发平台

感知数据多模态检索 无论是经过标注还是未经标注的传感输出数据,均可利用本产品强大的能力进行多模态检索,找到需要的corner case或目标物数据集。数据集回放与重组 通过场景回放或检索或其他算法识别出的数据标签、感兴趣的数据区间,...

通过ack-co-scheduler组件实现协同调度

与原生的Kubernetes调度相比,容器服务ACK的调度扩展出更多其他功能,例如Gang Scheduling、CPU拓扑感知、ECI弹性调度等。本文介绍通过为注册集群安装ack-co-scheduler组件的方式,以实现在您的本地集群中使用阿里云容器服务ACK的调度...

GPU监控

监控项 单位 MetricName Dimensions(Agent)GPU维度解码使用率%gpu_decoder_utilization userId、instanceId、gpuId(Agent)GPU维度编码使用率%gpu_encoder_utilization userId、instanceId、gpuId(Agent)GPU维度GPU温度 ℃ gpu_...

GPU监控

监控项 单位 MetricName Dimensions(Agent)GPU维度解码使用率%gpu_decoder_utilization userId、instanceId、gpuId(Agent)GPU维度编码使用率%gpu_encoder_utilization userId、instanceId、gpuId(Agent)GPU维度GPU温度 ℃ gpu_...

2023-08-21版本

CDAS功能支持了在对新增表等变更操作后,可以以有状态的方式重启作业并继续执行,这避免了重启带来的状态丢失与额外作业的管理成本。新增OceanBase连接,可以将OceanBase数据库作为结果表和维表使用。OceanBase是阿里巴巴和蚂蚁集团100%...

Linux实例

如果不希望在命令前面写入过多的加载启动文件的语句,而是希望启用Shell解释的交互模式和登录模式,由Shell解释自身来加载所依赖的启动文件,那么可以使用Shell解释的-i 参数启用交互模式、使用-l 参数启用登录模式。两个参数合并为-...

异构计算集群概述

支持GPU拓扑感知调度功能:通过Node节点获取异构计算资源的拓扑结构,调度端基于节点的拓扑信息,完成调度决策,为NVLINK、PCIe Switch、QPI和RDMA NIC提供最佳的调度选择,实现最优的运行性能。更多信息,请参见 GPU拓扑感知调度概述。...

基本概念

服务名称 与其他服务的关系 相关文档 云服务ECS 迁移为云服务镜像后,可通过云服务镜像创建ECS实例。什么是云服务ECS 专有网络VPC 迁移时,通过专有网络VPC传输迁移数据。什么是专有网络 快照 迁移时,SMC通过快照功能将源服务器...

安装GPU拓扑感知调度组件

前提条件 已创建ACK Pro集群,且集群的实例规格类型选择为 GPU云服务。更多信息,请参见 创建Kubernetes托管版集群。获取集群KubeConfig并通过kubectl工具连接集群。系统组件版本满足以下要求。组件 版本要求 Kubernetes 1.18.8及以上...

应用FAQ

kubectl get pods 删除Pod:直接删除Pod也会触发控制(例如Deployment、DaemonSet等)重新创建新的Pod实例,从而达到重启容器的目的。删除单个Pod的命令如下:kubectl delete pod删除Pod后,Kubernetes会根据对应的控制自动创建一个新...

错误码

建议重启应用或重启设备 SpeakerNotAvailable 17040400 无可用的音频播放设备,检查是否接入了可用的扬声或耳机,并检查系统设置中,该设备是否被禁用 SpeakerOpenFail 17040389 播放设备初始化失败、播放设备媒体服务异常、音频设备被...

GPU调度概述

普通GPU调度 申请Kubernetes GPU集群后,通过运行TensorFlow的GPU实验环境,关于如何使用Kubernetes默认调度独占GPU,请参见 使用Kubernetes默认GPU调度。您也可通过使用GPU节点标签自定义调度,具体操作,请参见 使用节点标签自定义GPU...

重启实例或节点

重启方式 支持 重启 和 强制重启重启:当实例的 状态 为 正常(绿色)时,才可进行重启,否则需要进行强制重启。实例在重启过程中可持续提供服务(需要满足上文的前提条件),但耗时较长。重要 节点在重启期间,对应的CPU和内存使用率会...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
云安全中心 云投屏 应用实时监控服务 数据库自治服务 应用高可用服务 弹性公网IP
新人特惠 爆款特惠 最新活动 免费试用