性能监控

本文介绍如何在可观测可视化Grafana版控制台查看当前Grafana工作区性能监控,以及在CPU和内存的使用触发预设警戒线时,如何升级Grafana工作区,保证Grafana的稳定性。查看性能监控 登录 ARMS控制台,在左侧导航栏选择 Grafana服务>工作区...

集群 CPU 使用率告警

告警描述 OceanBase 集群中的节点 CPU 过高时触发该告警,此处节点 CPU 是指从操作系统角度查看整体机器的 CPU。规则信息 添加告警方式可参考:添加报警规则 告警项 指标类型 监控指标 默认阈值 持续时间(连续触发告警周期数)检测周期 告...

租户 CPU 负载告警

在 租户工作台 的 性能监控 界面,查看 CPU 使用率 的折线图,判断图中告警时间点的 CPU 使用率在较长时间内(1-7 天)是否突然增大。有,则为非正常负载。否,为正常负载(正常流量引起负载过高,考虑对租户规格进行扩容)。可能是大查询...

Group Identity功能说明

功能原理 Group Identity功能可以对每一个CPU cgroup设置身份标识,以区分cgroup中的任务优先级。Group Identity核心是双红黑树设计,在CFS(Completely Fair Scheduler)调度队列的单红黑树基础上,新增了一棵低优先级的红黑树,用于存放...

云数据库OceanBase集群CPU使用率过高的解决方法

问题描述 在阿里云云数据库OceanBase性能监控页面,节点和租户CPU使用率都比较高,且触发“OB节点CPU使用率”和“租户CPU负载告警”告警。问题原因 导致CPU使用率高的常见原因包括:业务产生了大查询或热点数据。集群的资源规划比实际偏小...

调度概述

共享GPU调度概述 共享GPU调度专业版 GPU/CPU拓扑感知调度 调度器基于节点异构资源的拓扑信息,如GPU卡之间的NVLink、PcleSwitch等通信方式、CPU的NUMA拓扑结构等,在集群维度进行最佳的调度选择,为工作负载提供更好的性能。CPU拓扑感知...

AI负载调度

共享GPU调度专业版 GPU/CPU拓扑感知调度 调度器基于节点异构资源的拓扑信息,如GPU卡之间的NVLink、PcieSwitch等通信方式、CPU的NUMA拓扑结构等,在集群维度进行最佳的调度选择,为工作负载提供更好的性能。CPU拓扑感知调度 GPU拓扑感知...

修改工作流集群配置

本文介绍如何修改工作流集群的配置。前提条件 已安装阿里云CLI 3.0.172或以上版本 并 配置凭证。已下载JSON数据处理工具。本文以JSON处理器jq为例,下载步骤,请参见 jq Download。指定集群虚拟交换机 创建ECI实例时,您可以通过指定多个...

使用基于Intel CPU的g8i实例加速Stable Diffusion推理

本文介绍如何使用 基于 Intel CPU的g8i实例,以 DreamShaper8_LCM(基于Stable Diffusion v1-5微调后得到的模型)模型为例,结合系统级优化及IPEX技术加速文生图模型的推理速度,在Intel CPU云服务器上搭建高效的文生图服务。背景信息 ...

应用场景

工作流 根据指定的依赖关系提交不同CPU、内存、带宽规格的批量计算作业,提升执行可靠性,提高资源利用率,优化成本。数据处理流水线 使用 云工作流 可以快速搭建一个高可用的数据处理流水线(Data Pipeline)。例如,来自不同数据源的...

成本估算策略介绍

功能原理 在单资源策略中,Pod成本通过CPU或内存指标计算。单Pod成本计算 Pod成本计算公式如下所示(资源包括内存资源和CPU资源):命名空间级别的成本计算 命名空间是一组具有相同字段的Pod的聚合。准确估算Pod的成本占比后,通过计算命名...

自定义镜像

PAI支持添加自定义镜像,您可以将推送至阿里云ACR中的镜像添加至当前PAI工作空间,以便在各个产品模块中快速使用。本文介绍如何添加和查看自定义镜像。操作权限 阿里云账号:使用该账号可完成所有操作,无需额外授权。RAM用户:需要为RAM...

MNS主题集成和消息发布

框架原理 应用部署后执行流程如下:执行工作流,任务步骤发布消息到MNS主题。任务步骤的 TaskToken 会被放入消息体一起发送到主题。工作流任务步骤暂停执行,等待任务回调。MNS主题接收到消息后,将消息和 TaskToken 通过 HTTP推送 发送到...

使用CPU加速Stable Diffusion XL Turbo的文生图推理

cpu:"14"memory:24Gi#工作负载更新策略 strategy:type:RollingUpdate#工作负载调度配置 nodeSelector:{} tolerations:[]affinity:{}#容器安全配置 securityContext:capabilities:drop:ALL runAsNonRoot:true runAsUser:1000#是否为工作负载...

使用CPU加速Stable Diffusion XL Turbo的文生图推理

cpu:"14"memory:24Gi#工作负载更新策略 strategy:type:RollingUpdate#工作负载调度配置 nodeSelector:{} tolerations:[]affinity:{}#容器安全配置 securityContext:capabilities:drop:ALL runAsNonRoot:true runAsUser:1000#是否为工作负载...

弹性并行查询(ePQ)发布说明

技术原理 弹性并行查询(ePQ)的目标是打通节点间的计算资源,基本原理是将一个复杂查询任务拆分为多个子任务,子任务可以被派发到同集群内的任意节点来完成计算,从而有效利用集群内其它节点的空闲计算资源(CPU、内存等)来加速查询。...

Hologres管控台的监控指标

自2023年9月开始,管控台监控服务底层技术升级,升级后的监控指标汇报原理如下:1天内间隔按照1分钟聚合 5天内间隔按照5分钟聚合 10天内间隔按10分钟聚合 15天内间隔按照15分钟聚合 30天内间隔按照30分钟聚合 CPU使用率(%)CPU使用率 包含...

请求调度策略

SAE 2.0分为微服务场景和Web场景,Web场景根据CPU分配模式的不同,又可以细分为仅在有请求时分配CPU和始终分配CPU模式。其中,仅在有请求时分配CPU的模式会涉及请求调度实例的不同情况。原理 单实例并发请求数是指每个应用实例能同时处理的...

修改租户规格进行扩容

当前集群 CPU 4C,已分配 75%,剩余 1C,tutorial_mysql02 租户扩容所需 CPU 1 C,当前集群存储 16GB,已分配 75%,剩余 4GB,tutorial_mysql02 租户扩容所需存储 4GB。剩余容量资源符合扩容需求。查看左上角集群状态,确认集群状态为 运行...

ACS Pod实例概述

本文主要介绍ACS Pod的使用准备工作、使用限制以及核心功能,包括安全隔离、CPU/Memory资源和规格配置、镜像拉取、存储、网络、日志收集等。实例类型定义 ACS当前提供了3种实例类型,3种实例均是运行在x86架构服务器上。不同的实例类型在...

调优集群性能

INSERT OVERWRITE 批量写入(Batch load)的过程中需要进行数据解析、按照聚集索引字段(如果有聚集键)进行排序(Sort)、构建主键索引和普通索引等操作,上述操作都属于CPU密集型操作(每个Shard需要一个线程进行上述工作)。目前虽然有...

配置Sidecar代理

工作负载 页签,选择配置生效的 命名空间,配置工作负载级别Sidecar代理配置的 名称,在 匹配标签 中创建匹配工作负载标签的标签选择器,单击目标Sidecar配置,选中目标配置项并进行相关配置,单击 创建。由于工作负载级别不是最低的...

2021年

03-17 开启SQL Server高可用实例的SSIS服务、通过Active Directory(AD)集成将SQL Server和SSIS工作负载迁移到阿里云 MySQL、SQL Server 优化 支持CPU、内存、本地盘使用率上调 专属集群支持CPU、内存、本地盘使用率上调。03-15 管理集群 ...

ECI Pod概述

本文主要介绍弹性容器实例ECI Pod的使用准备工作、使用限制以及核心功能,包括安全隔离、CPU/Memory资源和规格配置、镜像拉取、存储、网络、日志收集等。前提条件 已创建ACK集群或 ACK Serverless集群,并已在集群中部署虚拟节点。详情请...

基于函数计算创建自定义规则

本文通过编写函数代码检测ECS实例中的CPU核数为例,为您介绍基于函数计算创建自定义规则的完整操作流程。前提条件 请确保您已开通函数计算服务。具体操作,请参见 开通服务。说明 关于函数计算服务的收费标准,请参见 计费概览。背景信息 ...

工作空间调度中心

单击 添加组,支持按 闲置时长、CPU利用率、内存利用率、GPU利用率 设置当前工作空间DSW实例的自动关机策略。说明 在策略组内(AND),所有条件都满足,才会触发DSW的自动回收。在策略组外(OR),任意满足一个条件,都会触发DSW的自动回收...

管理命名空间与配额

命名空间可以有效划分工作区,将集群资源划分为多个用途。本文介绍如何在ACS集群中创建命名空间、设置资源配额和限制。前提条件 已 创建ACS集群。已 获取集群KubeConfig并通过kubectl工具连接集群。背景信息 在ACS集群中,您可以使用命名...

资源组管理

CPU_RATE_LIMIT CPU_RATE_LIMIT用于定义在多个资源组竞争CPU资源时的比例,该参数确定了一个资源组可以从空闲资源组获取的CPU资源的最大比例,如果某资源组设置了较高的CPU_RATE_LIMIT值,那么在竞争CPU时,该资源组将获得较多的CPU时间片...

新建租户

租户是数据库对象管理和资源管理的基础,既是各类数据库对象的容器,又是各种资源(CPU、Memory、IO 等)的容器。OceanBase 数据库通过租户实现资源隔离,采用单集群多租户的管理模式,租户之间的资源和数据都是隔离的。租户拥有一组计算和...

自定义和查看CPU选项

当您通过RunInstances购买实例时,部分实例规格支持自定义设置CPU选项(CPU选项由CPU物理核心数和每核线程数决定)。您可以根据应用的性能需求灵活调整ECS实例的物理核心数和每核线程数(即调整ECS实例的vCPU),以获得更好的性能表现,并...

DNS概述

DNS为Kubernetes集群内的工作负载提供域名解析服务。本文主要介绍Kubernetes集群中DNS域名解析原理和ACS集群中默认内置的DNS服务器CoreDNS。Kubernetes集群中DNS域名解析原理 ACS集群中kubelet的启动参数有-cluster-dns=和-cluster-domain=...

过载保护

背景 当用户做促销活动时,数据库主库的CPU资源容易负载过高,这时就需要对数据库进行变配(升级),但变配的过程中整个集群的请求可能都会路由到主节点,导致主节点CPU资源超负载甚至雪崩,从而影响用户业务的连续性。为了缓解此种情况的...

使用硬件DSA进行数据流加速

测试场景 迁移时间(s)CPU使用率 核时(s)关闭DSA加速功能 9.649 1.000 9.649 开启DSA加速功能 4.928 0.668 3.292 结果说明:在DSA加速功能触发的内存迁移中,实际耗时降低至51.8%,平均CPU消耗降低至66.8%,所需核时降低至34.1%。...

Logstash性能排查

检查管道参数配置 管道工作线程:该参数值设置使用多少线程来处理filter和output任务,默认为CPU核数。如果CPU使用率不高,可适当调大该参数,提高处理性能。管道批大小:该参数设置每个独立的工作线程,对接收到的多少个事件做filter和...

集群扩容

若节点资源不足,会导致创建工作负载等操作失败。您可以通过以下两种方式进行扩容:创建新节点 添加已有节点 前提条件 已创建集群。创建新节点 登录容器应用服务控制台,在左侧导航栏单击 集群管理。在 集群详情 页,单击 节点 页签,进入...

节点诊断

ECS实例CPU状态 检查ECS实例底层是否存在CPU争抢或CPU绑定失败。ECS实例存在CPU争抢,可能导致实例无法获得CPU或出现其他异常,您可以尝试通过重启实例进行恢复。ECS实例CPU是否存在Split Lock问题 检查ECS实例CPU是否存在Split Lock问题。...

Pod诊断

容器智能运维平台 提供Pod诊断功能,帮助您诊断...每个节点消耗一个PodCIDR网段,Pod网段耗尽后,新添加的节点将无法正常工作。请 提交工单 处理。DNS 服务后端服务端点 检查集群DNS服务Endpoints数。请检查CoreDNS Pod运行状态和运行日志。...

ALIYUN:ECI:ContainerGroup

语法 {"Type":"ALIYUN:ECI:ContainerGroup","Properties":{"SecurityContextSysctl":List,"Memory":Number,"InitContainer":List,"Cpu":Number,"EipInstanceId":String,"ContainerGroupName":String,"Container":List,"ImageSnapshotId":...

执行角色

授权的基本原理如下:策略 表示访问某个服务的能力,为 角色 绑定指定策略,那么角色就具有了访问该服务的能力。当有第三方需要访问这个服务的时候,只需要扮演具有访问能力的角色即可。从而避免使用长期密钥,让系统变得更加安全。创建...

执行角色

授权的基本原理如下:策略 表示访问某个服务的能力,为 角色 绑定指定策略,那么角色就具有了访问该服务的能力。当有第三方需要访问这个服务的时候,只需要扮演具有访问能力的角色即可。从而避免使用长期密钥,让系统变得更加安全。创建...
共有165条 < 1 2 3 4 ... 165 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
弹性公网IP 短信服务 人工智能平台 PAI 金融分布式架构 对象存储 物联网平台
新人特惠 爆款特惠 最新活动 免费试用