Jenkins集成

前提条件 开通事件总线EventBridge并授权 创建自定义总线 安装Jenkins 为Jenkins安装Notification plugin插件 步骤一:创建Jenkins监控源 在 事件总线EventBridge 控制台 创建事件源 HTTP/HTTPS 触发,参数配置如下。更多信息,请参见 ...

Grafana集成

事件总线EventBridge 支持简单、快速地集成Grafana,实现报警和事件的统一管理。前提条件 开通事件总线EventBridge并授权 创建自定义总线 安装并注册Grafana账号 步骤一:创建Grafana监控源 在 事件总线EventBridge 控制台 创建事件源 ...

GitHub集成

背景信息 GitHub是一种版本管理工具,针对多人开发的项目,当代码仓库发生某些特定操作时,将此类操作事件通过 事件总线EventBridge 推送给项目成员,有效关注代码变更,提高协同效率。前提条件 开通事件总线EventBridge并授权 创建自定义...

Jenkins集成

前提条件 开通事件总线EventBridge并授权 创建自定义总线 安装Jenkins 为Jenkins安装Notification plugin插件 步骤一:创建Jenkins监控源 在 事件总线EventBridge 控制台 创建事件源 HTTP/HTTPS 触发,参数配置如下。更多信息,请参见 ...

Grafana集成

事件总线EventBridge 支持简单、快速地集成Grafana,实现报警和事件的统一管理。前提条件 开通事件总线EventBridge并授权 创建自定义总线 安装并注册Grafana账号 步骤一:创建Grafana监控源 在 事件总线EventBridge 控制台 创建事件源 ...

GitHub集成

背景信息 GitHub是一种版本管理工具,针对多人开发的项目,当代码仓库发生某些特定操作时,将此类操作事件通过 事件总线EventBridge 推送给项目成员,有效关注代码变更,提高协同效率。前提条件 开通事件总线EventBridge并授权 创建自定义...

基于API端点集成Jenkins触发构建部署

本文介绍如何基于 事件总线EventBridge 的API端点和Jenkins监控源进行集成对接。背景信息 API端点(API Destinations)可以帮助您调用第三方SaaS系统或自建系统的HTTP接口,提供低代码接入方式,无需更多额外架构即可完成接口调用。借助API...

GPU拓扑感知调度

Kubernetes对节点的GPU拓扑信息不感知,调度过程中对GPU的选择...关于GPU拓扑感知调度如何使用,请参见以下文档:GPU拓扑感知调度概述 安装GPU拓扑感知组件 Tensorflow分布式训练使用GPU拓扑感知调度 Pytorch分布式训练使用GPU拓扑感知调度

使用Terraform管理组件

addons { name="migrate-controller"} resource-controller 其他 实现动态控制Pod资源的关键组件,使用ACK Pro集群的CPU拓扑感知调度需要安装此组件。addons { name="resource-controller"} sandboxed-container-controller 其他 安全沙箱...

使用Terraform管理组件

addons { name="migrate-controller"} resource-controller 其他 实现动态控制Pod资源的关键组件,使用ACK Pro集群的CPU拓扑感知调度需要安装此组件。addons { name="resource-controller"} sandboxed-container-controller 其他 安全沙箱...

GPU调度概述

本文介绍调度GPU资源的不同方法,包括使用Kubernetes默认GPU调度...关于如何使用GPU拓扑感知调度,请参见以下文档:GPU拓扑感知调度概述 安装GPU拓扑感知组件 Tensorflow分布式训练使用GPU拓扑感知调度 Pytorch分布式训练使用GPU拓扑感知调度

安装GPU拓扑感知调度组件

激活GPU拓扑资源调度前,您需要安装并配置相关组件。本文介绍如何安装GPU拓扑感知调度相关组件以及在集群中开启GPU拓扑感知调度能力。前提条件 已创建ACK Pro集群,且集群的实例规格类型选择为 GPU云服务器。更多信息,请参见 创建...

GPU拓扑感知调度概述

本文简要描述了GPU拓扑分布情况,以及GPU拓扑感知调度的优势。GPU拓扑分布 下图为NVLink连接8个Tesla V100的混合立体网络拓扑。...相关文档 安装GPU拓扑感知调度组件 使用GPU拓扑感知调度(Tensorflow版)使用GPU拓扑感知调度(Pytorch版)

使用GPU拓扑感知调度(Tensorflow版)

ACK基于Scheduling Framework机制,实现GPU拓扑感知调度,即在节点的GPU组合中选择具有最优训练速度的组合。本文介绍如何使用GPU拓扑感知调度来提升TensorFlow分布式训练的训练速度。...相关文档 GPU拓扑感知调度概述 安装GPU拓扑感知调度组件

使用GPU拓扑感知调度(Pytorch版)

ACK基于Scheduling Framework机制,实现GPU拓扑感知调度,即在节点的GPU组合中选择具有最优训练速度的组合。本文介绍如何使用GPU拓扑感知调度来提升PyTorch分布式训练的训练速度。...相关文档 GPU拓扑感知调度概述 安装GPU拓扑感知调度组件

安装最新版本ack-arms-cmonitor失败

在 容器服务管理控制台 目标集群下的 应用>Helm 页面确认是否存在ack-arms-cmonitor组件,如果存在,请直接删除,然后在 运维管理>集群拓扑 页面重新安装。如果查询不到集群Helm,可通过以下命令查询集群内包含ack-arms-cmonitor的Helm。...

安装ACCL库

其中$BDF为相应PCI桥的总线地址:setpci-s$BDF 0xf28.l=0x207f RDMA管控服务 宿主侧的rdma-service提供了集群信息,ACCL可利用该信息进行拓扑感知的通信优化。进行容器化训练时建议把管控服务提供的信息文件(/etc/sysconfig/rdma/cluster...

(停止维护)ACK发布Kubernetes 1.22版本说明

除了在创建集群时配置正确的IPv4和IPv6无类别域间路由外,还需要集群内安装支持双栈的CNI插件。更多信息,请参见 IPv4/IPv6双协议栈。1.21版本后,默认开启节点优雅下线(GracefulNodeShutdown)特性。该特性目前仅支持Linux节点,在...

ACK灵骏发布Kubernetes 1.22版本说明

除了在创建集群时配置正确的IPv4和IPv6无类别域间路由外,还需要集群内安装支持双栈的CNI插件。更多信息,请参见 IPv4/IPv6双协议栈。1.21版本后,默认开启节点优雅下线(GracefulNodeShutdown)特性。该特性目前仅支持Linux节点,在...

组件概述

resource-controller 可选组件 实现动态控制Pod资源的关键组件,使用ACK Pro集群的CPU拓扑感知调度需要安装此组件。directx-device-plugin-windows 可选组件 ACK集群上使用的DirectX设备插件。在阿里云上使用虚拟化GPU云服务器时,directx-...

多NUMA机型的容器内存就近访问加速

内存就近访问加速功能的优势 多个非一致性内存访问NUMA(Non-uniform memory access)架构下,当内存与CPU不在同一个NUMA时,进程在跨NUMA读取远端内存时需要经过QPI总线,相对于内存与CPU在相同NUMA的本地内存访问场景,跨NUMA场景访存...

基本概念

云服务总线 云服务总线 CSB(Cloud Service Bus)面向专有云和专有域,帮助企业在自己的多个系统之间,或者与合作伙伴以及第三方的系统之间实现跨系统跨协议的服务能力互通。在EDAS中创建CSB专享实例,用来管理和控制目标环境内应用对外的...

应用开发手册

该应用一方面接受云端应用通过IoT平台的服务模型调用,然后将调用转换成本地系统支持的接口调用,另外一方面该应用处理本地的事件上报,然后通过边缘数据总线,将消息安装数据模型格式要求,上传到IoT云端平台。2.2 核心流程说明 基于边缘...

边缘应用开发手册

该应用一方面接受云端应用通过IoT平台的服务模型调用,然后将调用转换成本地系统支持的接口调用,另外一方面该应用接受本地系统的事件上报,然后通过边缘数据总线,将消息安装数据模型格式要求,上传到IoT云端平台 本地系统:即项目现场的...

适配器应用

一方面该应用接受云端应用通过IoT平台的服务调用,然后将调用转换成本地系统支持的接口调用,另外一方面该应用接受本地系统的事件上报,然后通过边缘数据总线,将消息安装数据模型格式要求,上传到IoT云端平台。本地系统:即项目现场的本地...

使用云防火墙阻止安装非法工具

安装非法工具的危害 安装非法工具有可能导致以下问题:内部员工执行违规操作 企业内部员工下载并安装非法工具后,可通过该工具对企业的内部资产或外部资产进行绘制,将内部网络拓扑透露给外部人员或进行其他违规操作。黑客攻击 黑客入侵到...

集群拓扑监控

在集群拓扑页面,单击 开始安装。控制台将会为您自动安装Kubernetes监控组件ack-arms-cmonitor。说明 命名空间默认为 arms-prom。方式二:通过ARMS控制台开启Kubernetes监控 安装Prometheus监控组件ack-arms-prometheus。登录 ARMS控制台。...

ARMS+云效AppStack实现应用环境监控

开通Kubernetes监控集群拓扑 有关ARMS Kubernetes监控的更多信息,请参见 什么是阿里云Kubernetes监控。开通监控 方式1:通过AppStack资源池页面开通Kubernetes监控 在 资源池 页面,进入目标集群,点击 集群拓扑 页面。点击 立即安装,...

Kubernetes 集群托管

Kubernetes 集群 Agent 安装 导入集群后,可选安装 Agent,安装Agent将获得分批发布等精细化部署控制能力。点击 立即安装 将在集群执行 Agent 安装任务,执行时间预计1~2分钟。Agent 安装异常,可点击 查看 日志排查原因,也可以手动点击 ...

手动接入应用至应用监控 eBPF 版

阿里云 应用监控 eBPF 版 是一套针对Kubernetes集群开发的一站式可观测性产品,为Kubernetes集群手动安装 应用监控 eBPF 版 组件后,即可查看基于Kubernetes集群下的指标、应用链路、日志和事件。前提条件 说明 应用监控 eBPF 版 目前正在...

查看和修改CPU拓扑结构

通常情况下,每个物理核心都包含一个或多个逻辑核心,而物理核心直接通过总线或互联网络连接,拓扑结构的不同将直接影响多核处理器的性能和能效。目前阿里云部分实例规格族支持 HT连续模式(ContinuousCoreToHTMapping)和 HT离散模式...

使用前须知

自动化:支持ECS、Kubernetes自动安装,具备自动生成服务拓扑和网络拓扑的能力。海量:基于日志服务自研的可观测存储分析引擎,支持写入与查询超大规模的可观测数据。弹性:支持过滤任意的可观测数据,也支持任意设置可观测数据存储周期。...

卸载应用监控 eBPF 版组件

当您不再需要使用 应用监控 eBPF 版 时,可以卸...在左侧导航栏选择 运维管理>集群拓扑。如果页面提示未安装即卸载成功。联系我们 如果您在使用应用监控 eBPF 版中有任何问题,请联系应用监控 eBPF 版答疑钉钉群(群号:35568145)获取帮助。

Go SDK使用手册

前提条件 您已完成以下操作:开通事件总线EventBridge并授权 创建AccessKey 环境准备 环境要求 安装Golang1.12.0以上的版本。更多信息,请参见 安装Golang。查看语言版本 执行命令 go version 查看Go语言版本。管控API SDK 安装SDK 执行...

Python SDK使用手册

前提条件 您已完成以下操作:开通事件总线EventBridge并授权 创建AccessKey 环境准备 环境要求 安装Python 3.4以上版本。更多信息,请参见 安装Python。说明 Python 3.4以上版本自带pip。查看语言版本 执行命令 python-V 查看Python语言...

使用Terraform创建API Destination

前提条件 安装Terraform,具体操作,请参见 在本地安装和配置Terraform。创建阿里云账号并获取访问密钥。请在阿里云控制台中的 AccessKey管理页面 上创建和查看您的账号及密钥。操作步骤 创建terraform.tf文件,声明API Destination、...

Java SDK使用手册

前提条件 您已完成以下操作:开通事件总线EventBridge并授权 创建AccessKey 环境准备 环境要求 安装1.8或以上版本JDK。具体操作。请参见 安装JDK。安装2.5或以上版本Maven。具体操作,请参见 安装Maven。查看语言版本 执行命令 java-...

TypeScript SDK使用手册

本文介绍了TypeScript SDK的安装方法、示例代码以及如何使用TypeScript SDK发布事件。SDK简介 事件总线EventBridge 的SDK分为管控API SDK和数据API SDK,示例代码有所不同。管控API SDK:对控制台页面进行操作使用的SDK。数据API SDK:事件...

ack-ai-installer

关于GPU拓扑感知调度的更多信息,例如安装步骤、使用场景等,请参见 GPU拓扑感知调度。使用说明 ack-ai-installer组件仅支持在ACK Pro版集群和 ACK Edge集群Pro版 中通过云原生AI套件控制台页面安装,在ACK灵骏托管版集群中以组件的形式预...

C++ SDK使用手册

本文介绍了C++ SDK的安装方法、示例代码以及如何使用C++ SDK发布事件。SDK简介 事件总线EventBridge 的SDK分为管控API SDK和数据API SDK,示例代码有所不同。管控API SDK:对控制台页面进行操作使用的SDK。数据API SDK:事件数据的通道,...
共有51条 < 1 2 3 4 ... 51 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
数据总线 DataHub 可观测链路 OpenTelemetry 版 高速通道 弹性公网IP 短信服务 人工智能平台 PAI
新人特惠 爆款特惠 最新活动 免费试用