查询网络通信距离(NCD)

PAI灵骏提供了统一的网络通信距离NCD(Network Communication Distance)查询接口,供您对GPU节点(或网卡)通信距离进行查询,以实现更优的任务调度,获得最佳的训练性能。本文为您介绍NCD的基本概念、使用NCD的原因以及如何使用NCD。...

消息通信计费

生活物联网平台云端与设备的数据流转是通过消息上报和下发实现的,本文介绍消息通信过程中产生的费用以及计费详情。背景介绍 由于生活物联网平台采用的消息通信收费方案需要进行全面更新升级,为把控设备日均消息量不超过平台额定成本,...

接入物联网平台设备开发引导

广域网设备:广域网设备是指使用移动蜂窝协议连接网络,并与阿里云物联网进行通信的设备。以下介绍它的两种接入模式:MCU+模组模式:这种模式指产品内包含一个MCU以及一个通信模组,其中MCU集成Link SDK以及运行产品逻辑,模组用于发起与...

WAL日志并行回放

目的是让有依赖关系的任务尽量被同一个进程执行,减少进程间同步的开销。如果期望优先分配的进程队列已满,或者没有相同的Task Tag在执行,则在进程组中按顺序选择一个进程,从中获取状态为 Idle 的Task Node来调度任务执行。目的是让任务...

WAL日志并行回放

目的是让有依赖关系的任务尽量被同一个进程执行,减少进程间同步的开销。如果期望优先分配的进程队列已满,或者没有相同的Task Tag在执行,则在进程组中按顺序选择一个进程,从中获取状态为 Idle 的Task Node来调度任务执行。目的是让任务...

一次调用过程

HSF的一次调用过程如下图所示:过程 说明 1 在客户端线程中将用户的请求参数即请求对象进行序列化,并将序列化后的内容存放在请求通信的对象中。说明 请求通信对象对应的是HSF协议,包括了请求ID等多个与请求对象无关的内容。2 系统将请求...

一次调用过程

HSF的一次调用过程如下图所示:过程 说明 1 在客户端线程中将用户的请求参数即请求对象进行序列化,并将序列化后的内容存放在请求通信的对象中。说明 请求通信对象对应的是HSF协议,包括了请求ID等多个与请求对象无关的内容。2 系统将请求...

M2M设备间通信

M2M(即Machine-to-Machine)是一种端对端通信技术。本章节以智能灯和手机App连接为例,分别使用规则引擎数据流转和Topic消息路由来实现M2M...具体实现过程,请参见以下文档:基于规则引擎的M2M设备间通信 基于Topic消息路由的M2M设备间通信

Alibaba Cloud Linux等保2.0三级版镜像检查规则说明

auditd是审计进程audit的守护进程,syslogd是日志进程syslog的守护进程,查看系统进程是否启动。入侵防范 应能发现可能存在的已知漏洞,并在经过充分测试评估后,及时修补漏洞。云安全中心的漏洞检测和修复功能可以满足。如果有其他方式,...

Shared Server

Shared模式是标准的、期望的连接池状态,表示后端进程是可复用的。SS开启后,后端进程会优先使用Shared模式,同时会在触发兜底机制时转换为Dedicated模式。Dedicated模式(兜底模式):由于各种原因导致后端进程被污染,退化为当前后端进程...

Shared Server

Shared模式是标准的、期望的连接池状态,表示后端进程是可复用的。SS开启后,后端进程会优先使用Shared模式,同时会在触发兜底机制时转换为Dedicated模式。Dedicated模式(兜底模式):由于各种原因导致后端进程被污染,退化为当前后端进程...

Pod异常问题排查

问题现象 若被终止的进程为容器的阻塞进程,可能导致容器异常重启。若出现OOM异常问题,登录 容器服务管理控制台,在Pod详情页面单击 事件 页签可看到OOM事件 pod was OOM killed。具体操作,请参见 检查Pod的事件。若集群配置了集群容器...

系统信息函数和运算符

pg_blocking_pids(integer)→integer[]返回阻止服务器进程的会话的进程ID数组,该进程ID与指定的进程ID一起获取锁定,如果没有这样的服务器进程或者没有被阻塞,则返回一个空数组。如果一个服务器进程持有一个与被阻塞进程的锁请求冲突的锁...

ACK等保加固使用说明

auditd是审计进程audit的守护进程,syslogd是日志进程syslog的守护进程,查看系统进程是否启动。入侵防范 应能发现可能存在的已知漏洞,并在经过充分测试评估后,及时修补漏洞。云安全中心的漏洞检测和修复功能可以满足。如果有其他方式,...

物联网平台通信方式概述

本文介绍设备、物联网平台、服务器间通信的方法。背景信息 设备通过消息Topic实现消息的发送和接收,消息通信Topic的定义、使用和分类说明,请参见 什么是Topic。设备上报的原始数据格式,需您在设备端完成开发。阿里云物联网平台提供的...

诊断指标与诊断结果条目说明

目前阿里云无法确定具体的进程信息,请您结合业务进一步分析,详细监控信息请登录 云监控控制台 查看。Instance.UtilizationHigh.DiskIOPS 您选择的诊断时间范围内实例的IOPS负载达到过上限的80%,IOPS负载高意味着您的实例正在进行频繁的...

ECS实例宕机并报错“Out of memory and no killable ...

问题现象 ECS实例在运行过程中出现宕机,并且有类似于如下所示的调用栈:[28663.625353][pid]uid tgid total_vm rss nr_ptes nr_pmds swapents oom_score_adj name[28663.625363][1799]0 1799 26512 245 56 3 0-1000 sshd[28663.625367]...

Linux系统日志提示“file-max limit 65535 reached”...

执行如下命令,查询PID对应的进程信息。ps aux|grep[$PID]注:[$PID]为进程号。如果是应用进程出现的问题,对相关应用进行检查和优化。否则 执行如下命令,修改 fs.file-max 配置项参数。echo“fs.file-max=100000”>>/etc/sysctl.conf ...

Page Cache限制功能

背景信息 在内核系统中,系统分配内存并在相应内存子系统(memcg)中的统计达到memcg设定的内存上限时,会触发memcg级别的直接内存回收,这可能导致当前进程的性能抖动。尽管具有 Memcg后台异步回收 功能,但对于突发性的内存申请来说,其...

什么是AI通信加速库Deepnccl

多机CPU-Reduce:该优化继承了单机内CPU-Reduce高效的异步流水线,并将跨机Socket通信也设计为流水线形态,实现多机通信过程流水化,有效减少通信延迟,提高整体训练性能。例如,在通信量较大的Transformer-based模型的多机训练场景下,...

控制面质量

最近几年,云原生概念越来越火,蚂蚁集团历来热衷于技术创新,积极在云原生领域实践 Service Mesh 理念,结合现有技术架构,将一些通用能力(通信/数据/安全等)抽离出来,沉淀出了 MOSN。同时,依托于 Istio 的能力,扩展出了 Service ...

Windows系统内存分析工具介绍

任务管理器 Windows系统可以使用任务管理器进行内存监控,监控可以显示出详细的内存占用的进程。尤其是在性能中检查虚拟内存的使用情况,可以通过已提交虚拟内存(Commited Bytes)/虚拟内存上限(Commit Limit)查看使用情况。如果已提交...

Windows系统内存分析工具的介绍

任务管理器 Windows系统可以使用任务管理器进行内存监控,监控可以显示出详细的内存占用的进程。尤其是在性能中检查虚拟内存的使用情况,可以通过已提交虚拟内存(Commited Bytes)/虚拟内存上限(Commit Limit)查看使用情况。如果已提交...

ePQ支持并行写入及查询OSS外部表

将本地表的数据通过写入OSS外部表创建归档时,PolarDB PostgreSQL版(兼容Oracle)默认将启动一个进程写入OSS外部表,其本质上是单进程上传的网络访问模式。在归档数据量非常大的场景中,单进程写入OSS外部表无法有效利用OSS的网络高带宽,...

ePQ支持并行写入及查询OSS外部表

将本地表的数据通过写入OSS外部表创建归档时,PolarDB PostgreSQL版(兼容Oracle)默认将启动一个进程写入OSS外部表,其本质上是单进程上传的网络访问模式。在归档数据量非常大的场景中,单进程写入OSS外部表无法有效利用OSS的网络高带宽,...

ePQ支持并行写入及查询OSS外部表

将本地表的数据通过写入OSS外部表创建归档时,PolarDB PostgreSQL版 默认将启动一个进程写入OSS外部表,其本质上是单进程上传的网络访问模式。在归档数据量非常大的场景中,单进程写入OSS外部表无法有效利用OSS的网络高带宽,导致非常低效...

节点异常问题排查

本文介绍关于节点异常问题的诊断流程、排查思路、常见问题及解决方案。本文目录 类别 内容 诊断流程 诊断流程 常见...解决方案 通过节点的监控查看CPU增长曲线,确认异常出现时间点,检查节点上的进程是否存在CPU占用过高的现象。具体操作,...

节点异常问题排查

本文介绍关于节点异常问题的诊断流程、排查思路、常见问题及解决方案。本文目录 类别 内容 诊断流程 诊断流程 常见排查...解决方案 通过节点的监控查看CPU增长曲线,确认异常出现时间点,检查节点上的进程是否存在CPU占用过高的现象。具体操作...

领域模型概述

云消息队列 RocketMQ 版 产品具备异步通信的优势,系统拓扑简单、上下游耦合较弱,主要应用于异步解耦,流量削峰填谷等场景。对于同步链路,需要实时返回调用结果的场景,建议使用RPC调用方案。您在进行产品选型时,请明确您的业务场景和...

什么是SP经营许可证?

有效期限:5年 SP信息服务业务是指通过信息采集、开发、处理和信息平台的建设,通过公用通信网向用户提供信息服务的业务。信息服务业务面向的用户可以是固定通信网络用户、移动通信网络用户、互联网用户或其他数据传送网络的用户。业务应用...

并行计划

相反,计划的并行部分一定被查询优化器在内部当作一个 部分计划,即它必须被构建出来,这样每一个执行该计划的进程将以无重复地方式产生输出行的一个子集,即保证每一个所需要的输出行正好只被一个合作进程生成。通常,这意味着该查询的...

QPS限制

通过阅读本文,您可以了解音视频通信单用户的API QPS限制。单用户QPS限制 单用户的API QPS限制是指以阿里云账号为基准,该账号及其RAM用户每秒或每分钟调用某API的频率上限。例如:某阿里云账号及其对应5个RAM用户同时调用接口 ...

设备接入简介

物联网边缘计算提供终端设备接入服务,支持接入...视频设备类型 NVR设备,是指网络视频存储设备,支持标准通信协议。IPC设备,是指网络摄像头设备。通信协议 目前支持ONVIF协议、国标GB/T28181协议、部分主流摄像头厂商私有视频流接入协议等。

什么是Deepytorch Training(训练加速)

多机CPU-Reduce:该优化继承了单机内CPU-Reduce高效的异步流水线,并将跨机Socket通信也设计为流水线形态,实现多机通信过程流水化,有效减少通信延迟,提高整体训练性能。例如,在通信量较大的Transformer-based模型的多机训练场景下,...

QPS限制

通过阅读本文,您可以了解音视频通信数据服务单用户的API QPS限制。单用户QPS限制 单用户的API QPS限制是指以阿里云账号为基准,该账号及其RAM用户每秒或每分钟调用某API的频率上限。例如:某阿里云账号及其对应5个RAM用户同时调用接口 ...

常见问题

Node.js 性能平台运行时与社区 Node.js 运行时是什么关系 Node.js 性能平台运行时完全兼容社区对应版本 Node.js 运行时,对应关系 请查看。Node.js 性能平台运行时是否会影响性能 Node.js 性能平台运行时每分钟在主线程将监控数据写到内存...

CPU使用率高排查方法

PolarDB PostgreSQL版 在使用过程中,可能会出现CPU使用率异常升高甚至达到满载的情况。本文将介绍造成这种情况的常见原因和排查方法,以及对应的解决方案。问题原因 业务量上涨 当CPU使用率上升时,最有可能的情况是业务量的上涨导致数据...

高级配置

使用Supervisor启动ossfs Supervisor是用Python开发的一套通用的进程管理程序,能将一个普通的命令行进程变为后台daemon,并监控进程状态。异常退出时能自动重启。使用Supervisor启动ossfs的步骤如下:重要 以下操作步骤中的文件安装路径以...

只读节点Online Promote

POLAR_BG_ONLINE_PROMOTE 读取LogIndex数据,组织并分发回放任务,利用并行回放进程组回放WAL日志,该状态的进程需要回放完所有的LogIndex数据才会进行状态切换,最后推进后台回放进程的回放位点。POLAR_BG_REDO_NOT_START 表示回放任务...

只读节点Online Promote

POLAR_BG_ONLINE_PROMOTE 读取LogIndex数据,组织并分发回放任务,利用并行回放进程组回放WAL日志,该状态的进程需要回放完所有的LogIndex数据才会进行状态切换,最后推进后台回放进程的回放位点。POLAR_BG_REDO_NOT_START 表示回放任务...
共有200条 < 1 2 3 4 ... 200 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
高速通道 短信服务 商标服务 边缘网络加速 物联网无线连接服务 弹性公网IP
新人特惠 爆款特惠 最新活动 免费试用