使用HPL测试集群浮点性能

P和Q的取值一般遵循以下规律:P≤Q,一般情况下P的取值小于Q,因为列向通信量(通信次数和通信数据量)要远大于横向通信。P建议选择2的幂。HPL中水平方向通信采用二元交换法(Binary Exchange),当水平方向处理器个数P为2的幂时性能最优。...

如何使用Prometheus监控Windows

进程内存使用率(%):展示进程使用内存情况进程句柄数。进程I/O字节数:展示进程I/O读写量。为了方便运维人员快速查看所管理Windows集群的整体运行情况,这里还建议服务配置TopN(包括CPU使用率、磁盘空间使用率、磁盘空闲率、网络流量...

如何使用Prometheus监控Windows

进程内存使用率(%):展示进程使用内存情况进程句柄数。进程I/O字节数:展示进程I/O读写量。为了方便运维人员快速查看所管理Windows集群的整体运行情况,这里还建议服务配置TopN(包括CPU使用率、磁盘空间使用率、磁盘空闲率、网络流量...

共享内存通信(SMC)使用说明

Alibaba Cloud Linux 3提供的共享内存通信SMC(Shared Memory Communication)是一种兼容socket层、使用共享内存技术实现的高性能内核网络协议栈。根据共享内存技术的不同,SMC又可以细分为基于Internal Shared Memory(ISM)技术的SMC ...

共享内存通信(SMC)使用说明

Alibaba Cloud Linux 3提供的共享内存通信SMC(Shared Memory Communication)是一种兼容socket层、使用共享内存技术实现的高性能内核网络协议栈。根据共享内存技术的不同,SMC又可以细分为基于Internal Shared Memory(ISM)技术的SMC ...

工作负载推荐配置

容器内只有一个进程情况下,如果进程中断,外部的容器引擎可以清楚地感知到,并且重启容器。如果容器内有多个进程,某个进程挂了,容器未必受影响,外部的容器引擎无法感知到容器内有进程退出,也不会对容器做任何操作,但是实际上容器...

解决Linux实例磁盘空间满问题

通过kill命令清除 根据 lsof 命令列的PID进程号(通常为第二列),使用 kill 命令结束占用这些文件的服务进程。执行以下命令,列PID进程号。lsof|grep delete 根据您的业务情况,确保对应进程可以停止或者重启,执行以下命令,停止占用...

重要日志

您可以通过查看日志快速查看单机运行情况,从而排查问题。本文列了MSE提供的重要日志,适用于所有接入MSE应用防护的应用。文件 路径 说明 秒级监控日志${user_home}/logs/csp/${app_name}-${pid}-metrics.log 资源都会产生秒级日志,可以...

常见问题

通义灵码的启动和登录、支持语言、数据安全、收费等相关问题,可以在本文找到相关答案。说明 如果你在使用的过程中遇到问题,可先尝试重启 IDE。重启后依然无法解决,可 提交工单 或加入钉钉群:53770000738,我们将尽快为你解决问题。关于...

Linux实例磁盘空间满和Inode满的问题排查方法

通过kill命令清除 根据 lsof 命令列的PID进程号(通常为第二列),使用 kill 命令结束占用这些文件的服务进程。执行以下命令,列PID进程号。lsof|grep delete 根据您的业务情况,确保对应进程可以停止或者重启,执行以下命令,停止占用...

如何使用Linux系统的atop监控工具

其以一定的频率记录系统和进程活动,采集的数据包含CPU、内存、磁盘、网络的资源使用情况进程运行情况,并能以日志文件的方式保存在磁盘中。对于每个进程,会显示CPU使用率、内存增长、磁盘使用率、优先级、用户名、状态和退出码等。当...

Windows实例中CPU使用率较高问题的排查及解决方法

本文主要介绍Windows实例中CPU使用率较高问题的排查及解决方案。问题现象 Windows实例中CPU使用率较高,即CPU使用率≥80%。问题原因 CPU使用率较高可能有以下原因。实例遭到病毒木马入侵。实例中第三方杀毒软件运行。实例中应用程序异常、...

Windows系统ECS实例中CPU使用率较高问题的排查及解决...

本文主要介绍Windows系统ECS实例中CPU使用率较高问题的排查及解决方案。问题现象 Windows系统ECS实例中CPU使用率较高,即CPU使用率≥80%。问题原因 CPU使用率较高可能有以下原因。ECS实例遭到病毒木马入侵。ECS实例中第三方杀毒软件运行。...

《互联网站管理工作细则》(信部电[2005]501号)

信息产业部关于发布《互联网站管理工作细则》的通告 中华人民共和国信息产业部 信部电[2005]501号 各省、自治区、直辖市通信管理局,各互联网接入服务提供者、各互联网信息服务提供者、各IP地址备案单位、各域名注册服务机构:为切实加强...

产品功能

智能联络中心为您提供人工坐席、智能语音交互呼入、智能语音交互呼以及智能外呼机器人。您可以根据自身需求选择不同的产品功能。人工坐席 智能联络中心人工坐席是阿里在电商和新零售等领域多年沉淀的一套全渠道智能客服解决方案,提供...

共享内存通信(SMC)常见问题

如果您在Alibaba Cloud Linux 3系统中启用了共享内存通信SMC(Shared Memory Communication),且使用过程中遇到无法正常通信、部分端口不可用、对比TCP没有应用性能提升等问题,可以参考本文提供的方案进行排查并解决。启用SMC后应用性能...

使用配置巡检检查集群工作负载

如果未配置的话,Pod有被调度到资源紧张的节点上的风险,可能会出现容器内进程运行缓慢的情况。修改Pod Spec,增加 resources.requests.cpu 字段。示例:cpuLimitsMissing 通过检查Workload的Pod Spec中是否未配置 resources.limits.cpu ...

常见问题

本文介绍云连接器(Cloud Connector)相关常见问题什么是物联网?什么是云连接器?为什么选择云连接器?云连接器的使用场景及操作指导?使用云连接器有哪些注意事项?什么是物联网?物联网IoT(Internet of Things)是基于互联网、传统...

常见问题

产品常见问题 EMAS崩溃保护机制导致SDK无法初始化且功能不可用 阿里百川账号如何在阿里云平台使用 覆盖patch需要重启App生效吗 热修复支持多进程吗 后台上传补丁的时候出现,找不到补丁的情况 补丁发错了怎么办,是否有相应办法补救 针对同...

AI负载调度

为了解决这个问题,阿里云提供Gang Scheduling功能,保障所有相关联的进程能够同时启动,防止因部分进程的异常而导致整个关联进程组的阻塞的问题。使用Gang scheduling Capacity Scheduling 当集群中有多个用户时,通过Kubernetes原生的...

应用场景

语音通知作为短信通知的有效补充,提供多样化的通知手段,及时通知用户,帮您解决通知不及时的问题。常用于订单提醒、风险告知、故障提醒、配送服务、退票提醒等场景。尊敬的${mcUserName}您好,您的云通信账号余额不足,请尽快续费以免...

设备接入引导

MQTT:使用自定义证书、自定义设备认证方式、自定义通信Topic的能力,可以将存量设备在无需做改造的情况下迁移到阿里云企业物联网平台。JT/T 808:建议采用TLS方式接入,支持使用服务端单向认证、设备端和服务端证书OCSP能力、设备和服务端...

专业版

v2.4.7 2020-07-29【修复】修复了断网情况下,子设备在边缘端的状态不正确等问题。说明 为了您更好地体验Link IoT Edge功能,请已使用v2.4.6版本的用户,将版本直接升级到v2.4.7。v2.4.5 2020-05-20【修复】修复了启动Link IoT Edge服务时...

虚拟机场景

本文列了虚拟机常见的故障演练场景。JvmCodeCache满 制造JVM CodeCache区域满的故障,CodeCache区域满会直接导致JIT编译关闭,从而引起业务系统性能下降。一般用于验证业务系统在高并发且系统性能下降的情况下,是否能够通过限流、快速扩...

Paho-MQTT Java接入示例

本文介绍如何使用Java语言的Paho MQTT库,接入阿里云物联网平台,并进行物模型消息通信。前提条件 已在物联网平台中,创建了产品和设备,并在产品的 功能定义 页签下,定义一个LightSwitch属性。请参见 创建产品、单个创建设备 和 单个添加...

Pod异常问题排查

本文介绍关于Pod异常问题的诊断流程、排查方法、常见问题及解决方案。本文目录 类别 内容 诊断流程 诊断流程 常见排查方法 检查Pod的状态 检查Pod的详情 检查Pod的配置 检查Pod的事件 检查Pod的日志 检查Pod的监控 使用终端进入容器 Pod...

调度概述

为了解决这个问题,阿里云提供Gang Scheduling功能,保障所有相关联的进程能够同时启动,防止因部分进程的异常而导致整个关联进程组的阻塞的问题。使用Gang scheduling Capacity Scheduling 当集群中有多个用户时,通过Kubernetes原生的...

核心文件监控

核心文件监控功能可以实时监控服务器上核心文件的访问情况,对文件的访问、修改、删除、重命名等操作进行实时监控和告警,可监控核心文件是否被盗取或篡改。本文介绍如何实现对服务器核心文件访问的监控。使用限制 仅云安全中心的企业版和...

读写访问文件类问题

问题现象 文件存储NAS为多客户端提供了统一名字空间的文件共享读写能力,但在多进程或多客户端并发写同一个文件的场景中(典型的例如并发写同一个日志文件),各进程分别维护了独立的文件描述符及写入位置等上下文信息,而NFS协议本身并...

2022年

进程分为idle进程数组和active进程数组,优先对idle进程进行内存释放,然后再对active进程进行内存释放。cancel_query:只对active进程进行取消查询操作。terminate_idle_backend:停止用户idle进程。terminate_any_backend:停止任意用户...

DDH常见问题

本文介绍DDH相关的常见问题及解决方案。DDH相关的常见问题及解决方案如下:什么是专有宿主机DDH?DDH有什么优势?在什么场景下需要购买DDH?DDH是裸机产品吗?DDH与弹性裸金属服务器有什么区别?怎么创建和释放DDH?怎么查看每台DDH上有...

Mesh 网关

具体内容将从下述几个方面展开:网关的演变历史:解释网关为什么要 Mesh 化。网关 Mesh 化:阐述如何进行 Mesh 化改造。双十一落地:介绍在此过程中实现三板斧能力。网关的演变历史 当前,蚂蚁集团的无线网关接入了数百个业务系统,提供数...

使用异常

本节将介绍消息队列常见的使用异常问题及相应的解决方案。无法连接 Broker 客户端启动失败,出现“Can not find name server with endpoint”报错 启动 Producer、Consumer 失败,Group ID 重复 主动订阅消息,获取队列列表失败 消息显示 ...

2022年

进程分为idle进程数组和active进程数组,优先对idle进程进行内存释放,然后再对active进程进行内存释放。cancel_query:只对active进程进行取消查询操作。terminate_idle_backend:停止用户idle进程。terminate_any_backend:停止任意用户...

OSS存储卷FAQ

创建硬链接时返回错误Operation not supported或Operation not permitted ossfs常见问题 控制台检测失败问题 控制台检测长期卡住,或失败无信息透,或显示unknown error 网络问题:connection timed out 权限问题:错误码StatusCode=403 ...

Linux实例使用df和du命令查看磁盘时结果不一致

df命令使用statfs系统调用,直接读取分区的超级块信息,获取分区使用情况,如果运行中的进程持有被删除文件的句柄,分区超级块中的信息不会更改,df命令仍会统计被删除文件的信息,最终导致du和df命令统计结果不一致。解决方案 您可以通过...

什么是高速通道

阿里云高速通道(Express Connect)可在本地数据中心IDC(Internet Data Center)和云上专有网络VPC(Virtual Private Cloud)间建立高速、稳定、安全的私网通信。高速通道的物理专线数据传输过程可信可控,避免网络质量不稳定问题,同时可...

pg_stat_activity视图

pg_stat_activity是 云原生数据仓库AnalyticDB PostgreSQL版 用来定位实例当前执行查询的系统视图,每行显示一个服务器进程同时详细描述与之关联的用户会话和查询,可以有效帮助用户分析排查当前运行的SQL任务以及异常问题。注意事项 只有...

使用云消息队列 Kafka 版时出现消息堆积

一般情况下,客户端消费流程大致如下:判断消息堆积是否属于正常情况 如果发现Group中出现消息堆积,请参见下列步骤,判断消息堆积是否属于正常情况:登录 云消息队列 Kafka 版控制台。在顶部菜单栏,选择地域。在左侧导航栏,单击 实例...

使用AIACC-Training TensorFlow版

如何快速判断是否是梯度通信带来的性能瓶颈 您可以将适配代码中的 DistributedOptimizer(opt)参数注释掉,此时,将不会产生梯度通信,您即可进一步排查数据IO、CPU预处理等可能造成性能瓶颈的原因。对数据集做shard的注意事项 由于AIACC-...
共有150条 < 1 2 3 4 ... 150 >
跳转至: GO
产品推荐
云服务器 安全管家服务 安全中心
这些文档可能帮助您
短信服务 高速通道 边缘网络加速 物联网无线连接服务 号码隐私保护 弹性公网IP
新人特惠 爆款特惠 最新活动 免费试用