计算机视觉速递_第4页-阿里云

计算机视觉论文速递（九）EfficientFormer： Vision Transformers at MobileNet Speed 轻量化实时推理的Transformer模型

相关资源来自集智书童1. 摘要 Vision Transformers (ViT) 在计算机视觉任务中取得了快速进展，在各种基准测试中取得了可喜的成果。然而，由于大量的参数和模型设计，例如注意力机制，基于 ViT 的模型通常比轻量级卷积网络慢几倍。因此，应用部署 ViT 具有很大的挑战性...

文章原载于集智书童1. 摘要人体姿态估计是计算机视觉领域的基本研究问题之一，具有很广泛的实际应用，例如医疗健康领域的行为分析、元宇宙领域的AIGC内容生成等。但是，由于人体姿态丰富，人物衣着表观变化多样，光照和遮挡等因素，人体姿态估计任务非常具有挑战性。之前的深度学习方法主要研究了新的...

YOLO-Pose论文：MiniViT：Compressing Vision Transformers with Weight Multiplexing代码已开源：https://github.com/Wolfwjs/GANet1. 摘要在CVPR 2022上，商汤智能汽车-创新研发...

相关资源来自集智书童1. 摘要最近的研究表明，Vision Transformers对各种Corruptions表现出很强的鲁棒性。虽然这一特性部分归因于Self-Attention机制，但目前仍缺乏系统的理解。在本文中研究了Self-Attention在学习鲁棒表征中的...

YOLO-Pose论文：MiniViT：Compressing Vision Transformers with Weight Multiplexing代码已开源：https://github.com/microsoft/Cream1. 摘要 Vision Transformer由于...

Dynamic Sparse R-CNN论文：Dynamic Sparse R-CNN代码目前未开源1. 摘要 Sparse R-CNN是最近的一种强目标检测Baseline，通过对稀疏的、可学习的proposal boxes和proposal features进行集合预测。在这项工作中...

YOLO-Pose论文：Enhancing YOLO for Multi Person Pose Estimation Using Object Keypoint Similarity Loss代码已开源：https://github.com/TexasInst…1. 简介本文介绍了...

NAT论文：NAT：Neighborhood Attention Transformer1. 摘要本文提出了Neighborhood Attention Transformer(NAT)，NAT是一种集高效、准确和可扩展的分层Transformer，Neighborhood Atten...

SepViT论文：SepViT: Separable Vision Transformer1. 摘要 Vision Transformers在一系列的视觉任务中取得了巨大的成功。然而，它们通常都需要大量的计算来实现高性能，这在部署在资源有限的设备上这是一个负担。为了解决这...

共有39条

< 2 3 4 >

跳转至： GO

更新时间 2023-08-17 13:29:42

本页面内关键词为智能算法引擎基于机器学习所生成，如有任何问题，可在页面下方点击"联系我们"与我们沟通。

社区圈子

计算机视觉

172+人已加入

加入