计算机视觉论文速递(九)EfficientFormer: Vision Transformers at MobileNet Speed 轻量化实时推理的Transformer模型

计算机视觉论文速递(九)EfficientFormer: Vision Transformers at MobileNet Speed 轻量化实时推理的Transformer模型

相关资源来自集智书童1. 摘要  Vision Transformers (ViT) 在计算机视觉任务中取得了快速进展,在各种基准测试中取得了可喜的成果。然而,由于大量的参数和模型设计,例如注意力机制,基于 ViT 的模型通常比轻量级卷积网络慢几倍。因此,应用部署 ViT 具有很大的挑战性...

计算机视觉论文速递(八)ViTAE:COCO人体姿态估计新模型取得最高精度81.1AP

计算机视觉论文速递(八)ViTAE:COCO人体姿态估计新模型取得最高精度81.1AP

文章原载于集智书童1. 摘要  人体姿态估计是计算机视觉领域的基本研究问题之一,具有很广泛的实际应用,例如医疗健康领域的行为分析、元宇宙领域的AIGC内容生成等。但是,由于人体姿态丰富,人物衣着表观变化多样,光照和遮挡等因素,人体姿态估计任务非常具有挑战性。之前的深度学习方法主要研究了新的...

计算机视觉论文速递(六)GANet: A Keypoint-based Global Association Network for Lane Detection 基于关键点建模的全局关联网络

计算机视觉论文速递(六)GANet: A Keypoint-based Global Association Network for Lane Detection 基于关键点建模的全局关联网络

YOLO-Pose论​文:MiniViT:Compressing Vision Transformers with Weight Multiplexing代码已开源:https://github.com/Wolfwjs/GANet1. 摘要  在CVPR 2022上,商汤智能汽车-创新研发...

计算机视觉论文速递(七)FAN:提升ViT和CNN的鲁棒性和准确性

计算机视觉论文速递(七)FAN:提升ViT和CNN的鲁棒性和准确性

相关资源来自集智书童1. 摘要  最近的研究表明,Vision Transformers对各种Corruptions表现出很强的鲁棒性。虽然这一特性部分归因于Self-Attention机制,但目前仍缺乏系统的理解。  在本文中研究了Self-Attention在学习鲁棒表征中的...

计算机视觉论文速递(五)MiniViT:Compressing Vision Transformers with Weight Multiplexing 极致压缩视觉Transformer

计算机视觉论文速递(五)MiniViT:Compressing Vision Transformers with Weight Multiplexing 极致压缩视觉Transformer

YOLO-Pose论文:MiniViT:Compressing Vision Transformers with Weight Multiplexing代码已开源:https://github.com/microsoft/Cream​​1. 摘要  Vision Transformer由于...

计算机视觉论文速递(四)Dynamic Sparse R-CNN:Sparse R-CNN升级版,使用ResNet50也能达到47.2AP

计算机视觉论文速递(四)Dynamic Sparse R-CNN:Sparse R-CNN升级版,使用ResNet50也能达到47.2AP

Dynamic Sparse R-CNN论文:Dynamic Sparse R-CNN代码目前未开源1. 摘要  Sparse R-CNN是最近的一种强目标检测Baseline,通过对稀疏的、可学习的proposal boxes和proposal features进行集合预测。在这项工作中...

计算机视觉论文速递(三)YOLO-Pose:《Enhancing YOLO for Multi Person Pose .....》实时性高且易部署的姿态估计模型

计算机视觉论文速递(三)YOLO-Pose:《Enhancing YOLO for Multi Person Pose .....》实时性高且易部署的姿态估计模型

YOLO-Pose​论文:Enhancing YOLO for Multi Person Pose Estimation Using Object Keypoint Similarity Loss代码已开源:https://github.com/TexasInst…1. 简介  本文介绍了...

计算机视觉论文速递(二)NAT:超越 Swin、ConvNeXt 的Neighborhood Attention Transformer

计算机视觉论文速递(二)NAT:超越 Swin、ConvNeXt 的Neighborhood Attention Transformer

NAT论文:NAT:Neighborhood Attention Transformer1. 摘要  本文提出了Neighborhood Attention Transformer(NAT),NAT是一种集高效、准确和可扩展的分层Transformer,Neighborhood Atten...

计算机视觉论文速递(一)SepViT:Separable Vision Transformer 可分离视觉Transformer

计算机视觉论文速递(一)SepViT:Separable Vision Transformer 可分离视觉Transformer

SepViT论文:SepViT: Separable Vision Transformer​1. 摘要  Vision Transformers在一系列的视觉任务中取得了巨大的成功。然而,它们通常都需要大量的计算来实现高性能,这在部署在资源有限的设备上这是一个负担。  为了解决这...

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

社区圈子

计算机视觉
计算机视觉
172+人已加入
加入
相关电子书
更多
视频云+人工智能计算机视觉和机器学习在消费级视频中的应用
《2019人工智能发展报告》
《阿里巴巴机器智能计算机视觉技术精选》
立即下载 立即下载 立即下载