论文 #
-
论文地址 AN IMAGE IS WORTH 16X16 WORDS:TRANSFORMERS FOR IMAGE RECOGNITION AT SCALE
-
开源地址 vision_transformer git
model #

代码[1] #
参考 #
ViT #
1xx. VIT (Vision Transformer) 模型论文+代码(源码)从零详细解读,看不懂来打我 V
1xx. 详解VIT(Vision Transformer)模型原理, 代码级讲解 VIT Repo git ***
1xx. ViT| Vision Transformer |理论 + 代码 V PPT
ViLT #
1xx. ViLT:最简单的多模态Transformer 1xx. ViLT git 1xx. ViLT 论文精读【论文精读】 ViLT 论文精读【论文精读】 V 1xx. 多模态ViLT模型下游任务微调原理及代码