ViT 모델 사이즈 별 parameter 수 (feat.GFLOPs)

요즘 CLIP 관련해서 논문을 쓰고 있어서 ViT/B-32 , ViT/B-16, ViT/L-14 등의 parameter 수를 검색하는데, 통 안나왔다.

보니까 ViT/B , ViT/L, ViT/H의 차이는 있지만,

ViT/B-32와 ViT/B-16의 parameter수는 차이가 안난다는 것을 알아내었다.

따라서 모델의 계산량을 따지는 게 맞다.

GFLOPs로 비교하는 경우 model size라는 단어보다 model compute를 사용한다. (CLIP paper figure caption 참고)

conda 가상환경 그대로 옮기는 법 (참조 링크) (0)	2022.08.16
tmux 사용법 (참조링크) (0)	2022.08.15
pytorch Distributed DataParallel 설명 (multi-gpu 하는 법) (0)	2022.08.13
Moving average란? (이동평균선) (0)	2022.08.12
Deep learning에서 Collapse (Collapsing)란? (0)	2022.08.12

티스토리툴바