728x90
요즘 CLIP 관련해서 논문을 쓰고 있어서 ViT/B-32 , ViT/B-16, ViT/L-14 등의 parameter 수를 검색하는데, 통 안나왔다.
보니까 ViT/B , ViT/L, ViT/H의 차이는 있지만,
ViT/B-32와 ViT/B-16의 parameter수는 차이가 안난다는 것을 알아내었다.
따라서 모델의 계산량을 따지는 게 맞다.
GFLOPS 자료 출처 : https://chowdera.com/2021/06/20210620230815101l.html
GFLOPs로 비교하는 경우 model size라는 단어보다 model compute를 사용한다. (CLIP paper figure caption 참고)
728x90
'DL&ML' 카테고리의 다른 글
conda 가상환경 그대로 옮기는 법 (참조 링크) (0) | 2022.08.16 |
---|---|
tmux 사용법 (참조링크) (0) | 2022.08.15 |
pytorch Distributed DataParallel 설명 (multi-gpu 하는 법) (0) | 2022.08.13 |
Moving average란? (이동평균선) (0) | 2022.08.12 |
Deep learning에서 Collapse (Collapsing)란? (0) | 2022.08.12 |