kongsberg
콩스버그
kongsberg
전체 방문자
오늘
어제
  • 분류 전체보기 (42)
    • DL&ML (29)
    • 웹프로그래밍 (2)
    • 상식 (3)
    • 재테크 (7)

블로그 메뉴

  • 홈
  • 태그
  • 방명록

공지사항

인기 글

태그

  • Llama
  • html 글자크기
  • GPT
  • pytorch
  • CMA
  • pylint
  • 토스뱅크
  • further pre-training
  • LLM
  • 네이버통장
  • TMUX
  • llm pre-training
  • instruction-pt
  • 글자크기 조절
  • llm code
  • llama2
  • 네이버CMA
  • 거대언어모델
  • 재테크
  • CSS 글자크기

최근 댓글

최근 글

티스토리

hELLO · Designed By 정상우.
kongsberg

콩스버그

ViT 모델 사이즈 별 parameter 수 (feat.GFLOPs)
DL&ML

ViT 모델 사이즈 별 parameter 수 (feat.GFLOPs)

2022. 8. 11. 16:00
728x90

요즘 CLIP 관련해서 논문을 쓰고 있어서 ViT/B-32 , ViT/B-16, ViT/L-14 등의 parameter 수를 검색하는데, 통 안나왔다.

 

그나마 찾은 자료

보니까 ViT/B , ViT/L, ViT/H의 차이는 있지만,

ViT/B-32와 ViT/B-16의 parameter수는 차이가 안난다는 것을 알아내었다.

 

따라서 모델의 계산량을 따지는 게 맞다.

 

같은 B,L,H끼리는 사이즈로 비교를 못하니 GFLOPs를 비교해보자

GFLOPS 자료 출처 : https://chowdera.com/2021/06/20210620230815101l.html

GFLOPs로 비교하는 경우 model size라는 단어보다 model compute를 사용한다. (CLIP paper figure caption 참고)

728x90

'DL&ML' 카테고리의 다른 글

conda 가상환경 그대로 옮기는 법 (참조 링크)  (0) 2022.08.16
tmux 사용법 (참조링크)  (0) 2022.08.15
pytorch Distributed DataParallel 설명 (multi-gpu 하는 법)  (0) 2022.08.13
Moving average란? (이동평균선)  (0) 2022.08.12
Deep learning에서 Collapse (Collapsing)란?  (0) 2022.08.12
    'DL&ML' 카테고리의 다른 글
    • tmux 사용법 (참조링크)
    • pytorch Distributed DataParallel 설명 (multi-gpu 하는 법)
    • Moving average란? (이동평균선)
    • Deep learning에서 Collapse (Collapsing)란?
    kongsberg
    kongsberg

    티스토리툴바