An Image is Worth 16x16 Words:Transformers for Image Recognition at Scale

Поділитися
Вставка

КОМЕНТАРІ • 5

  • @sion5224
    @sion5224 Рік тому

    3:51 ViT의 weight 가 input에 따라 유동적으로 변한다고 하셨는데, 무슨 뜻일까요? ViT도 학습시 weight의 변화는 없지않나요? 또한 BiT가 ResNet기반 모델인 base model 아닌가요?

  • @로봇-y8n
    @로봇-y8n 2 роки тому +3

    좋은 발표 감사합니다.

  • @rileykim6314
    @rileykim6314 2 роки тому +4

    PDF가 필요하신 분은 아래에서 다운로드 가능합니다 :)
    - github.com/seonokkim/dl-paper-review/blob/main/ViT/ViT.pdf

    • @user-qw3dsfh8e
      @user-qw3dsfh8e 2 роки тому

      좋은 자료 감사합니다. 슬라이드에 움직이는 이미지는 어떤 프로그램으로 만드는건가요?