Vision Transformer (ViT) Paper Explained

Swin Transformer: Hierarchical Vision Transformer using Shifted Windows

This Insane AI Video Search Technology Selected by NVIDIA and Snowflake | Twelve Labs, Jae Lee

МІША ЛЕБІГА і АНДРІЙ ЛУЗАН в СРАЧІ #32

Что будет если украсть в магазине шоколадку 🍫

Женская супер-сила 😂 #ComedyClub #КамедиКлаб #харламов #тнт4 #тнт #демискарибидис #богатство #кравец

Swin Transformer - Paper Explained

Soroush Mehraban

Переглядів 13 176

Додати в
- Мій плейлист
- Переглянути пізніше
Поділитися

Поділитися

Вставка

Розмір відео:

Показувати елементи керування програвачем

Автоматичне відтворення

Автоповтор

Опубліковано 17 гру 2024

КОМЕНТАРІ • 30

@VedantJoshi-mr2us 6 місяців тому ⁺⁴
By far one of the best + complete, SWIN transformer explanations on the entire Internet.
@soroushmehraban 6 місяців тому
Thanks!
@FinalProject-rw1yf 6 місяців тому
@@soroushmehraban Hi sir, could you also explain the FasterViT and GCViT paper...
@kerenc91 8 днів тому
Great explanation, thanks!
@omarabubakr6408 Рік тому
That's The Most Illustrative Video Of Swin-Transformers on The Internet!
@soroushmehraban Рік тому
Glad you enjoyed it 😃
@omarabubakr6408 Рік тому
@@soroushmehraban yes abs thx so much, although I Have a Quick Question More Related to PyTorch actually which is in min 12:49 in line 239 in the code 1st what does -1 here means and what does it do exactly with the tensor 2nd from where we get [4,16] the 4 here from where we got it cuz its not mentioned in the reshaping. Thanks in advance.
@SizzleSan Рік тому ⁺¹
Thorough! Very comprehensible, thank you.
@yehanwasura Рік тому ⁺²
Really informative, helped me lot to understand many concepts here. Keep up the good work
@soroushmehraban Рік тому ⁺¹
Thanks! I’ll try my best.
@rohollahhosseyni8564 Рік тому
Very well explained, thank you Soroush.
@soroushmehraban Рік тому
Glad you liked it
@kundankumarmandal6804 11 місяців тому
You deserve more likes and subscribers
@soroushmehraban 11 місяців тому
Thanks man🙂 appreciated
@antonioperezvelasco3297 Рік тому
Thanks for the good explanation!
@symao-ir9vw 18 днів тому
17:15, may I ask why the number at the right bottom of the 3rd swin block is 6?
@soroushmehraban 17 днів тому
That's a hyperparameter I believe. It's hard to use lots of layers at first and second stage because of the memory constraints we have with 4x4 and 8x8 patches and 32x32 patch at the last stage has the highest patch size (least attention to details). So they used the most at 16x16 patch size instead.
@proteus333 Рік тому
Amazing video !
@soroushmehraban Рік тому
Thanks!
@symao-ir9vw 18 днів тому
The discussion about patch size at around 16:40 is confusing
@soroushmehraban 17 днів тому
I was comparing 4x4 swin transformer vs 4x4 ViT. In 4x4 ViT the whole layers have patches of 4x4 pixels so in all layers they have good attention to details. But in swin transformer as we go forward we merge these tokens so we have less attention to details in deep layers (that's why the end layer output is not enough for segmentation).
@SaniaEskandari Рік тому
perfect description.
@soroushmehraban Рік тому
Glad it was helpful 🙂
@siarez Рік тому
Great video! Thanks
@soroushmehraban Рік тому
Thanks for the feedback 🙂
@pradyumagarwal3978 3 місяці тому
where is the code that u were referring to?
@soroushmehraban 3 місяці тому
github.com/microsoft/Swin-Transformer/blob/main/models/swin_transformer.py#L222
@akbarmehraban5007 Рік тому
I enjoy very much
@Karthik-kt24 5 місяців тому
very nicely explained thank you! likes are at 314 so didnt hit like it😁subbed instead
@dslkgjsdlkfjd 5 місяців тому
2:43 C would be equal to the number of filters not the number of kernels. In the torch.nn.conv2d operation being performed we have 3 kernels for each input channel and then C number of filters. Each filter having 3 kernels not C number of kernels.

Наступне

Автоматичне відтворення

Vision Transformer (ViT) Paper Explained

Vision Transformer (ViT) Paper Explained

Swin Transformer: Hierarchical Vision Transformer using Shifted Windows

Swin Transformer: Hierarchical Vision Transformer using Shifted Windows

This Insane AI Video Search Technology Selected by NVIDIA and Snowflake | Twelve Labs, Jae Lee

This Insane AI Video Search Technology Selected by NVIDIA and Snowflake | Twelve Labs, Jae Lee

МІША ЛЕБІГА і АНДРІЙ ЛУЗАН в СРАЧІ #32

МІША ЛЕБІГА і АНДРІЙ ЛУЗАН в СРАЧІ #32

Что будет если украсть в магазине шоколадку 🍫

Что будет если украсть в магазине шоколадку 🍫

Женская супер-сила 😂 #ComedyClub #КамедиКлаб #харламов #тнт4 #тнт #демискарибидис #богатство #кравец

Женская супер-сила 😂 #ComedyClub #КамедиКлаб #харламов #тнт4 #тнт #демискарибидис #богатство #кравец

Cat mode and a glass of water #family #humor #fun

Cat mode and a glass of water #family #humor #fun

Swin Transformer V2 - Paper explained

Swin Transformer V2 - Paper explained

Swin Transformer paper animated and explained

Swin Transformer paper animated and explained

Transformers (how LLMs work) explained visually | DL5

Transformers (how LLMs work) explained visually | DL5

Linear algebra with Transformers - Paper Explained

Linear algebra with Transformers – Paper Explained

Swin Transformer: Hierarchical Vision Transformer using Shifted Windows (paper illustrated)

Swin Transformer: Hierarchical Vision Transformer using Shifted Windows (paper illustrated)

Swin Transformer

Swin Transformer

Diffusion Models (DDPM & DDIM) - Easily explained!

Diffusion Models (DDPM & DDIM) - Easily explained!

Vision Transformer Quick Guide - Theory and Code in (almost) 15 min

Vision Transformer Quick Guide - Theory and Code in (almost) 15 min

Vision Transformer Basics

Vision Transformer Basics

Что выбрать Вике айфон или таба лапку? SchoolBoy Runaway

Что выбрать Вике айфон или таба лапку? SchoolBoy Runaway

Гениальное изобретение из обычного стаканчика!

Гениальное изобретение из обычного стаканчика!

The Witcher IV - Cinematic Reveal Trailer | The Game Awards 2024

The Witcher IV — Cinematic Reveal Trailer | The Game Awards 2024

ЧТО ОПАСНЕЕ? ОТВЕТЫ ВАС ШОКИРУЮТ... (1% ОТВЕЧАЮТ ПРАВИЛЬНО) #Shorts #Глент

ЧТО ОПАСНЕЕ? ОТВЕТЫ ВАС ШОКИРУЮТ... (1% ОТВЕЧАЮТ ПРАВИЛЬНО) #Shorts #Глент

"Бажано відбити посадку без втрат": військовий розповів, як загибель побратимів впливає на психіку

"Бажано відбити посадку без втрат": військовий розповів, як загибель побратимів впливає на психіку

😯 Подарила сыну БМВ, но не ожидала такой реакции на машину! | Новостничок

😯 Подарила сыну БМВ, но не ожидала такой реакции на машину! | Новостничок

⚡КОРЕЙЦІ ПРОТИ росіянок

⚡КОРЕЙЦІ ПРОТИ росіянок

Они Скупали ВСЁ Серебро Мира и вот ЧТО Было Дальше! #shorts

Они Скупали ВСЁ Серебро Мира и вот ЧТО Было Дальше! #shorts