How DINO learns to see the world - Paper Explained

An Image is Worth 16x16 Words: Transformers for Image Recognition at Scale (Paper Explained)

AI can't cross this line and we don't know why.

В ЧЬИХ РУКАХ СУДЬБА МИРА В УКРАИНЕ? БЕСЕДА С ВИТАЛИЙ ПОРТНИКОВ @portnikov.argumenty

"Він залишив свій слід в Україні та світі": у Вінниці попрощалися з В'ячеславом Узелковим

Самый быстрый НОКАУТ в ИСТОРИИ бокса. Даже Тайсон на ТАКОЕ не способен #shorts

DINO: Self-Supervised Vision Transformers

Soroush Mehraban

Переглядів 3 225

Додати в
- Мій плейлист
- Переглянути пізніше
Поділитися

Поділитися

Вставка

Розмір відео:

Показувати елементи керування програвачем

Автоматичне відтворення

Автоповтор

Опубліковано 21 лис 2024

КОМЕНТАРІ • 16

@animeshsinha Місяць тому
Woww❤, great explanation
@moienr4104 2 місяці тому
What an amazing and clear explanation!
@yiqian22 Рік тому
As always, thank you very much for the clear explanation - I truly appreciate it! 👏
@soroushmehraban Рік тому
My pleasure!
@marioparreno24 5 місяців тому
Thanks for the intuitions, faqs and clearly explained topics!
@soroushmehraban 5 місяців тому ⁺¹
Glad you liked it Mario🙂
@marioparreno24 4 місяці тому
@@soroushmehraban Just one question. Why is centering only applied to the teacher and sharpening to both the student and the teacher? Could we not apply centering to both?
Maybe if we add both operations to both sides we play a sum 0 game and we have the collapse problem again, I dont know 😅 Maybe we need then artificially create an unbalance
@soroushmehraban 4 місяці тому ⁺¹
@@marioparreno24 From my understanding, sharpening makes the model more confident that this sample belongs to a certain sudo-class (the output label of model that we don't have ground truth).
And we want the student to be kept certain about it and we sharpen it. The less certain the student is, the less certain it is to differentiate samples from different images.
But for images we do both to prevent the mode collapse.
But this is just based on my intuition. Don't quote me on that lol.
@ericsy78 Рік тому
This is a great video I really appreciate the dedication in each video you post, I learn a lot watching your videos and it has always been helpful to me.
@soroushmehraban Рік тому
Thanks for the feedback! It’s my pleasure
@pulakgautam3536 Рік тому
I love your channel!
@soroushmehraban Рік тому
Thanks for the kind comment! This is really encouraging. Will try my best to come up with more paper reviews in the future.
@alihadimoghadam8931 Рік тому
Great video, as always 🤘
@soroushmehraban Рік тому
Thanks😃
@AshishJain-iw5md Рік тому ⁺¹
Very informative!!!
@soroushmehraban Рік тому
Glad you liked it!

Наступне

Автоматичне відтворення

How DINO learns to see the world - Paper Explained

How DINO learns to see the world - Paper Explained

An Image is Worth 16x16 Words: Transformers for Image Recognition at Scale (Paper Explained)

An Image is Worth 16x16 Words: Transformers for Image Recognition at Scale (Paper Explained)

AI can't cross this line and we don't know why.

AI can't cross this line and we don't know why.

В ЧЬИХ РУКАХ СУДЬБА МИРА В УКРАИНЕ? БЕСЕДА С ВИТАЛИЙ ПОРТНИКОВ @portnikov.argumenty

В ЧЬИХ РУКАХ СУДЬБА МИРА В УКРАИНЕ? БЕСЕДА С ВИТАЛИЙ ПОРТНИКОВ @portnikov.argumenty

"Він залишив свій слід в Україні та світі": у Вінниці попрощалися з В'ячеславом Узелковим

"Він залишив свій слід в Україні та світі": у Вінниці попрощалися з В'ячеславом Узелковим

Самый быстрый НОКАУТ в ИСТОРИИ бокса. Даже Тайсон на ТАКОЕ не способен #shorts

Самый быстрый НОКАУТ в ИСТОРИИ бокса. Даже Тайсон на ТАКОЕ не способен #shorts

这个同学真的太捣蛋了……#小丑#家庭

这个同学真的太捣蛋了……#小丑#家庭

Swin Transformer V2 - Paper explained

Swin Transformer V2 - Paper explained

DINO: Emerging Properties in Self-Supervised Vision Transformers (Facebook AI Research Explained)

DINO: Emerging Properties in Self-Supervised Vision Transformers (Facebook AI Research Explained)

Attention in transformers, visually explained | DL6

Attention in transformers, visually explained | DL6

DINO: Emerging Properties in Self-Supervised Vision Transformers | Paper Explained!

DINO: Emerging Properties in Self-Supervised Vision Transformers | Paper Explained!

The moment we stopped understanding AI [AlexNet]

The moment we stopped understanding AI [AlexNet]

Vision Transformer for Image Classification

Vision Transformer for Image Classification

Yann LeCun: Self-Supervised Learning Explained | Lex Fridman Podcast Clips

Yann LeCun: Self-Supervised Learning Explained | Lex Fridman Podcast Clips

How AI Image Generators Work (Stable Diffusion / Dall-E) - Computerphile

How AI Image Generators Work (Stable Diffusion / Dall-E) - Computerphile

Vision Transformers Need Registers - Fixing a Bug in DINOv2?

Vision Transformers Need Registers - Fixing a Bug in DINOv2?

Лишилося кілька днів? Коли буде ракетна атака РФ

Лишилося кілька днів? Коли буде ракетна атака РФ

Побег из Тюрьмы : Тетрис помог Nuggets Gegagedigedagedago сбежать от Nikocado Avocado !

Побег из Тюрьмы : Тетрис помог Nuggets Gegagedigedagedago сбежать от Nikocado Avocado !

"Він залишив свій слід в Україні та світі": у Вінниці попрощалися з В'ячеславом Узелковим

"Він залишив свій слід в Україні та світі": у Вінниці попрощалися з В'ячеславом Узелковим

Молодой боец приземлил легенду!

Молодой боец приземлил легенду!

Эффект Карбонаро и госуслуги

Эффект Карбонаро и госуслуги

Холостяк 13 - Випуск 1 від 01.11.2024 | ПРЕМ’ЄРА

Холостяк 13 – Випуск 1 від 01.11.2024 | ПРЕМ’ЄРА

Самый быстрый НОКАУТ в ИСТОРИИ бокса. Даже Тайсон на ТАКОЕ не способен #shorts

Самый быстрый НОКАУТ в ИСТОРИИ бокса. Даже Тайсон на ТАКОЕ не способен #shorts

Когда муж не доверяет жене @Oscar_elteacher

Когда муж не доверяет жене @Oscar_elteacher