Карина Романова - LLAMA, 100500 вариантов её файнтюнинга

Где взять данные для предобучения LLM - Анатолий Потапов, Тинькофф

ВЕНЕДИКТОВ: «Орешник» - это имитация. Крах рубля и рост цен на продукты. Путин, Трамп и переговоры

Mix the spurious with the genuine #joker #cosplay#Harriet Quinn

Симбу закрыли дома?! 🔒 #симба #симбочка #арти

«Машина з такою швидкістю летіла, і такий гул, я думала, що це ракета летить» #shortsvideo #дтп

Александр Голубев - Воркшоп по LLM + RLHF

ML Trainings

Переглядів 5 905

Додати в
- Мій плейлист
- Переглянути пізніше
Поділитися

Поділитися

Вставка

Розмір відео:

Показувати елементи керування програвачем

Автоматичне відтворення

Автоповтор

Опубліковано 29 лис 2024

КОМЕНТАРІ • 7

@OskarKokoschka-u2h Рік тому ⁺¹
Хорошо поставленный рассказ, все кратко, по содержанию и очень полезно, спасибо :)
@Skayfaks 6 місяців тому ⁺¹
Ппц, вот это рокетСайнс 😭. Надо разбираться! Спасибо за контент!
@ГеоргийХлестов-я6ъ Рік тому
Спасибо за доклад!
@АлексейСвищев-н7к Рік тому
LoRA обязательно применять ко всем линейным слоям модели? Есть какое-то исследование на эту тему? Может есть более чувствительные слои?
Вопрос еще такой детский.
На стадии supervised finetuning мы просто обучаем модель на текстах, которые соответствуют формату наших инструкций? Т.е. учим предсказывать следующее слово, но сами сами тексты уже устроены подходящим нашей задаче образом?
@alex_golubev13 Рік тому
Лору можно применять не ко всем слоям, это настраивается одним параметром в peft. Видел, что иногда применяют на attention матрицы Q, K, V и не трогают feed forward слои, но какого-то исследования с ходу не могу вспомнить
@alex_golubev13 Рік тому
Да, Instruction tuning в этом и заключается
@kobalt17 Рік тому
Так запустить у себя итоговую модель у себя?

Наступне

Автоматичне відтворення

Карина Романова - LLAMA, 100500 вариантов её файнтюнинга

Карина Романова - LLAMA, 100500 вариантов её файнтюнинга

Где взять данные для предобучения LLM - Анатолий Потапов, Тинькофф

Где взять данные для предобучения LLM — Анатолий Потапов, Тинькофф

ВЕНЕДИКТОВ: «Орешник» - это имитация. Крах рубля и рост цен на продукты. Путин, Трамп и переговоры

ВЕНЕДИКТОВ: «Орешник» — это имитация. Крах рубля и рост цен на продукты. Путин, Трамп и переговоры

Mix the spurious with the genuine #joker #cosplay#Harriet Quinn

Mix the spurious with the genuine #joker #cosplay#Harriet Quinn

Симбу закрыли дома?! 🔒 #симба #симбочка #арти

Симбу закрыли дома?! 🔒 #симба #симбочка #арти

«Машина з такою швидкістю летіла, і такий гул, я думала, що це ракета летить» #shortsvideo #дтп

«Машина з такою швидкістю летіла, і такий гул, я думала, що це ракета летить» #shortsvideo #дтп

Why no RONALDO?! 🤔⚽️

Why no RONALDO?! 🤔⚽️

Игорь Котенков - RLHF Intro: from Zero to Aligned Intelligent Systems

Игорь Котенков - RLHF Intro: from Zero to Aligned Intelligent Systems

Let's build GPT: from scratch, in code, spelled out.

Let's build GPT: from scratch, in code, spelled out.

Fine-Tuning в ChatGPT. Как дообучить LLM (простым языком и на примере)

Fine-Tuning в ChatGPT. Как дообучить LLM (простым языком и на примере)

Fine-tune проиграл. RAG это лучший способ получить точные ответы от LLM. База знаний для нейросетей.

Fine-tune проиграл. RAG это лучший способ получить точные ответы от LLM. База знаний для нейросетей.

Сиракан Багдасарян | ML-платформа: что это за зверь и как его приготовить?

Сиракан Багдасарян | ML-платформа: что это за зверь и как его приготовить?

«GigaChat: наш опыт обучения LLM»

«GigaChat: наш опыт обучения LLM»

Stanford CS25: V2 I Introduction to Transformers w/ Andrej Karpathy

Stanford CS25: V2 I Introduction to Transformers w/ Andrej Karpathy

Открытые модели и их обучение

Открытые модели и их обучение

ПОДРАЛСЯ С БРАТОМ (Смешное видео, юмор, приколы, поржать )

ПОДРАЛСЯ С БРАТОМ (Смешное видео, юмор, приколы, поржать )

Попри зливу у Полтаві відкрили дошку воїну

Попри зливу у Полтаві відкрили дошку воїну

«Машина з такою швидкістю летіла, і такий гул, я думала, що це ракета летить» #shortsvideo #дтп

«Машина з такою швидкістю летіла, і такий гул, я думала, що це ракета летить» #shortsvideo #дтп

💔«Закінчується відчуття радості та щастя» #конкурентtv #новини #новинисьогодні

💔«Закінчується відчуття радості та щастя» #конкурентtv #новини #новинисьогодні

СТАЛКЕР 2 ВЫШЕЛ ➤ STALKER 2: Heart of Chornobyl ◉ Прохождение 1

СТАЛКЕР 2 ВЫШЕЛ ➤ STALKER 2: Heart of Chornobyl ◉ Прохождение 1

СНОГШИБАТЕЛЬНАЯ ПРЕМЬЕРА! РОМАН С ЖЕНАТЫМ МУЖЧИНОЙ ОБЕРНУЛСЯ ЕЩЁ ОДНИМ ПРЕДАТЕЛЬСТВОМ | Мелодрама

СНОГШИБАТЕЛЬНАЯ ПРЕМЬЕРА! РОМАН С ЖЕНАТЫМ МУЖЧИНОЙ ОБЕРНУЛСЯ ЕЩЁ ОДНИМ ПРЕДАТЕЛЬСТВОМ | Мелодрама

Mix the spurious with the genuine #joker #cosplay#Harriet Quinn

Mix the spurious with the genuine #joker #cosplay#Harriet Quinn

消防避险训练，消防员用“水盾”逼退烈火！这是训练，也是他们可能面对的日常。致敬！#熱門 #中国

消防避险训练，消防员用“水盾”逼退烈火！这是训练，也是他们可能面对的日常。致敬！#熱門 #中国