Влад Голощапов | Затухание градиентов

Александр Голубев - Воркшоп по LLM + RLHF

How AIs, like ChatGPT, Learn

КИТАЙСКАЯ ПЕТАРДА детям не игрушка!😂 TG: great_hustle жду тебя там

ДИЗЕЛЬ ШОУ 2024 🇺🇦 ПРЕМ'ЄРА 🇺🇦 ВИПУСК 145 на підтримку ЗСУ ⭐ Гумор ICTV від 17.05.2024

Вопрос с AMG GT закрыт РАЗ и НАВСЕГДА.

Игорь Котенков - RLHF Intro: from Zero to Aligned Intelligent Systems

ML Trainings

Переглядів 3 423

Додати в
- Мій плейлист
- Переглянути пізніше
Поділитися

Поділитися

Вставка

Розмір відео:

Показувати елементи керування програвачем

Автоматичне відтворення

Автоповтор

Опубліковано 8 чер 2023
- A story about Text Summarization
- What the Alignment is, and what's the problem?
- How RLHF works
- Data setup, and why we'd like to follow instructions
- Reward Modeling and PPO
- Why RLHF works (and when it doesn't)
- ChatGPT improvements
- What's next and what to expect?
Data Fest 2023:
ods.ai/events/datafestonline2023
Трек "Instruct Models":
ods.ai/tracks/df23-instruct-m...
Наши соц.сети:
Telegram: t.me/datafest
Вконтакте: datafest

КОМЕНТАРІ • 4

@wadyn95 11 місяців тому ⁺⁴
Потрясающий доклад, я не датасатинист, а сочувствующий)
было невероятно интересно узнать столько подробностей про RLFH
@user-jf6li8mn3l 11 місяців тому ⁺¹
Спасибо! Все очень доходчиво и структурировано.
@user-vs3tt8xc6j 11 місяців тому ⁺²
Отличный доклад, отличная дикция и скорость речи. Один из немногих докладов, которые я смотрел в записи на скорости 1.0
А кто-нибудь оценивал возможность модели быть "сингулярнинькой" с точки зрения полноты и противоречивости множества формул модели? Теорема о неполноте тут не будет работать? Т.е. либо модель не будет бесконечно расти в качестве правильных ответов (полнота знаний), либо она скатится в галлюцинации (противоречивость).
@user-yt4mh2xg9r 5 місяців тому
1:31:53 мне кажется, что alignment противоречит точности модели. Так как он выстраивается на основе оценок пользователей, большинство из которых не понимают что от них хотят, а тех, кто понимает, банальное меньшинство. В итоге получается, что модель не может сказать, о том что вероятность болезни у негров и белых разная, несмотря на то, что для медика это важный факт во время диагностики. Мне кажется, что нейросеть должна отвечать на любой вопрос максимально честно, а не жонлгировать терминами, чтобы ни кого не обидеть. Есть мнение, что ChatGPT "отупел" после того как его дообучили на оценках пользователей.

Наступне

Автоматичне відтворення

Влад Голощапов | Затухание градиентов

Влад Голощапов | Затухание градиентов

Александр Голубев - Воркшоп по LLM + RLHF

Александр Голубев - Воркшоп по LLM + RLHF

How AIs, like ChatGPT, Learn

How AIs, like ChatGPT, Learn

КИТАЙСКАЯ ПЕТАРДА детям не игрушка!😂 TG: great_hustle жду тебя там

КИТАЙСКАЯ ПЕТАРДА детям не игрушка!😂 TG: great_hustle жду тебя там

ДИЗЕЛЬ ШОУ 2024 🇺🇦 ПРЕМ'ЄРА 🇺🇦 ВИПУСК 145 на підтримку ЗСУ ⭐ Гумор ICTV від 17.05.2024

ДИЗЕЛЬ ШОУ 2024 🇺🇦 ПРЕМ'ЄРА 🇺🇦 ВИПУСК 145 на підтримку ЗСУ ⭐ Гумор ICTV від 17.05.2024

Вопрос с AMG GT закрыт РАЗ и НАВСЕГДА.

Вопрос с AMG GT закрыт РАЗ и НАВСЕГДА.

Chips evolution !! 😔😔

Chips evolution !! 😔😔

Kotenkov Igor | Nearest Neighbors Language Models (part 1) | kNN-LM model

Kotenkov Igor | Nearest Neighbors Language Models (part 1) | kNN-LM model

Где взять данные для предобучения LLM - Анатолий Потапов, Тинькофф

Где взять данные для предобучения LLM — Анатолий Потапов, Тинькофф

Языковые модели для чайников: просто и полезно про BERT и GPT | Вебинар 2021-02-18

Языковые модели для чайников: просто и полезно про BERT и GPT | Вебинар 2021-02-18

Математик и черт

Математик и черт

История Linux и UNIX! Кто породил ВСЕ современные системы!

История Linux и UNIX! Кто породил ВСЕ современные системы!

What is the Internet of Things? And why should you care? | Benson Hougland | TEDxTemecula

What is the Internet of Things? And why should you care? | Benson Hougland | TEDxTemecula

Evolving AIs - Predator vs Prey, who will win?

Evolving AIs - Predator vs Prey, who will win?

Основы проектирования ML-систем (autumn 2023 update)

Основы проектирования ML-систем (autumn 2023 update)

Купил ПОСЫЛКУ с ALIEXPRESS за 1 000 000 рублей ft. Бустер, Супер Стас, Сабина, Яяна, Мага

Купил ПОСЫЛКУ с ALIEXPRESS за 1 000 000 рублей ft. Бустер, Супер Стас, Сабина, Яяна, Мага

Did you find it?! 🤔✨✍️ #funnyart

Did you find it?! 🤔✨✍️ #funnyart

Шавушка чи кfc?

Шавушка чи кfc?

Ходорковский - девяностые и «Предатели» / вДудь

Ходорковский – девяностые и «Предатели» / вДудь

Серіал Одна родина 2024 серія 3 | МЕЛОДРАМИ 2024 | УКРАЇНСЬКИЙ СЕРІАЛ ПРО КОХАННЯ | ПРЕМ'ЄРА

Серіал Одна родина 2024 серія 3 | МЕЛОДРАМИ 2024 | УКРАЇНСЬКИЙ СЕРІАЛ ПРО КОХАННЯ | ПРЕМ'ЄРА

УСИК та КЛИЧКО після перемоги Олександра 🇺🇦🔥 #усик #кличко #україна

УСИК та КЛИЧКО після перемоги Олександра 🇺🇦🔥 #усик #кличко #україна

Поруч з могилою збудували Каховське водосховище | #УПошукахІстини #Сірко #історія

Поруч з могилою збудували Каховське водосховище | #УПошукахІстини #Сірко #історія