Карина Романова - LLAMA, 100500 вариантов её файнтюнинга

Александр Голубев - Воркшоп по LLM + RLHF

Пахаруков Илья | Прогнозирование LTV на основании паттернов поведения игроков

When you go out and meet your old-fashioned husband, you 'd better wear normal clothes for the sake

Incredibox Sprunki vs Inside Out 2 - Which team will win? #shorts #animation

Пропагандисти з РФ поглузували зі свого ж ПІДБИТОГО ТАНКА

Илья Гусев - Синтетические датасеты как способ сокращения неравенства

ML Trainings

Переглядів 3 749

Додати в
- Мій плейлист
- Переглянути пізніше
Поділитися

Поділитися

Вставка

Розмір відео:

Показувати елементи керування програвачем

Автоматичне відтворення

Автоповтор

Опубліковано 15 лис 2024

КОМЕНТАРІ • 10

@mlcat Рік тому ⁺¹⁰
Спасибо за сайгу и турбоальпакалору ❤
@mlcat Рік тому ⁺¹
Попробовал рецепты: 13b-сайга выдала рецепт борща без свеклы и рецепт щей без капусты 😅
@DmitryRomanov 6 місяців тому
Спасибо вам большое за отличный доклад, за ваш труд, и за канал в телеграмме ❤️👍🙏🤘
@ЕгорЗяблицев-ю4ч Рік тому ⁺¹
Спасибо! Очень интересно!
@АлексейСвищев-н7к Рік тому
Получается, Сайга училась только на Instruction finetuning? Или все-все-таки был RLHF этап?
Не увидел в докладе этот момент. Было что-то про ранжирование 1о датасета, которое может подойти для HF. И все.
@IlyaGusev-y8c Рік тому
Нет, никакого RLHF этапа не было, потому что не было никакого HF. Только SFT, но не только на инструкциях.
@АлексейСвищев-н7к Рік тому
@@IlyaGusev-y8c на датасете персонаже тоже училась опубликованная сетка?
Пробовал ее попросить создать персонажа и придерживаться созданного при общении. Придерживалась. Только ответы давала предельно развернутые и корректные.
Нельзя её указать. что персонаж ругается или говорит грубо . . .
@IlyaGusev-y8c Рік тому
@@АлексейСвищев-н7к Ага, у всех последних версий был RP датасет в обучении. А что не ругается - так это потому, что датасет генерировался GPT-4/GPT-3.5, и там такого быть не могло.
@petyap7600 Рік тому ⁺¹
Кластеризация новостей - это тот который в телеге nyannnews?
@IlyaGusev-y8c Рік тому ⁺¹
(уже отвечал, видимо коммент удалился из-за ссылки)
Нет, это про дорожку на Диалоге 2021 про кластеризацию новостей.

Наступне

Автоматичне відтворення

Карина Романова - LLAMA, 100500 вариантов её файнтюнинга

Карина Романова - LLAMA, 100500 вариантов её файнтюнинга

Александр Голубев - Воркшоп по LLM + RLHF

Александр Голубев - Воркшоп по LLM + RLHF

Пахаруков Илья | Прогнозирование LTV на основании паттернов поведения игроков

Пахаруков Илья | Прогнозирование LTV на основании паттернов поведения игроков

When you go out and meet your old-fashioned husband, you 'd better wear normal clothes for the sake

When you go out and meet your old-fashioned husband, you 'd better wear normal clothes for the sake

Incredibox Sprunki vs Inside Out 2 - Which team will win? #shorts #animation

Incredibox Sprunki vs Inside Out 2 - Which team will win? #shorts #animation

Пропагандисти з РФ поглузували зі свого ж ПІДБИТОГО ТАНКА

Пропагандисти з РФ поглузували зі свого ж ПІДБИТОГО ТАНКА

Увеличили моцареллу для @Lorenzo.bagnati

Увеличили моцареллу для @Lorenzo.bagnati

Алерон Миленкин | RAG и как его правильно готовить

Алерон Миленкин | RAG и как его правильно готовить

Fine-tuning, RAG, Llama, prompt-engineering, LLM-арены | Что происходит в LLM

Fine-tuning, RAG, Llama, prompt-engineering, LLM-арены | Что происходит в LLM

How large language models work, a visual intro to transformers | Chapter 5, Deep Learning

How large language models work, a visual intro to transformers | Chapter 5, Deep Learning

Мое резюме в Топ 1 на HeadHunter

Мое резюме в Топ 1 на HeadHunter

Запускаем RAG через llama3 с помощью LM studio и Anything LLM на своем компьютере

Запускаем RAG через llama3 с помощью LM studio и Anything LLM на своем компьютере

CI/CD - Простым языком на понятном примере

CI/CD — Простым языком на понятном примере

Татьяна Гайнцева - Instruction tuning: что, почему и как

Татьяна Гайнцева - Instruction tuning: что, почему и как

Георгий Бредис | Мультимодальные LLM, как их сделать, улучшить и применить

Георгий Бредис | Мультимодальные LLM, как их сделать, улучшить и применить

[DeepLearning | видео 1] Что же такое нейронная сеть?

[DeepLearning | видео 1] Что же такое нейронная сеть?

LOTS of PROMO CODES! #standoff #promocode

LOTS of PROMO CODES! #standoff #promocode

Пришла в себя в городской больнице... // Было дело. Советский след

Пришла в себя в городской больнице... // Было дело. Советский след

家里的东西越扔越少了...#電車 #車文化 #跑車

家里的东西越扔越少了...#電車 #車文化 #跑車

🔥 ПРЕМЬЕРА МЕЛОДРАМЫ 2024! 🔥 Дикарка. 1 серия.

🔥 ПРЕМЬЕРА МЕЛОДРАМЫ 2024! 🔥 Дикарка. 1 серия.

БОЕВИК! СПЕЦНАЗОВЕЦ ДОЛЖЕН ВЫВЕСТИ ДЕВОЧКУ ИЗ ЭПИЦЕНТРА ВОЕННЫХ ДЕЙСТВИЙ! Уцелевший! Русский фильм

БОЕВИК! СПЕЦНАЗОВЕЦ ДОЛЖЕН ВЫВЕСТИ ДЕВОЧКУ ИЗ ЭПИЦЕНТРА ВОЕННЫХ ДЕЙСТВИЙ! Уцелевший! Русский фильм

ПРЕМ'ЄРА! Неймовірний серіал! РЕВАНШ. 22 серія

ПРЕМ'ЄРА! Неймовірний серіал! РЕВАНШ. 22 серія

За кого болели?😂

За кого болели?😂

😱 ТРАМП НЕ СТРИМАЄ ОБІЦЯНКУ! Неочікуване ПРОРОЦТВО | Валерій Шатилович @shatilovich_valery

😱 ТРАМП НЕ СТРИМАЄ ОБІЦЯНКУ! Неочікуване ПРОРОЦТВО | Валерій Шатилович @shatilovich_valery