Fine-Tuning в ChatGPT. Как дообучить LLM (простым языком и на примере)

Singularity is Coming

Додати в
- Мій плейлист
- Переглянути пізніше
Поділитися

Поділитися

Вставка

Розмір відео:

Показувати елементи керування програвачем

Автоматичне відтворення

Автоповтор

Опубліковано 26 лис 2024

КОМЕНТАРІ • 31

@xeno7828 5 місяців тому ⁺¹
Ну наконец то нашелся вменяемый канал который по пальцам объясняет новичкам что и как устроено !)
@yarafilms Рік тому ⁺³
Прям мега полезно! Как раз искал понятные материал, буду пробовать! Спасибо! ;)
@codeforlemontea 2 місяці тому
Спасибо, братик. Просто и доступно!
@TheAmadur 9 місяців тому ⁺¹
Это топовый видос. Очень помог, спасибо
@secondlifetools6060 6 місяців тому
это охрененно полезная инфа! продолжай пожалуйста.
@АлександрЧечетов 5 місяців тому
10 в нулевой степени это 1
10 в первой степени это 10
А видос крутой
@yason24ru Рік тому
Крутой видос. Спасибо большое
@dmitriyneledva4693 Рік тому
очень крутое видео!
@ДревнийГоблин 11 днів тому
Спасибо. Видео полезно не столько с практической точки зрения (не урок все-таки подразумевался, как я думаю). Но позволяет направить мысль в нужном направлении. Спасибо.
З.Ы. Как мне кажется 10 в степени 1 это 10, не сотня. Эту картинку видел в книге "Foundation Models for Natural Language Processing", глава 3.6.3 Creating Few-Shot Prompts. График приведен со ссылкой на первоисточник: " T. B. Brown et al. “Language Models Are Few-Shot Learners”. 2020. arXiv: 2005.14165." Кстати, в первой книге стоит просто "10", без ненужных в этом случае степеней.
@moresevas Рік тому ⁺²
Отличный видос! Хотелось бы обсудить вот что: всегда ли возможны другие режимы, кроме zero-shot? Например, работаем через API чтобы оценивать ответы студентов на тест по физике, допустим из 20 заданий. Каким образом мы можем проапгрейдить zero-shot(s), если от раза к разу у нас разные 20 заданий по разным темам физики?
@Singularity_is_Coming Рік тому ⁺¹
в файн тюнинге зеро-шот под такую задачу идеально зайдет, нужно побольше примеров из разных тем и LLM будет справляться с разными темами без проблем.
для файтюнинга я бы делал 1 запрос = 1 задание и собрал датасет хотя бы на 200-300 задач с ответами.
а как улучшить уже сам zero-shot промпт рассказал в новом видео:
ua-cam.com/video/B71fdZPZT7M/v-deo.html
@povezlo46 10 місяців тому
Спасибо за полезный урок, Денис. Однозначно подписка. А что там по деньгам получилось? во сколько обошлось тебе обучить эту модель писать в стиле Нориса?
@Singularity_is_Coming 10 місяців тому ⁺²
Поскольку база небольшая, вышло недорого, что-то около 1$
@АлексейДорошев-з7в Рік тому
Спасибо
@IvanLesnov Місяць тому
Как файнтюнить офлайн модель ?
@Roman-hv3ss 7 місяців тому
Огонь! С огромным интересом посмотрел. Подписка. А можно таким образом дообучить локальные нейронки?
@Singularity_is_Coming 7 місяців тому
Да, можно и локальные конечно, но ресурсов нужно много для этого, если модели большие
@wms_ll 10 місяців тому
Привет, какой у тебя Git?
@kiryllshynharow9058 Рік тому ⁺³
2:39 Чтоооо? 10^1 это ну уж точно не сотня. Математически это 10, но судя о масштабе по подписи "Number of Examples in Context (K)" по горизонтальной оси отложены тысячи примеров
@Singularity_is_Coming Рік тому ⁺¹
спасибо за комментарий, верно заметили! там 10 примеров а не 100
@OlafAndvarafors 4 місяці тому
@@Singularity_is_Comingтам не 10 примеров, а 10 000.
@DizroAI 11 місяців тому
У меня есть небольшая база данных, и я пытаюсь разработать процесс обработки больших новостных текстов. Какую модель лучше всего использовать в этом случае, и как ее правильно настроить? На вход модели будет подаваться обширный новостной контент, а требуется получить отформатированный и сокращенный вариант текста.
@Singularity_is_Coming 11 місяців тому
лучше всего конечно GPT-4, но нужно смотреть насколько существенная разница в качестве, т.к. разница в цене существенная - ~5-10 раз
@ilyashturm8043 3 місяці тому
А зачем это так делать если в chat gpt уже все эти функции есть?
@MrStepanok 5 місяців тому
Привет! Подскажи пожалуйста, что это может быть. Я сделал файнтюнинг модели, причем прям на сайте, там сейчас появились для этого инструменты (возможно они были и раньше) но моя модель не отображается в playground. Что это может быть?
@Singularity_is_Coming 5 місяців тому
Должна появиться через время. А по API она доступна? В любом случае это скорее вопрос в поддержку, похоже на баг.
@MrStepanok 5 місяців тому
@@Singularity_is_Coming Разобрался! Я тренировал через организацию, и в ней вообще ничего кроме gpt3.5turbo выбрать было нельзя. Перетренил в обычном аккаунте и сразу все ок ок. Спасибо!!!
@mr.grixakrushkas5667 Рік тому
Это лора чтоль, или есть отличия?
@IlyaPanfilov Рік тому ⁺¹
Зачем спалил ключ на 12:29) или это пасхалка?
@Singularity_is_Coming Рік тому
пасхалка, а вообще то тестовый ключ был для видео)
@ВекНовый-х4л Рік тому
+

Наступне

Автоматичне відтворення

Prompt Engineering Pro: 7 советов как составлять эффективные промпты