Fine-tuning, RAG, Llama, prompt-engineering, LLM-арены | Что происходит в LLM

Поділитися
Вставка
  • Опубліковано 25 січ 2025

КОМЕНТАРІ • 35

  • @TheFemenistka
    @TheFemenistka 5 місяців тому +6

    спасибо! такое милое видео! звучит очень интересно, надеюсь получиться записаться на ваш курс

    • @deep_school
      @deep_school  5 місяців тому

      Спасибо! Будем рады видеть вас на курсе)

  • @БоряДикий
    @БоряДикий Місяць тому +1

    Оченьк коротко и очень по делу! Благодарочка!

  • @cnrd9529
    @cnrd9529 12 днів тому +2

    2:46 - не расслышал - какен фейс? Факин фейс?
    Неплохо бы в описании такие ссылки писать

    • @deep_school
      @deep_school  11 днів тому +1

      hugging face, библиотека trandformers huggingface.co/docs/transformers/index
      Добавим в описание, спасибо!

  • @MovFrame
    @MovFrame 20 днів тому +1

    Спасибо

  • @IvanLesnov
    @IvanLesnov 3 місяці тому +1

    Как дообучить модель в оффлайне?

  • @andor1904
    @andor1904 23 дні тому +1

    Спасибо за видео, интересное!
    P.S. без черно белых вставок было бы значительно лучше)

    • @nadyamoscow2461
      @nadyamoscow2461 15 днів тому +2

      А мне понравились вставки

    • @deep_school
      @deep_school  9 днів тому

      Спасибо! Учтем)

    • @rtm-h5b
      @rtm-h5b 7 днів тому +1

      Мне тоже очень понравились вставки

  • @stask7258
    @stask7258 5 місяців тому

    Срастбо.

  • @bakaai445
    @bakaai445 5 місяців тому +1

    Интересно

  • @internetnickname8923
    @internetnickname8923 5 місяців тому +2

    Расскажите плз, как можно слить 2 LLM в 1, если есть необходимость объединить знания обеих моделей и получить гибрид)

    • @deep_school
      @deep_school  5 місяців тому +6

      Есть хороший блогпост на эту тему huggingface.co/blog/mlabonne/merge-models Сливают обычно модели одной и той же архитектуры, например вариации того же Mixtral-8x7b. Делается это зачастую линейной интерполяцией весов между двумя моделями с различными параметрами. Есть различные инструменты - какие-то требуют задать параметры руками, какие-то пытаются откалибровать эти параметры проходом по датасету. В некоторых merged (слитых) моделях авторы пишут, каким подходом и какие модели они объединяли, например huggingface.co/vicgalle/Merge-Mixtral-Prometheus-8x7B Список инструментов (не полный): github.com/Gryphe/BlockMerge_Gradient github.com/arcee-ai/mergekit github.com/Gryphe/MergeMonster

    • @internetnickname8923
      @internetnickname8923 5 місяців тому +1

      @@deep_school Супер) А есть способ выжать из модели полный датасет, на которой она обучалась?

    • @daniyarkalmanbetov7271
      @daniyarkalmanbetov7271 5 місяців тому

      Пни если ответят плиз ​@@internetnickname8923

  • @Mustafazadeh.E
    @Mustafazadeh.E 4 місяці тому

    Спасибо!!!

  • @MrGoudvin
    @MrGoudvin 5 місяців тому +1

    ролик в духе "скелетон" )

  • @hsqlk
    @hsqlk Місяць тому +1

    LLM всегда предсказывает следующий токен

  • @fodezargames
    @fodezargames 5 місяців тому

    У меня 2080 super и 32 гб памяти, какую модель смогу запустить? так чтоб не фигня была, а чтото умела

    • @daniyarkalmanbetov7271
      @daniyarkalmanbetov7271 5 місяців тому

      Gemma2 - 8b?

    • @Zganshin
      @Zganshin 3 місяці тому

      У меня вообще видеокарты нет, сервер dell r430 с одним слабым xeon процом, ну и апиративы 64 стоит последняя лама от Nvidia, всё работает , но медленно , сообщение может минут 10 писать, у тебя на GPU будет в разы быстрей ​@@daniyarkalmanbetov7271

    • @nz792006
      @nz792006 2 місяці тому

      поставь LM Studio и проверь, что религия не позволяет?

  • @antonmanukyan3307
    @antonmanukyan3307 3 місяці тому

    А где цены на курс?

    • @deep_school
      @deep_school  3 місяці тому

      Запись на курс мы открываем за несколько недель до старта, тогда же публикуем изменения в программе и цены. Вы можете оставить свои контакты в анкете предзаписи deepschool.ru/llm - чтобы мы сообщили вам о новом потоке и условиях в первую очередь :)

  • @usersimple562
    @usersimple562 5 місяців тому

    как же заработать на макбук

  • @thirteeenth
    @thirteeenth 3 місяці тому

    Супер. Благодарность до 7го неба )
    А скажи , просто оч интересно , какая у тебя профильная деятельность ? чем ты занимаешься в основном ?

    • @deep_school
      @deep_school  3 місяці тому

      Илья занимается обучением различных LLM-моделей, любит распределённое обучение и нейросети, еще Илье очень нравится рассказывать об этом студентам)

  • @romanbolgar
    @romanbolgar 5 місяців тому

    Сколько мучений. Оно то конечно интересно но отвлекает. Как говорится сапожник без сапог. Хотя я вообще видео не делаю потому что вот из-за этого. Всё никак не найду бесплатного диктора с искусственным интеллектом желательно чтобы говорил моим голосом. Ну это опять же надо обучать. Кстати этот текст в комментарии я тоже говорю. Но это уже другая технология. Речь в текст. В принципе уже давно есть и текст в речь Тоже давно пользуюсь. Но многим режет слух Голос робота. Хотя сейчас вроде уже и голоса есть хорошие. Более того есть сервисы на базе того же искусственного интеллекта Которые видеоряд подбирают. А то тема сложная не всё понятно.