Илья Гусев - Синтетические датасеты как способ сокращения неравенства

Поділитися
Вставка
  • Опубліковано 15 лис 2024

КОМЕНТАРІ • 10

  • @mlcat
    @mlcat Рік тому +10

    Спасибо за сайгу и турбоальпакалору ❤

    • @mlcat
      @mlcat Рік тому +1

      Попробовал рецепты: 13b-сайга выдала рецепт борща без свеклы и рецепт щей без капусты 😅

  • @DmitryRomanov
    @DmitryRomanov 6 місяців тому

    Спасибо вам большое за отличный доклад, за ваш труд, и за канал в телеграмме ❤️👍🙏🤘

  • @ЕгорЗяблицев-ю4ч

    Спасибо! Очень интересно!

  • @АлексейСвищев-н7к

    Получается, Сайга училась только на Instruction finetuning? Или все-все-таки был RLHF этап?
    Не увидел в докладе этот момент. Было что-то про ранжирование 1о датасета, которое может подойти для HF. И все.

    • @IlyaGusev-y8c
      @IlyaGusev-y8c Рік тому

      Нет, никакого RLHF этапа не было, потому что не было никакого HF. Только SFT, но не только на инструкциях.

    • @АлексейСвищев-н7к
      @АлексейСвищев-н7к Рік тому

      @@IlyaGusev-y8c на датасете персонаже тоже училась опубликованная сетка?
      Пробовал ее попросить создать персонажа и придерживаться созданного при общении. Придерживалась. Только ответы давала предельно развернутые и корректные.
      Нельзя её указать. что персонаж ругается или говорит грубо . . .

    • @IlyaGusev-y8c
      @IlyaGusev-y8c Рік тому

      @@АлексейСвищев-н7к Ага, у всех последних версий был RP датасет в обучении. А что не ругается - так это потому, что датасет генерировался GPT-4/GPT-3.5, и там такого быть не могло.

  • @petyap7600
    @petyap7600 Рік тому +1

    Кластеризация новостей - это тот который в телеге nyannnews?

    • @IlyaGusev-y8c
      @IlyaGusev-y8c Рік тому +1

      (уже отвечал, видимо коммент удалился из-за ссылки)
      Нет, это про дорожку на Диалоге 2021 про кластеризацию новостей.