Finetuning Mistral-7B для уменьшения галлюцинаций модели при RAG (retrieval-augmented generation)

Поділитися
Вставка
  • Опубліковано 25 чер 2024
  • Код из видео: github.com/pineforest-ai/nlp_...
    Разработка AI-решений на заказ: t.me/pine_forest_ai_support
    Широкий выбор карт для обучения и инференса нейронных сетей: immers.cloud/signup/r/2024052...
    Один из ведущих поставщиков услуг IaaS (Infrastructure as a Service) в России, специализирующийся на использовании графических процессоров (GPU).
    00:00 - что такое RAG (Retrieval-Augmented Generation)
    01:03 - арендуем сервер immers.cloud
    02:06 - подключаемся к серверу immers.cloud по ssh
    02:56 - подключаемся к серверу immers.cloud в VS Code
    05:06 - настраиваем kernel в jupyter notebook
    05:40 - описание кейса (чат-бот для магазина сматфонов)
    06:11 - prompt engineering
    06:44 - параметры LORA-адаптеров
    07:35 - top-k sampling, top-p sampling
    08:13 - диалог с Saiga-Mistral, галлюцинации LLM
    09:38 - датасет Company Cases
    11:49 - форматирование промпта, padding, DataCollatorForCompletionOnlyLM
    13:15 - BitsAndBytesConfig
    14:35 - обучение с помощью SFTTrainer
    15:25 - тестирируем RuDlg-Mistral, уменьшение галлюцинаций
    16:34 - тестируем RuDlg-Mistral с различным описанием личности чат-бота
    Реклама. ООО «ДТЛ». ИНН 9717073792. erid: LjN8KK7XN
  • Наука та технологія

КОМЕНТАРІ •