Файнтюнинг и квантизация Llama-3 70B

Поділитися
Вставка
  • Опубліковано 7 вер 2024
  • В этом видео я показываю процесс файнтюнинга Llama 3 70B и квантизации модели с конвертацией в формат GGUF.
    💻 immers.cloud - широкий выбор карт для обучения и инференса нейронных сетей: immers.cloud/s...
    Один из ведущих поставщиков услуг IaaS (Infrastructure as a Service) в России, специализирующийся на использовании графических процессоров (GPU).
    Сервис предлагает конкурентоспособные цены и интуитивно понятный интерфейс, который даже начинающие пользователи могут легко освоить и начать работу с необходимым программным обеспечением.
    💻 gptchain - фреймворк для быстрого развертывания AI-ассистентов: github.com/Rus...
    Поддерживает интеграцию с Telegram-ботом, Retrieval Augmented Generation (RAG), деплой моделей на LLM сервер и файнтюнинг LLM на собственных данных.
    Телеграм-канал: t.me/ruslandev...
    Дискорд: / discord
    🤗 Веса моей модели: huggingface.co...
    📉 Метрики обучения: api.wandb.ai/l...
    Это описание содержит реферальные ссылки.

КОМЕНТАРІ • 20