LoRA (Low-rank Adaption of AI Large Language Models) for fine-tuning LLM models

Cheap mini runs a 70B LLM 🤯

Is AI Replacing Software Engineering?

ФИЛЬМ НА МИЛЛИОН! | Неуловимые | Криминал Приключения

ПРЕМ'ЄРА! Неймовірний серіал! РЕВАНШ. 13 серія

ОСКАР И ДЖОНИ ЗАВЕЛИ ПИТОМЦА 😍

GGUF quantization of LLMs with llama cpp

AI Bites

Переглядів 3 385

Додати в
- Мій плейлист
- Переглянути пізніше
Поділитися

Поділитися

Вставка

Розмір відео:

Показувати елементи керування програвачем

Автоматичне відтворення

Автоповтор

Опубліковано 6 лис 2024

КОМЕНТАРІ • 12

@sqlsql4304 3 місяці тому ⁺¹
Hi, what is reason you first convert it to FP16.gguf not directly to 8 bit.
@AIBites 2 місяці тому
the conversion doesn't go through unless we convert to gguf. At least it was the case for me when I did the work. May be some recent commits to the library has eased the process and skipped the step?
@rajivraghu9857 6 місяців тому ⁺¹
Good one
@AIBites 6 місяців тому
Thank you 🙂
@arjungoud3450 6 місяців тому ⁺¹
cannot we convert base model to gguf format & quantize with cpp. cannot we apply LORA after that?
@AIBites 2 місяці тому
yes that could also be one of the routes. But I am not sure if LoRA can be applied after. Did you try it out at all?
@kalaajaurkal887 7 місяців тому ⁺²
What about raspberry pi, can this be applied to them as well.
@AIBites 7 місяців тому ⁺¹
yes. I feel models up to a size of 7B parameters quantized to 4 bits should fit into raspberry pi. Anything larger might be out of memory. Try the mistral 7B or llama2 7B pls.
Did you try running on raspberry pi and face any issues? I am curious now :)
@kalaajaurkal887 7 місяців тому ⁺¹
@@AIBites I haven't tried to run it as of now, still looking for what model would be best.
@jankigabani4394 5 місяців тому ⁺²
I'm not able to convert openelm model into gguf format! need help for that
@AIBites 2 місяці тому
sorry about the late reply but did you manage to convert now or is it still a problem?

Наступне

Автоматичне відтворення

LoRA (Low-rank Adaption of AI Large Language Models) for fine-tuning LLM models

LoRA (Low-rank Adaption of AI Large Language Models) for fine-tuning LLM models

Cheap mini runs a 70B LLM 🤯

Cheap mini runs a 70B LLM 🤯

Is AI Replacing Software Engineering?

Is AI Replacing Software Engineering?

ФИЛЬМ НА МИЛЛИОН! | Неуловимые | Криминал Приключения

ФИЛЬМ НА МИЛЛИОН! | Неуловимые | Криминал Приключения

ПРЕМ'ЄРА! Неймовірний серіал! РЕВАНШ. 13 серія

ПРЕМ'ЄРА! Неймовірний серіал! РЕВАНШ. 13 серія

ОСКАР И ДЖОНИ ЗАВЕЛИ ПИТОМЦА 😍

ОСКАР И ДЖОНИ ЗАВЕЛИ ПИТОМЦА 😍

ВЕЛИКИЙ ЕКСКЛЮЗИВ: Чому Оля Полякова більше не співає для чоловіка? Він розкаже! Вперше за 20 років

ВЕЛИКИЙ ЕКСКЛЮЗИВ: Чому Оля Полякова більше не співає для чоловіка? Він розкаже! Вперше за 20 років

Quantize any LLM with GGUF and Llama.cpp

Quantize any LLM with GGUF and Llama.cpp

LLaMa GPTQ 4-Bit Quantization. Billions of Parameters Made Smaller and Smarter. How Does it Work?

LLaMa GPTQ 4-Bit Quantization. Billions of Parameters Made Smaller and Smarter. How Does it Work?

All You Need To Know About Running LLMs Locally

All You Need To Know About Running LLMs Locally

How to Fine-tune Llama 3.1 | Tutorial Video | Shorthills AI

How to Fine-tune Llama 3.1 | Tutorial Video | Shorthills AI

Installing Llama cpp on Windows

Installing Llama cpp on Windows

Demo: Rapid prototyping with Gemma and Llama.cpp

Demo: Rapid prototyping with Gemma and Llama.cpp

Deploy Open LLMs with LLAMA-CPP Server

Deploy Open LLMs with LLAMA-CPP Server

Запускаем RAG через llama3 с помощью LM studio и Anything LLM на своем компьютере

Запускаем RAG через llama3 с помощью LM studio и Anything LLM на своем компьютере

XLSTM - Extended LSTMs with sLSTM and mLSTM (paper explained)

XLSTM - Extended LSTMs with sLSTM and mLSTM (paper explained)

бабл ти гель для душа // Eva mash

бабл ти гель для душа // Eva mash

Речь Дональда Трампа по итогам выборов: «беспрецедентный и мощный мандат», «золотой век Америки»

Речь Дональда Трампа по итогам выборов: «беспрецедентный и мощный мандат», «золотой век Америки»

Вот для чего китайцы туалетную бумагу кладут в авто которое отправляют в Россию , у нас нет разметки

Вот для чего китайцы туалетную бумагу кладут в авто которое отправляют в Россию , у нас нет разметки

美味しい食べ物のASMR ASMR FOOD 🍜🍝🍜🥓🥢🍗#asmr #美味しい食べ物#食べ物#vlog

美味しい食べ物のASMR ASMR FOOD 🍜🍝🍜🥓🥢🍗#asmr #美味しい食べ物#食べ物#vlog

Отечественный Суперкар Маруся! Оживляем легенду

Отечественный Суперкар Маруся! Оживляем легенду

小路飞还不知道他把路飞给擦没有了 #路飞#海贼王

小路飞还不知道他把路飞给擦没有了 #路飞#海贼王

"Вони мене заставили розмовляти російською мовою": староста села про катування #shorts

"Вони мене заставили розмовляти російською мовою": староста села про катування #shorts

ОБМЕНЯЛА КВИНКУ НА…😱(смотрите до конца😂)#роблокс #игры #смешное #интересное #квинка

ОБМЕНЯЛА КВИНКУ НА…😱(смотрите до конца😂)#роблокс #игры #смешное #интересное #квинка