![Oğuzhan Şahin](/img/default-banner.jpg)
- 1
- 2 129
Oğuzhan Şahin
Приєднався 20 вер 2016
Türkçe LLM ile Sohbet Doktoru Yapma Rehberi | LLM | Fine-tuning | PEFT
Trendyol LLM modelini kullanarak Doktor Asistan uygulaması eğitiyoruz!!!
HuggingFace model adı: oguuzhansahin/trendyol-chat-doctor-4bq
Notebook linki: colab.research.google.com/drive/1DZ_otNpdeWyGmzFmN9ag8FC1a14t9tL8#scrollTo=JY6XYD1V8Kgl
Lora Paper: arxiv.org/abs/2106.09685
QLora Paper: arxiv.org/pdf/2305.14314.pdf
HuggingFace model adı: oguuzhansahin/trendyol-chat-doctor-4bq
Notebook linki: colab.research.google.com/drive/1DZ_otNpdeWyGmzFmN9ag8FC1a14t9tL8#scrollTo=JY6XYD1V8Kgl
Lora Paper: arxiv.org/abs/2106.09685
QLora Paper: arxiv.org/pdf/2305.14314.pdf
Переглядів: 2 131
eğitim ne kadar sürede gerçekleşti
abi mala anlatır gibi tutorial yapmanı istesem çook mu şey istemiş olurum :)
Videonun devamının gelmemesi üzücü olmuş
Elinize sağlık
Çok faydalı bir video olmuş. Kurs veriyor musunuz yada videoların devamı gelecek mi?
Teşekkürler video için, bir sorum olacaktı. Tek amaçla eğitilmiş bir ai yi düşük bütçeli bir sistemde çalıştırdığımızda hızlı cevap alabilir miyiz ? yani mesela diğer ai datasetlerini lokalde kurduğumuzda baya geç cevap veriyor. Tek iş için eğitilen yapay zekalarda durum nasıl acaba
Merhabalar, genelde düşük bütçeli sistemlerde kural tabanlı chatbotlar daha çok kullanılıyor. Sistemin ne kadar düşük olduğuna göre değişir lakin genel amaçlı büyük dil modellerine göre daha hızlı çalışır muhtemelen. Tabii ki bir çok parametre var. Hangi model, kaç parametreli ne kadar büyük gibi bir çok değişkene göre de cevap değişir. Hatalı olabilirim. Hatam varsa düzeltin.
altın madeni
bunu arıyordum, çok teşekkürler.
Merhabalar, Güzel ve eğitici bir video olmuş. Kaydettiğiniz modelin nasıl kullanılacağı ile ilgili bir video daha yükleyeceğim demişsiniz. Ne zaman için düşünüyorsunuz. Ben çalışmanızı denedim. Ama aşağıdaki hatayı aldım. RuntimeError: Error(s) in loading state_dict for LlamaForCausalLM: size mismatch for model.embed_tokens.weight: copying a param with shape torch.Size([44224, 4096]) from checkpoint, the shape in current model is torch.Size([44222, 4096]). size mismatch for lm_head.weight: copying a param with shape torch.Size([44224, 4096]) from checkpoint, the shape in current model is torch.Size([44222, 4096]). Teşekkürler şimdiden.
hocam, selam. kusura bakmayın geç gördüm biraz. problemi çözebildiniz mi acaba?
güzel anlatımınız için teşekkürler öncelikle. notebook linkini google colab t4 ile çalıştırmayı denediğimde bf16 ve tf32 için hata almıştım. acaba doğru mu yaptım bilmiyorum ama bf16 değerini fp16=True olarak değiştirdim ve tf32=False yaparak eğitimi başlatabildim.
torch versiyonundan kaynaklı olabilir bu hata, hiç karşılaşmadım öncesinde.
Çok faydalı bir video olmuş, adım adım kendim de takip ederek birçok şey öğrendim. Çok teşekkürler!
Teşekkürler. Devamını dilerim.
thank you very much for sharing! it is great :)
thank farnaz! nice to see you in here:)
çok iyi bir anlatım olmuş hocam. Bir inşaat mühendisi olarak merakla izliyorum sizi yeni videolarınızı için çok heyecanlıyım.
Harika bir anlatım olmuş. Devamını bekliyoruz hocam :)
Çok akıcı ve net bir anlatım olmuş, farklı case'ler için de video bekliyoruz.
Oguzhan hocam cok guzel anlatmissiniz lutfen serinin devami gelsin <3