1
2 129

Türkçe LLM ile Sohbet Doktoru Yapma Rehberi | LLM | Fine-tuning | PEFT

Trendyol LLM modelini kullanarak Doktor Asistan uygulaması eğitiyoruz!!!
HuggingFace model adı: oguuzhansahin/trendyol-chat-doctor-4bq
Notebook linki: colab.research.google.com/drive/1DZ_otNpdeWyGmzFmN9ag8FC1a14t9tL8#scrollTo=JY6XYD1V8Kgl
Lora Paper: arxiv.org/abs/2106.09685
QLora Paper: arxiv.org/pdf/2305.14314.pdf

Відео

КОМЕНТАРІ

@tuti8452 18 днів тому
eğitim ne kadar sürede gerçekleşti
@Sokratesin_Çaybardağı Місяць тому
abi mala anlatır gibi tutorial yapmanı istesem çook mu şey istemiş olurum :)
@ferdiislamylmaz1300 Місяць тому
Videonun devamının gelmemesi üzücü olmuş
@defaultbot_xtype9785 2 місяці тому
Elinize sağlık
@burakinan7518 2 місяці тому
Çok faydalı bir video olmuş. Kurs veriyor musunuz yada videoların devamı gelecek mi?
@barsbulutdemir8229 3 місяці тому
Teşekkürler video için, bir sorum olacaktı. Tek amaçla eğitilmiş bir ai yi düşük bütçeli bir sistemde çalıştırdığımızda hızlı cevap alabilir miyiz ? yani mesela diğer ai datasetlerini lokalde kurduğumuzda baya geç cevap veriyor. Tek iş için eğitilen yapay zekalarda durum nasıl acaba
@kadiryonak4443 3 місяці тому
Merhabalar, genelde düşük bütçeli sistemlerde kural tabanlı chatbotlar daha çok kullanılıyor. Sistemin ne kadar düşük olduğuna göre değişir lakin genel amaçlı büyük dil modellerine göre daha hızlı çalışır muhtemelen. Tabii ki bir çok parametre var. Hangi model, kaç parametreli ne kadar büyük gibi bir çok değişkene göre de cevap değişir. Hatalı olabilirim. Hatam varsa düzeltin.
@Sokratesin_Çaybardağı 6 місяців тому
altın madeni
7 місяців тому
bunu arıyordum, çok teşekkürler.
@musapeker8070 9 місяців тому
Merhabalar, Güzel ve eğitici bir video olmuş. Kaydettiğiniz modelin nasıl kullanılacağı ile ilgili bir video daha yükleyeceğim demişsiniz. Ne zaman için düşünüyorsunuz. Ben çalışmanızı denedim. Ama aşağıdaki hatayı aldım. RuntimeError: Error(s) in loading state_dict for LlamaForCausalLM: size mismatch for model.embed_tokens.weight: copying a param with shape torch.Size([44224, 4096]) from checkpoint, the shape in current model is torch.Size([44222, 4096]). size mismatch for lm_head.weight: copying a param with shape torch.Size([44224, 4096]) from checkpoint, the shape in current model is torch.Size([44222, 4096]). Teşekkürler şimdiden.
@oguuzhansahin 6 місяців тому
hocam, selam. kusura bakmayın geç gördüm biraz. problemi çözebildiniz mi acaba?
@ZaferCan 9 місяців тому
güzel anlatımınız için teşekkürler öncelikle. notebook linkini google colab t4 ile çalıştırmayı denediğimde bf16 ve tf32 için hata almıştım. acaba doğru mu yaptım bilmiyorum ama bf16 değerini fp16=True olarak değiştirdim ve tf32=False yaparak eğitimi başlatabildim.
@oguuzhansahin 6 місяців тому
torch versiyonundan kaynaklı olabilir bu hata, hiç karşılaşmadım öncesinde.
@okanerhan5780 10 місяців тому
Çok faydalı bir video olmuş, adım adım kendim de takip ederek birçok şey öğrendim. Çok teşekkürler!
@mustafaisildak 10 місяців тому
Teşekkürler. Devamını dilerim.
@farnazzeidi4065 10 місяців тому
thank you very much for sharing! it is great :)
@oguuzhansahin 10 місяців тому
thank farnaz! nice to see you in here:)
@barancakr7952 11 місяців тому
çok iyi bir anlatım olmuş hocam. Bir inşaat mühendisi olarak merakla izliyorum sizi yeni videolarınızı için çok heyecanlıyım.
@EbubekirTosun-y3q 11 місяців тому
Harika bir anlatım olmuş. Devamını bekliyoruz hocam :)
@ozgurdogan9536 11 місяців тому
Çok akıcı ve net bir anlatım olmuş, farklı case'ler için de video bekliyoruz.
@erenakbuluttt 11 місяців тому
Oguzhan hocam cok guzel anlatmissiniz lutfen serinin devami gelsin <3

Oğuzhan Şahin

КОМЕНТАРІ