Teşekkürler video için, bir sorum olacaktı. Tek amaçla eğitilmiş bir ai yi düşük bütçeli bir sistemde çalıştırdığımızda hızlı cevap alabilir miyiz ? yani mesela diğer ai datasetlerini lokalde kurduğumuzda baya geç cevap veriyor. Tek iş için eğitilen yapay zekalarda durum nasıl acaba
Merhabalar, genelde düşük bütçeli sistemlerde kural tabanlı chatbotlar daha çok kullanılıyor. Sistemin ne kadar düşük olduğuna göre değişir lakin genel amaçlı büyük dil modellerine göre daha hızlı çalışır muhtemelen. Tabii ki bir çok parametre var. Hangi model, kaç parametreli ne kadar büyük gibi bir çok değişkene göre de cevap değişir. Hatalı olabilirim. Hatam varsa düzeltin.
güzel anlatımınız için teşekkürler öncelikle. notebook linkini google colab t4 ile çalıştırmayı denediğimde bf16 ve tf32 için hata almıştım. acaba doğru mu yaptım bilmiyorum ama bf16 değerini fp16=True olarak değiştirdim ve tf32=False yaparak eğitimi başlatabildim.
Merhabalar, Güzel ve eğitici bir video olmuş. Kaydettiğiniz modelin nasıl kullanılacağı ile ilgili bir video daha yükleyeceğim demişsiniz. Ne zaman için düşünüyorsunuz. Ben çalışmanızı denedim. Ama aşağıdaki hatayı aldım. RuntimeError: Error(s) in loading state_dict for LlamaForCausalLM: size mismatch for model.embed_tokens.weight: copying a param with shape torch.Size([44224, 4096]) from checkpoint, the shape in current model is torch.Size([44222, 4096]). size mismatch for lm_head.weight: copying a param with shape torch.Size([44224, 4096]) from checkpoint, the shape in current model is torch.Size([44222, 4096]). Teşekkürler şimdiden.
Elinize sağlık
Çok faydalı bir video olmuş, adım adım kendim de takip ederek birçok şey öğrendim. Çok teşekkürler!
çok iyi bir anlatım olmuş hocam. Bir inşaat mühendisi olarak merakla izliyorum sizi yeni videolarınızı için çok heyecanlıyım.
bunu arıyordum, çok teşekkürler.
Çok akıcı ve net bir anlatım olmuş, farklı case'ler için de video bekliyoruz.
Harika bir anlatım olmuş. Devamını bekliyoruz hocam :)
Oguzhan hocam cok guzel anlatmissiniz lutfen serinin devami gelsin
Teşekkürler. Devamını dilerim.
Videonun devamının gelmemesi üzücü olmuş
thank you very much for sharing! it is great :)
thank farnaz! nice to see you in here:)
Çok faydalı bir video olmuş. Kurs veriyor musunuz yada videoların devamı gelecek mi?
abi mala anlatır gibi tutorial yapmanı istesem çook mu şey istemiş olurum :)
eğitim ne kadar sürede gerçekleşti
Teşekkürler video için, bir sorum olacaktı. Tek amaçla eğitilmiş bir ai yi düşük bütçeli bir sistemde çalıştırdığımızda hızlı cevap alabilir miyiz ? yani mesela diğer ai datasetlerini lokalde kurduğumuzda baya geç cevap veriyor. Tek iş için eğitilen yapay zekalarda durum nasıl acaba
Merhabalar, genelde düşük bütçeli sistemlerde kural tabanlı chatbotlar daha çok kullanılıyor. Sistemin ne kadar düşük olduğuna göre değişir lakin genel amaçlı büyük dil modellerine göre daha hızlı çalışır muhtemelen. Tabii ki bir çok parametre var. Hangi model, kaç parametreli ne kadar büyük gibi bir çok değişkene göre de cevap değişir. Hatalı olabilirim. Hatam varsa düzeltin.
güzel anlatımınız için teşekkürler öncelikle. notebook linkini google colab t4 ile çalıştırmayı denediğimde bf16 ve tf32 için hata almıştım. acaba doğru mu yaptım bilmiyorum ama bf16 değerini fp16=True olarak değiştirdim ve tf32=False yaparak eğitimi başlatabildim.
torch versiyonundan kaynaklı olabilir bu hata, hiç karşılaşmadım öncesinde.
altın madeni
Merhabalar, Güzel ve eğitici bir video olmuş. Kaydettiğiniz modelin nasıl kullanılacağı ile ilgili bir video daha yükleyeceğim demişsiniz. Ne zaman için düşünüyorsunuz. Ben çalışmanızı denedim. Ama aşağıdaki hatayı aldım.
RuntimeError: Error(s) in loading state_dict for LlamaForCausalLM:
size mismatch for model.embed_tokens.weight: copying a param with shape torch.Size([44224, 4096]) from checkpoint, the shape in current model is torch.Size([44222, 4096]).
size mismatch for lm_head.weight: copying a param with shape torch.Size([44224, 4096]) from checkpoint, the shape in current model is torch.Size([44222, 4096]).
Teşekkürler şimdiden.
hocam, selam. kusura bakmayın geç gördüm biraz. problemi çözebildiniz mi acaba?