Bu videoda anlattıklarımı beğendiysen, *SPSS Dersleri* isimli video serimi de izlemeni tavsiye ederim ua-cam.com/play/PL9dwBqqedrdzg5Ord9MA7kiR0B7eyhecp.html Gelecekteki videolarımı kaçırmamak için kanalıma abone olmayı unutma 😊ua-cam.com/users/ofislab Ayrıca, bu videoyu beğendiysen BEĞEN tuşuna da basarsan daha fazla kişinin bu videoyu görmesini sağlayıp onların da faydalanmasını sağlayabilirsin!
Merhaba videonuz için çok teşekkürler, gerçekten çok açıklayıcı ve anlaşılır. Bir sorum vardı; 5'li likert ölçeğine sahip bağımlı değişken soruları için bu yöntemi nasıl uygulayacağız?
Merhaba hocam. O tarz bir değişken için bu yöntemi uygulanmamanız lazım çünkü o tarz bir değişkende cevapların iyiden kötüye veya negatiften pozitife doğru sıralandışını düşünüyoruz. Bu nedenle kukla değişkene çevirmeye gerek yok. Kukla değişkene çevirme sadece kategorik değişkenler için yapılıyor
Çok değerli bu bilgiler için teşekkürler emeğinize sağlık. Benim kafama takılan bir konu var istatistikte belki konu dağılacak ama özellikle spss’deki regresyon analizinde (hem linear hem de lojistikte) constant ı modelden kaldırma seçeneği var. Bu seçenek hangi durumlar için kullanılabilir. Örneğin modelde constant ın p değeri anlamsızsa onu modelden kaldırıp modeli tekrar test ettiğimizde daha uyumlu modeller buluyoruz. Bu durumlarda constant kullanmadan model kurmak daha uygun değil midir? Cevap için şimdiden çok teşekkürler
Merhaba. Aslında constantı (intercept) kaldırarak onu tamamen kaldırmıyorsunuz, sadece 0’a eşitliyorsunuz. Yani normalde verimizde intercept mesela 3 ise onu 0’a eşitleyerek regresyon analizini yapmış oluyoruz. Bu da aslında yapmamamız gereken bir şey. Nedeni de şu; intercept 0 olduğu zaman yani biz onu 0’a zorla getirdiğimiz zaman artık verimizin gösterdiği regresyon denklemi şaşıyor, regreson doğrusu artık verilere daha da uzaklaşıyor genelde. Bunu sadece intercept’in 0’a eşit olduğuna yüzde yüz emin olduğunuzda yapmanız öneriliyor. Bu uzaklaşma demek regresyon denklemimizin verimizi daha kötü tahmin ediyor hale gelmesi demek. Daha uyumlu modeller darken Rsquare değerinin artmasından bahsediyorsanız, constant olmadan hesaplanan Rsquare değerinin yanlış hesaplandığı söyleniyor. Bu makaleden inceleyebilirsiniz: web.ist.utl.pt/~ist11038/compute/errtheory/,regression/regrthroughorigin.pdf Özetlemek gerekirse, slope değişiyor yani regresyon çizgimiz artık verilerden daha uzaklaşıyor. Bu da analiz sonuçlarına “bias” katıyor. Bunun neticesinde residual değerleri artıyor yani açıklanamayan varyans, doğal olarak, çünkü artık veriyi daha kötü şekilde açıklıyoruz. Bu da istemediğimiz bir şey.
Merhabalar çok faydalı bir anlatım, teşekkürler. Bir sorum olacak multivariate linear regresyon analizinde birden fazla kategorik değişken kullanabilir miyiz? Örneğin hem cinsiyeti hem sigara içmeyi hem de diyabeti dummy değişken yapıp çok değişkenli analize sokabilir miyiz?( sonuçta verdiğim örneklerin hepsi 2 kategorili ve her biri için tek dummy yeterli)
Hocam merhaba ekonometri öğretmenim ödev vermiş soru şu: ''Ekonometrik bir araştırmada kukla değişken kullanımını örnekler vererek açıklayınız'' araştırma yaptım videonuzu izledim ama bu sorunun cevabını bulamadım. Yardımcı olursanız çok sevinirim
Merhaba, video için çok teşekkür ederim, çok açıklayıcı ve anlaşılır; zamanınıza ve emeğinize sağlık. Bir sorum olacak, eğer yardımcı olursanız çok sevinirim. Verdiğiniz örnekten yola çıkarak, diyelim ki medeni halin, gelir durumuna bir etkisi olup olmadığına bakıyoruz. Normal şartlarda, kukla değişken yaptığımızda illa bir değişkeni referans alıyoruz ve bu referans aldığımız değişkeni önceden ilgilendiğimiz hipotez üzerinden belirliyoruz. Ama diyelimki biz araştırmamızda hem bekarların, hem boşanmışların hem de evlilerin etkilerine bakıp anlamlı olup olmadığını görmek istiyoruz. Böyle bir durumda nasıl bir yol izlenebilir?
@@OfisLab Kendi çalışmamdan direk örnek verirsem; okuduğu sınıf ve stres derecesini ölçmek isiyorum. 1., 2., 3., 4. ve 5. sınıf öğrencileri benim değişkenlerim. Sizin videonuzdan yola çıkarak kukla değişkenleri yarattım ve 5. sınıf öğrencilerini referans aldım ancak dediğim gibi bütün sınıfların etkisini ölçmek istiyorum aslında. Bu arada anketimnde bir çok sosyodemografik değişkenim var; medeni hali, okuduğu sınıf vb. ayrıca cevabı evet ya da hayır olacak "çocuğunuz var mı?" gibi sorularım da bulunuyor. Bu değişkenlerin stres üzerinde etkisi olup olmadığına bakmak amacıyla her madde için ayrı regresyon analizi yapıyorum. Ve dolayısıyla her bir madde de bir referansım oluyor ama aslında özel bir başlangıç hipotezim yok, bu da araştırmamı sıkıntıya sokuyor biraz.
Anladım. Aslında siz zaten referans grubunun etkisine de bakıyorsunuz onu eklemeseniz bile. Regresyon analizi yaptığınız zaman (Constant) adlı satırdaki değerler referans grubunun bağımlı değişken üzerindeki etkisini gösteriyor. Sadece beta değerleri olmuyor. Onun haricindeki değerler var: b değeri, SE, t-değeri ve significance değeri var. Yani bütün değişkenleriniz için referans grubu belirleyin, bu hipotezinize uygun olsa daha iyi olur ama olmasa bile fark etmez çünkü zaten referans grubunun etkisine de bakıyoruz.
@@OfisLab Cevaplarınız ve zamanınız için çok teşekkür ederim. Yalnız, bütün değişkenlerimdeki constant satırındaki signification .000 çıkıyor; yani her referans değişkenim için sonuç çok anlamlı çıkıyor (hatta muhtemelen (tahminimce) anlamlı olmaması gereken durumlarda hep referans aldığım değişken .000). Bu normal bir durum mu, yoksa şansıma hep çok anamlı olan değikeni mi referans almış bulundum ?
Hocam merhaba. Ben de analiz yaparken kukla değişkenden yararlandım ve 4 kategorili (yaşanılan kişi= yalnız, aile, arkadaş, özel bir insan) bir değişkenimi çevirdim. Analizde S1, S2 ve S3 adında üç farklı değişken oluşturdum. Tabloyu araştırmaya aktarırken bu üç değişkeni (S1, S2 ve S3), tek bir başlık altında (Yaşanılan kişi şeklinde) nasıl tabloya aktarabilirim? Şimdiden teşekkür ederim.
Merhaba hocam. Yorumla bu soruya cevap vermek çok zor. Tek tavsiyem arama motorlarından şu arama terimleriyle arama yapmak: regression table with dummy variables
neziha K. Merhabalar, öncelikle kolay anlaşılır bir dille oluşturduğunuz videolar için çok teşekkür ederim sorum kukla değişkenlerle ilgili değil ancak yine de değişkenlerle ilgili olduğu için buraya yazmak istedim: kişisel bilgi formunda yer alan değişkenlerdeki bazı maddeleri hiç işaretleyen olmadıysa örneğin gelir değişkeninde herkes 1000₺ altını, 2000-3000₺ arası, ve 3000-4000₺ arasını işaretlemişse ancak değişkenlerde yer alan 5000₺ üstü aylık geliri işaretleyen kimse yoksa; analizlere bu maddeyi dahil ettiğimizde bir sorun olur mu? Bilgi Formunda yer aldığı için betimsel istatistik kısmında yer alacak bu maddeler frekans 0 %0 olarak ancak analiz kısmında dağılımın geçerliğini güvenirliğini ya da normalliğini etkiler mi bu durum?
Merhabalar. Videoları beğendiğiniz için teşekkürler öncelikle. Sorunuza gelirsek. Bu tip kimsenin seçmediği seçenekler verinizin dağılımının normalden sapmasına neden olabilir. Yani herkes düşük gelirli seçenekleri seçerse, verinizde pozitif skew dediğimiz şey oluşabilir. Bu da parametrik test yapmanızı engelleyebilir. Bunnu haricinde bir sorun olmaz. Verinizin normal dağılıp dağılmadığını test edin, eğer normal dağılıyorsa bir sorun olmadan parametrik testleri yapabilirsiniz. Eğer ANOVA yapacaksanız da veriniz normal dağılmasa bile yine de kullanabilirsiniz çünkü ANOVA normal dağılmayan verilere karşı da dayanıklı bir test. Normal dağılımı test etmek için kanalımdaki şu videoyu izleyebilirsin: ua-cam.com/video/2B5VK2WLjJE/v-deo.html
Merhabalar hocam, video için çok teşekkürler. Yaptığım çalışmada kategorik bir değişkenim var (öğrenci annesinin eğitim durumu). Kukla değişken oluşturup üniversite ve üstü kademeyi 1, üniversite altı kademeyi 0 olarak kodladım. Bu kukla değişken ile t-testi yaptığımda üniversite üstü kademesi değişkeni bağımlı değişkeni anlamlı olarak etkiliyor (öğrenci annesi üniversite mezunu ise öğrenci puanı anlamlı ölçüde yüksek çıkıyor.). Fakat aynı kukla değişkeni çoklu regresyon analizine soktuğumda (toplam 8 bağımsız değişken var) annenin üniversite mezunu olması öğrenci başarısını olumsuz yönde etkiliyor (B= -16.178, SH= 3.849, β= -.068, t= -4.203, p=.000, İkili r= .205, Kısmi r= -.056.). Bunu nasıl yorumlayabilirim? Bir yerde hata mı yapıyorum? Cevap için çok teşekkürler...
Merhaba hocam. Regresyondaki en çok tartışılan konulardan biri de bu aslında. Bunun bir çok nedeni olabilir. Bir tanesi Suppression. Bunun ne olduğunu Google'da Suppression in Regression yazarak aratıp çözümlere bakabilirsiniz. Bir diğer etken de multicollinearity olabilir. VIF değerleriniz yüksekse ondan olabilir.
Merhabalar hem kategorik (cinsiyet, medeni durum) değişkenler hem de sürekli değişken lineer analizde bakılabilir mi yoksa ayrı ayrı mı bakmak gerekiyor. Ayrıca regresyona sokmadan önce bu değişkenlerin korelasyonu olup olmadığına bakmalımıyız
Hocam merhaba yüksek lisans tezim için veri setime hiyerarşik regresyon analizi yaptım, fakat bazı değerler diğer çalışmaların sonuçları ile kıyasladığımda oldukça düşük geldi. Özellikle r kare ve f değerleri. Ayrıca sonuçlarımın çoğunun anlamlı çıkmadığını gördüm. Bu durumun normal olup olmadığını anlayamadım. Veri setim ile ilgili bir problem mi var ve analizi yanlış mı yaptım yoksa bu sonuçlar normal ve raporlaştırılabilir mi?
Merhaba hocam. Kusura bakmayın biraz geç yanıt veriyorum. Bu durum gayet normal. Eğer diğer çalışmalar sizinle tıpa tıp aynı örneklemi kullandıysa ve aynı şartlarda veri topladıysa o zaman şüphelenebilirsiniz. Bunun haricinde 4-eyes check dediğimiz yani bir başka uzmana verinizi gözden geçirmesi için gösterebilirsiniz. Mesela o kişiye verinizde uç değerleri bulmasını ve sizin yaptığınız analizi yapmasını isteyin. O da aynı şekilde buluyor mu diye kendi sonuçlarınızla karşılaştırın.
Ebrar hocam merhabalar, yaşadığınız problemin tamamen aynını şu an ben yaşıyorum yüksek lisans tezim için ve hala sorunun ne olduğunu nerde yanlış yaptığımı çözemedim, mesajınızın 6 ay önce yazıldığını ve sorunu çözmüş olma ihtimali ve bilgilerinizin taze olması umuduyla yazmak istedim, dönüş yaparsanız çok mutlu olurum, hayırlı günler
Hocam merhaba, yıllık çalışma saatleri gelir üzerine regres edildiğinde, hataların varyansının çalışma saatleri ile birlikte artması tam olarak neyi etkileyecek yardımcı olur musunuz? Birçok döküman okudum fakat net bir kanıya varamadım.
Merhaba hocam. Böyle bir durumla hiç karşılaşmadım ama multiple response sorularda her yanıt için farklı değişken oluşturduysanız (örneğin okulu seçme nedeni olarak "ailem istedi" diye bir değişken "arkadaşlarım istedi" diye bir değişken ve "diğer" diye bir değişken oluşturmak) o zaman bunlara verilen yanıtları da 0 ve 1 olarak kodladığınız zaman bunları bu şekilde kullanabilirsiniz diye düşünüyorum.
Hocam anketimde bir senaryo verdim, buna göre 4 farklı yorumdan hangisini tercih edeceklerini tespit etmek istedim. Bunun neticesinde de 4 yorumun hepsinin de ölçek ortalama puanına etkisine bakmak istiyorum. Constantı neye göre seçmem gerekiyor? Seçtiğim constant analize dahil edilmeyecekse, onun etkisine nasıl bakmam gerekir.
Merhaba! Constant olarak seçtiğiniz kategori, analizde 'referans kategori' olarak kullanılır. Diğer kategoriler, bu referans kategoriye göre karşılaştırılır. Genellikle, en sık rastlanan veya analiz açısından en ilginç olan kategori referans olarak seçilir. Analizde constant olarak seçtiğiniz kategoriye doğrudan bir katsayı atanmaz, çünkü bu kategori analizin 'sıfır noktası' olarak kabul edilir. Diğer kategorilerin etkileri, bu referans kategorisine göre yorumlanır. Constant dışındaki diğer kategorilerin etkilerini, regresyon analizi sonuçlarından elde edilen katsayılar ve p-değerleri ile değerlendirebilirsiniz. Bu katsayılar, referans kategoriye göre diğer kategorilerin ortalama puan üzerindeki etkisini gösterir. Constantın etkisini değerlendirmek için, analizden çıkan sabit (intercept) değerine bakabilirsiniz. Sabit değer, tüm kukla değişkenlerin '0' olduğu durumu temsil eder ve bu referans kategorisinin ölçek ortalama puanını temsil edebilir. Kukla değişkenlerle yapılan analizde, her bir değişkenin etkisini ve modelin genel uygunluğunu anlamak için R-kare, ayarlanmış R-kare ve F-testi gibi istatistiklere dikkat edin. Eğer bu süreçle ilgili daha fazla yardıma ihtiyacınız olursa veya belirli bir kukla değişkenin seçimi konusunda daha fazla bilgi isterseniz, lütfen sormaktan çekinmeyin. Araştırmanızda başarılar dilerim!
Hocam merhabalar, diyelimki referans değer oluşturmak istiyorum. Yani kanıtlamak istediğim sonuca göre bu değerleri vermek istiyorum. Bu durumda örneğin; eğitim durumuna göre ( ilkokul, ortaokul ve lise) ilkokulu referans değer olarak seçersem (n-1)'den : ilkokul 0 ortaokul: 1 ve lise: 1 ' mi olmalı ?
Merhaba hocam. İki tane kukla değişken oluşturmanız lazım. Birisnde ilkokul=0, lise=0 ve ortaokul=1 olmalı, diğerinde de ilkokul=0, lise=1, ortaokul=0 olmalı. Böylece ilkokul sizin referans grubunuz oluyor.
Sayın hocam. Yüksek orta düşük çok düşük olmak üzere 4 değişkenim var yaptığınız yöntemi uyguluyorum ancak kukla değişkenleri elde edemiyorum. Üç değişken oluyor. Tüm satırlar sıfır ve output ekranı oluşmuyor. Sorunun kaynağı nedir acaba. İyi çalışmalar
çok teşekkür ederim video için.size sorum olacaktı yardım edebilir misiniz? 1. kategorik değişkenlerle çoklu regresyon yapıyorum dummye dönüştürüp. UÇ değerleri tespit ederken Z,cook's ve leverageye göre uç değer çıkmıyor fakat mahalonobise göre çok fazla uç değer çıkıyor. şunu farkettim benim referans değişkenin olan dummy değişkenimin verilerinin hepsini uç değer olarak hesaplamış.2 farklı analizde de bu şekilde karşıma çıktı.yada mahalanobis ve leverageye göre uç dğer çıkıyor ama yine bu veriler referans grubumun tüm verileri oluyor. silemiyorumda bu durumda. Ne yapmam gerekiyor? 2.değişkenler arasında korelasyona baktığımda hepsi0.80 değerinden düşük ilişki gösteriyor. yani çoklu bağlantılılık yoktur demem gerekiyor sanırım fakat VIF değerleri biri hariç tüm değişkenlerim için 10 dan büyük çıktı.bu durumda çoklu bağlantı sorunu vardır mı demeliyim. ne yapmam gerekiyor bundan sonra?
Tabii ki, sorularınıza yardımcı olmaya çalişayım. İşte önerilerim: Mahalanobis ve Referans Grubuyla İlgili Sorun: Mahalanobis mesafesi bazen referans grubundaki verileri uç değer olarak gösterebilir, çünkü bu mesafe istatistiği, verilerin ortalama ve kovaryans matrisine göre hesaplanır ve referans grubunuz diğer kategorilerden farklı olabilir. Bu durumda, referans grubunuzun farklı bir kategoriyle kıyaslandığında farklı özelliklere sahip olup olmadığını inceleyin. Ayrıca, uç değer tespiti için alternatif yöntemler kullanmayı deneyebilirsiniz. Eğer referans grubunuzu değiştiremiyorsanız, modelinize bu uç değerlerin etkisini azaltacak yöntemler (örneğin, robust regression) eklemeyi düşünebilirsiniz. Korelasyon ve VIF Değerleri: Korelasyon değerleriniz 0.80'in altında olsa bile, VIF değerlerinin yüksek çıkması çoklu bağlantı sorununa işaret edebilir. Bu durum, değişkenler arasındaki doğrusal bağımlılığın daha karmaşık bir yapıya sahip olduğunu gösterebilir. VIF değerlerini düşürmek için şu adımları izleyebilirsiniz: Değişken Seçimi: VIF değeri yüksek olan değişkenleri modelden çıkararak veya yeniden kodlayarak modelinizdeki çoklu bağlantıyı azaltabilirsiniz. Ana Bileşen Analizi (PCA): Bu yöntemle değişkenleri daha az sayıda bileşene indirerek çoklu bağlantıyı azaltabilirsiniz. Ridge Regression veya Lasso Regression: Bu regresyon türleri, çoklu bağlantı sorununu azaltmak için cezalandırma terimleri kullanır. Umarım bu bilgiler yardımcı olur! Başka sorularınız olursa, çekinmeden sorabilirsiniz.
beta değerini değil b değerini (coefficient) kullanıyoruz hocam. her bir kukla değişkenle bu b değerini çarpıyoruz. Mesela medeni hal değişkeninde 3 grup varsa bundan 2 tane kukla değişken oluşturduktan sonra bu 2 kukla değişkeni D1 ve D2 olarak ya da kendi adlarıyla formüle ekledikten sonra yeni bir veri elde ettiğimizde bu veri D1e göre 1 ise bu değeri D1'in b değeriyle çarpıyoruz. Bu durumda tabi D2'ye göre 0 olacak ve D2'nin b değeriyle çarpıp o değeri 0 buluyoruz.
@@OfisLab Tam anlayamadım Hocam. videonun sonundaki 3 gruplu medeni hal değişkeni çıktılarına göre bir örnek formül yazabilirmisiniz. Ayrıca anlamsız çıkan kukla değişkenini formüle ekleyecekmiyiz?
Merhaba hocam. Büyük ihtimal stepwise regresyon yapmanız gerekiyor yani regresyon menüsündeki adımları (model/step) kullanarak analizi yapmanız lazım eğer SPSS kullanıyorsanız. Bunun için birinci adıma yaş ve cinsiyet değişkenlerini girdikten sonra ikinci adıma diğer değişkenleri girerek analizi yapabilirsiniz.
Merhaba hocam. Dahil edebilirsin iki gruplu olduktan sonra her değişken olur. Tek sorun şu: bir değişkeni kukla değişkene dönüştürdüysen o değişken 2 den daha fazla grupluydu demektir. Eğer durum buysa o zaman anova kullanman daha iyi olur. Eğer değişken zaten 2 grupluysa (mesela cinsiyet: kadın ve erkek) o zaman t test ile yapmalısın. Zaten bu durumda cinsiyet değişkeni kukla değişken olarak tanımlanmıyor. Dichotomous değişken olarak tanımlanıyor.
@@OfisLab Teşekkürler Hocam. Ben çoklu yanıt içeren soruları kukla değişkenlere böldüm yani anova yapmam mümkün değil çünkü normal bir kategorik değişkenli soru değil. Öte yandan, mesela gelir düzeyi gibi şıklar arasında bir bağlantı olmadığı için ve her seçenek birbirinden bağımsız olduğu için t testi olabilir gibime geldi ama siz daha iyi bilirsiniz.
@@OfisLab Örnek vermem gerekirse, sosyal medyayı gündemi takip etmek için kullanıyorum (0-1), içerik paylaşmak için kullanıyorum (0-1) ya da başkalarını takip etmek için kullanıyorum (0-1) gibi... Burada t test ile içerik paylaşmak için kullanmanın sürekli değişkenimle olan ilişkisine bakacağım mesela...
Evet bu örneğe göre en iyi çözüm o değişkenlerle (0-1 kodlanmış) t test yapmak. Sonuç olarak da içerik paylaşmak için kullananlarla içerik paylaşmak için kullanmayanlar arasında bağımlı değişken skorlarının farklılaştığı/farklılaşmadığı bulundu diye rapor edilebilir. Bu arada gruplar arasında ranking gibi bir ilişki olmadığında aslında biz t test ve anova yapıyoruz. Eğer aralarında ranking olsaydı o zaman regresyon yapılabilirdi
Excel'de yapmak için IF yani EĞER formulünü kullanabilirsiniz. EĞER dedikten sonra A1=1 ise onun 1 olarak yeni hücreye geçirilmesini, diğer türlü 0 olarak kalmasının formülünü yazın. Daha sonra bunu diğer kukla değişkenler için de uygulayın.
Hocam iyi günler..kukla değişkeni kullanarak yapisal kirilma olan donemleri ayrışırdık. Ardl üzerinden cusom ve cusomsq grafikleri gozlem donemi 2009-q1 ile 2021a2 olnasina karşın son 3 donemi gosteriyor. . Tamamini kapsayacak şekilde nasil ayarlayabiliriz.. testin tum 0 lari aldigina nasil emin olabiliriz.
Kukla değişkenleri kendiniz oluşturmadınız mı? Bu kadar çok kukla değişken oluşturulması gereken durumda SPSS'in menülerini kullanmak daha işlevsel olabilir. Transform menüsünde Create Dummy Variables seçeneğine tıklayın ve açılan menüde Root N:ames'e bu kukla değişkenler için bir temel isim verin. Ayrıca kukla değişkene dönüştürülecek değişkeni de *Create Dummy Variables for* kutusuna atıp OK'e basın.
Hocam bizim hocamız bir ödev vermiş ben şimdi kukla değişken yorumlamalıyım ama hiç değer yok sadece evlilere 1, evli olmayanlara 0 diyip bir denklem koymuş ve hangisi maaşı daha çok etkiler, hangisini seçersiniz diyor. Ben dinledim ama siz excel üzerinden yapmışsınız benim elimde değer yok sadece denklem ve bunlar var ben hangisinin daha iyi etkilediğini nasıl anlarım, ne yapmam gerekiyor?
Merhaba Rabia. Elinde bir veri seti ya da bazı sayılar olması gerekiyor. Soruyu gdrive ya da wetransfer sitesine koyup linkini paylaşırsan adını gizleyip, daha iyi yardımcı olabilirim.
Öncelikle teşekkürler, 4 kategorili değişkenim için 3 kukla değişken oluşturdum fakat constant kısmında tüm ortalamayı veriyor ve karşılaştırmayı referans gruba göre değil de tüm gruba göre yapıyor, neden olabiilir sizce?
@@OfisLab Gümrük Birliği’nin Türkiye nin Ekonomisine Etkisini araştırdığım konumda 1987 den 2018 e kadar olan verilerimi Eviews programında kukla değişken modelini kullanarak analiz edeceğim bu videoda anlattığınız şekilde Eviews programında kukla değişken modelini yaparsam doğru sonuca ulaşabilir miyim? Ayrıca Gümrük Birliği ülkemizde 1996 dan itibaren başladığı için 1996 öncesine 0, 1996 sonrasına 1 vermem doğru mudur?
Öncelikle kullanacağın program fark etmez. İster eviews ister Excel istersen spss kullan, doğru şekilde regresyon denklemi kurulduktan sonra ya da menülerden doğru seçenekler seçilip değişken doğru şekilde kukla değişkene çevrildikten sonra sorun olmaz.
merhaba, regresyon analizi için kategorik değişkenlerim var ve kukla değişken oluşturmam gerekiyor anladığım kadarıyla, fakat çalışmaya göre bir kukla değişken seçemiyorum, referans olabilecek bir durum yok çünkü, 3 değişkenim var ve 3 ününde etkisine bakmak istiyorum, bunun için bir çözüm var mı acaba?
Merhaba. Üçünün de etkisine bakabilirsiniz ama yine de bir referans grubu seçin. Sonra Regresyon analizi sonucunda Constant adıyla görülen değer aslında sizin referans grubunuz oluyor. Constant'ın değerlerini referans grubunuz için kullanarak referans grubunuzun da etkisini yorumlayabilirsiniz.
@@OfisLab çok teşekkürler, fakat sorunumu çözmekte zorlanıyorum, websitenizde 1-1 görüşme için randevu almaya çalıştım fakat hata verdi, facebooktan mesaj yazdım, youtube kanalında daha aktif olduğunuz yazınca burdan yazmak istedim, online 1-1 destek hakkında bilgi almak istiyordum
hocam iyi günler ben spss de kukla değişkenli bir model yaptim.Cinsiyet nitel değişken ve IQ nicel değişken erkeklere 1 atadım ayrıca.Ödevimde daha zeki erkekler daha fazla ücret alır hipotezini yorumlanmasını istedi hoca etkileşimi yani cinsiyet ve ıq yu çarpıp denkleme ekledim fakat devamında katsayıları nasıl bulacağımı anlamadım hocam yardımcı olabilir misiniz acaba ?
bu soruya buradan cevap vermek zor. acikcasi her zaman regresyon katsayilarini SPSS ya da kullandigim baska istatistik veri analizi programi otomatik olarak hesaplayip bana veriyor. Bunun haricinde soruna cevap bulmak icin Google`a "regression coefficient formula" yazarak cikan kaynaklarda arama yapmani oneririm.
hocam merhaba kukla değişkenler hakkında bir odevim var veri seti bulup kukla değişkenlerle analizi yapılacak STATA'da. Fakat gerçek veriler bulunması lazımmış. Kukla değişkenler analizi gerçek veri seti ile nasıl yapılır hiç bir fikrim yok nasıl uyarlayabilirim. Mesela kadının cocuk sayısına göre ele aldıgım bir değişkenin verilerini nasıl bulabilriim ki
Merhaba hocam. SPSS'in Program files'taki klasöründe gerçek verilerden oluşan örnek veri setlerini bulabilirsiniz. Bunun için C:\Program Files\IBM\SPSS\Statistics\25\Samples\English yolunu izleyerek Samples klasörüne gidin. Orada 100 adetten fazla örnek veri seti bulunuyor. Bunlardan "anorectic.sav", "behavior.sav", "breakfast.sav" ve "car_insurance_claims.sav" vs gerçek veri setleridir. Hangislerinin gerçek hangilerinin uydurma olduğunu da şu siteden bulabilirsiniz: www.ibm.com/docs/de/spss-statistics/23.0.0?topic=system-sample-files
hocam ben eviewste kukla değişken oluşturdum. 2001 ve 2008 etkilerini analize katmak için kukla değişkenimi örnek 2001 krizi; 1990 dan 2000 yılına kadar 0 2001 ve 2008 yılına kadar 1 verdim bu kukla değişken doğru mu veri setim 1990-2008 dönemi .cvplarsınız çok memnun olurum.iyi çalışmalar.
Merhaba İbrahim. Oluşturacağın kukla değişken etkisine bakmak istediğin yıl olacağından, 2001 ve 2008 için ayrı kukla değişkenler oluşturman lazım. Örneğin, 2001'i 1 olarak kodlayıp, diğer bütün yılları 0 olarak kodladığın bir değişken oluştur. Bu değişken sayesinde 2001'in etkisine bakacaksın. Bir de 2008'i 1 kodlayıp, diğer bütün yılları 0 kodladığın başka bir değişken oluştur. Bu değişkenle de 2008'in etkisine bakacaksın.
@@OfisLab sizin dediğiniz gibi yaptıgımda kukla değişken anlamsız çıkıyor fakat 2001 öncesine 0 2001 ve sonrasına 1 atadıgımda kukla değişken anlamlı çıkıyor bole yaptıgımda sorun olur mu?
Aslında bu hipotezine göre değişir. Eğer bu şekilde kullanmak istiyorsan o zaman hipotezin şöyle olmalı: 2001 sonrasında 2001 öncesine göre daha fazla (daha az) ....... olduğu görülmektedir. Ama benim dediğim gibi yaparsan şunu yazabilirsin hipotez olarak: 2001 yılında diğer yıllara göre daha fazla (daha az)...... olduğu görülmektedir. 2008 yılında da diğer yıllara göre daha fazla (daha az) ......... olduğu görülmektedir. Anlamsız çıkması da bir bilgidir bunu da öyle düşünmek lazım.
Bu videoda anlattıklarımı beğendiysen, *SPSS Dersleri* isimli video serimi de izlemeni tavsiye ederim ua-cam.com/play/PL9dwBqqedrdzg5Ord9MA7kiR0B7eyhecp.html
Gelecekteki videolarımı kaçırmamak için kanalıma abone olmayı unutma 😊ua-cam.com/users/ofislab
Ayrıca, bu videoyu beğendiysen BEĞEN tuşuna da basarsan daha fazla kişinin bu videoyu görmesini sağlayıp onların da faydalanmasını sağlayabilirsin!
teşekkür ederiz, çok faydalı bir video hazırlamışsınız, izlediklerimin içinde en iyisiydi.
Rica ederim, elimden geldiğince konuyla ilgili bütün bilgiyi harmanlamaya çalışıyorum videolarımda.
tebrik ederim, bence başarılısınz, gayet güzel, diğer videolarınızı henüz izleyemedim, ama vaktim olduğunda izleyeceğim. teşekkür ederiz.
Çok teşekkürler yorumunuz için. Elimden geldiğince araştırıp bilgileri harmanlayıp videoları öyle çekiyorum.
SPSS 25'de kukla değişkenleri program kendi oluşturabiliyor. "Transform" menüsünden "create dummy variables" diyerek yapabilirsiniz.
Teşekkürler hocam ipucu için ;)
spss 25 te göremedim hocam sürüm olarak hangi sürümde var acaba
Çok başarılı bir video olmuş, çok yararlıydı, aklımdaki birçok soruyu çözmeme vesile oldu. Çok teşekkürler hocam.
rica ederim hocam faydası olduysa ne mutlu
Merhaba videonuz için çok teşekkürler, gerçekten çok açıklayıcı ve anlaşılır. Bir sorum vardı; 5'li likert ölçeğine sahip bağımlı değişken soruları için bu yöntemi nasıl uygulayacağız?
Merhaba hocam. O tarz bir değişken için bu yöntemi uygulanmamanız lazım çünkü o tarz bir değişkende cevapların iyiden kötüye veya negatiften pozitife doğru sıralandışını düşünüyoruz. Bu nedenle kukla değişkene çevirmeye gerek yok. Kukla değişkene çevirme sadece kategorik değişkenler için yapılıyor
@@OfisLab Anladım hocam çok teşekkürler cevabınız için, iyi çalışmalar.
Rica ederim hocam, iyi çalışmalar size de
hocam merhaba, videolarınız çok anlaşılır ve faydalı emeğinize sağlık
Teşekkürler hocam
Çok değerli bu bilgiler için teşekkürler emeğinize sağlık. Benim kafama takılan bir konu var istatistikte belki konu dağılacak ama özellikle spss’deki regresyon analizinde (hem linear hem de lojistikte) constant ı modelden kaldırma seçeneği var. Bu seçenek hangi durumlar için kullanılabilir. Örneğin modelde constant ın p değeri anlamsızsa onu modelden kaldırıp modeli tekrar test ettiğimizde daha uyumlu modeller buluyoruz. Bu durumlarda constant kullanmadan model kurmak daha uygun değil midir?
Cevap için şimdiden çok teşekkürler
Merhaba. Aslında constantı (intercept) kaldırarak onu tamamen kaldırmıyorsunuz, sadece 0’a eşitliyorsunuz. Yani normalde verimizde intercept mesela 3 ise onu 0’a eşitleyerek regresyon analizini yapmış oluyoruz. Bu da aslında yapmamamız gereken bir şey. Nedeni de şu; intercept 0 olduğu zaman yani biz onu 0’a zorla getirdiğimiz zaman artık verimizin gösterdiği regresyon denklemi şaşıyor, regreson doğrusu artık verilere daha da uzaklaşıyor genelde. Bunu sadece intercept’in 0’a eşit olduğuna yüzde yüz emin olduğunuzda yapmanız öneriliyor. Bu uzaklaşma demek regresyon denklemimizin verimizi daha kötü tahmin ediyor hale gelmesi demek.
Daha uyumlu modeller darken Rsquare değerinin artmasından bahsediyorsanız, constant olmadan hesaplanan Rsquare değerinin yanlış hesaplandığı söyleniyor. Bu makaleden inceleyebilirsiniz: web.ist.utl.pt/~ist11038/compute/errtheory/,regression/regrthroughorigin.pdf
Özetlemek gerekirse, slope değişiyor yani regresyon çizgimiz artık verilerden daha uzaklaşıyor. Bu da analiz sonuçlarına “bias” katıyor. Bunun neticesinde residual değerleri artıyor yani açıklanamayan varyans, doğal olarak, çünkü artık veriyi daha kötü şekilde açıklıyoruz. Bu da istemediğimiz bir şey.
@@OfisLab çok ama çok teşekkür ederim. Çok makbule geçti gerçekten🙏🏻🙏🏻
rica ederim kolaylıklar
hayırlı gunler dummy kukla değişkeni için esneklik hesaplaması yapılıyormu acaba
Esneklik hesaplaması ne demek bilmiyorum açıkçası. İngilizcesi ne?
Merhabalar çok faydalı bir anlatım, teşekkürler. Bir sorum olacak multivariate linear regresyon analizinde birden fazla kategorik değişken kullanabilir miyiz? Örneğin hem cinsiyeti hem sigara içmeyi hem de diyabeti dummy değişken yapıp çok değişkenli analize sokabilir miyiz?( sonuçta verdiğim örneklerin hepsi 2 kategorili ve her biri için tek dummy yeterli)
Merhaba. Hepsini aynı anda kullanabilirsiniz.
@@OfisLab teşekkürler🙏🏻👍
@@deadpool_8552 rica ederim ;)
Hocam merhaba ekonometri öğretmenim ödev vermiş soru şu: ''Ekonometrik bir araştırmada kukla değişken kullanımını örnekler vererek açıklayınız'' araştırma yaptım videonuzu izledim ama bu sorunun cevabını bulamadım. Yardımcı olursanız çok sevinirim
Merhaba hocam. Yardımcı olmak isterdim ancak alanım ekonometri olmadığı için sağlıklı bir cevap veremem. Kolaylıklar dilerim.
Merhaba, video için çok teşekkür ederim, çok açıklayıcı ve anlaşılır; zamanınıza ve emeğinize sağlık. Bir sorum olacak, eğer yardımcı olursanız çok sevinirim. Verdiğiniz örnekten yola çıkarak, diyelim ki medeni halin, gelir durumuna bir etkisi olup olmadığına bakıyoruz. Normal şartlarda, kukla değişken yaptığımızda illa bir değişkeni referans alıyoruz ve bu referans aldığımız değişkeni önceden ilgilendiğimiz hipotez üzerinden belirliyoruz. Ama diyelimki biz araştırmamızda hem bekarların, hem boşanmışların hem de evlilerin etkilerine bakıp anlamlı olup olmadığını görmek istiyoruz. Böyle bir durumda nasıl bir yol izlenebilir?
Merhaba Deniz. Tabiki bu grupların hepsinin etkilerine bakabilirsin. İlk sormak istediğim soru bu 3 grup haricinde başka grup var mı bu değişkende?
@@OfisLab Kendi çalışmamdan direk örnek verirsem; okuduğu sınıf ve stres derecesini ölçmek isiyorum. 1., 2., 3., 4. ve 5. sınıf öğrencileri benim değişkenlerim. Sizin videonuzdan yola çıkarak kukla değişkenleri yarattım ve 5. sınıf öğrencilerini referans aldım ancak dediğim gibi bütün sınıfların etkisini ölçmek istiyorum aslında.
Bu arada anketimnde bir çok sosyodemografik değişkenim var; medeni hali, okuduğu sınıf vb. ayrıca cevabı evet ya da hayır olacak "çocuğunuz var mı?" gibi sorularım da bulunuyor. Bu değişkenlerin stres üzerinde etkisi olup olmadığına bakmak amacıyla her madde için ayrı regresyon analizi yapıyorum. Ve dolayısıyla her bir madde de bir referansım oluyor ama aslında özel bir başlangıç hipotezim yok, bu da araştırmamı sıkıntıya sokuyor biraz.
Anladım. Aslında siz zaten referans grubunun etkisine de bakıyorsunuz onu eklemeseniz bile. Regresyon analizi yaptığınız zaman (Constant) adlı satırdaki değerler referans grubunun bağımlı değişken üzerindeki etkisini gösteriyor. Sadece beta değerleri olmuyor. Onun haricindeki değerler var: b değeri, SE, t-değeri ve significance değeri var. Yani bütün değişkenleriniz için referans grubu belirleyin, bu hipotezinize uygun olsa daha iyi olur ama olmasa bile fark etmez çünkü zaten referans grubunun etkisine de bakıyoruz.
@@OfisLab Cevaplarınız ve zamanınız için çok teşekkür ederim. Yalnız, bütün değişkenlerimdeki constant satırındaki signification .000 çıkıyor; yani her referans değişkenim için sonuç çok anlamlı çıkıyor (hatta muhtemelen (tahminimce) anlamlı olmaması gereken durumlarda hep referans aldığım değişken .000). Bu normal bir durum mu, yoksa şansıma hep çok anamlı olan değikeni mi referans almış bulundum ?
Rica ederim. Aynen onlar şansınıza anlamlı çıkmış diyebiliriz ;)
Hocam merhaba. Ben de analiz yaparken kukla değişkenden yararlandım ve 4 kategorili (yaşanılan kişi= yalnız, aile, arkadaş, özel bir insan) bir değişkenimi çevirdim. Analizde S1, S2 ve S3 adında üç farklı değişken oluşturdum. Tabloyu araştırmaya aktarırken bu üç değişkeni (S1, S2 ve S3), tek bir başlık altında (Yaşanılan kişi şeklinde) nasıl tabloya aktarabilirim? Şimdiden teşekkür ederim.
Merhaba hocam. Yorumla bu soruya cevap vermek çok zor. Tek tavsiyem arama motorlarından şu arama terimleriyle arama yapmak: regression table with dummy variables
neziha K.
Merhabalar, öncelikle kolay anlaşılır bir dille oluşturduğunuz videolar için çok teşekkür ederim sorum kukla değişkenlerle ilgili değil ancak yine de değişkenlerle ilgili olduğu için buraya yazmak istedim: kişisel bilgi formunda yer alan değişkenlerdeki bazı maddeleri hiç işaretleyen olmadıysa örneğin gelir değişkeninde herkes 1000₺ altını, 2000-3000₺ arası, ve 3000-4000₺ arasını işaretlemişse ancak değişkenlerde yer alan 5000₺ üstü aylık geliri işaretleyen kimse yoksa; analizlere bu maddeyi dahil ettiğimizde bir sorun olur mu? Bilgi Formunda yer aldığı için betimsel istatistik kısmında yer alacak bu maddeler frekans 0 %0 olarak ancak analiz kısmında dağılımın geçerliğini güvenirliğini ya da normalliğini etkiler mi bu durum?
Yani values kısmında böyle kimsenin işaretlemediği maddelere de yer vermenin ölçeğe bir etkisi olup olmadığını merak etmiştim
Merhabalar. Videoları beğendiğiniz için teşekkürler öncelikle.
Sorunuza gelirsek. Bu tip kimsenin seçmediği seçenekler verinizin dağılımının normalden sapmasına neden olabilir. Yani herkes düşük gelirli seçenekleri seçerse, verinizde pozitif skew dediğimiz şey oluşabilir. Bu da parametrik test yapmanızı engelleyebilir. Bunnu haricinde bir sorun olmaz. Verinizin normal dağılıp dağılmadığını test edin, eğer normal dağılıyorsa bir sorun olmadan parametrik testleri yapabilirsiniz. Eğer ANOVA yapacaksanız da veriniz normal dağılmasa bile yine de kullanabilirsiniz çünkü ANOVA normal dağılmayan verilere karşı da dayanıklı bir test.
Normal dağılımı test etmek için kanalımdaki şu videoyu izleyebilirsin: ua-cam.com/video/2B5VK2WLjJE/v-deo.html
Merhabalar hocam, video için çok teşekkürler. Yaptığım çalışmada kategorik bir değişkenim var (öğrenci annesinin eğitim durumu). Kukla değişken oluşturup üniversite ve üstü kademeyi 1, üniversite altı kademeyi 0 olarak kodladım. Bu kukla değişken ile t-testi yaptığımda üniversite üstü kademesi değişkeni bağımlı değişkeni anlamlı olarak etkiliyor (öğrenci annesi üniversite mezunu ise öğrenci puanı anlamlı ölçüde yüksek çıkıyor.). Fakat aynı kukla değişkeni çoklu regresyon analizine soktuğumda (toplam 8 bağımsız değişken var) annenin üniversite mezunu olması öğrenci başarısını olumsuz yönde etkiliyor (B= -16.178, SH= 3.849, β= -.068, t= -4.203, p=.000, İkili r= .205, Kısmi r= -.056.). Bunu nasıl yorumlayabilirim? Bir yerde hata mı yapıyorum? Cevap için çok teşekkürler...
Merhaba hocam. Regresyondaki en çok tartışılan konulardan biri de bu aslında. Bunun bir çok nedeni olabilir. Bir tanesi Suppression. Bunun ne olduğunu Google'da Suppression in Regression yazarak aratıp çözümlere bakabilirsiniz. Bir diğer etken de multicollinearity olabilir. VIF değerleriniz yüksekse ondan olabilir.
@@OfisLab Değişkenler arasındaki korelasyon .80'den küçük hocam. En yüksek VIF değeri 8.
Merhabalar hem kategorik (cinsiyet, medeni durum) değişkenler hem de sürekli değişken lineer analizde bakılabilir mi yoksa ayrı ayrı mı bakmak gerekiyor. Ayrıca regresyona sokmadan önce bu değişkenlerin korelasyonu olup olmadığına bakmalımıyız
Merhaba. Bakılabilir aynı anda. Aynı şekilde bu değişkenler arasındaki korelasyona bakılmalı.
@@OfisLab teşekkürler
Rica ederim
çok yararlı oldu sağolun
rica ederim hocam ;)
Hocam merhaba yüksek lisans tezim için veri setime hiyerarşik regresyon analizi yaptım, fakat bazı değerler diğer çalışmaların sonuçları ile kıyasladığımda oldukça düşük geldi.
Özellikle r kare ve f değerleri. Ayrıca sonuçlarımın çoğunun anlamlı çıkmadığını gördüm.
Bu durumun normal olup olmadığını anlayamadım. Veri setim ile ilgili bir problem mi var ve analizi yanlış mı yaptım yoksa bu sonuçlar normal ve raporlaştırılabilir mi?
Merhaba hocam. Kusura bakmayın biraz geç yanıt veriyorum.
Bu durum gayet normal. Eğer diğer çalışmalar sizinle tıpa tıp aynı örneklemi kullandıysa ve aynı şartlarda veri topladıysa o zaman şüphelenebilirsiniz. Bunun haricinde 4-eyes check dediğimiz yani bir başka uzmana verinizi gözden geçirmesi için gösterebilirsiniz. Mesela o kişiye verinizde uç değerleri bulmasını ve sizin yaptığınız analizi yapmasını isteyin. O da aynı şekilde buluyor mu diye kendi sonuçlarınızla karşılaştırın.
Ebrar hocam merhabalar, yaşadığınız problemin tamamen aynını şu an ben yaşıyorum yüksek lisans tezim için ve hala sorunun ne olduğunu nerde yanlış yaptığımı çözemedim, mesajınızın 6 ay önce yazıldığını ve sorunu çözmüş olma ihtimali ve bilgilerinizin taze olması umuduyla yazmak istedim, dönüş yaparsanız çok mutlu olurum, hayırlı günler
Hocam merhaba, yıllık çalışma saatleri gelir üzerine regres edildiğinde, hataların varyansının çalışma saatleri ile birlikte artması tam olarak neyi etkileyecek yardımcı olur musunuz? Birçok döküman okudum fakat net bir kanıya varamadım.
Hocam merhaba. Bu durumda bağımsız değişkenlerin normal dağılmamış olma ihtimali var. Bunu kontrol ettiniz mi?
Hocam multiple response sorular kukla değişken ile analiz edilebilir mi? Birden fazla yanıt olacağı için toplam %100'ü geçecek sorun olur mu?
Merhaba hocam. Böyle bir durumla hiç karşılaşmadım ama multiple response sorularda her yanıt için farklı değişken oluşturduysanız (örneğin okulu seçme nedeni olarak "ailem istedi" diye bir değişken "arkadaşlarım istedi" diye bir değişken ve "diğer" diye bir değişken oluşturmak) o zaman bunlara verilen yanıtları da 0 ve 1 olarak kodladığınız zaman bunları bu şekilde kullanabilirsiniz diye düşünüyorum.
@@OfisLab Aynen dediğiniz gibi yaptım Hocam, diğeri referans değişken olarak ele aldım. Umarım istatiksel olarak doğrudur. :) Teşekkür ederim.
Kolay gelsin ;)
Hocam anketimde bir senaryo verdim, buna göre 4 farklı yorumdan hangisini tercih edeceklerini tespit etmek istedim. Bunun neticesinde de 4 yorumun hepsinin de ölçek ortalama puanına etkisine bakmak istiyorum. Constantı neye göre seçmem gerekiyor? Seçtiğim constant analize dahil edilmeyecekse, onun etkisine nasıl bakmam gerekir.
Merhaba!
Constant olarak seçtiğiniz kategori, analizde 'referans kategori' olarak kullanılır. Diğer kategoriler, bu referans kategoriye göre karşılaştırılır. Genellikle, en sık rastlanan veya analiz açısından en ilginç olan kategori referans olarak seçilir.
Analizde constant olarak seçtiğiniz kategoriye doğrudan bir katsayı atanmaz, çünkü bu kategori analizin 'sıfır noktası' olarak kabul edilir. Diğer kategorilerin etkileri, bu referans kategorisine göre yorumlanır.
Constant dışındaki diğer kategorilerin etkilerini, regresyon analizi sonuçlarından elde edilen katsayılar ve p-değerleri ile değerlendirebilirsiniz. Bu katsayılar, referans kategoriye göre diğer kategorilerin ortalama puan üzerindeki etkisini gösterir.
Constantın etkisini değerlendirmek için, analizden çıkan sabit (intercept) değerine bakabilirsiniz. Sabit değer, tüm kukla değişkenlerin '0' olduğu durumu temsil eder ve bu referans kategorisinin ölçek ortalama puanını temsil edebilir.
Kukla değişkenlerle yapılan analizde, her bir değişkenin etkisini ve modelin genel uygunluğunu anlamak için R-kare, ayarlanmış R-kare ve F-testi gibi istatistiklere dikkat edin.
Eğer bu süreçle ilgili daha fazla yardıma ihtiyacınız olursa veya belirli bir kukla değişkenin seçimi konusunda daha fazla bilgi isterseniz, lütfen sormaktan çekinmeyin. Araştırmanızda başarılar dilerim!
@@OfisLab
Teşekkürler 🌸
@@minimalist6887 rica ederim ☺️
Hocam merhabalar, diyelimki referans değer oluşturmak istiyorum. Yani kanıtlamak istediğim sonuca göre bu değerleri vermek istiyorum. Bu durumda örneğin; eğitim durumuna göre ( ilkokul, ortaokul ve lise) ilkokulu referans değer olarak seçersem (n-1)'den : ilkokul 0 ortaokul: 1 ve lise: 1 ' mi olmalı ?
Merhaba hocam. İki tane kukla değişken oluşturmanız lazım. Birisnde ilkokul=0, lise=0 ve ortaokul=1 olmalı, diğerinde de ilkokul=0, lise=1, ortaokul=0 olmalı. Böylece ilkokul sizin referans grubunuz oluyor.
@@OfisLab çok teşekkür ederim 😊
rica ederim ;)
Sayın hocam. Yüksek orta düşük çok düşük olmak üzere 4 değişkenim var yaptığınız yöntemi uyguluyorum ancak kukla değişkenleri elde edemiyorum. Üç değişken oluyor. Tüm satırlar sıfır ve output ekranı oluşmuyor. Sorunun kaynağı nedir acaba. İyi çalışmalar
Merhaba hocam. Bu 4 grupta kaçar tane kişi var? Ölçeğin kaçlı? Toplam kaç kişiden veri topladınız?
@@OfisLab ölçek 5 li 440 kişi minimum 45 max 135
çok teşekkür ederim video için.size sorum olacaktı yardım edebilir misiniz?
1. kategorik değişkenlerle çoklu regresyon yapıyorum dummye dönüştürüp. UÇ değerleri tespit ederken Z,cook's ve leverageye göre uç değer çıkmıyor fakat mahalonobise göre çok fazla uç değer çıkıyor. şunu farkettim benim referans değişkenin olan dummy değişkenimin verilerinin hepsini uç değer olarak hesaplamış.2 farklı analizde de bu şekilde karşıma çıktı.yada mahalanobis ve leverageye göre uç dğer çıkıyor ama yine bu veriler referans grubumun tüm verileri oluyor. silemiyorumda bu durumda. Ne yapmam gerekiyor?
2.değişkenler arasında korelasyona baktığımda hepsi0.80 değerinden düşük ilişki gösteriyor. yani çoklu bağlantılılık yoktur demem gerekiyor sanırım fakat VIF değerleri biri hariç tüm değişkenlerim için 10 dan büyük çıktı.bu durumda çoklu bağlantı sorunu vardır mı demeliyim. ne yapmam gerekiyor bundan sonra?
Tabii ki, sorularınıza yardımcı olmaya çalişayım. İşte önerilerim:
Mahalanobis ve Referans Grubuyla İlgili Sorun:
Mahalanobis mesafesi bazen referans grubundaki verileri uç değer olarak gösterebilir, çünkü bu mesafe istatistiği, verilerin ortalama ve kovaryans matrisine göre hesaplanır ve referans grubunuz diğer kategorilerden farklı olabilir. Bu durumda, referans grubunuzun farklı bir kategoriyle kıyaslandığında farklı özelliklere sahip olup olmadığını inceleyin. Ayrıca, uç değer tespiti için alternatif yöntemler kullanmayı deneyebilirsiniz. Eğer referans grubunuzu değiştiremiyorsanız, modelinize bu uç değerlerin etkisini azaltacak yöntemler (örneğin, robust regression) eklemeyi düşünebilirsiniz.
Korelasyon ve VIF Değerleri:
Korelasyon değerleriniz 0.80'in altında olsa bile, VIF değerlerinin yüksek çıkması çoklu bağlantı sorununa işaret edebilir. Bu durum, değişkenler arasındaki doğrusal bağımlılığın daha karmaşık bir yapıya sahip olduğunu gösterebilir. VIF değerlerini düşürmek için şu adımları izleyebilirsiniz:
Değişken Seçimi: VIF değeri yüksek olan değişkenleri modelden çıkararak veya yeniden kodlayarak modelinizdeki çoklu bağlantıyı azaltabilirsiniz.
Ana Bileşen Analizi (PCA): Bu yöntemle değişkenleri daha az sayıda bileşene indirerek çoklu bağlantıyı azaltabilirsiniz.
Ridge Regression veya Lasso Regression: Bu regresyon türleri, çoklu bağlantı sorununu azaltmak için cezalandırma terimleri kullanır.
Umarım bu bilgiler yardımcı olur! Başka sorularınız olursa, çekinmeden sorabilirsiniz.
Hocam kukla değişkenlerini regresyon formülüne aktarırken beta değeriyle hangi değeri çarpıyoruz?
beta değerini değil b değerini (coefficient) kullanıyoruz hocam. her bir kukla değişkenle bu b değerini çarpıyoruz. Mesela medeni hal değişkeninde 3 grup varsa bundan 2 tane kukla değişken oluşturduktan sonra bu 2 kukla değişkeni D1 ve D2 olarak ya da kendi adlarıyla formüle ekledikten sonra yeni bir veri elde ettiğimizde bu veri D1e göre 1 ise bu değeri D1'in b değeriyle çarpıyoruz. Bu durumda tabi D2'ye göre 0 olacak ve D2'nin b değeriyle çarpıp o değeri 0 buluyoruz.
@@OfisLab Tam anlayamadım Hocam. videonun sonundaki 3 gruplu medeni hal değişkeni çıktılarına göre bir örnek formül yazabilirmisiniz. Ayrıca anlamsız çıkan kukla değişkenini formüle ekleyecekmiyiz?
Hocam yas ve cinsiyete gore adjust nasil yapilir? Bunu bir turlu bulamadim..
Merhaba hocam. Büyük ihtimal stepwise regresyon yapmanız gerekiyor yani regresyon menüsündeki adımları (model/step) kullanarak analizi yapmanız lazım eğer SPSS kullanıyorsanız. Bunun için birinci adıma yaş ve cinsiyet değişkenlerini girdikten sonra ikinci adıma diğer değişkenleri girerek analizi yapabilirsiniz.
@@OfisLab cok tesekkürler hocam
Rica ederim hocam ;)
Hocam bir kukla değişkeni T testine dahil edemez miyiz sonuçta 0 ve 1 olarak 2 kategorili değişken. Istatiksel acidan yanlış olur mu?
Merhaba hocam. Dahil edebilirsin iki gruplu olduktan sonra her değişken olur. Tek sorun şu: bir değişkeni kukla değişkene dönüştürdüysen o değişken 2 den daha fazla grupluydu demektir. Eğer durum buysa o zaman anova kullanman daha iyi olur. Eğer değişken zaten 2 grupluysa (mesela cinsiyet: kadın ve erkek) o zaman t test ile yapmalısın. Zaten bu durumda cinsiyet değişkeni kukla değişken olarak tanımlanmıyor. Dichotomous değişken olarak tanımlanıyor.
@@OfisLab Teşekkürler Hocam. Ben çoklu yanıt içeren soruları kukla değişkenlere böldüm yani anova yapmam mümkün değil çünkü normal bir kategorik değişkenli soru değil. Öte yandan, mesela gelir düzeyi gibi şıklar arasında bir bağlantı olmadığı için ve her seçenek birbirinden bağımsız olduğu için t testi olabilir gibime geldi ama siz daha iyi bilirsiniz.
@@OfisLab Örnek vermem gerekirse, sosyal medyayı gündemi takip etmek için kullanıyorum (0-1), içerik paylaşmak için kullanıyorum (0-1) ya da başkalarını takip etmek için kullanıyorum (0-1) gibi... Burada t test ile içerik paylaşmak için kullanmanın sürekli değişkenimle olan ilişkisine bakacağım mesela...
Evet bu örneğe göre en iyi çözüm o değişkenlerle (0-1 kodlanmış) t test yapmak. Sonuç olarak da içerik paylaşmak için kullananlarla içerik paylaşmak için kullanmayanlar arasında bağımlı değişken skorlarının farklılaştığı/farklılaşmadığı bulundu diye rapor edilebilir. Bu arada gruplar arasında ranking gibi bir ilişki olmadığında aslında biz t test ve anova yapıyoruz. Eğer aralarında ranking olsaydı o zaman regresyon yapılabilirdi
@@OfisLab Sağ olun Hocam yavaş yavaş mantığını kavradım şu spss'in sizin sayenizde... 🙏👍
Kukla değişkeni Excel üzerinde nasıl yapabiliriz
Excel'de yapmak için IF yani EĞER formulünü kullanabilirsiniz. EĞER dedikten sonra A1=1 ise onun 1 olarak yeni hücreye geçirilmesini, diğer türlü 0 olarak kalmasının formülünü yazın. Daha sonra bunu diğer kukla değişkenler için de uygulayın.
Hocam iyi günler..kukla değişkeni kullanarak yapisal kirilma olan donemleri ayrışırdık. Ardl üzerinden cusom ve cusomsq grafikleri gozlem donemi 2009-q1 ile 2021a2 olnasina karşın son 3 donemi gosteriyor. . Tamamini kapsayacak şekilde nasil ayarlayabiliriz.. testin tum 0 lari aldigina nasil emin olabiliriz.
İyi günler hocam. toplam kaç grubunuz var? 2009q1 ve 2021q2 arası yani 46 grup mu?
@@OfisLab Toplam 50 çeyreklik veri mevcut
Kukla değişkenleri kendiniz oluşturmadınız mı? Bu kadar çok kukla değişken oluşturulması gereken durumda SPSS'in menülerini kullanmak daha işlevsel olabilir. Transform menüsünde Create Dummy Variables seçeneğine tıklayın ve açılan menüde Root N:ames'e bu kukla değişkenler için bir temel isim verin. Ayrıca kukla değişkene dönüştürülecek değişkeni de *Create Dummy Variables for* kutusuna atıp OK'e basın.
Hocam bizim hocamız bir ödev vermiş ben şimdi kukla değişken yorumlamalıyım ama hiç değer yok sadece evlilere 1, evli olmayanlara 0 diyip bir denklem koymuş ve hangisi maaşı daha çok etkiler, hangisini seçersiniz diyor. Ben dinledim ama siz excel üzerinden yapmışsınız benim elimde değer yok sadece denklem ve bunlar var ben hangisinin daha iyi etkilediğini nasıl anlarım, ne yapmam gerekiyor?
Merhaba Rabia. Elinde bir veri seti ya da bazı sayılar olması gerekiyor. Soruyu gdrive ya da wetransfer sitesine koyup linkini paylaşırsan adını gizleyip, daha iyi yardımcı olabilirim.
@@OfisLab hocam facebook hesabınıza soruyu mesaj attım.
Öncelikle teşekkürler, 4 kategorili değişkenim için 3 kukla değişken oluşturdum fakat constant kısmında tüm ortalamayı veriyor ve karşılaştırmayı referans gruba göre değil de tüm gruba göre yapıyor, neden olabiilir sizce?
Merhaba. Öyle olmaması gerekiyor. Tekrar herşeyi kontrol eidp bir daha denemenizi öneririm.
Tamamdır, teşekkürler
Rica ederim
Hocam lojistik regresyonda da kullanabilir miyiz kukla değişkeni?
Hocam kukla değişken ile ilgili bir soru sorabilir miyim acaba
Tabi ki
@@OfisLab Gümrük Birliği’nin Türkiye nin Ekonomisine Etkisini araştırdığım konumda 1987 den 2018 e kadar olan verilerimi Eviews programında kukla değişken modelini kullanarak analiz edeceğim bu videoda anlattığınız şekilde Eviews programında kukla değişken modelini yaparsam doğru sonuca ulaşabilir miyim? Ayrıca Gümrük Birliği ülkemizde 1996 dan itibaren başladığı için 1996 öncesine 0, 1996 sonrasına 1 vermem doğru mudur?
Öncelikle kullanacağın program fark etmez. İster eviews ister Excel istersen spss kullan, doğru şekilde regresyon denklemi kurulduktan sonra ya da menülerden doğru seçenekler seçilip değişken doğru şekilde kukla değişkene çevrildikten sonra sorun olmaz.
1996 öncesine 0 ve sonrasına 1 dersen dediğin gibi gümrük birliğinin etkisine bakabilirsin, doğru bir yaklaşım bu.
@@OfisLab çok teşekkür ederim hocam
merhaba, regresyon analizi için kategorik değişkenlerim var ve kukla değişken oluşturmam gerekiyor anladığım kadarıyla, fakat çalışmaya göre bir kukla değişken seçemiyorum, referans olabilecek bir durum yok çünkü, 3 değişkenim var ve 3 ününde etkisine bakmak istiyorum, bunun için bir çözüm var mı acaba?
Merhaba. Üçünün de etkisine bakabilirsiniz ama yine de bir referans grubu seçin. Sonra Regresyon analizi sonucunda Constant adıyla görülen değer aslında sizin referans grubunuz oluyor. Constant'ın değerlerini referans grubunuz için kullanarak referans grubunuzun da etkisini yorumlayabilirsiniz.
@@OfisLab çok teşekkürler, fakat sorunumu çözmekte zorlanıyorum, websitenizde 1-1 görüşme için randevu almaya çalıştım fakat hata verdi, facebooktan mesaj yazdım, youtube kanalında daha aktif olduğunuz yazınca burdan yazmak istedim, online 1-1 destek hakkında bilgi almak istiyordum
merhaba. info@ofislab.info adresinden ulaşabilirsiniz. Web sitesindekim randevu formunda sorun var bu aralar çalışmıyor
hocam iyi günler ben spss de kukla değişkenli bir model yaptim.Cinsiyet nitel değişken ve IQ nicel değişken erkeklere 1 atadım ayrıca.Ödevimde daha zeki erkekler daha fazla ücret alır hipotezini yorumlanmasını istedi hoca etkileşimi yani cinsiyet ve ıq yu çarpıp denkleme ekledim fakat devamında katsayıları nasıl bulacağımı anlamadım hocam yardımcı olabilir misiniz acaba ?
bu soruya buradan cevap vermek zor. acikcasi her zaman regresyon katsayilarini SPSS ya da kullandigim baska istatistik veri analizi programi otomatik olarak hesaplayip bana veriyor. Bunun haricinde soruna cevap bulmak icin Google`a "regression coefficient formula" yazarak cikan kaynaklarda arama yapmani oneririm.
hocam merhaba kukla değişkenler hakkında bir odevim var veri seti bulup kukla değişkenlerle analizi yapılacak STATA'da. Fakat gerçek veriler bulunması lazımmış. Kukla değişkenler analizi gerçek veri seti ile nasıl yapılır hiç bir fikrim yok nasıl uyarlayabilirim. Mesela kadının cocuk sayısına göre ele aldıgım bir değişkenin verilerini nasıl bulabilriim ki
Merhaba hocam. SPSS'in Program files'taki klasöründe gerçek verilerden oluşan örnek veri setlerini bulabilirsiniz. Bunun için C:\Program Files\IBM\SPSS\Statistics\25\Samples\English yolunu izleyerek Samples klasörüne gidin. Orada 100 adetten fazla örnek veri seti bulunuyor. Bunlardan "anorectic.sav", "behavior.sav", "breakfast.sav" ve "car_insurance_claims.sav" vs gerçek veri setleridir. Hangislerinin gerçek hangilerinin uydurma olduğunu da şu siteden bulabilirsiniz: www.ibm.com/docs/de/spss-statistics/23.0.0?topic=system-sample-files
@@OfisLab tesekkurler hocam
@@merveissvn3161 rica ederim hocam
Merhabalar Hocam, mail adresiniz var mıdır acaba?
Merhaba. Var ama bu aralar sadece buradan yazılan sorulara cevap verecek vaktim var maalesef.
hocam ben eviewste kukla değişken oluşturdum. 2001 ve 2008 etkilerini analize katmak için kukla değişkenimi örnek 2001 krizi; 1990 dan 2000 yılına kadar 0 2001 ve 2008 yılına kadar 1 verdim bu kukla değişken doğru mu veri setim 1990-2008 dönemi .cvplarsınız çok memnun olurum.iyi çalışmalar.
Merhaba İbrahim. Oluşturacağın kukla değişken etkisine bakmak istediğin yıl olacağından, 2001 ve 2008 için ayrı kukla değişkenler oluşturman lazım. Örneğin, 2001'i 1 olarak kodlayıp, diğer bütün yılları 0 olarak kodladığın bir değişken oluştur. Bu değişken sayesinde 2001'in etkisine bakacaksın. Bir de 2008'i 1 kodlayıp, diğer bütün yılları 0 kodladığın başka bir değişken oluştur. Bu değişkenle de 2008'in etkisine bakacaksın.
@@OfisLab sizin dediğiniz gibi yaptıgımda kukla değişken anlamsız çıkıyor fakat 2001 öncesine 0 2001 ve sonrasına 1 atadıgımda kukla değişken anlamlı çıkıyor bole yaptıgımda sorun olur mu?
Aslında bu hipotezine göre değişir. Eğer bu şekilde kullanmak istiyorsan o zaman hipotezin şöyle olmalı: 2001 sonrasında 2001 öncesine göre daha fazla (daha az) ....... olduğu görülmektedir. Ama benim dediğim gibi yaparsan şunu yazabilirsin hipotez olarak: 2001 yılında diğer yıllara göre daha fazla (daha az)...... olduğu görülmektedir. 2008 yılında da diğer yıllara göre daha fazla (daha az) ......... olduğu görülmektedir. Anlamsız çıkması da bir bilgidir bunu da öyle düşünmek lazım.
@@OfisLab tşk ederim. her iki kukla çeşidini de kullabilirim yani .
Rica ederim. Her ikisini de kullanabilirsin evet.
hocam gretl bilginiz var mı
gretl nedir bilmiyorum açıkçası
@@OfisLab ekonometri de kullanilan istatistik verileri isleyen program teşekkürler cevabınız için
Rica ederim hocam, kolaylıklar ;)
Hocam benim ödevim var bir türlü anlayıp yapamadım bana yardımcı olur musunuz lütfen
Merhaba Selin. Buraya yorum olarak soruların varsa yazabilirsin, bildiğim kadarıyla yardımcı olmaya çalışırım.
OfisLab teşekkürler hocam ödevimi teslim ettim
Tamam öyleyse, başarılar ;)
nasil yaptın beni de aydınlat lütfennn