W teście Kołmogorowa-Smirnowa wyskakuje mi komunikat, że wartości powtórzone nie powinny być obecne w teście Kolmogorowa-Smirnowa. Rozumiem, że muszą to być tylko wartości unikalne?
Tak. Pojawia się takie ostrzeżenie. Błędem byłoby tu usunięcie duplikatów - to by zmieniało nasz testowany rozkład empiryczny. Sensowne wydaje mi się natomiast dodanie do duplikatów bardzo małej liczby losowej (to sprawi, że dla testu będą się one różnić). np. z przedziału -0.0001; +0.0001 (chyba, że sama zmienna przyjmuje bardzo małe wartości - wtedy wartość losowa powinna być jeszcze mniejsza). Osobiście zalecałbym jednak wykorzystanie wykresu Q-Q + Shapiro-Wilk Normality Test. Test Shapiro Wilka został zmodyfikowany tak, że teraz (wersja z R funkcja shapiro.test()) można go stosować także do dużych prób (3 - 5000). Jeśli ma Pan/Pani próbę większą niż 5000 - to polecam ocenę wzrokową w oparciu o stosowne wykresy. Pozdrawiam
Mam ten sam problem co @quegon6125 @@zArkadiuszem rozumiem, że skoro u Pana ten test dziala, to Pan ma zmodyfikowany plik? Może Pan go gdzieś udostępnić? Chętnie bym poćwiczyła. Podobny komunikat wyskakiwał mi, gdy próbowałam test Wilcoxona i pojawiały się powtórzone wartości. Czy R nie jest odporny na takie sytuacje (dla przykładu LabVIEW nie ma z tym problemu)? Jeśli tak, to jest to jego bardzo poważne ograniczenie, bo jeśli chcemy zautomatyzować pracę, to ciężko nam zakładać brak powtórzeń, a ocena wzrokowa nie jest oceną obiektywną i nie daje się zautomatyzować. Ręczne wyszukiwanie tych samych próbek i modyfikacji ich wartości w zbiorze bardzo dużych danych nie wchodzi w rachubę.
R to w znacznej mierze zbiór pakietów - jeśli coś można poprawić - zasadne jest dodanie (stworzenie) nowego pakietu. R rozwija się właśnie przez taką pracę ludzi zainteresowanych tematem. Tu powtórzę wcześniejszą sugestię: "Osobiście zalecałbym jednak wykorzystanie wykresu Q-Q + Shapiro-Wilk Normality Test". @@acha10000
W teście Kołmogorowa-Smirnowa wyskakuje mi komunikat, że wartości powtórzone nie powinny być obecne w teście Kolmogorowa-Smirnowa. Rozumiem, że muszą to być tylko wartości unikalne?
Tak. Pojawia się takie ostrzeżenie. Błędem byłoby tu usunięcie duplikatów - to by zmieniało nasz testowany rozkład empiryczny. Sensowne wydaje mi się natomiast dodanie do duplikatów bardzo małej liczby losowej (to sprawi, że dla testu będą się one różnić). np. z przedziału -0.0001; +0.0001 (chyba, że sama zmienna przyjmuje bardzo małe wartości - wtedy wartość losowa powinna być jeszcze mniejsza).
Osobiście zalecałbym jednak wykorzystanie wykresu Q-Q + Shapiro-Wilk Normality Test. Test Shapiro Wilka został zmodyfikowany tak, że teraz (wersja z R funkcja shapiro.test()) można go stosować także do dużych prób (3 - 5000). Jeśli ma Pan/Pani próbę większą niż 5000 - to polecam ocenę wzrokową w oparciu o stosowne wykresy. Pozdrawiam
Mam ten sam problem co @quegon6125
@@zArkadiuszem rozumiem, że skoro u Pana ten test dziala, to Pan ma zmodyfikowany plik? Może Pan go gdzieś udostępnić? Chętnie bym poćwiczyła.
Podobny komunikat wyskakiwał mi, gdy próbowałam test Wilcoxona i pojawiały się powtórzone wartości. Czy R nie jest odporny na takie sytuacje (dla przykładu LabVIEW nie ma z tym problemu)? Jeśli tak, to jest to jego bardzo poważne ograniczenie, bo jeśli chcemy zautomatyzować pracę, to ciężko nam zakładać brak powtórzeń, a ocena wzrokowa nie jest oceną obiektywną i nie daje się zautomatyzować. Ręczne wyszukiwanie tych samych próbek i modyfikacji ich wartości w zbiorze bardzo dużych danych nie wchodzi w rachubę.
R to w znacznej mierze zbiór pakietów - jeśli coś można poprawić - zasadne jest dodanie (stworzenie) nowego pakietu. R rozwija się właśnie przez taką pracę ludzi zainteresowanych tematem. Tu powtórzę wcześniejszą sugestię: "Osobiście zalecałbym jednak wykorzystanie wykresu Q-Q + Shapiro-Wilk Normality Test". @@acha10000