Uczenie maszynowe - Wprowadzenie do wartości odstających z użyciem winsoryzacji | DATAcademy

Поділитися
Вставка
  • Опубліковано 11 гру 2024

КОМЕНТАРІ • 10

  • @klak6279
    @klak6279 2 роки тому +2

    Super, czekam na kolejny film

  • @czystadedukcja
    @czystadedukcja 2 роки тому +1

    Kurczę, brakuje takich materiałów po polsku, więc tym bardziej szkoda, że zapowiada się kolejny kurs, który pokazuje co jak zakodować, ale pozostawia wiele nieścisłości i niedopowiedzeń.
    1) Podana jest definicja kwantyla z rozkładu teoretycznego (już pomijam, że nie jest to formalna definicja), a potem liczone są estymatory kwartyli na podstawie próby. Wobec tego, że są to estymatory, definicja ma się nijak do tego, co dzieje się potem w obliczeniach. Przykładowo 30% obserwacji jest mniejsza od estymatora pierwszego kwartyla i można odnieść wrażenie, że mamy tu pewną sprzeczność (12:12 - 12:17). Nie zostało to w żaden sposób skomentowane.
    2) Brak jakiegokolwiek komentarza, skąd więcej niż jedna metoda wyznaczania kwantyli (przecież definicja wydaje się prosta i jednoznaczna).
    3) Istnieje znana miara asymetrii, która nigdy nie osiągnie wartości spoza przedziału [-1, 1]. Podawanie reguł interpretacji wyniku bez odniesienia się do tego, co konkretnie rozumiemy przez miarę asymetrii, budzi niejasności (warunek |A| > 1 w odniesieniu do jednej z miar nigdy nie będzie spełniony).
    4) Użyta funkcja skew jest z jakiego pakietu? W pandas domyślnie liczą się momenty centralne z próby, a w scipy są to momenty centralne z populacji...
    5) Nie usłyszałem przestrogi przed bezrefleksyjnym usuwaniem / modyfikowaniem wartości odstających. Jak to jest? Dobieramy dane pod konkretny algorytm, czy algorytm pod konkretne dane?

    • @Datacademypl
      @Datacademypl  2 роки тому +1

      Cześć!
      Filmiki, które tworzymy mają być jedynie wprowadzeniem dla osób "zielonych" z tego tematu - mają być zwięzłe i informatywne. Można powiedzieć, że jest to pewny zwiastun tego, co się dzieje na kursie. Jeżeli mielibyśmy wchodzić w bardzo specyficzne szczegóły, to te filmiki trwałyby ponad godzinę - nie o to nam chodzi, bo to pokrywamy na kursie i na nie serdecznie zapraszamy.
      Na kursie dokładnie tłumaczymy, czym są estymatory obciążone i nieobciążone, jaka jest różnica pomiędzy statystykami liczonymi w populacji i próbie i wiele innych rzeczy.
      Weź proszę pod uwagę to, że jeśli chce się zachęcić nowe osoby do nauki statystyki oraz uczenia maszynowego, należy używać prostego języka, oraz nie zalewać ich bardzo specyficznym słownictwem. A dokładnie taki jest nasz cel - zachęcić ludzi do przebranżawiania się i pokazać, że nauka Data Science nie jest czarną magią.
      W ramach dostępnych obecnie kursów wprowadzane są pojęcia statystyczne w takim zakresie w jakim potrzebne są do zrozumienia zagadnień Data Science i do bieżącej pracy analityka danych. W przyszłości planujemy również wypuścić kurs dedykowany stricte statystyce.

  • @ar2rtg491
    @ar2rtg491 2 роки тому

    Super materiał . Takie pytanko.... na Waszych kursach ta wiedza już ma być opanowana?

    • @Datacademypl
      @Datacademypl  2 роки тому

      Dzięki ☺️ Nie, ta wiedza nie jest wymagana na naszych kursach. To i inne zagadnienia tłumaczymy od podstaw na naszych kursach w obszerny sposób 🙂

  • @Malins2000
    @Malins2000 2 роки тому +2

    cześć z python (kodem) jest baaardzo cicho :(
    Duży błąd nadpisanie słowa kluczowego pythona - "max"

    • @Datacademypl
      @Datacademypl  2 роки тому

      Cześć, dzięki za uwagę, nad dźwiękiem popracujemy. Co do drugiej uwagi, faktycznie dobrą praktyką jest nie tworzyć zmiennych o nazwach wbudowanych funkcji ale nie jest to błąd sam w sobie - Python na to zezwala :)

    • @Malins2000
      @Malins2000 2 роки тому

      @@Datacademypl technicznie nie - przecież się kompiluje.
      Ale to jest po prostu błąd.
      Tak jakby print zastąpić jakąś zmienną.
      Każdy tutorial/lektor/nauczyciel pythona zawsze jasno mówi, by omijać słowa kluczowe.
      Lepiej nagrajcie tę sekcję jeszcze raz. Z lepszym dźwiękiem i poprawnym kodem.

    • @kacperwojkowski665
      @kacperwojkowski665 2 роки тому +2

      @@Malins2000 Mi się filmik bardzo podobał - wszystko było dobrze wytłumaczone. Co do przypisanie zmiennej do "max" to oczywiście jest to niepoprawne, ale pamiętajmy o tym, że to tylko przykładowy kod zrobiony tylko na potrzeby filmu - wydaje mi się, że przyrównanie tego do sytuacji z "przypisaniem czegoś pod print" jest trochę przesadą. Tak czy siak czekam na więcej takich filmów :)

    • @MissMeisel
      @MissMeisel 2 роки тому

      @@kacperwojkowski665 po co uczy kogos z bledem? W kadym filmie gosc popelnia podobne gafy. mysle. ze brakuje mu podstaw,