- 63
- 45 224
Analiza danych z Arkadiuszem
Приєднався 19 лип 2022
Google Colab + Python dla początkujących - Wprowadzenie
Wprowadzenie do Google Colab. Otwieranie arkusza Excel. Wstęp do analizy danych z Pythonem.
Sekcje
00:00 Wprowadzenie do Google Colab - tworzenie notatnika
02:50 Robienie notatek - podstawy Markdown
08:46 Praca z kodem
13:48 Otwieramy plik Excel w Colab
Sekcje
00:00 Wprowadzenie do Google Colab - tworzenie notatnika
02:50 Robienie notatek - podstawy Markdown
08:46 Praca z kodem
13:48 Otwieramy plik Excel w Colab
Переглядів: 216
Відео
Książka R w naukach społecznych
Переглядів 14121 день тому
Książka: R w naukach społecznych. Zastosowania naukowe i edukacja Informacje o książce: scholar.com.pl/pl/glowna/8867-r-w-naukach-spolecznych-zastosowania-naukowe-i-edukacja.html
Cała aplikacja ML - zamieszczanie w Internecie
Переглядів 399Місяць тому
#ml #shiny #datascience #rlanguage #rstudio Wykorzystanie trzech algorytmów ML w aplikacji shiny. Wersja rozbudowana. Aplikacja wspierająca decyzję. Modele klasyfikacji. XAI - wyjaśnialna AI. Możliwość publikacji - zamieszczenia w Internecie #ml #shiny #datascience #rlanguage #rstudio
Maszynowe uczenie w aplikacji
Переглядів 2562 місяці тому
Wykorzystanie trzech algorytmów ML w aplikacji shiny. Powiązanie maszynowego uczenia (ML) z aplikacją shiny. Aplikacja wspierająca decyzję. Modele klasyfikacji.
Aplikacja dydaktyczna w Shiny
Переглядів 2214 місяці тому
Aplikacja dydaktyczna napisana w języku R (pakiet Shiny). Aplikacja obrazuje proces oceny założenia normalności rozkładu. Skrypt do pobrania: github.com/zarkadiuszem/YT-zarkadiuszem-
Gotowa aplikacja Shiny - Shiny i bslib
Переглядів 2004 місяці тому
Skrypt do pobrania: github.com/zarkadiuszem/YT-zarkadiuszem- Prosta ale funkcjonalna aplikacja Shiny. Biblioteka bslib.
Shiny - wykresy w aplikacji
Переглядів 995 місяців тому
Shiny, ggplot2, dplyr, wykresy w aplikacji. Wybór zmiennych i wariantów.
shiny wprowadzenie - aplikacje w R
Переглядів 2055 місяців тому
pakiet shiny wprowadzenie - aplikacje w R, Dashboard, tworzenie aplikacji w rStudio
SQL + R. Baza MySQL w RStudio
Переглядів 1756 місяців тому
Obsługa relacyjnych baz danych (SQL) w środowisku R (RStudio).
Korelacja w SQL - r Pearsona (MySQL)
Переглядів 1336 місяців тому
Współczynnik korelacja r Pearsona w SQL (MySQL). Widoki i zmienne użytkownika w analizach statystycznych. Skrypt do pobrania: github.com/zarkadiuszem/YT-zarkadiuszem-.git
SQL - analiza statystyczna
Переглядів 2357 місяців тому
Grupowanie danych klauzule GROUP BY, HAVING. Wybrane funkcje statystyczne, średnia, wariancja, odchylenie statystyczne, suma, częstość. Obliczenia statystyczne. Praca z wieloma tabelami. Skrypt i schemat do pobrania: github.com/zarkadiuszem/YT-zarkadiuszem-.git Aplikacja do otwarcia/tworzenia schematu: app.diagrams.net/
SQL łączenie tabel - MYSQL
Переглядів 1457 місяців тому
Praca z trzema tabelami SQL. Tworzenie i łączenie tabel. LEFT JOIN, RIGHT JOIN. ON DELETE CASCADE Skrypt i schemat do pobrania: github.com/zarkadiuszem/YT-zarkadiuszem-.git Aplikacja do otwarcia/tworzenia schematu: app.diagrams.net/
MySQL - praca z jedną tabelą SQL
Переглядів 1758 місяців тому
Praca w MySQL: tworzenie bazy danych, tabeli, wypełnianie tabeli danymi, podstawowe zapytania. Wybrane typy danych, klauzule, operatory, ograniczenia Skrypt do pobrania: github.com/zarkadiuszem/YT-zarkadiuszem-.git MySQL Workbench: www.mysql.com/downloads/
SQL w analizie danych - relacyjne bazy danych wprowadzenie
Переглядів 5538 місяців тому
Czym są relacyjne bazy danych. Rola SQL w analizie danych. System zarządzania bazami danych, relacja jeden do wielu, SQL a inne narzędzia analityczne, podstawowe pojęcia. SQL w analizie danych - wprowadzenie do relacyjnych baz danych. Problem redundancji.
500 subskrypcji - 500 subskrybentów statystyki kanału YT
Переглядів 1809 місяців тому
500 subskrypcji - 500 subskrybentów statystyki kanału YT. Czy łatwo zdobyć 500 subskrypcji, ile to trwa? O czym warto pamiętać? Jakich błędów nie popełniać? Co daje 500 subskrybentów? 500 subskrypcji - zarabianie na kanale YT.
tidymodels - przykład maszynowego uczenia z tidymodels
Переглядів 3159 місяців тому
tidymodels - przykład maszynowego uczenia z tidymodels
Uczenie nienadzorowane - algorytm k-średnich
Переглядів 44510 місяців тому
Uczenie nienadzorowane - algorytm k-średnich
Porównanie algorytmów klasyfikacji ML - Wybór zmiennych w modelu ML
Переглядів 23710 місяців тому
Porównanie algorytmów klasyfikacji ML - Wybór zmiennych w modelu ML
10 błędów przy pisaniu prac dyplomowych - prace magisterskie, licencjat
Переглядів 143Рік тому
10 błędów przy pisaniu prac dyplomowych - prace magisterskie, licencjat
K najbliższych sąsiadów - algorytm klasyfikacji knn
Переглядів 775Рік тому
K najbliższych sąsiadów - algorytm klasyfikacji knn
Las losowy - projekt maszynowego uczenia
Переглядів 742Рік тому
Las losowy - projekt maszynowego uczenia
Poziomy pomiaru - zmienna zależna i niezależna
Переглядів 834Рік тому
Poziomy pomiaru - zmienna zależna i niezależna
Maszynowe Uczenie. Projekt klasyfikacji - Drzewa decyzji
Переглядів 787Рік тому
Maszynowe Uczenie. Projekt klasyfikacji - Drzewa decyzji
Analiza składowych głównych (PCA) - uczenie maszynowe (redukcja zmiennych)
Переглядів 1,3 тис.Рік тому
Analiza składowych głównych (PCA) - uczenie maszynowe (redukcja zmiennych)
Sondaże społeczne - interpretacja wyników badań sondażowych
Переглядів 221Рік тому
Sondaże społeczne - interpretacja wyników badań sondażowych
Uczenie maszynowe - CARET i funkcja preProcess()
Переглядів 406Рік тому
Uczenie maszynowe - CARET i funkcja preProcess()
❤
Dziękuję za świetne wytłumaczenie jak to działa, mam przedmiot z analizą danych na studiach i bardzo mi pomogłeś:)
Cieszę się. Pozdrawiam
Czy mogę 'zunifikować' jakoś dane które zostaną poddane analizie PCA? Różnice pomiędzy próbkami są na tyle duże, że PCA nie wiele wyjaśnia, a gdy przeliczę je na udział % to wykres wygląda już lepiej. Czy taki zabieg nie jest błędny?
Rozumiem to pytanie w następujący sposób: Czy powinno się standaryzować dane przed przeprowadzeniem PCA (tak, żeby różne zmienne miały porównywalne wariancje)? Tak - jest to zalecane - wtedy takie ujednolicenie sprawi, że w analizie nie będą dominować zmienne o największych rozstępach - wariancjach. Mam nadzieję, że jest to odpowiedź na Pani pytanie. Pozdrawiam
Bardzo porządnie wytłumaczone funkcję dużo łatwiej jest przez to je zrozumieć
Dziękuję i pozdrawiam
Dziękuje bardzo ! jest pan dla mnie ratunkiem
Cieszę się. Pozdrawiam
Gratulacje!
Dziękuję i pozdrawiam
Właśnie kupiłem i to nie tylko przez ogromny sentyment do "Analiza danych z Arkadiuszem". A R nadaje się nie tylko do nauk społecznych, do medycznych też, wolę go od Statisticy.
Dziękuję za miłe słowa. Mam nadzieję, że książka się Panu spodoba. Pozdrawiam
Bardzo dobre podejście do zagadnień z zakresu datascience. Super się tego słucha, wszystko dobrze wyjaśnione w prosty sposób. 👍👍👍👍👍👍 Czy planujesz coś z zakresu reguł asocjacyjnych z wykorzystaniem R ? Bardzo jestem ciekaw tego tematu.
Dziękuję. Myślę, że tak. Ale jest "kolejka" tematów, które chcę omówić. Między innymi chcę też rozpocząć temat Pythona w analizie danych. Więc nie potrafię powiedzieć kiedy.
@@zArkadiuszem A czy masz może doświadczenie z językiem Julia ? Kiedyś czytałem o nim, sporo ludzi dobrze się wypowiadało na jego temat w zakresie datascience. Ponoć Rust jeżeli chodzi o uczenie maszynowe jest OK ze względu na szybkość pracy.
Nie pracowałem w tych językach. Z tego co wiem z YT Julia miała integrować środowisko badaczy poprzez tworzenie kodu, który jest bliższy naukowej notacji (formułom obliczeniowym). Sam kod miał być przez to zrozumiały co miało wspierać dyskusje naukowe (także te interdyscyplinarne).
Arkadiusz, masz dziewczynę albo żonę 🙄?
Mili Państwo, to nie kanał matrymonialny tylko o analizie danych.
@@zArkadiuszem Szkoda. 🥰😘😍
wow! nie spodziewałem się zobaczyć materiałów z shiny, super! Liczę na jak najwięcej materiałów z tego tematu, wielkie dzieki za to co robisz. Generalnie dobrze byłoby poznać różne techniki prezentowania wyników za pomocą R jak np. Quarto czy przedstawienie pakietów jak 'gt' do tworzenia tabel
Dziękuję. Tworzenie aplikacji z shiny to spory krok do przodu dla każdego użytkownika R. Przede wszystkim jest to wiedza o dużej wartości praktycznej. Pozdrawiam
Super filmik dziękuję bardzo 🔥
Polecam się na przyszłość!
Moje wyniki Data dołączenia: 24 mar 2024 --------------- *293* subskrybentów-----*16* filmów---*7617* wyświetleń
Ja w porównywalnym czasie miałem 10 subskrybentów. Powodzenia
Brakuje ci jeszcze hasztagów
Dziękuję za podpowiedź. Pewnie od strony marketingowej sporo można byłoby tu zmienić
Uczenie maszynowe w R, tego szukałem!
Cieszę się
Fajny film pzdr
Dziękuję i pozdrawiam
dzieki!
Pozdrawiam
Tak z ciekawości, operator pipe jest powszechnie/komercyjnie stosowany? Tak jak cały pakiet dyplr ? Czy bardziej klasyczny R ?
Ja się zajmuję nauką. Korzystam z R głównie do analizy danych empirycznych w celach naukowych. Sam pakiet dplyr jest popularny - ułatwia przetwarzanie danych. Operator pipe sprawia, że kod staje się bardziej czytelny. Pozdrawiam
To bardzo pomocne😊
Co prawda, to prawda ;)
Nie wiem czemu tu tak mało odwiedzin i lajków . Twoje materiały to złoto
Możliwe, że filmy są za długie i widzów to odstrasza. Dziękuję i pozdrawiam
zajebiste!
Dziękuję i pozdrawiam
Mogłbyś udostepniac kod?
Będę zamieszczał skrypty do części filmów, które dopiero zamierzam opublikować. Do tego materiału musi wystarczyć to co jest. Pozdrawiam
Świetny materiał!
Dziękuję i pozdrawiam
Najbardziej interesuje mnie obsługa baz SQL z poziomu R, czekam z niecierpliwością!
Kilka następnych filmów będzie o SQL - po nich wrócę do R. Pozdrawiam
bardzo przystępna forma prezentacji, dziekuję
Cieszę się, że się podobała. Pozdrawiam
Chciałbym podzielić się kilkoma refleksjami na temat Twojego kanału na UA-cam. Jestem osobą związana zawodowo z farmacją, wyrobami medycznymi i badaniami klinicznymi. W Twoich filmach znalazłem wiele ciekawych informacji, które mogę wykorzystać w mojej pracy naukowej. Cenię Twoją zdolność do jasnego wyjaśniania skomplikowanych zagadnień i merytoryczną jakość Twoich materiałów. Dziękuję Ci, że dzielisz się swoją wiedzą i udostępniasz te treści. Uważam, że Twój kanał jest prawdziwą perłą w zakresie nauki analizy danych w polskim internecie. Z niecierpliwością oczekuję na nowe odcinki i życzę powodzenia w dalszym tworzeniu. 😊
Dziękuję bardzo za te miłe słowa. Cieszę się, że osoby reprezentujące różne nauki empiryczne są zainteresowane moimi materiałami. Jednym z moich celów jest prezentowanie materiału w taki sposób, aby wspierać widza w jego pracy naukowej (pisaniu artykułów, książek, prac dyplomowych). Pozdrawiam
Świetnie, dzięki za wyjaśnienie!
Dziękuję, cieszę się, że się podobało.
Świetne wprowadznie - dzięki!
Dziękuję i pozdrawiam
dzięki! Świetne materiały, liczę na więcej contentu z R+statystyka+ML
Dziękuję. Będą jeszcze takie materiały, ale będą też nowe zagadnienia z zakresu analizy danych.
super wytłumaczone, dziękuję! Ps. Obecnie plik "storm" zawiera ponad 19000 próbek i dużo więcej typów wiatru. Fajnie to wygląda na wykresie ze statusem.
Dziękuję i pozdrawiam
Świetna robota, bardzo fajnie Pan tlumaczy! Mam jedno pytanie - jaki jest wzór na CI.mean0.95?
błąd standardowy średniej * wartość z tablicy dla rozkładu normalnego lub t studenta (dla określonego poziomu ufności np. 0.95 lub 0.99). Dla poziomu ufności 0.95 i "dużej" próby wartość ta wynosi 1.96 Zatem upraszczając temat błąd standardowy średniej * 1.96
dziękuję! @@zArkadiuszem
🫡 dziękuję
Proszę
Bardzo dziękuję za pracę, którą Pan wykonuje i z niecierpliwością czekam na podręcznik.
Dziękuję. Prace pisarskie trwają
świetnie wytłumaczone, lepiej niż na wykladzie, na który uczęszczam. Dziękuję
Dziękuję i pozdrawiam
Ekstra:D
Dziękuję
jest szansa na udostepnienie tego csv zeby sobie mozna przecwiczyc u siebie?
Proszę napisać do mnie maila na: zarkadiuszem@gmail.com Prześlę. Pozdrawiam
@@zArkadiuszem ok
koment dla zasięgu
Dziękuję i pozdrawiam
Dzięki Tobie zaliczę ekonometrie
Zatem trzymam kciuki
Witam. Dziś odkryłem kanał. Uczę się R na doktoracie i na pewno skorzystam! Są gdzieś dostępne skrypty, które pokazujesz na filmikach? Pozdro
Piszę książkę o R i tam będzie więcej dostępnych informacji - ale niestety to jeszcze trochę potrwa. Skryptów nie zamieszczam. Pozdrawiam
Super materiał, dziękuję!
Dziękuję i pozdrawiam
Super! :)
Dziękuję
Super kurs! Takiej solidnej powtórki właśnie szukałem :) Pozdrawiam serdecznie !
Cieszę się, że się kurs podoba. Pozdrawiam
Bardzo dobrze dobrane przykłady, dzięki czemu wykład jest bardzo ciekawy
Dziękuję. Braki danych przetwarza się często "automatycznie" za pomocą właściwych algorytmów. To zagadnienie omawiam na kanale w serii poświęconej maszynowemu uczeniu. Pozdrawiam
Bardzo dobry kurs. Dziękuję
Cieszę się. Pozdrawiam
Super seria dla osób początkujących. Treści baaardzo przyjemne i mogę powiedzieć że pomagaja nie tylko studentom ale też licealistom !!!
O - nie wiedziałem, że licealiści też oglądają. Świetnie. Pozdrawiam
Super poradnik! Tylko brakuje mi linku do danych, z których Pan korzysta, a tak poza tym to dziękuję za włożoną pracę!
Dziękuję. Przygotowuję materiał - książkę - na ten temat. Ale to jeszcze trochę potrwa. Pozdrawiam
Ciekawy feature jest przy funkcji ifelse nie można stosować znaku = zamiast <- bo funkcja tego nie rozpoznaje ;/
Sprawdziłem - faktycznie wymagany jest tu operator przypisania <-. Dzięki temu kod jest bardziej czytelny. Gdyby działało = można byłoby pomyśleć, że to jest określenie jakiegoś argumentu w funkcji. Pozdrawiam
Super poradnik, dziękuję!!
Proszę :)
Ten kurs jest lepszy niż dostępne polskie książki z R. Dobry nauczyciel rozumie, że uczeń zawsze nic nie wie o niczym. I to niezależnie od tytułów naukowych. I to mi się podoba. Sam też tak piszę publikacje to rozumiejąc. Podsumowując zapewne niezrozumiały wywód - szkolenie rewelacja 🙂
Dziękuję za miłe słowa. Taką problematykę (analizę danych w języku programowania) łatwiej wyłożyć na nagraniu, niż w książce. Książki rządzą się swoimi prawami. Pozdrawiam.
W teście Kołmogorowa-Smirnowa wyskakuje mi komunikat, że wartości powtórzone nie powinny być obecne w teście Kolmogorowa-Smirnowa. Rozumiem, że muszą to być tylko wartości unikalne?
Tak. Pojawia się takie ostrzeżenie. Błędem byłoby tu usunięcie duplikatów - to by zmieniało nasz testowany rozkład empiryczny. Sensowne wydaje mi się natomiast dodanie do duplikatów bardzo małej liczby losowej (to sprawi, że dla testu będą się one różnić). np. z przedziału -0.0001; +0.0001 (chyba, że sama zmienna przyjmuje bardzo małe wartości - wtedy wartość losowa powinna być jeszcze mniejsza). Osobiście zalecałbym jednak wykorzystanie wykresu Q-Q + Shapiro-Wilk Normality Test. Test Shapiro Wilka został zmodyfikowany tak, że teraz (wersja z R funkcja shapiro.test()) można go stosować także do dużych prób (3 - 5000). Jeśli ma Pan/Pani próbę większą niż 5000 - to polecam ocenę wzrokową w oparciu o stosowne wykresy. Pozdrawiam
Mam ten sam problem co @quegon6125 @@zArkadiuszem rozumiem, że skoro u Pana ten test dziala, to Pan ma zmodyfikowany plik? Może Pan go gdzieś udostępnić? Chętnie bym poćwiczyła. Podobny komunikat wyskakiwał mi, gdy próbowałam test Wilcoxona i pojawiały się powtórzone wartości. Czy R nie jest odporny na takie sytuacje (dla przykładu LabVIEW nie ma z tym problemu)? Jeśli tak, to jest to jego bardzo poważne ograniczenie, bo jeśli chcemy zautomatyzować pracę, to ciężko nam zakładać brak powtórzeń, a ocena wzrokowa nie jest oceną obiektywną i nie daje się zautomatyzować. Ręczne wyszukiwanie tych samych próbek i modyfikacji ich wartości w zbiorze bardzo dużych danych nie wchodzi w rachubę.
R to w znacznej mierze zbiór pakietów - jeśli coś można poprawić - zasadne jest dodanie (stworzenie) nowego pakietu. R rozwija się właśnie przez taką pracę ludzi zainteresowanych tematem. Tu powtórzę wcześniejszą sugestię: "Osobiście zalecałbym jednak wykorzystanie wykresu Q-Q + Shapiro-Wilk Normality Test". @@acha10000
WOW, dzięki wielkie, tego potrzebowałem!
Miło to słyszeć. Pozdrawiam.