Cómo saber si los Datos siguen una Distribución dada usando Gráficos Cuantil-Cuantil (o QQ) y Python

Поділитися
Вставка
  • Опубліковано 13 лип 2024
  • Los gráficos cuantil-cuantil o diagramas Q-Q se utilizan para verificar si un conjunto de datos sigue una distribución de probabilidad dada. Por ejemplo, comúnmente los gráficos QQ se utilizan para verificar si un conjunto de datos sigue una distribución normal. En este video se explica cómo construir paso a paso los gráficos Q-Q además de cómo interpretarlos. También se presenta cómo crear los gráficos Q-Q usando python de forma manual y automatizada.
    Para citar este recurso educativo utiliza la siguiente referencia:
    Gutiérrez-García, J.O. [Código Máquina]. (2023, 30 de Octubre). Cómo saber si los Datos siguen una Distribución dada usando Gráficos Cuantil-Cuantil (o QQ) y Python. [Video]. UA-cam. [Incluye aquí la URL del video]
    ********************************************
    Para guiar tu aprendizaje, en este vínculo ( • Curso de Inteligencia ... ) se encuentra una guía secuencial para aprender:
    1. Programación Básica con Python;
    2. Manejo de Datos;
    3. Visualización de Datos;
    4. Análisis de Datos; y
    5. Aprendizaje de Máquina y Ciencia de Datos.
    ********************************************
    Índice del Video:
    0:00 Introducción
    1:00 Qué es un gráfico Q-Q y para qué se utilizan
    1:39 Construcción paso a paso de los gráficos Q-Q
    22:07 Gráficos Q-Q con python
    Apoya a Código Máquina dando un Like, con un Super Gracias o visitando nuestra tienda en:
    / shop
    El código del video está disponible en GitHub github.com/CodigoMaquina/code
    #estadística #datascience #python #cienciadedatos #analisisdedatos

КОМЕНТАРІ • 21

  • @CodigoMaquina
    @CodigoMaquina  8 місяців тому +1

    Apoya a Código Máquina dando un Like, con un Super Gracias o visitando nuestra tienda en facebook.com/C0d1g0Maqu1na/shop

  • @user-th3xk4yd7n
    @user-th3xk4yd7n 5 місяців тому

    El video entrega contenidos con claridad y simpleza. He visto varios de tus videos y son muy útiles. Gracias por el contenido!!!

  • @Luk17a5
    @Luk17a5 7 місяців тому +1

    Sos un ídolo! Ojala hubiera estado este video la primera vez que me toco aprenderlo😢

    • @CodigoMaquina
      @CodigoMaquina  6 місяців тому

      @Luk17a5 muchas gracias por tu comentario y un gran año 2024!!!

  • @octavioh
    @octavioh 8 місяців тому +3

    Excelente!

  • @israelmg1749
    @israelmg1749 8 місяців тому +2

    Excelente contenido 👏

  • @reinerromero7265
    @reinerromero7265 8 місяців тому +1

    Excelente.

    • @CodigoMaquina
      @CodigoMaquina  8 місяців тому

      @reinerromero7265 muchas gracias!

  • @edwardbrandt4868
    @edwardbrandt4868 8 місяців тому +1

    Gracias Octavio por la información presentada. Debo decir que he tenido que ver el video a lo menos 3 veces para entender mejor el concepto. Porque si con los graficoa Q-Q al final vere si un dataset se ajusta a una fdp determinada (Normal, weibull, exponencial, etc), no es mas economico realizar con python una prueba de bondad de ajuste?. Es decir, si quisera saber si un conjunto de datos se ajustan a una distribución weibull, aplicando una prueba kolmogorov smirnof podria tener resultado de mi hipótesis, de la misma forma que se plantea con los graficos Q-Q. Ayudame a entender este punto por favor. Ademas de agradecer el conocimiento entregados.

    • @CodigoMaquina
      @CodigoMaquina  6 місяців тому +1

      @edwardbrandt4868 efectivamente los gráficos Q-Q y algunas pruebas de hipótesis se pueden utilizar para el mismo propósito. En general, las pruebas de hipótesis son mucho más utilizadas aunque los gráficos Q-Q se llegan a utilizar para checar visualmente y de una forma rápida si los datos siguen o no una distribución dada. Según este artículo de la Universidad de Virginia (library.virginia.edu/data/articles/understanding-q-q-plots), otra ventaja es que en caso de que los datos no sigan una distribución dada, los gráficos Q-Q te ayudan a ver qué puntos particulares son los que contribuyen a que no se siga la distribución. Feliz año!!!

    • @edwardbrandt4868
      @edwardbrandt4868 6 місяців тому +1

      @@CodigoMaquina muy agradecido...feliz 2024

  • @luisgil267
    @luisgil267 8 місяців тому +1

    Gran video. Para saber si los datos siguen algunas otras distribuciones conocidas como por ejemplo, exponencial, chi cuadrada etc. ¿Existes pruebas similares o como se puede determinar eso?

    • @israelmg1749
      @israelmg1749 8 місяців тому +3

      Las pruebas de bondad y ajuste según yo.

    • @CodigoMaquina
      @CodigoMaquina  8 місяців тому +1

      Estimado @luisgil267 como menciona @israelmg1749, efectivamente hay varias formas de determinar si los datos siguen una cierta distribución. De hecho, una de esas formas, es justo utilizando los gráficos q-q. En el video me enfoqué en la distribución estándar, sin embargo, es posible verificar otras distribuciones, por ejemplo, la exponencial. Aquí va un ejemplo:
      import numpy as np
      import matplotlib.pyplot as plt
      import statsmodels.api as sm
      import scipy.stats as stats
      monto_promedio = 500
      montos = np.random.exponential(monto_promedio, size=10000)
      sm.qqplot(montos, dist=stats.expon, fit=True, line="45")
      plt.show()

    • @CodigoMaquina
      @CodigoMaquina  8 місяців тому

      @israelmg1749 muchas gracias por apoyar a la comunidad respondiendo preguntas!

    • @luisgil267
      @luisgil267 8 місяців тому +1

      @@CodigoMaquina Entiendo, muchas gracias.

    • @alecg223
      @alecg223 8 місяців тому +1

      Las más típicas son pruebas de bondad de ajuste. Ahi tienes 2 pruebas muy usadas:
      1) Prueba de Xi-Cuadrado
      2) Prueba de K-S (Kolmogorov-Smirnov)
      El detalle lo encuentras en cualquier libro de Estadística Universitaria.
      Suerte!

  • @arturo3138
    @arturo3138 3 місяці тому

    ¿Que ocurre si tengo mas de 100 datos?