Correlación Lineal en Python

Поділитися
Вставка
  • Опубліковано 4 сер 2024
  • Si te sirvió el vídeo y deseas apoyarme directamente, te dejo mi cuenta Paypal 😊:
    www.paypal.com/paypalme/rocio...
    Mis cursos en línea:
    ======================
    - Aplica SQL al Mundo del Data Science
    - Creación de Reportes Visuales con RMarkdown
    rociochavezml.com/cursos-en-l...
    Descarga los archivos que voy analizando en: github.com/rociochavezmx/Roci...
    Blog "Aprende Ciencia de Datos con Rocío Chávez": rociochavezml.com/
    Espero que mis videos te estén siendo de utilidad. Si gustas cooperar por medio de PayPal para poder seguir creando contenido, puedes hacerlo en la página de mi Blog
    En un video anterior te platiqué acerca de la correlación lineal y de algunos métodos para detectarla.
    En este video te explico como llevar a cabo la detección de la correlación, incluyendo la creación de diagramas de dispersión y las pruebas de normalidad utilizando el lenguaje python
    Además, te muestro como puedes obtener una matriz indicando el valor de las correlaciones entre las variables por medio de colores.
    Los archivos que voy utilizando los puedes encontrar en:
    github.com/rociochavezmx/Roci...
    Algunos archivos no los encontrarás en el link, ya que se van creando al correr los códigos que vienen en los videos y estos se grabarán en tu computadora.
    Si quieres aprender más acerca de este tipo de técnicas, suscríbete a mi canal, en donde estaré subiendo videos de Machine Learning, Estadística y de Matemáticas en general aplicadas a los negocios.
    Si conoces a alguna persona a la que le pudiera ser de utilidad esta información, por favor ayúdame a compartirla. Te lo agradeceré muchísimo 😉
    Artículos acerca de la comparación de pruebas de normalidad:
    Mohd Razali, Nornadiah & Yap, Bee. (2011). Power Comparisons of Shapiro-Wilk, Kolmogorov-Smirnov, Lilliefors and Anderson-Darling Tests. J. Stat. Model. Analytics.
    Cabrera, G., Zanazzi, J. F., Zanazzi, J. L., & Boaglio, L. (2017). Comparación de potencias en pruebas estadísticas de normalidad, con datos escasos. Revista De La Facultad De Ciencias Exactas, Físicas Y Naturales, 4(2), 47.
  • Наука та технологія

КОМЕНТАРІ • 43

  • @RocioChavezCienciadeDatos
    @RocioChavezCienciadeDatos  Рік тому

    Obtén los scripts, archivos y diapositivas que se muestran en mis videos en: www.patreon.com/rociochavezcienciadedatos

  • @israelconstanteamores4816
    @israelconstanteamores4816 4 роки тому +1

    ¡Has realizado un increíble trabajo!

  • @Diego-xr3bd
    @Diego-xr3bd 4 роки тому +1

    videazo rocio !! muy buenoo , agradecido totalmente

  • @angellaguna5374
    @angellaguna5374 3 роки тому +1

    Excelente tu manera de explicar soy tu fan... Te felicito

  • @alonsocortes2341
    @alonsocortes2341 4 роки тому +1

    Excekente video! todo muy bien explicado!

  • @RocioChavezCienciadeDatos
    @RocioChavezCienciadeDatos  2 роки тому +2

    Si te fue de utilidad este video y deseas ayudarme a seguir creando contenido, puedes hacerlo de varias formas:
    - Dando clic en "Me gusta" para incrementar la probabilidad de que el algoritmo de UA-cam promueva mi contenido
    - Dejándome un comentario
    - Suscribiéndote a mi canal
    - Compartiendo mi canal en tus redes sociales
    - Presionando el ícono "Gracias" y haciendo una donación

  • @nekojose
    @nekojose 2 роки тому

    me quedo clarisimo! muchas gracias pro el video

  • @jesusaguirre4556
    @jesusaguirre4556 4 роки тому +1

    Muy buen video gracias por compartir

  • @marcoantoniomunozquiroz5870
    @marcoantoniomunozquiroz5870 4 роки тому

    Hola Rocio! Felicidades por los videos!! apenas hace unos días los descubrí aqui en UA-cam y explicas todo muy bien! Nuevamente Felicidades!! Saludos desde Monterrey, N.L.

  • @lucaremo
    @lucaremo 3 роки тому

    Eres genial!!

  • @astronomiahoy264
    @astronomiahoy264 Рік тому

    Excelente Explicación

  • @ivancruz1988
    @ivancruz1988 Рік тому

    exelente contenido!!!

  • @omarojeda2223
    @omarojeda2223 4 роки тому

    Muy buen video, saludos

  • @cMonsalveAdm
    @cMonsalveAdm 3 роки тому

    mil gracias

  • @RocioChavezCienciadeDatos
    @RocioChavezCienciadeDatos  4 роки тому +4

    Para llevar a cabo el pre-procesamiento de tus datos y poder obtener
    información confiable en tus análisis, visita mi lista de reproducción
    llamada Pre-procesamiento de Datos en Python
    ua-cam.com/play/PLUofJx5RUeFqAIVdzfnJayenwZFEGtCmg.html

  • @sebastianchaves6548
    @sebastianchaves6548 2 роки тому

    Hola buen video. Una consulta como podemos mejorar la correlacion entre 2 variables? tenes algun video q lo explique?
    Gracias

  • @cyberipsec
    @cyberipsec Рік тому

    🥰🥰🥰🥰😍😍😍

  • @juanantonioriverarivera9908
    @juanantonioriverarivera9908 4 роки тому +1

    Hola, Rocío. Te escribo desde España. Estoy suscrito a tu canal. Te agradezco que compartas tus conocimientos y te felicito por la manera tan didáctica en que lo haces. Veo que usas indistintamente Python y R. Mi pregunta, que supongo que ya te habrán hecho a menudo antes, es: ¿con cuál de ellos te sientes más cómoda y por qué? ¿Cuál te parece mejor para hacer estadística clásica? ¿Es el que usarías también para Machine Learning? Muchas gracias de antemano.

    • @RocioChavezCienciadeDatos
      @RocioChavezCienciadeDatos  4 роки тому +1

      Hola Juan Antonio! La razón por la que utilizo ambos lenguajes es porque desde mi punto de vista, se complementan. Para la estadística y el análisis de datos R tiene más paquetes y tengo entendido que quienes crearon R revisan las librerías que hacer los usuarios antes de subirlas al CRAN. La verdad no sé si en Python exista un control similar. Para Machine Learning prefiero Python.

    • @juanantonioriverarivera9908
      @juanantonioriverarivera9908 4 роки тому +1

      @@RocioChavezCienciadeDatos Gracias por tu pronta respuesta.

  • @JavierLopez-zy2ck
    @JavierLopez-zy2ck 2 роки тому

    Hola una pregunta... Estoy tratando de hacer pero simplemete al compilar me sale solo la primera fila del excel ayuda

  • @RocioChavezCienciadeDatos
    @RocioChavezCienciadeDatos  4 роки тому +1

    Si te interesa saber como obtener el coeficiente de correlación en R, visita mi video Correlación Lineal en R ua-cam.com/video/giwGCNt7zxY/v-deo.html

  • @martinmercadov6831
    @martinmercadov6831 4 роки тому

    Hola Rocio, muchas gracias por compartir tus conocimientos, excelente video. Hay una manera de particular de interpretar los p valores? al final del video mencionas los p valores de las variables "contaminación y fábricas" y "fábricas y habitantes" pero no coinciden con lo que podemos ver en la tabla. También te quería preguntar si sabes en que librería de python podemos encontrar análisis multivariantes como: análisis factorial exploratorio y confirmatorio, modelos de ecuaciones estructurales, regresión multinivel etc.

    • @RocioChavezCienciadeDatos
      @RocioChavezCienciadeDatos  4 роки тому

      Muchas gracias Martín! Una disculpa, pues hasta hoy vi tu comentario. Acerca del p-value, si éste es mayor que 0.05 como fué el caso de contaminación y fábricas (p-value=0.09 o 9e-02), no existe una correlación entre las variables. No sé si ya viste el video en el que explico la teoría de la correlación lineal, que se encuentra en ua-cam.com/video/_c5wOIV4nKE/v-deo.html En cuanto a la librería que me comentas, no tengo información al respecto :(

  • @jeannsyo
    @jeannsyo 3 роки тому

    muy buen video, la mejor explicacion que encontre, tengo una duda para la tabla de contamina.corr
    que valores estan correlacionadas las

    • @matematiqueandoando8551
      @matematiqueandoando8551 3 роки тому +1

      Muchas gracuas Jean! El p-value debe ser menor que 0.05 (siempre es positivo) para saber que la correlación sí es significativa, es decir, que no se debió al azar

  • @tensoescalar1
    @tensoescalar1 4 роки тому

    Que imprecionante estuvo este video, muchísima información, una pregunta con Matplotlif se pueden hacer gráficas en 3D? Por ejemplo de superficies?
    Muchas gracias por este Magnífico visto, Saludos

    • @RocioChavezCienciadeDatos
      @RocioChavezCienciadeDatos  4 роки тому +1

      Hola Beto! Si se pueden hacer gráficas 3D. Puedes ver ejemplos en el siguiente enlace matplotlib.org/3.1.0/gallery/mplot3d/surface3d.html

    • @tensoescalar1
      @tensoescalar1 4 роки тому

      @@RocioChavezCienciadeDatos Está padrisimo, muchas gracias, no se ve tan complicado hacer esos gráficos, muchas gracias, ya compartí tu vídeo en diferentes grupos de Facebook.
      Saludos

  • @cynthiamoricordova5099
    @cynthiamoricordova5099 3 роки тому

    Buen video. Una consulta para aclarar algo. Si el p-value es menor que 0.05 y el valor del coeficiente es bueno , ¿al final entre las variables entonces no existe correlacion?

    • @RocioChavezCienciadeDatos
      @RocioChavezCienciadeDatos  3 роки тому +2

      Para que la correlación sea significativa el valor del p-value debe ser menor a 0.05, si fuera mayor a 0.05, aunque el valor de la correlación sea alta, esta pudo deberse simplemente al azar.

    • @cynthiamoricordova5099
      @cynthiamoricordova5099 3 роки тому +1

      @@RocioChavezCienciadeDatos oh. De acuerdo. Muchas gracias!!!

  • @perico7seven
    @perico7seven 3 роки тому

    Excelente, una duda, como puedo ocultar la mitad de los datos del mapa de calor, para que no se dupliquen, visualmente, las correlaciones.

    • @RocioChavezCienciadeDatos
      @RocioChavezCienciadeDatos  3 роки тому +1

      Hola Santiago! Te paso una página en la que encontré lo que me estás preguntando. Espero te sea de utilidad ; raphaelvallat.com/correlation.html

    • @perico7seven
      @perico7seven 3 роки тому

      @@RocioChavezCienciadeDatos Perfecto muchas gracias

  • @juank46983
    @juank46983 4 роки тому

    Buen video, gracias. Estoy buscando una medida de la dispersión, desviación estándar de un conjunto numérico o matriz o array 3x3 (es para una programación en python) con respecto a su valor central, deseo saber que tan desviados estan los datos de su dato central, no se si me puedas ayudar, los datos son estos (el valor central es 34)
    41 45 25
    29 34 40
    35 28 25

    • @RocioChavezCienciadeDatos
      @RocioChavezCienciadeDatos  4 роки тому +1

      Muchas gracias Juan! NO comprendo bien tu pregunta, si gustas, envíame un correo a rociochavezmx@yahoo.com para platicar con mas detalle al respecto ;)

    • @RocioChavezCienciadeDatos
      @RocioChavezCienciadeDatos  4 роки тому +1

      Perdón Juan, veo que puse "no" con mayúsculas... no fue con intención

    • @juank46983
      @juank46983 4 роки тому +1

      @@RocioChavezCienciadeDatos Hola Rocio, ya pude resolver mi duda, en jupyter el codigo luce asi:
      varianza = ((p1-34)**2+(p2-34)**2+(p3-34)**2+(p4-34)**2+(p5-34)**2+(p6-34)**2+(p7-34)**2+(p8-34)**2)/9
      Tambien para mi analisis desde scipy.stats importo spearmanr para obtener la correlacion entre 2 arreglos que junto con la varianza me dan una buena idea de como estan relacionados los datos (me va mejor con spearman en lugar de Person, kendal).
      La graficas que analizo luces asi
      i.postimg.cc/PfchRQCx/tye.png

    • @RocioChavezCienciadeDatos
      @RocioChavezCienciadeDatos  4 роки тому

      Me da gusto que ya lo hayas resuelto. Mucha suerte en todo ;)

  • @vika439
    @vika439 3 роки тому

    Hola, muy buena aportación, estoy aprendiendo a programar en Python y aun me complica mucho, ahora tengo problemas para obtener la correlación de dos columnas, podría usted guiarme con eso por favor? estoy trabajando con numpy. (adebiomedica@gmail.com)

  • @RocioChavezCienciadeDatos
    @RocioChavezCienciadeDatos  3 роки тому

    Si estás interesado en adquirir alguno de mis cursos en línea, vista mi página web rociochavezml.com/cursos-en-linea/ ;)