Descubre cómo manejar Datos ó Valores Faltantes Imputando con K-Vecinos más cercanos (KNN) y Python

Поділитися
Вставка
  • Опубліковано 1 лют 2025

КОМЕНТАРІ • 28

  • @CodigoMaquina
    @CodigoMaquina  2 роки тому +2

    👉 Xiperia ofrece consultoría empresarial que transforma datos en conocimiento accionable para alcanzar los objetivos de tu negocio. Conoce más en www.xiperia.com

  • @saulbarrerag
    @saulbarrerag 9 місяців тому +1

    Excelente video, tu manera de explicar es muy clara y con chispa. Gracias por el video.

    • @CodigoMaquina
      @CodigoMaquina  5 місяців тому

      Muchas gracias por tus palabras!!!

  • @tiagoaular9665
    @tiagoaular9665 2 роки тому +1

    Eres el mejor. Obrigado.

  • @Michael-b7z8y
    @Michael-b7z8y 2 роки тому +3

    Un video muy interesante Knn tiene muchas utilidades

    • @CodigoMaquina
      @CodigoMaquina  2 роки тому

      Ciertamente, así son algunas de las ideas buenas: simples y con muchas aplicaciones :)

  • @luisgil267
    @luisgil267 Рік тому +1

    Increible video, muy útil

    • @CodigoMaquina
      @CodigoMaquina  Рік тому +1

      Muchas gracias @luisgil267. Sigue echándole muchas ganas a tu preparación, lograrás toda meta que te propongas :)

  • @salvadornunez23
    @salvadornunez23 2 роки тому +4

    muy buena explicación , la buena onda q le pones, gracias

  • @lautaroperez
    @lautaroperez 2 роки тому +3

    Excelente video. Le pones mucha onda al video y las explicaciones son muy claras. Te felicito.

  • @evaristegalois9832
    @evaristegalois9832 2 роки тому +1

    Un buen video. Saludos desde Ecuador.

  • @msaretto
    @msaretto 2 роки тому +1

    Como siempre maestro, muy bueno, que mundo mas interesante el machine learning y lo hace ver muy fácil.Saludos que estés bien

    • @CodigoMaquina
      @CodigoMaquina  2 роки тому

      Muchas gracias por tus comentarios. Un brazo :)

  • @CarlosMorenoV
    @CarlosMorenoV 10 місяців тому +1

    Tienes algun video sobre tecnicas de SMOTE o ADASYN? buen video.

  • @joseleonardosanchezvasquez1514
    @joseleonardosanchezvasquez1514 2 роки тому +1

    Muy buen video gracias

    • @CodigoMaquina
      @CodigoMaquina  2 роки тому

      Gracias por ver el video José. Saludos!!

  • @gabrielayavaca3206
    @gabrielayavaca3206 Рік тому +2

    Muy buena explicación. Pero como se podría medir el desempeño del modelo.

    • @CodigoMaquina
      @CodigoMaquina  Рік тому +1

      Hola @gabrielayavaca3206 gracias por la pregunta. Al respecto, comúnmente la mejor imputación se determina con experimentación. Es decir, puedes aplicar diferentes formas de imputar tus datos, de ahí, construyes tus modelos ya sea sea regresión, clasificación o pronóstico. Ya con el modelo construido, lo evalúas con las métricas adecuadas (en función del negocio) y así ves cuál fue la mejor forma de imputar. Aquí hay un par de videos sobre métricas de regresión (ua-cam.com/video/9IZ6OPQWtpw/v-deo.html) y métricas de clasificación (ua-cam.com/video/uaGMk43XTOw/v-deo.html).

  • @javiervalenzuelaorellana2826
    @javiervalenzuelaorellana2826 Рік тому +1

    Gracias Octavio, como siempre muy claro!!!
    Estoy re100 iniciando en DataScience. Estoy en el pre procesamiento de datos de un df conocido como es salespredictions. En una primera etapa pude rellenar valores faltantes utilizando .fill con método .ffill, pues ordené el df y fui ocupando el último valor no nulo de la columna.
    Sin embargo, esta vez debo hacerlo utilizando imputer. Puedo trabajar KNN obteniendo los datos de una columna ‘object’? Los valores vacíos son el peso del producto y ese valor lo conozco porque aparece en otras filas para los mismo productos

    • @CodigoMaquina
      @CodigoMaquina  Рік тому

      Hola @javiervalenzuelaorellana2826, si por 'object' te refieres a str, KNN imputer sí trabaja con strings. Una disculpa por tardar tanto en responder y ojalá la respuesta todavía sea de utilidad.

  • @MrCrismath
    @MrCrismath Рік тому +1

    Excelente! tengo una duda. Cómo logro ver los datos originales? por ejemplo quisiera ver el ultimo gráfico pero con los datos sin el escalamiento.

    • @CodigoMaquina
      @CodigoMaquina  Рік тому

      Hola @MrCrismath gracias por la pregunta. La clase de MinMaxScaler de sklearn tiene un método que justo realiza esa operación, se llama inverse_transform().

  • @molot684
    @molot684 2 роки тому +1

    Pero en este caso hiciste una comparación de ambos métodos con los datos que quitaste, pero, que pasaría si tengo algún df con algún campo que tiene valores nulos, ya se que se puede aplicar lo que hiciste en el video, excepto que no tendría con que comparar los resultados, supongo que debe haber algún tipo de métrica que diga que método es mejor para rellenar los registros nulos.

    • @CodigoMaquina
      @CodigoMaquina  2 роки тому

      Gracias por la pregunta y por seguir el contenido del canal. Normalmente la eficacia de los métodos de imputación y de cualquier otro tipo de pre-procesamiento se puede observar/medir con los datos de validación de un modelo. Aquí va un video sobre datos de entrenamiento, validación y prueba que tal vez pueda serte de utilidad: ua-cam.com/video/vdYzm4xC7mc/v-deo.html