👉 Xiperia ofrece consultoría empresarial que transforma datos en conocimiento accionable para alcanzar los objetivos de tu negocio. Conoce más en www.xiperia.com
Hola @gabrielayavaca3206 gracias por la pregunta. Al respecto, comúnmente la mejor imputación se determina con experimentación. Es decir, puedes aplicar diferentes formas de imputar tus datos, de ahí, construyes tus modelos ya sea sea regresión, clasificación o pronóstico. Ya con el modelo construido, lo evalúas con las métricas adecuadas (en función del negocio) y así ves cuál fue la mejor forma de imputar. Aquí hay un par de videos sobre métricas de regresión (ua-cam.com/video/9IZ6OPQWtpw/v-deo.html) y métricas de clasificación (ua-cam.com/video/uaGMk43XTOw/v-deo.html).
Gracias Octavio, como siempre muy claro!!! Estoy re100 iniciando en DataScience. Estoy en el pre procesamiento de datos de un df conocido como es salespredictions. En una primera etapa pude rellenar valores faltantes utilizando .fill con método .ffill, pues ordené el df y fui ocupando el último valor no nulo de la columna. Sin embargo, esta vez debo hacerlo utilizando imputer. Puedo trabajar KNN obteniendo los datos de una columna ‘object’? Los valores vacíos son el peso del producto y ese valor lo conozco porque aparece en otras filas para los mismo productos
Hola @javiervalenzuelaorellana2826, si por 'object' te refieres a str, KNN imputer sí trabaja con strings. Una disculpa por tardar tanto en responder y ojalá la respuesta todavía sea de utilidad.
Hola @MrCrismath gracias por la pregunta. La clase de MinMaxScaler de sklearn tiene un método que justo realiza esa operación, se llama inverse_transform().
Pero en este caso hiciste una comparación de ambos métodos con los datos que quitaste, pero, que pasaría si tengo algún df con algún campo que tiene valores nulos, ya se que se puede aplicar lo que hiciste en el video, excepto que no tendría con que comparar los resultados, supongo que debe haber algún tipo de métrica que diga que método es mejor para rellenar los registros nulos.
Gracias por la pregunta y por seguir el contenido del canal. Normalmente la eficacia de los métodos de imputación y de cualquier otro tipo de pre-procesamiento se puede observar/medir con los datos de validación de un modelo. Aquí va un video sobre datos de entrenamiento, validación y prueba que tal vez pueda serte de utilidad: ua-cam.com/video/vdYzm4xC7mc/v-deo.html
👉 Xiperia ofrece consultoría empresarial que transforma datos en conocimiento accionable para alcanzar los objetivos de tu negocio. Conoce más en www.xiperia.com
Excelente video, tu manera de explicar es muy clara y con chispa. Gracias por el video.
Muchas gracias por tus palabras!!!
Eres el mejor. Obrigado.
Muchas gracias Tiago :)
Un video muy interesante Knn tiene muchas utilidades
Ciertamente, así son algunas de las ideas buenas: simples y con muchas aplicaciones :)
Increible video, muy útil
Muchas gracias @luisgil267. Sigue echándole muchas ganas a tu preparación, lograrás toda meta que te propongas :)
muy buena explicación , la buena onda q le pones, gracias
Muchas gracias por tus comentarios :)
Excelente video. Le pones mucha onda al video y las explicaciones son muy claras. Te felicito.
Muchas gracias :)
Un buen video. Saludos desde Ecuador.
¡Gracias! Saludos desde México :)
Como siempre maestro, muy bueno, que mundo mas interesante el machine learning y lo hace ver muy fácil.Saludos que estés bien
Muchas gracias por tus comentarios. Un brazo :)
Tienes algun video sobre tecnicas de SMOTE o ADASYN? buen video.
Muy buen video gracias
Gracias por ver el video José. Saludos!!
Muy buena explicación. Pero como se podría medir el desempeño del modelo.
Hola @gabrielayavaca3206 gracias por la pregunta. Al respecto, comúnmente la mejor imputación se determina con experimentación. Es decir, puedes aplicar diferentes formas de imputar tus datos, de ahí, construyes tus modelos ya sea sea regresión, clasificación o pronóstico. Ya con el modelo construido, lo evalúas con las métricas adecuadas (en función del negocio) y así ves cuál fue la mejor forma de imputar. Aquí hay un par de videos sobre métricas de regresión (ua-cam.com/video/9IZ6OPQWtpw/v-deo.html) y métricas de clasificación (ua-cam.com/video/uaGMk43XTOw/v-deo.html).
Gracias Octavio, como siempre muy claro!!!
Estoy re100 iniciando en DataScience. Estoy en el pre procesamiento de datos de un df conocido como es salespredictions. En una primera etapa pude rellenar valores faltantes utilizando .fill con método .ffill, pues ordené el df y fui ocupando el último valor no nulo de la columna.
Sin embargo, esta vez debo hacerlo utilizando imputer. Puedo trabajar KNN obteniendo los datos de una columna ‘object’? Los valores vacíos son el peso del producto y ese valor lo conozco porque aparece en otras filas para los mismo productos
Hola @javiervalenzuelaorellana2826, si por 'object' te refieres a str, KNN imputer sí trabaja con strings. Una disculpa por tardar tanto en responder y ojalá la respuesta todavía sea de utilidad.
Excelente! tengo una duda. Cómo logro ver los datos originales? por ejemplo quisiera ver el ultimo gráfico pero con los datos sin el escalamiento.
Hola @MrCrismath gracias por la pregunta. La clase de MinMaxScaler de sklearn tiene un método que justo realiza esa operación, se llama inverse_transform().
Pero en este caso hiciste una comparación de ambos métodos con los datos que quitaste, pero, que pasaría si tengo algún df con algún campo que tiene valores nulos, ya se que se puede aplicar lo que hiciste en el video, excepto que no tendría con que comparar los resultados, supongo que debe haber algún tipo de métrica que diga que método es mejor para rellenar los registros nulos.
Gracias por la pregunta y por seguir el contenido del canal. Normalmente la eficacia de los métodos de imputación y de cualquier otro tipo de pre-procesamiento se puede observar/medir con los datos de validación de un modelo. Aquí va un video sobre datos de entrenamiento, validación y prueba que tal vez pueda serte de utilidad: ua-cam.com/video/vdYzm4xC7mc/v-deo.html