Hola Naren, me parece muy interesante el vídeo me ayudo mucho, sería bueno que dejara el código en alguna parte para poder realizar el ejercicio de una manera más sencilla
Gracias por compartir tus conocimientos Naren, tengo una pregunta: tengo una base de datos de una banco, 101 variables y 149 registros en las filas, use tu técnica de encontrar outlaiers en la variable EDAD y ubique outlaiers, edades de 0 a 20 años que por reglamento el banco no los atiende, y también encontré edades de mas de 76 años hasta 121 años :) por supuesto que esta mal, entonces como elimino de golpe todos esos outlaiers incluyendo toda la fila de estas variables... (correspondiente a sus 101 variables).
Podes crear un boxplot y visualizar que valores están por encima o de bajo de cuartiles o mínimos, una vez q los visualizaste podes filtrarlo y guardar los datos en un nuevo df y de esa manera podes eliminar los outliers.
Hola yo aplique los dos metodos, pero el primer me "borro" mas datos atipicos que el segundo, incluso el segundo metodo lo que hizo fue hacer mas estrecho el boxplot, pero quedaron los mismo datos atipicos que los que habia sin aplicar ningun metodo
Cada técnica debe aplicarse según las características de los datos que se tiene, no puede ser igual un conjunto de datos a otro, entr menos información se pierda será mejor.
Muchas gracias Naren!
Hola Naren, me parece muy interesante el vídeo me ayudo mucho, sería bueno que dejara el código en alguna parte para poder realizar el ejercicio de una manera más sencilla
Gracias por compartir tus conocimientos Naren, tengo una pregunta: tengo una base de datos de una banco, 101 variables y 149 registros en las filas, use tu técnica de encontrar outlaiers en la variable EDAD y ubique outlaiers, edades de 0 a 20 años que por reglamento el banco no los atiende, y también encontré edades de mas de 76 años hasta 121 años :) por supuesto que esta mal, entonces como elimino de golpe todos esos outlaiers incluyendo toda la fila de estas variables... (correspondiente a sus 101 variables).
Podes crear un boxplot y visualizar que valores están por encima o de bajo de cuartiles o mínimos, una vez q los visualizaste podes filtrarlo y guardar los datos en un nuevo df y de esa manera podes eliminar los outliers.
Hola, por favor aun tienes el script? seria de mucha ayuda!!
Hola yo aplique los dos metodos, pero el primer me "borro" mas datos atipicos que el segundo, incluso el segundo metodo lo que hizo fue hacer mas estrecho el boxplot, pero quedaron los mismo datos atipicos que los que habia sin aplicar ningun metodo
Cada técnica debe aplicarse según las características de los datos que se tiene, no puede ser igual un conjunto de datos a otro, entr menos información se pierda será mejor.