Clasificacion con data desbalanceada. Down Sampling.
Вставка
- Опубліковано 29 тра 2017
- En este video enseño como usar la tecnica de Down Sampling para balancear datasets que no estan balanceados o que tiene una alta cantidad de observaciones negativas comparadas con las positivas. Utilizamos una regresion logista y una matriz de confusión para verificar el mejoramiento en el performance de la predicción.
===Suscribete a nuestro canal en youtube===
/ chzelada
===Siguenos en Facebook===
/ wikimatematica
/ academatica
===Visitas nuestros sitios===
www.wikimatematica.org
www.academatica.com
Los últimos tres videos incluyendo el tema de la curva ROC me han sido muy útiles para entender los conceptos. Muchas gracias.
Gracias Maestro.
De nada! Recuerda suscribirte. Todos los miercoles tenemos un taller en vivo con temas relacionados a este video. Saludos!
Hola, Muy buen video, una consulta... por qué se multiplica por 0.4285?
¿tendrás un correo donde contactarte? Saludos
Excelente video. ¿donde consigo la data y el código en R?
Aqui puedes ver el codigo rpubs.com/chzelada/275494
Estoy buscando el dataset cuando lo tenga te lo envío.
Una consulta, ¿este video forma de un curso presencial o en línea? Agradeceré información. Saludos desde Perú. :)
Si es parte de un curso que doy en la Mestria en investigación de operaciones. Yo me encargo del área de ciencia de datos. Aquí puedes ver la información de la maestría io.galileo.edu. También en esta lista puedes ver todos los videos que grabe sobre ciencia de datos, ua-cam.com/play/PLAFn9q_BCao_H7Nzdk7wcnOX0YMjd4Kqz.html. Saludos!
Felicitaciones. ¿tendrás algún correo para contactarte? Saludos
@@Academaticabuenas tardes.
Veo que en el vídeo primero balancea los datos y luego sobre la data desbalanceada hace el train y test, y en la mayoría de casos y trabajos hacen al revés... O sea primero separan train y test, luego balancean el train.
Habrá alguna bibliografía donde sustente o comenté cuál va primero??? En la mayoría veo que primero separan train y test, y luego balancean el train. Pero en el vídeo hacen distinto
AYUDAA!!! DONDE HICISTE %>% nrow() no me corre......me tira error... que es esoooo
Por qué 70% la clase mayoritaria y 30% la minoritaria?