Clasificacion con data desbalanceada. Down Sampling.

Поділитися
Вставка
  • Опубліковано 29 тра 2017
  • En este video enseño como usar la tecnica de Down Sampling para balancear datasets que no estan balanceados o que tiene una alta cantidad de observaciones negativas comparadas con las positivas. Utilizamos una regresion logista y una matriz de confusión para verificar el mejoramiento en el performance de la predicción.
    ===Suscribete a nuestro canal en youtube===
    / chzelada
    ===Siguenos en Facebook===
    / wikimatematica
    / academatica
    ===Visitas nuestros sitios===
    www.wikimatematica.org
    www.academatica.com

КОМЕНТАРІ • 14

  • @fernandor4340
    @fernandor4340 2 роки тому

    Los últimos tres videos incluyendo el tema de la curva ROC me han sido muy útiles para entender los conceptos. Muchas gracias.

  • @alejandroquintoschoy3919
    @alejandroquintoschoy3919 3 роки тому

    Gracias Maestro.

    • @Academatica
      @Academatica  3 роки тому

      De nada! Recuerda suscribirte. Todos los miercoles tenemos un taller en vivo con temas relacionados a este video. Saludos!

  • @javiercabeza07
    @javiercabeza07 2 роки тому

    Hola, Muy buen video, una consulta... por qué se multiplica por 0.4285?

  • @estadisticaparatodos6070
    @estadisticaparatodos6070 6 років тому

    ¿tendrás un correo donde contactarte? Saludos

  • @cursosestadistica3069
    @cursosestadistica3069 6 років тому +1

    Excelente video. ¿donde consigo la data y el código en R?

    • @Academatica
      @Academatica  6 років тому

      Aqui puedes ver el codigo rpubs.com/chzelada/275494

    • @Academatica
      @Academatica  6 років тому

      Estoy buscando el dataset cuando lo tenga te lo envío.

  • @cursosestadistica3069
    @cursosestadistica3069 6 років тому +1

    Una consulta, ¿este video forma de un curso presencial o en línea? Agradeceré información. Saludos desde Perú. :)

    • @Academatica
      @Academatica  6 років тому

      Si es parte de un curso que doy en la Mestria en investigación de operaciones. Yo me encargo del área de ciencia de datos. Aquí puedes ver la información de la maestría io.galileo.edu. También en esta lista puedes ver todos los videos que grabe sobre ciencia de datos, ua-cam.com/play/PLAFn9q_BCao_H7Nzdk7wcnOX0YMjd4Kqz.html. Saludos!

    • @cursosestadistica3069
      @cursosestadistica3069 6 років тому

      Felicitaciones. ¿tendrás algún correo para contactarte? Saludos

    • @alessandro9786
      @alessandro9786 Рік тому

      ​@@Academaticabuenas tardes.
      Veo que en el vídeo primero balancea los datos y luego sobre la data desbalanceada hace el train y test, y en la mayoría de casos y trabajos hacen al revés... O sea primero separan train y test, luego balancean el train.
      Habrá alguna bibliografía donde sustente o comenté cuál va primero??? En la mayoría veo que primero separan train y test, y luego balancean el train. Pero en el vídeo hacen distinto

  • @patrimonioyfotografia7018
    @patrimonioyfotografia7018 5 років тому

    AYUDAA!!! DONDE HICISTE %>% nrow() no me corre......me tira error... que es esoooo

  • @alessandro9786
    @alessandro9786 Рік тому

    Por qué 70% la clase mayoritaria y 30% la minoritaria?