Cross-validation (o Validación Cruzada) para Evaluar Modelos de Machine Learning con Python

Поділитися
Вставка
  • Опубліковано 26 гру 2024

КОМЕНТАРІ •

  • @CodigoMaquina
    @CodigoMaquina  2 роки тому +3

    👉 Xiperia ofrece consultoría empresarial que transforma datos en conocimiento accionable para alcanzar los objetivos de tu negocio. Conoce más en www.xiperia.com

  • @giovannicordova4803
    @giovannicordova4803 3 місяці тому

    Excelente explicación, no solo es un canal muy bueno explicando ML en español, es muy bueno explicando ML/IA en general.

    • @CodigoMaquina
      @CodigoMaquina  2 місяці тому

      Muchas gracias por tus comentarios 😉

  • @josemanuelgarciaabreu2973
    @josemanuelgarciaabreu2973 Рік тому +6

    La mejor explicación del tema que he visto por internet.

    • @CodigoMaquina
      @CodigoMaquina  Рік тому

      José Manuel muchas gracias por tus comentarios y por seguir el contenido del canal :)

  • @yngter
    @yngter 4 місяці тому

    Excelente, tu explicación es muy buena, explicas en forma clara y al detalle, te felicito 👍👍

  • @fpicado1
    @fpicado1 2 роки тому +9

    Este canal es oro!

  • @brahianserna694
    @brahianserna694 Рік тому +1

    Que canal tan bueno, un moton de detalles que uno no sabe y que pueden hacer la diferencia las aprendo acá.

    • @CodigoMaquina
      @CodigoMaquina  Рік тому

      Brahian muchas gracias por tus comentarios y por interactuar en el canal :)

  • @JavierCarpintero
    @JavierCarpintero Рік тому +1

    Eres un excelente profesor. Te saludo desde Barranquilla Colombia

    • @CodigoMaquina
      @CodigoMaquina  Рік тому

      @JavierCarpintero muchas gracias por tus palabras. Saludos desde la Ciudad de México :)

  • @EduardoMarck-jo6mt
    @EduardoMarck-jo6mt 8 місяців тому +2

    Thanks!

    • @CodigoMaquina
      @CodigoMaquina  8 місяців тому

      @EduardoMarck-jo6mt muchísimas gracias por creer en este proyecto y por apoyarnos. Como una pequeña muestra de nuestro agradecimiento, por favor échale un ojo a nuestro último video de "backpropagation" por ahí del segundo 48: ua-cam.com/video/iOsR-EC9z6I/v-deo.html

  • @paulaalbornoz7
    @paulaalbornoz7 6 місяців тому +1

    excelente!!!, muchas gracias por su contenido, muy claro y entendible!

    • @CodigoMaquina
      @CodigoMaquina  Місяць тому

      Muchas gracias por seguir el contenido del canal!!!

  • @andresespejogoez3348
    @andresespejogoez3348 4 місяці тому +1

    Los videos de este canal son demasiado útiles!!. Muchísimas gracias

  • @JuniorLeiva
    @JuniorLeiva 2 роки тому +4

    Muchas gracias Octavio, todo a quedado claro !!

  • @manuelcorrea256
    @manuelcorrea256 Рік тому +1

    Muchas gracias por el material, es de calidad y claro

    • @CodigoMaquina
      @CodigoMaquina  Рік тому

      @manuelcorrea256 muchas gracias y feliz año!!!

  • @ivanferre5708
    @ivanferre5708 2 роки тому +1

    Excelente explicación.!! te ganaste un nuevo suscriptor

  • @brunocordova5808
    @brunocordova5808 7 місяців тому

    Mas claro que mi profesora de data science

  • @HEBERTHENRIQUEDELCARPIOMARAZA
    @HEBERTHENRIQUEDELCARPIOMARAZA Рік тому +1

    Gracias, muy buena explicaciòn

    • @CodigoMaquina
      @CodigoMaquina  11 місяців тому

      @user-do3wk5ng2h es un placer. Feliz año!!!

  • @sebacele
    @sebacele 3 роки тому +2

    Excelente canal , sos muy buen profesor . Saludos

  • @joseleonardosanchezvasquez1514
    @joseleonardosanchezvasquez1514 2 роки тому +1

    Genial buen video, ere muy bueno ojala sigas subiendo mas videos

  • @foland2619
    @foland2619 5 місяців тому +1

    Todos los videos son una genialidad, ilustrativo, claro, didáctico. Queda de uno el estudiar y aplicar lo que mencionas Octavio. Saludos

    • @CodigoMaquina
      @CodigoMaquina  5 місяців тому

      Muchas gracias por tus comentarios :)

  • @fer12858
    @fer12858 4 місяці тому

    Joya de video, una consulta, los subgrupos para la validación cruzada también son tomados los datos de forma aleatoria (como se divide el train y test)

  • @sergiohernanvazquez6469
    @sergiohernanvazquez6469 2 роки тому +1

    super claro, gracias Octavio!

    • @CodigoMaquina
      @CodigoMaquina  2 роки тому

      Gracias por interactuar y por tus comentarios :)

  • @juanpablocruz6225
    @juanpablocruz6225 2 роки тому +1

    Gracias Octavio, excelente video.

    • @CodigoMaquina
      @CodigoMaquina  2 роки тому

      Muchas gracias por ver el canal e interactuar con nosotros :)

  • @luisaaron144
    @luisaaron144 3 роки тому +1

    Muchas gracias por el video! De verdad, muy enriquecedor! Sigue así!

    • @CodigoMaquina
      @CodigoMaquina  3 роки тому

      ¡Muchas gracias por tus comentarios! :)

  • @yngter
    @yngter 4 місяці тому

    Permíteme una pregunta, en dónde puedo encontrar una guía respecto de una hoja de ruta para evaluar cada modelo, es decir:
    1. Cómo selecciona el dataset.
    2. Cómo limpiar, ordenar, preparar el dataset
    3. Cuáles son las librerías utilizadas,
    4. Cuál es la estructura del modelo.
    5. Aparte de la estructura qué métricas de desempeño o ajuste se deben realizar
    6. Qué otras recomendaciones más hay que realizar al momento de desarrollar un modelo.
    7. Etc.
    Saludos !!

  • @msaretto
    @msaretto 3 роки тому +5

    Excelente Octavio nos aterriza un poco el tema. Te puedo sugerir que incluyas entre los videos , uno de modelo de redes neuronales de sklearn. me intereza mucho Saludos

    • @CodigoMaquina
      @CodigoMaquina  3 роки тому +1

      Muchas gracias por tus comentarios y por esa excelente sugerencia. Muy probablemente iniciando el año metamos algunos videos sobre redes neuronales :)

  • @brunocordova5808
    @brunocordova5808 7 місяців тому +1

    Buenisimo!

  • @emmanuelpena2653
    @emmanuelpena2653 2 роки тому +1

    Como siempre excelente video, solo una duda... a la hora de configurar croos_val_score siempre debemos agregar las variables completas(X=X, y=y) sin división? como lo realizaste en el video, o debemos aplicar Croos Validation solo con los datos de entrenamiento (X=X_train, y=y_train), muchas gracias Octavio.

    • @joseleonardosanchezvasquez1514
      @joseleonardosanchezvasquez1514 2 роки тому +1

      La Croos Validation solo se hace sobre los datos de entrenamiento

    • @CodigoMaquina
      @CodigoMaquina  2 роки тому +2

      Muchas gracias por tus comentarios y por tu pregunta. Si tienes muy pocos datos, entonces, si se utilizan todos los datos. Sin embargo, idealmente, si hay muchos datos, se utiliza un cierto porcentaje (ejemplo el 80%) de los datos para determinar los hiper-parámetros de un modelo usando cross-validation, y el resto de los datos (ejemplo 20%) se utiliza para evaluar el desempeño del modelo. Espero la respuesta ayude un poco :)

    • @D3ser4
      @D3ser4 11 місяців тому

      @@CodigoMaquina cuantos datos serian muchos como para que ameriten hacer un split de los datos y separar ese 20% para dejarlo para evaluar?

  • @KevinRodriguez.96
    @KevinRodriguez.96 8 місяців тому

    Puedo hacer una validación cruzada teniendo los datos ya clasificados fuera de python?

  • @jesusg54g
    @jesusg54g 2 роки тому +1

    Muy buen video gracias por compartir la información!!! Tengo una pregunta respecto a este método, se podría dividir el dataset en train y test calcular la matriz de confusión y las métricas de score para compararlos con la validación cruzada? Lo pregunto porque podríamos tener un dataset y aplicar distintos tipos de algoritmos de clasificación y con la validación cruzada podríamos determinar cual de ellos tiene la mayor precisión y a su vez la mejor aproximación a la métricas calculadas previamente, seria de utilidad hacer esta comparación?

    • @CodigoMaquina
      @CodigoMaquina  2 роки тому +1

      Gracias por tus comentarios y pregunta. Al respecto, si tienes los datos suficientes, es preferible comparar los diferentes modelos utilizando validación cruzada pues es una evaluación más robusta. Si no hay datos suficientes, puedes comparar los modelos usando su rendimiento con el test set. Lo que te recomiendo es evaluar todos los modelos utilizando la misma metodología (ya sea test set o validación cruzada) para que los resultados sean comparables.

  • @jrobledo25
    @jrobledo25 2 роки тому +1

    ¡Excelente explicación! De las mejores que haya escuchado, tengo una pequeña duda ¿Es una buena práctica al momento de dividir los datos en train, test y validación utilizar un K-fold cross validation para que los datos estén muy bien permutados o no vale la pena?

    • @CodigoMaquina
      @CodigoMaquina  2 роки тому +1

      Gracias por preguntar. Muchas librerías ya realizan un muestreo aleatorio para crear los folds de cross-validation. Entonces, no habría ganancia al realizar un doble muestreo aleatorio. Gracias por el ver el canal :)

  • @israelmg1749
    @israelmg1749 Рік тому +1

    😀

    • @CodigoMaquina
      @CodigoMaquina  11 місяців тому

      @israelmg1749 lo mejor para este 2024!

  • @jorgemarroquin9413
    @jorgemarroquin9413 2 роки тому

    excelente contenido , sin embargo lo vi a una velocidad de 1.75 y aun así me parece que habla lento, podría considerar ponerle mayor velocidad antes de subirlo, super clara la explicación

    • @RaulOramas
      @RaulOramas 2 роки тому +2

      A mi me parece bien la voz tal cual está. Tal vez en algunos países se habla mucho más rápido.

    • @yaredlevi
      @yaredlevi 2 роки тому +1

      @@RaulOramas soy chileno y me acomoda la velocidad en la que explica AJAJAJ

    • @edwinnoebadillorivera5621
      @edwinnoebadillorivera5621 7 місяців тому

      @@yaredlevi jajaja qué buena¡