Це відео не доступне.
Перепрошуємо.

Optimiza tus Modelos de Machine Learning ajustando Hiperparámetros con Python

Поділитися
Вставка
  • Опубліковано 14 сер 2024
  • Para citar este recurso educativo utiliza la siguiente referencia:
    Gutiérrez-García, J.O. [Código Máquina]. (2022, 21 de Marzo). Optimiza tus Modelos de Machine Learning ajustando Hiperparámetros con Python [Video]. UA-cam. [Incluye aquí la URL del video]
    ********************************************
    Para guiar tu aprendizaje, en este vínculo ( • Curso de Inteligencia ... ) se encuentra una guía secuencial para aprender:
    1. Programación Básica con Python;
    2. Manejo de Datos;
    3. Visualización de Datos;
    4. Análisis de Datos; y
    5. Aprendizaje de Máquina y Ciencia de Datos.
    ********************************************
    Optimiza los hiperparámetros de los modelos de Machine Learning en función de una métrica dada. Este video explica la técnica de búsqueda en rejilla (grid search) y la técnica de búsqueda aleatoria (randomized search) para ajustar/"tunear" modelos de aprendizaje automático.
    Índice del Video:
    0:00 Introducción
    2:11 Datos y técnica a utilizar
    3:26 Explicación de bosques aleatorios
    6:26 Hiperparámetros de los bosques
    13:15 Búsqueda en Rejilla (GridSearch)
    20:41 Información de la Rejilla
    23:30 Validación cruzada y Rejilla
    26:41 Conjuntos de hiperparámetros explorados
    28:06 Ranking de los mejores modelos
    30:05 Los mejores hiperparámetros
    30:23 Usando el mejor modelo
    33:04 Búsqueda aleatoria (RandomizedSearch)
    35:40 Hiperparámetros explorados aleatoriamente
    ⭐ Apoya a Código Máquina dando un Like, Comentando, Compartiendo o con un Super Gracias.
    ⭐ De la co-fundadora de Código Máquina, productos de cosmética natural SINHAKI:
    www.amazon.com...
    El código y datos del video están disponibles en GitHub github.com/Cod...
    #AprendizajeDeMaquina #DataScience #MachineLearning #ScikitLearn #AprendizajeAutomatico #Python #CienciaDeDatos

КОМЕНТАРІ • 48

  • @CodigoMaquina
    @CodigoMaquina  2 роки тому +1

    ⭐ Apoya a Código Máquina dando un Like, Comentando, Compartiendo o con un Super Gracias.
    ⭐ De la co-fundadora de Código Máquina, productos de cosmética natural SINHAKI:
    www.amazon.com.mx/stores/sinHaki/page/1BD34FBC-C0F9-44F5-AC69-520634334C61?ref_=ast_bln

  • @DavidHernandez-dp5yu
    @DavidHernandez-dp5yu 2 роки тому +4

    Sigue así! Muy buena explicación! 🥳🥳!

  • @danielnatsu
    @danielnatsu Рік тому +2

    Explicas genial en tus videos. Gracias y me suscribo

    • @CodigoMaquina
      @CodigoMaquina  Рік тому

      @danielnatsu bienvenido al canal y muchas gracias por tus comentarios.

  • @msaretto
    @msaretto 2 роки тому +8

    Es muy valiosos tu trabajo, he aprendido muchísimo y estoy aplicando bastante de lo que has enseñado en tu canal. Espero cada semana que sigas publicando. Es un exito tu canal. Saludos

    • @CodigoMaquina
      @CodigoMaquina  2 роки тому

      Es muy gratificante recibir comentarios así. No solo es gratificante para mi, sino para todo el equipo de Código Máquina. Muchas gracias por la motivación :)

  • @eliasmaggi8011
    @eliasmaggi8011 2 роки тому +4

    Llegué hace poco en tu canal y ya casi todos tus vídeos . Excelentes explicaciones, siempre actualizando los contenidos.. excelente y adelante siempre

    • @CodigoMaquina
      @CodigoMaquina  2 роки тому

      Muchas gracias por estos comentarios tan motivadores :)

  • @Ferzuzklei
    @Ferzuzklei Рік тому +4

    Lo que me gusta de tu canal es que utilizas la menor cantidad de anglicismos en estos temas, eso está genial ya que al ser el español nuestra lengua madre el uso de los mismos cuando hay una traducción de los términos solo refleja la falta de lenguaje de esa persona, pero, tú no recaes en eso.
    Creo que hoy por hoy la mayoría de los profesionales en esta disciplina pecan de eso.
    Un saludo y buena virbra, gracias por tus videos.

    • @CodigoMaquina
      @CodigoMaquina  Рік тому

      Muchas gracias por todos tus comentarios, en verdad que son apreciados, aunque siento que no me los merezco, jejeje. Debo admitir que constantemente hago uso de Espanglish. De hecho, en este video uso la palabra "tunear" :)

  • @NewOrden12
    @NewOrden12 11 місяців тому +3

    El mejor canal de ciencia de datos. Gracias por tu contenido! Tienes canal en Spotify?

    • @CodigoMaquina
      @CodigoMaquina  10 місяців тому

      @NewOrden12 muchas gracias por tus palabras. Te comento que sí tenía un canal en Spotify aunque con un enfoque distinto: mucho menos técnico y más de difusión. Sin embargo, los episodios están aquí mismo en youtube. Aquí te dejo la lista de reproducción:
      ua-cam.com/play/PLat2DtY8K7YW3ZjQR3lJwBVzhTPQBVSU2.html

  • @maximobatallandev
    @maximobatallandev Рік тому +2

    Excelente la manera de explicar! Gracias por su tiempo! Un tema tan complejo explicado al detalle y a su debido tiempo! Saludos!!

    • @CodigoMaquina
      @CodigoMaquina  Рік тому

      Gracias por tus comentarios Máximo, me da gusto saber que los videos son de tu agrado. Saludos!!

  • @haytiempo8078
    @haytiempo8078 Рік тому +2

    Muchas gracias por su contenido! 🙌

    • @CodigoMaquina
      @CodigoMaquina  Рік тому

      Muchas gracias por tus palabras y por interactuar en el canal :)

  • @oliverrojasconde9144
    @oliverrojasconde9144 2 роки тому +3

    Excelente explicación!

    • @CodigoMaquina
      @CodigoMaquina  2 роки тому +1

      Muchas gracias por tu comentario y por ver el canal :)

  • @Nacho369
    @Nacho369 10 місяців тому +2

    qué bien explicas!! qué maravilla! muy agradecido!!!

  • @Luk17a5
    @Luk17a5 Рік тому +2

    Genio!!! Gracias por la excelente clase!!

    • @CodigoMaquina
      @CodigoMaquina  Рік тому

      Lucas muchas gracias por tus comentarios :)

  • @wilson8733
    @wilson8733 2 роки тому +2

    Excelente manera de explicar los contenidos, gracias por el tiempo que te tomas en desarrollar estos videos y de igual forma a tu equipo. Saludos

  • @nachosanabria6942
    @nachosanabria6942 2 роки тому +1

    gracias excelente video

    • @CodigoMaquina
      @CodigoMaquina  2 роки тому

      Gracias por comentar y por seguir el canal :)

  • @JavierPerez-ls8xe
    @JavierPerez-ls8xe 2 роки тому +2

    Excelente explicación, Gracias! Cuando puedan algo de Algoritmos Genéticos seria bárbaro!!

    • @CodigoMaquina
      @CodigoMaquina  2 роки тому +2

      Gracias por tus comentarios. Eventualmente, sí haré una serie de videos de algoritmos genéticos. Hay muchos temas que me gustaría incluir y poco a poco llenaré en canal de una gran variedad de temas de Inteligencia Artificial. Gracias por seguir al canal :)

  • @albertoalonso8367
    @albertoalonso8367 Рік тому +2

    Hola Octavio, primero que nada, quiero felicitarte por tu excelente contenido y tu muy buena explicación!
    Durante el vídeo me surgieron las siguientes dudas respecto al "max_samples":
    - Si en este tipo de modelo se emplea este hiperparámetro conforme al bootstrapping para la creación de la bolsa de datos y del "oob", ¿ya no sería necesaria la división de la data mediante el train_test_split?, ya que por lo que entiendo, el "oob" podría desarrollar la función de un test set ¿verdad?
    - Si es verdad lo anterior, ¿con ese "oob" se podrían desarrollar otras métricas como una matriz de confusión o un reporte de clasificación?, o forzosamente ese tipo de métricas del modelo se deben realizar con un test set.
    - ¿Cuál sería tu recomendación de los pasos a seguir en la creación de este tipo de modelos si se requiere obtener también una matriz de confusión y/o un reporte de clasificación?
    De nuevo, muchas gracias por tu contenido¡¡ 👍👍

    • @CodigoMaquina
      @CodigoMaquina  Рік тому

      Estimado Alberto muchas gracias por tus comentarios y por las preguntas. Sobre todo en foros he llegado a leer preguntas similares sobre OOB, cross-validation, y la separación de datos para la creación/evaluación de modelos de Random Forest. Podría dar mi punto de vista al respecto, pero en estos casos no hay nada mejor que citar a un experto de nivel mundial Leo Breiman:
      "In random forests, there is no need for cross-validation or a separate test set to get an unbiased estimate of the test set error. It is estimated internally, during the run, as follows:
      Each tree is constructed using a different bootstrap sample from the original data. About one-third of the cases are left out of the bootstrap sample and not used in the construction of the kth tree.
      Put each case left out in the construction of the kth tree down the kth tree to get a classification. In this way, a test set classification is obtained for each case in about one-third of the trees. At the end of the run, take j to be the class that got most of the votes every time case n was oob. The proportion of times that j is not equal to the true class of n averaged over all cases is the oob error estimate. This has proven to be unbiased in many tests."
      Un disculpa por no traducirlo, no quise alterar accidentalmente su significado.
      La información la extraje del siguiente vínculo: www.stat.berkeley.edu/~breiman/RandomForests/cc_home.htm

  • @rafaprog
    @rafaprog 2 роки тому

    muchas gracias por el aporte

    • @CodigoMaquina
      @CodigoMaquina  2 роки тому

      Es un placer. Gracias por seguir el contenido del canal :)

  • @alfredogallo9652
    @alfredogallo9652 2 роки тому +1

    Hola Código Maquina, me llamo Daniel.
    Excelente tu video de optimización de hiperparámetros con el método de la rejilla. Por favor, tendrás un video o información con los métodos bayesianos de optimización , por ejemplo OPTUNA.
    Un saludo.

    • @CodigoMaquina
      @CodigoMaquina  2 роки тому +1

      Gracias por tus comentarios Alfredo. Todavía no tenemos videos sobre métodos bayesianos, pero ya están anotados en la lista de videos por hacer :)

  • @danielnoecoaguilanunez2433
    @danielnoecoaguilanunez2433 Рік тому +1

    Excelente video, me ayudo bastante a entender como funcionan los hiperparametros.
    Me surge una duda, em relación a la variable objetivo (ingreso) debe ser binaria (0 o 1) o puede ser tambien quantitativa continua? O sea, USD725,1 USD653,1 ....

    • @CodigoMaquina
      @CodigoMaquina  Рік тому

      Muchas gracias por tus comentarios y por tu pregunta. Al respecto, sí, grid search también se utiliza para problemas de regresión con valores continuos :)

  • @GeekendZone
    @GeekendZone Рік тому +1

    Execelente Canal y contenido, tienes algo de Pipelines?

    • @CodigoMaquina
      @CodigoMaquina  Рік тому +2

      Muchas gracias por los comentarios. Lamentablemente aun no tenemos un video sobre pipelines, pero cualquier día de estos sale uno :)

  • @walternelsoncahuanaochoa7504
    @walternelsoncahuanaochoa7504 Рік тому +1

    Su contribución es valiosa y muy didáctica, es posible pueda compartir el excel ingresos? para poder aplicar lo aprendido

  • @jordyjaimes4401
    @jordyjaimes4401 4 місяці тому

    Hola, gracias por el vídeo. Tengo una duda en el min 15:00 cuando dices "qué porcentaje de nuestros datos vamos a usar" te refieres al número de variables? Lo que pasa es que no me queda del todo claro el hiperparámetro "max_samples" no sé si son un número de variables o una porción de los datos incluyendo todas las variables. Gracias de antemano

  • @luisernestotg9396
    @luisernestotg9396 Рік тому +1

    Disculpa me confundió lo siguiente:
    Si la búsqueda por rejilla ya usa cv=5 cuál es el caso de poner en los parámetros 'max_samples'=(1/3, 2/3). O sea, cada vez que hace un modelo con 1/3 de datos "en la bolsa" lo repite 5 veces debido a la validación cruzada con 8/10 de los datos?
    Lo que me confunde es cuál fracción de los datos es la que se usa? Por ejemplo para 'max_samples'=1/3 en la primera vuelta de la cv se tendría 1/3*8/10 =8/30 de los datos?
    Gracias

    • @CodigoMaquina
      @CodigoMaquina  Рік тому

      Muchas gracias por la pregunta. En realidad 'max_samples'=(1/3, 2/3) es un parámetro de los bosques aleatorios que no está directamente asociado al cross-validation (CV). Un bosque tiene muchos árboles y cada uno de ellos se crea utilizando un muestreo que en este caso fue de 1/3 y 2/3 de los datos para cada corrida. Entonces, para el caso del video, primero se realiza la separación de los datos para el CV, y se crea el bosque a partir de 4/5 de los datos y se evalúa con 1/5 de los datos. Supongamos que el total de registros es 150, esto equivaldría a crear el bosque con 120 registros y evaluarlo con 30 registros. Ahora, de los 120 registros utilizados para crear el bosque, se crean cada uno de los árboles utilizando un muestro de un 1/3 de esos 120 registros. Para mayor claridad te recomiendo echarle un ojo a nuestro video sobre árboles aleatorios: ua-cam.com/video/yOCJQLf_YFI/v-deo.html

  • @joseleonardosanchezvasquez1514

    Que buen video, lastima que solo se enfocas en modelo de bosques aleatorios

    • @CodigoMaquina
      @CodigoMaquina  Рік тому

      Gracias por interactuar en el canal y por tus comentarios y sugerencias. Tenemos la esperanza de posteriormente poder subir videos de "casos reales" para tener más ejemplos que utilicen otras técnicas.

    • @joseleonardosanchezvasquez1514
      @joseleonardosanchezvasquez1514 Рік тому

      @@CodigoMaquina Gracias