El APRENDIZAJE REFORZADO: la guía DEFINITIVA

Поділитися
Вставка
  • Опубліковано 13 лют 2021
  • 🔥🔥Academia Online🔥🔥: cursos.codificandobits.com/
    🔥🔥Asesorías y formación personalizada🔥🔥: www.codificandobits.com/servi...
    En este video les traigo una guía definitiva del aprendizaje reforzado, una de las áreas más prometedoras del Machine Learning, con el potencial de crear máquinas o agentes inteligentes, capaces de realizar tareas de forma muy parecida a como lo hacemos nosotros los humanos.
    Primero, a través de ejemplos entenderemos el significado y los elementos básicos de un sistema de aprendizaje reforzado (agente, entorno, estado, acción y recompensa). Luego veremos los dos algoritmos que son los pilares fundamentales del aprendizaje por refuerzo: el Q-learning y la política de gradientes. Veremos algunas de sus desventajas y luego analizaremos cómo el Machine Learning, y en particular las redes neuronales, han permitido lograr grandes avances en el campo del aprendizaje por refuerzo, algo que se conoce como Aprendizaje Reforzado Profundo (Deep Reinforcement Learning).
    🔴 ** VIDEOS Y PLAYLISTS RECOMENDADOS **
    🎥 ¿Qué es una red neuronal?: • ¿Qué es una Red Neuronal?
    🎥 Todo sobre las redes convolucionales (lista de reproducción): • Redes Convolucionales
    🔴 ** ÚNETE A CODIFICANDO BITS Y SÍGUEME EN MIS REDES SOCIALES **
    ✅ Suscríbete: ua-cam.com/users/codificando...
    ✅ Facebook: / codificandobits
    ✅ Instagram: / codificandobits
    ✅ Twitter: / codificandobits
    🔴 ** ACERCA DE MÍ **
    Soy Miguel Sotaquirá, el creador de Codificando Bits. Tengo formación como Ingeniero Electrónico, y un Doctorado en Bioingeniería, y desde el año 2017 me he convertido en un apasionado por el Machine Learning y el Data Science, y en la actualidad me dedico por completo a divulgar contenido y a brindar asesoría a personas y empresas sobre estos temas.
    🔴 ** ACERCA DE CODIFICANDO BITS **
    El objetivo de Codificando Bits es inspirar y difundir el conocimiento en las áreas de Machine Learning y Data Science.
    Colocar acá hashtags: #machinelearning #aprendizajereforzado
  • Наука та технологія

КОМЕНТАРІ • 62

  • @codificandobits
    @codificandobits  3 роки тому +3

    🔥🔥Academia Online🔥🔥: cursos.codificandobits.com/
    🔥🔥Asesorías y formación personalizada🔥🔥: www.codificandobits.com/servicios/

  • @Sebastian-tk4kw
    @Sebastian-tk4kw Місяць тому +1

    Estoy haciendo un agente que aprende por refuerzo, este video me viene genial

  • @luis-a0
    @luis-a0 3 роки тому +16

    Buena introducción al aprendizaje por Refuerzo, espero que pronto haya un video de [tutorial + código] sobre el tema.

    • @codificandobits
      @codificandobits  3 роки тому +3

      Hola Luis. Sí, espero más adelante publicar un video tutorial con algo más aplicado. Un saludo!

  • @elmarlyn
    @elmarlyn 3 роки тому +2

    me encanta la forma en como detallas esos conceptos complicados, hay pocos videos en español sobre esos temas tan interesantes

    • @codificandobits
      @codificandobits  3 роки тому

      Gracias por tu comentario. Esto me motiva un montón a seguir publicando este tipo de contenido. Un saludo!

  • @upiferico
    @upiferico 3 роки тому

    Muy buen video, gracias!

  • @teddychiarot7548
    @teddychiarot7548 2 роки тому

    Muchas gracias !!

  • @DrakerDG
    @DrakerDG 2 місяці тому

    Muchas gracias. Super interesante

  • @bebeperrunocanino2337
    @bebeperrunocanino2337 6 місяців тому

    Gracias.

  • @manueldenis730
    @manueldenis730 Рік тому

    Magnífico video. Estoy buscando info sobre el aprendizaje profundo reforzado y en este ejemplo me ha quedado bien claro en qué consiste (sustituir los algoritmos tradicionales por las redes profundas). Para implementarlo necesito un poco más de investigación, pero ya tengo el primer paso. Sería interesante hacer algunas pruebas sustituyendo las redes profundas por los Transformers, con la atención el agente sería capaz de ser consciente de todo el entorno, y luego a quien le presta atención en cada paso... Bueno esta es sólo una idea, que ahora no se me ocurre como implementarla para estos casos pero creo que valdría la pena explorar los resultados que se podrían obtener utilizando la atención de los Transformers. Muchas gracias por este video.👍🏻

  • @JhonDrock
    @JhonDrock 4 місяці тому

    excelente

  • @juanerazo9002
    @juanerazo9002 3 роки тому +1

    Gracias por darnos este contenido de forma gratuita.

    • @codificandobits
      @codificandobits  3 роки тому +1

      Gracias por tu comentario Juan. Esa es la idea, democratizar el conocimiento. Un saludo!

  • @itisdaniel4084
    @itisdaniel4084 2 роки тому

    muy buen video macho!! :)

  • @pablogiri812
    @pablogiri812 3 роки тому +2

    Excelente vídeo, voy a estar esperando un tutorial.👍🤖

    • @codificandobits
      @codificandobits  3 роки тому +1

      Claro que sí Pablo. Espero más adelante publicar un tutorial del tema. Un saludo!

  • @car19los96
    @car19los96 3 роки тому +1

    Eres genial! Aprendo mucho contigo y espero que sigas subiendo mucho contenido en el canal, ya que ayuda mucho a la divulgación científica de informática en el habla hispana!

    • @codificandobits
      @codificandobits  3 роки тому

      Gracias por tu comentario Carlos. Sí, viene más contenido de calidad para el canal!

  • @fabriciot4166
    @fabriciot4166 3 роки тому

    Buen video, gracias!. Me encanta tu canal hombre, muy buenos videos

    • @codificandobits
      @codificandobits  3 роки тому +1

      Gracias por tu comentario Luis, esto me motiva montones. Un saludo!

  • @josemanuelmanesridaura8874
    @josemanuelmanesridaura8874 3 роки тому

    Gracias por Compartir. Excelente Video.

  • @fernandosanchezvillanueva4762
    @fernandosanchezvillanueva4762 3 роки тому

    Buenísimo!!

  • @Jack-uc7hw
    @Jack-uc7hw 3 роки тому

    Excelente contenido ... Gracias

  • @jesmenpad
    @jesmenpad 3 роки тому +1

    Genial video profe. Siempre explicando los temas más complejos desde la metodología más sencilla. Yo alcancé a hacer un bot que jugara un juego con python + técnicas de PDI. Agregarle estos nuevos tópicos sería genial.

    • @codificandobits
      @codificandobits  3 роки тому

      Qué buena sugerencia. Sí, realmente son muchos los temas de los que se puede hablar acerca del aprendizaje reforzado. Este video es una guía inicial, pero se puede profundizar en cosas como actor-crítico, y desde luego en aplicaciones. En futuros videos hablaré de estos temas.
      Un saludo!

  • @aldotb
    @aldotb 3 роки тому

    Buena Maestroooo.....

  • @yilberrojas8306
    @yilberrojas8306 3 роки тому

    Excelente Profe..!

  • @rubengarcia-xt9qe
    @rubengarcia-xt9qe 3 роки тому

    que buen....pero que buen video...clarito...didactico....tremendo aporte....

  • @rricd
    @rricd 3 роки тому

    Excelente video.

  • @jalbarracin
    @jalbarracin 3 роки тому +1

    Muy buen video!!

  • @joseradowvisky6292
    @joseradowvisky6292 3 роки тому +2

    Muy buen video!!!. Sería interesante ver un pequeño código de ejemplo.

    • @codificandobits
      @codificandobits  3 роки тому

      Hola José. Sí, esa es la idea. Espero más adelante preparar un video sobre el tema. Un saludo!

    • @joseradowvisky6292
      @joseradowvisky6292 3 роки тому +1

      @@codificandobits Gracias! siempre son tan claras y didácticas tus clases que da ganas de aprender más! Saludos!

  • @rubengarcia-xt9qe
    @rubengarcia-xt9qe 3 роки тому

    tengo una duda, cuando estas explicando la politica de gradiente usando el agente en la cuadricula, indicas que tiene 4 acciones posibles, pero porque consideras como una accion posible el poder moverse hacia abajo si eso lo saca fuera del tablero?....gracias

  • @ignaciosanchezgendriz1457
    @ignaciosanchezgendriz1457 2 роки тому

    👏🏽👏🏽👏🏽👏🏽👏🏽

  • @hernanlopezarchila
    @hernanlopezarchila 3 роки тому

    Súper claro, mil gracias. De casualidad tienes proyectado hacer un ejercicio de transformers aplicado a nlp(español) en tensorflow?, seria genial

    • @codificandobits
      @codificandobits  3 роки тому +1

      Hola Hernán. De momento no tengo nada planeado por el momento. Pero gracias por tu sugerencia, acabo de tomar nota y espero publicar un próximo video sobre el tema. Un saludo!

  • @lbraasesoriaparatcp1948
    @lbraasesoriaparatcp1948 9 місяців тому

    Este tipo de algoritmos tienen la capacidad de generalizar. O sea si se entrena un algoritmo en ese medio será capaz de hacerlo en otro? Por ejemplo en el campo de las inversiones. Si se entrena a una lgoritmo para que haga operaciones de compra y venta en un periodo de tiempo, tal vez llegue el momento en que lo hace muy bien, pero que pasa en momentos futuros? Lo hará bien igual?

  • @JuanLopez-pm5mr
    @JuanLopez-pm5mr 4 місяці тому

    Hola me justaría conversar contigo sobre una asesoría para comprender un poco mejor el tema, el link de consultoría esta roto, podríamos conversar por algún otro medio ?

  • @enmanuelmariaiglesiasgarci7182
    @enmanuelmariaiglesiasgarci7182 5 місяців тому

    4:07

  • @facundopinela6842
    @facundopinela6842 3 роки тому

    Sos un genio paaaa

  • @capablancastyle
    @capablancastyle 3 роки тому

    Gracias por publicar, algunas paginas para consultar?? este aprendizaje reforzado es la clave en la industria.

    • @codificandobits
      @codificandobits  3 роки тому

      Te sugiero mirar OpenAI Gym, una librería de Python que facilita la implementación de estos modelos. Y como libro te sugiero el de Suton & Barto (Reinforcement Learning: an introduction), es gratuito y se encuentra fácilmente el PDF en Internet. Un saludo!

  • @monkycheaky4680
    @monkycheaky4680 3 роки тому

    Esto tiene que ver con los algoritmos genéticos?

  • @diegobrito8048
    @diegobrito8048 3 роки тому

    Deberías hacer un curso practico con código, incluso si este fuera pagado en plataformas como Udemy o incluso en el mismo youtube. muy buena explicación. :). aquí tienes a alguien que pagaría por ese curso

    • @codificandobits
      @codificandobits  3 роки тому

      Hola Diego. Sí, precisamente estoy organizando varios cursos online que espero lanzar próximamente, y el aprendizaje reforzado está precisamente en este listado. Te invito a suscribirte a mi "newsletter" en codificandobits.com, para que estés enterado cuando estos cursos estén disponibles. Un saludo!

  • @davidrosenblum4079
    @davidrosenblum4079 Рік тому

    En 12:06 no se entiende el ejemplo del tablero.

  • @hantondark8876
    @hantondark8876 3 роки тому

    se puede aplicarlo a NLP ?

    • @codificandobits
      @codificandobits  3 роки тому

      ¿Tienes pensada alguna aplicación en particular?

  • @NOnecesitosuscriptores
    @NOnecesitosuscriptores 3 роки тому +2

    ¿Hablemos de política ?
    sí tu candidato no sabe sumar,restar sin los dedos.
    votar a la oposición.
    saludos a todos los latinos
    Suerte cultura y gracias