Grokking Deep Reinforcement Learning Chapter 4 examples - balancing exploration and exploitation

Visualizing transformers and attention | Talk for TNG Big Tech Day '24

Grokking Deep Reinforcement Learning Capitulo 3 - Balanceando recompensas inmediatas y a largo plazo

Кирилл Набутов. Арестович в Кремле, кто взорвал командующего в Москве, война России с НАТО

😳Трамп ПОТІШИВ Скабєєву, але одразу РОЗЧАРУВАВ #shorts

Син ПОВАЛІЙ ПЛЮНУВ ЇЙ в ОБЛИЧЧЯ! Скандальне ПРИВІТАННЯ для ЗРАДНИЦІ! | OBOZ.LIFE

Grokking Deep Reinforcement Learning Chapter 3 examples - balancing immediate and long term rewards

IGA PR

Переглядів 165

Додати в
- Мій плейлист
- Переглянути пізніше
Поділитися

Поділитися

Вставка

Розмір відео:

Показувати елементи керування програвачем

Автоматичне відтворення

Автоповтор

Опубліковано 9 лют 2025
This chapter shows how to find optimal reinforcement learning policies for the simple slippery walk and frozen lake environments. It first does it by computing the "V" value function and the policy based on the "Q" function computed from the value function. Then it uses policy iteration and value iteration strategies to find optimal policies from zero.
References:
Book:
www.amazon.com...
Project:
github.com/mim...
Code:
github.com/mim...

КОМЕНТАРІ • 1

@xodlxo Рік тому ⁺²
I really appreciate your work !

Наступне

Автоматичне відтворення

Grokking Deep Reinforcement Learning Chapter 4 examples - balancing exploration and exploitation

Grokking Deep Reinforcement Learning Chapter 4 examples - balancing exploration and exploitation

Visualizing transformers and attention | Talk for TNG Big Tech Day '24

Visualizing transformers and attention | Talk for TNG Big Tech Day '24

Grokking Deep Reinforcement Learning Capitulo 3 - Balanceando recompensas inmediatas y a largo plazo

Grokking Deep Reinforcement Learning Capitulo 3 - Balanceando recompensas inmediatas y a largo plazo

Кирилл Набутов. Арестович в Кремле, кто взорвал командующего в Москве, война России с НАТО

Кирилл Набутов. Арестович в Кремле, кто взорвал командующего в Москве, война России с НАТО

😳Трамп ПОТІШИВ Скабєєву, але одразу РОЗЧАРУВАВ #shorts

😳Трамп ПОТІШИВ Скабєєву, але одразу РОЗЧАРУВАВ #shorts

Син ПОВАЛІЙ ПЛЮНУВ ЇЙ в ОБЛИЧЧЯ! Скандальне ПРИВІТАННЯ для ЗРАДНИЦІ! | OBOZ.LIFE

Син ПОВАЛІЙ ПЛЮНУВ ЇЙ в ОБЛИЧЧЯ! Скандальне ПРИВІТАННЯ для ЗРАДНИЦІ! | OBOZ.LIFE

МАФИЯ в РЕАЛЬНОЙ ЖИЗНИ: Дубровский, Позов, Мамикс, Катя Клэп, Егорик, Кадрол, Столяров, Масленников

МАФИЯ в РЕАЛЬНОЙ ЖИЗНИ: Дубровский, Позов, Мамикс, Катя Клэп, Егорик, Кадрол, Столяров, Масленников

Buddha Vs Jesus | Parallel Teachings of Buddha and Jesus | Buddha Quotes | Jesus Quotes

Buddha Vs Jesus | Parallel Teachings of Buddha and Jesus | Buddha Quotes | Jesus Quotes

Главные мифы об Украине. Выпуск, который не понравится всем

Главные мифы об Украине. Выпуск, который не понравится всем

Reinforcement Learning - My Algorithm vs State of the Art

Reinforcement Learning - My Algorithm vs State of the Art

I Spent 100 Hours Inside The Pyramids!

I Spent 100 Hours Inside The Pyramids!

Where Does Bad Code Come From?

Where Does Bad Code Come From?

Grokking Deep Reinforcement Learning Chapter 5 - Evaluating Agent's Behavior

Grokking Deep Reinforcement Learning Chapter 5 - Evaluating Agent's Behavior

Reinforcement Learning: Machine Learning Meets Control Theory

Reinforcement Learning: Machine Learning Meets Control Theory

Уличный боец с ДУХОМ воина

Уличный боец с ДУХОМ воина

СКАНДАЛЬНЫЙ бой Али, когда в ринге ему противостояли сразу ДВОЕ #shorts

СКАНДАЛЬНЫЙ бой Али, когда в ринге ему противостояли сразу ДВОЕ #shorts

Анна Трінчер - Треш (Official Music Video)

Анна Трінчер - Треш (Official Music Video)

Заява ЗАЛУЖНОГО ШОКУВАЛА увесь СВІТ😱ТРЕТЯ СВІТОВА ВІЙНА ПОЧАЛАСЬ?

Заява ЗАЛУЖНОГО ШОКУВАЛА увесь СВІТ😱ТРЕТЯ СВІТОВА ВІЙНА ПОЧАЛАСЬ?

Гениальное изобретение из обычного стаканчика!

Гениальное изобретение из обычного стаканчика!

Разобрался голыми руками 😎 #start #кино #фильм #сериал #молотведьм #полиция #пацаны

Разобрался голыми руками 😎 #start #кино #фильм #сериал #молотведьм #полиция #пацаны

REAL or FAKE? #beatbox #tiktok

REAL or FAKE? #beatbox #tiktok

Нельзя смеяться | Смех с водой | 97 #shorts

Нельзя смеяться | Смех с водой | 97 #shorts