Grokking Deep Reinforcement Learning Capítulo 8 -Introducción a estimación de valor Q

แชร์
ฝัง
  • เผยแพร่เมื่อ 14 ต.ค. 2024
  • Este video muestra un ejemplo simple de cómo utilizar el aprendizaje profundo para la estimación de la función de valor Q del aprendizaje por refuerzo. Se utiliza un entorno de equilibrio de postes de carrito de gimnasio Open AI.
    Referencias:
    Ejemplo del capítulo 8:
    github.com/mim...
    Grokking Deep Reinforcement Learning book:
    www.amazon.com...

ความคิดเห็น •