CS885 Lecture 9: Model-based RL

แชร์
ฝัง
  • เผยแพร่เมื่อ 12 ธ.ค. 2024

ความคิดเห็น • 8

  • @temamou43
    @temamou43 3 ปีที่แล้ว

    Love his explanation very simple to understand

  • @hsujerry7231
    @hsujerry7231 ปีที่แล้ว

    24:36 Do we need to take absolute value for (T(s,a) - s) and (R(s,a) - r)?

  • @jproberge
    @jproberge 4 ปีที่แล้ว

    Awesome lecture, thanks!

  • @phitara4023
    @phitara4023 3 ปีที่แล้ว

    valuable lessons! Thank you sir

  • @НиколайНовичков-е1э
    @НиколайНовичков-е1э 2 ปีที่แล้ว

    Thank you

  • @yuxiang3147
    @yuxiang3147 2 ปีที่แล้ว

    How do we update the transition and reward model in Monte Carlo Tree Search?

  • @李凯-f1d
    @李凯-f1d 4 ปีที่แล้ว

    really good

  • @sq9340
    @sq9340 5 ปีที่แล้ว

    excellent