ทำไม SARSA เลือก SAFER path? ทำไม Q learning เลือก OPTIMAL path? | Machine learning | Reinforcement

แชร์
ฝัง
  • เผยแพร่เมื่อ 21 เม.ย. 2021
  • My related medium article:
    / optimal-or-safest-q-le...
    code available at:
    github.com/gucino/cliff-walki...

ความคิดเห็น • 1

  • @pongthronai2271
    @pongthronai2271 3 ปีที่แล้ว +1

    ติดตามครับ รอดูคลิปใหม่ๆครับ