AlphaGo Zero Tutorial Part 2 - Monte Carlo Tree Search

แชร์
ฝัง
  • เผยแพร่เมื่อ 4 ธ.ค. 2024

ความคิดเห็น • 3

  • @morelfotsing2221
    @morelfotsing2221 5 ปีที่แล้ว

    Great explanation! Didn't understand it fully until I saw this video. Thanks!

  • @fndTenorio
    @fndTenorio 5 ปีที่แล้ว

    Thanks! What about the pi policy of the network? Why we never use it to make a move?

    • @sevfx
      @sevfx 2 ปีที่แล้ว

      We use it in the U part of the choosing function. The prior probability gets evaluated by the NN