Reinforcement Learning from Human Feedback (RLHF) Explained

แชร์
ฝัง
  • เผยแพร่เมื่อ 28 ต.ค. 2024

ความคิดเห็น • 17

  • @alex_ai_bot
    @alex_ai_bot 2 หลายเดือนก่อน +4

    Thank you! Please do more on RLHF!

  • @tiagomccruz
    @tiagomccruz 2 หลายเดือนก่อน +1

    IBM Tech always bringing great content. Loved it. 😍😍😍
    Also when RLHF becomes RHLF at min 10:05. Maybe trolling maybe just good old human error. 😏

    • @MartinKeen
      @MartinKeen 2 หลายเดือนก่อน +1

      Oops yes, I need some RLYF (Reinforcement Learning from TH-cam Feedback) to keep an eye out for transposing letters like that.. good spot!

  • @tatendatasara
    @tatendatasara หลายเดือนก่อน

    Amazing explanation

  • @muhammadyousifjamali3491
    @muhammadyousifjamali3491 2 หลายเดือนก่อน +1

    We want to complete series on reinforcement learning

  • @jagatkrishna1543
    @jagatkrishna1543 2 หลายเดือนก่อน +1

    Thanks 🙏❤

  • @alimuchenik9807
    @alimuchenik9807 2 หลายเดือนก่อน

    Thank you!!! As a layperson, how can I help? I see Meta AI and Gemini AI have a thumb up to click. But I don't know how to reward Pi AI for its excellent answers in so many fields.

  • @CarllyleHelen
    @CarllyleHelen หลายเดือนก่อน

    371 Delpha Ridges

  • @ErasmoMartorella
    @ErasmoMartorella หลายเดือนก่อน

    211 Gerson Springs

  • @JennyMax-x6s
    @JennyMax-x6s หลายเดือนก่อน

    Leda Ridge

  • @NancyRegan-d7d
    @NancyRegan-d7d หลายเดือนก่อน

    Breitenberg Cliffs

  • @VonCavitt
    @VonCavitt หลายเดือนก่อน

    6770 Senger Pines

  • @JamesBrown-l9v
    @JamesBrown-l9v หลายเดือนก่อน

    255 Kshlerin Forks

  • @HaroldBergan-i6s
    @HaroldBergan-i6s หลายเดือนก่อน

    Hettinger Station

  • @BarrieConrad
    @BarrieConrad หลายเดือนก่อน

    12494 Kiehn Circles

  • @LynchAdolph
    @LynchAdolph หลายเดือนก่อน

    198 Frami Valley