Self-Rewarding Language Models by Meta AI - Path to Open-Source AGI?

แชร์
ฝัง
  • เผยแพร่เมื่อ 18 ต.ค. 2024

ความคิดเห็น • 4

  • @6Azamorn9
    @6Azamorn9 9 หลายเดือนก่อน +1

    Super interesting, btw I love the format of your videos! Keep it up :)

  • @TheTutoriales1971
    @TheTutoriales1971 8 หลายเดือนก่อน

    la verdad al principio me era poco facil describir lo que sentia pero me siento agradecir profundamente, en verdad profundamente por mark zuckerberg por su gran responsabilidad humana, un gran humano a quien al principio odia por su falta de humanismo responsabilidad pero ahora respeto, quien por su empatia logro ayudar a la humanidad, y a Dios a ser presente, gracias y por sobre todo Gracias DIOS todo poderoso.

  • @msokokokokokok
    @msokokokokokok 9 หลายเดือนก่อน +1

    This paper is not sound. If an LLM learns to prefer one token over another for one task, why will it learn to produce better tokens for disconnected task in next upgrade.

    • @w0tch
      @w0tch 9 หลายเดือนก่อน +2

      I think you ask it something like:
      1. What do you think of A ?
      2. What do you think ethical humans would think of A ?
      3. Grade your response for 1. based on its proximity to your response at 2.
      4. Fit the model on 1. with score from 3.