Evaluation for Large Language Models and Generative AI - A Deep Dive

แชร์
ฝัง
  • เผยแพร่เมื่อ 6 ก.ย. 2024

ความคิดเห็น • 12

  • @amikewatson
    @amikewatson หลายเดือนก่อน

    This is an extremely well presented presentation for addressing enterprise requirements.. Awesome!!!!👍👍

  • @alishafique3
    @alishafique3 4 หลายเดือนก่อน

    I have consulted many blogs but this LLM evaluation video is best so far. Thank you so much

  • @jacehua7334
    @jacehua7334 10 หลายเดือนก่อน +1

    this is great been waiting for this

  • @twist8250
    @twist8250 10 หลายเดือนก่อน

    Super informative with great research and presentation!

  • @AjayJetty
    @AjayJetty 9 หลายเดือนก่อน +1

    Love this Rajiv. Do you think the evaluations will become industry specific so that people can use out of the box evaluation frameworks to automate evaluations

    • @Rajistics
      @Rajistics  9 หลายเดือนก่อน

      Yes, right now a lot of evaluations are aligned with traditional academic topics, but I fully expect more industry specific evaluations will emerge

  • @a-moralphilosopher3525
    @a-moralphilosopher3525 5 หลายเดือนก่อน

    Thank you for this! very helpful!

  • @GauravKumar-ud7zf
    @GauravKumar-ud7zf 5 หลายเดือนก่อน

    Great content. I watched from start to end. Just wondering which software or service you used to create this video, with your video on the slide.

  • @JOHNSMITH-ve3rq
    @JOHNSMITH-ve3rq 9 หลายเดือนก่อน

    Wow this channel is amazing!!!!

  • @MannyBernabe
    @MannyBernabe 10 หลายเดือนก่อน

    awesome! thx!

  • @felixhuthmacher6784
    @felixhuthmacher6784 10 หลายเดือนก่อน

    Great video Rajiv, even though it was over 1h, I was glued to the screen the entire time. :)
    For anyone who is interested in learning more about how to approach this on AWS, a few weeks back I put together this video th-cam.com/video/HUuO9eJbOTk/w-d-xo.html which also includes a notebook on how to get started quickly.

    • @Rajistics
      @Rajistics  10 หลายเดือนก่อน

      Thanks Felix, I added the video and notebook here: github.com/rajshah4/LLM-Evaluation