Laurens Weijs - Making a benchmarking system for LLMs

แชร์
ฝัง
  • เผยแพร่เมื่อ 27 มิ.ย. 2024
  • Safeguarding LLMs will be important going forward if we want to productionize LLMs, by building a benchmark system we can run all our LLMs in research against the benchmarks and then have a better answer whether our LLMs have unwanted baises. With the AI Validation team within the Dutch Government we our now building this up and it will be open source from the start.
  • วิทยาศาสตร์และเทคโนโลยี

ความคิดเห็น • 1

  • @alexd7466
    @alexd7466 19 วันที่ผ่านมา

    But why use a LLM for binary (yes/no) output? that is not what they're good at.