Gemini Can Now THINK like O1-But Does It Pass the Misaligned Attention Test?

แชร์
ฝัง
  • เผยแพร่เมื่อ 19 ธ.ค. 2024

ความคิดเห็น •

  • @elawchess
    @elawchess 15 ชั่วโมงที่ผ่านมา +1

    Please can you be showing us what it does when you warn it that it's a trick question etc, whether it still gets stuck or not?

  • @jamesjonnes
    @jamesjonnes 5 ชั่วโมงที่ผ่านมา +1

    From my tests even 4o is smarter than Gemini 2.0 Flash. OpenAI has fixed many simple mistakes that Google has not yet.

    • @nubboi21
      @nubboi21 5 ชั่วโมงที่ผ่านมา +2

      No, actually im using the flash and it’s actually far far better that 4o , I use it for my science questions in physics and stuff and it’s really a lot lot better

  • @carlkenner4581
    @carlkenner4581 3 นาทีที่ผ่านมา

    I've met many humans who can't pass the misaligned attention test.

  • @elawchess
    @elawchess 15 ชั่วโมงที่ผ่านมา

    Cos you can trick a human too with some of these and it wouldn't warrant the conclusion that the tricked human can't reason. If when alerted that it's a trick question it still can't do it then I'll probably agree about the seriousness of the issue. I've seen a couple videos when you've done this type of thing and seemingly concluded that "they can't reason", and I feel like that conclusion is not warranted.

  • @fabriziocasula
    @fabriziocasula 10 ชั่วโมงที่ผ่านมา

    wow

  • @jeffwads
    @jeffwads 11 ชั่วโมงที่ผ่านมา

    Orion dropping tomorrow. Wait until you get a load of that model.

  • @Heisenberg2097
    @Heisenberg2097 11 ชั่วโมงที่ผ่านมา

    As long as it never learns to think like you... humanity is save.

  • @chamikk90
    @chamikk90 21 ชั่วโมงที่ผ่านมา +4

    it's capable, but not smart as o1

    • @Cine95
      @Cine95 20 ชั่วโมงที่ผ่านมา +7

      Its flash bro

    • @samuelgarcia1802
      @samuelgarcia1802 19 ชั่วโมงที่ผ่านมา +6

      Yhea it's like the equivalent of o1 mini I suppose

    • @NakedSageAstrology
      @NakedSageAstrology 16 ชั่วโมงที่ผ่านมา +3

      You can get even better results than 01, if you use an API and have it prompt itself back and forth.

    • @josemarques3454
      @josemarques3454 10 ชั่วโมงที่ผ่านมา +1

      yes!... and it's free.

    • @ankitnmnaik229
      @ankitnmnaik229 10 ชั่วโมงที่ผ่านมา

      ​@@NakedSageAstrology it's exterminatal and flash..
      Not pro or ultra or specifically a separate reasoning model at all...

  • @punk3900
    @punk3900 17 ชั่วโมงที่ผ่านมา

    o1 pro is the 🔝

    • @anubisai
      @anubisai 14 ชั่วโมงที่ผ่านมา +1

      Okay moneybagg

    • @deepbrar1
      @deepbrar1 12 ชั่วโมงที่ผ่านมา

      so o1 did solve this problem ?

    • @ankitnmnaik229
      @ankitnmnaik229 10 ชั่วโมงที่ผ่านมา

      200$