O3: сильнейшая модель рассуждений. Когда будет достигнут AGI?

แชร์
ฝัง
  • เผยแพร่เมื่อ 13 ม.ค. 2025

ความคิดเห็น • 25

  • @Germesych_game
    @Germesych_game 14 วันที่ผ่านมา +2

    надо понимать простую штуку. если не залить в ее миллиард вариантов пройти такой бэнчмарк, оно не пройдет его! человеку же не надо миллиард тон данных чтоб это пройти, он может сам додуматься.
    как по мне ИИ еще очень слабые.. да, решать типоавые задачи по которым они обучены они могут !и тоне всегда... но стоит чуть в сторону отойти и все, ИИ ничего не может.. за уже лет пять наверное, пользования разными моделями. понял одно - "думать оно не умеет вообще! это шикарный поисковик по стеку готовых данных!".

  • @François_Gellert
    @François_Gellert 19 วันที่ผ่านมา

    Спасибо за видео! С наступающим!

  • @ПетрФомин-щ9ж
    @ПетрФомин-щ9ж 19 วันที่ผ่านมา +1

    Будет ли обзор свежей модели Microsoft_Phi-4 ? По моему они значительно улучшили поддержку русского языка и качество ответов у неё даже выше чем у Llama-3-70b хотя параметров у неё всего 14b. Такую можно даже на обычном геймерском пк попробовать запустить.

  • @Роберт628
    @Роберт628 18 วันที่ผ่านมา

    5:20 предполагаю, что эту модель выпустят Qwen. Они буквально недавно выпустили QVQ-72B-Preview.

    • @Fenixtremo
      @Fenixtremo 17 วันที่ผ่านมา +1

      Deepseek R3

    • @Роберт628
      @Роберт628 17 วันที่ผ่านมา

      @@Fenixtremo Да, но чтобы запустить его нужно нечто большее чем обычный компьютер.

  • @dssgames999
    @dssgames999 14 วันที่ผ่านมา

    Хотелось бы увидеть локальные модели для слабых пк.

  • @user-ey2vv1dl3n
    @user-ey2vv1dl3n 19 วันที่ผ่านมา +1

    сделай плз разбор мелких моделей с которыми может начинующий дома играться типа 3Б или новую квин с резонингом

    • @Denis_W3S
      @Denis_W3S 18 วันที่ผ่านมา

      тоже интересует эта тема, но я бы планку опустил до 1Б

  • @АндрейКрисанов-ь1м
    @АндрейКрисанов-ь1м 18 วันที่ผ่านมา

    Напоминает ли принцип, предположительно использованный разработчиками, ДОКТОРА СТРЕНДЖА, пересчитавшего 14.000.625 вариантов исходов?

  • @internetnickname8923
    @internetnickname8923 19 วันที่ผ่านมา +2

    о3 модель не для смертных, т.е. она создана по сути по большей части для решения сложных вопросов математики, медицины, программирования и науки в целом. Ни о каком AGI и говорить не приходится. По прежнему o1 не может решать даже некоторые детские задачи. AGI не нужно будет подталкивать к решению проблем через промпты, он сам будет их искать и решать в полуавтоматическом режиме, но до этого ещё минимум 4-5 лет. Я убеждён, что настоящий AGI и супер ИИ будет функционировать только на нейроморфных чипах интел и IBM.

    • @Denis_W3S
      @Denis_W3S 18 วันที่ผ่านมา

      Выскажу предположение, что сильный скачек в качестве моделей завязан на нескольких методах - рефлексии на основе повторяющихся циклов генерации, а также RAG in-memory. Последние может подгружать вместе с LLM в VRAM базу данных со структурированной информацией в виде справочников по наукам. Предполагаю что без MemoRAG в O3 не обошлось. По этому методу вообще инфы мало... Было бы интересно услышать мнение Руслана на этот счет🧐

    • @sterling4449
      @sterling4449 8 วันที่ผ่านมา

      Так то для технологии масштаба AGI, 4-5 лет это мелочь вообще. Речь идет о самой важной технологии в истории человечества.

  • @АлександрР-щ4ь
    @АлександрР-щ4ь 18 วันที่ผ่านมา

    спасибо

  • @ПетрФомин-щ9ж
    @ПетрФомин-щ9ж 19 วันที่ผ่านมา

    Ну понятно что это пока не AGI, потому что нет внутреннего состояния для эпизодичской памяти и эту модель очень дорого обучать на видео-токенах так как слишком много электро-энергии на это тратится, нужно дождаться аналоговоых или световых нейромофных чипов которые удешевят обучение и инференс моделей в разы тогда ОИИ замаячит на горизонте.

    • @vitall789
      @vitall789 19 วันที่ผ่านมา

      К Аналогу, нужен обязательно параллелизм в вычислении и запоминании состояния и не столь важно, что для этого будут использовать, магнетизм или фотоны, это уже будет достаточно для "замаячивания...", все остальное это жалкая пародия!

  • @igorlitvin1779
    @igorlitvin1779 18 วันที่ผ่านมา +1

    Звучит бредово))) Почему 85 процентов)) Почему именно эти тесты? Кто вообще судья. Это очень субьективно. Да и вообще сама задача странная и не определенная точно. Звучит как просто очередной хайп модели которую натренировали решать именно эти задачи. Челы посидели и решили датасет сдедать где похожие задачи решаются. Уверен чуть вправо или влево и будет провал. Визуальные тесты и взаимодействие с реальным миром должны быть проведены. Хотя это тоже не факт будет.

  • @markdjadchenko
    @markdjadchenko 19 วันที่ผ่านมา

    лайк!

  • @vitall789
    @vitall789 19 วันที่ผ่านมา

    Думаю эта уже точно не потянет текущ. техническую базу для масс! Нужен науч. прорыв в микропроцессорах и памяти!

    • @SashaKuzikov
      @SashaKuzikov 19 วันที่ผ่านมา +1

      Для масс и не требуется. Если AI позволит получать военное преимущество, разработки мгновенно станут закрытыми и секретными.

  • @yaroslavdmitriev3028
    @yaroslavdmitriev3028 19 วันที่ผ่านมา +1

    Как же хочется пощупать новую модель 😅

    • @ruslandev
      @ruslandev  19 วันที่ผ่านมา

      😁 а вы подайте заявку на ранний доступ для safety testing

    • @zigf
      @zigf 18 วันที่ผ่านมา

      @@ruslandev я уже подавал. Но модель сказала, что я нищеброд и чтобы шел лапать доярок.