Llama 3.1: разбор статьи. Часть 1.Intro & Data mix

แชร์
ฝัง
  • เผยแพร่เมื่อ 22 ธ.ค. 2024

ความคิดเห็น •

  • @machinelearningpodcast9502
    @machinelearningpodcast9502 4 หลายเดือนก่อน +14

    Классный формат! Я бы с большим удовольствием продолжал смотреть разбор топовых статей!

  • @fatvvsfatvvs5642
    @fatvvsfatvvs5642 2 หลายเดือนก่อน +1

    Спасибо за топ контент! Буду рад послушать про мультимодальность, тема тоже интересная.

  • @nickfarshev9575
    @nickfarshev9575 หลายเดือนก่อน

    Приветствую, Учитель.
    Интерес у аудитории к тематике есть.
    Спасибо за контент!

    • @razinkov
      @razinkov  หลายเดือนก่อน

      Спасибо, что смотрите!

  • @Ghost_Paladin
    @Ghost_Paladin 2 หลายเดือนก่อน +1

    Классный разбор статьи

    • @razinkov
      @razinkov  2 หลายเดือนก่อน +1

      Спасибо!

  • @sergejskorohodov9201
    @sergejskorohodov9201 4 หลายเดือนก่อน +1

    Евгений, огромное спасибо за работу.
    Много полезного.
    Ждём продолжения.
    Хорошего дня.

  • @CaptainAdmiral
    @CaptainAdmiral 2 หลายเดือนก่อน +1

    круто, спасибо за разбор

  • @user-fhi58gg4gk
    @user-fhi58gg4gk 2 หลายเดือนก่อน +1

    Огонь!!!!

  • @Skolzzkey
    @Skolzzkey 3 หลายเดือนก่อน +2

    Спасибо большое. Очень интересная форма подачи материала.
    Также повеселили отсылки к металлообработке - отжиг. Кстати, для понимания процедуры использования более качественных данных в конце можно использовать аналогию из слесарного дела - сначала металл обрабатывают напильником, а потом уже полируют чем-то с более мелкими зёрнами.

    • @ДмитрийЯковлев-у6ц
      @ДмитрийЯковлев-у6ц 3 หลายเดือนก่อน

      В ML тоже есть такой алгоритм, который называется отжигом.

    • @wad881988
      @wad881988 3 หลายเดือนก่อน

      Он поэтому и называется отжигом, потому что идея позаимствована из обработки металла методом отжига, когда металл сначала выдерживают при высокой температуре, чтобы сбросить внутреннее напряжение в металле, а затем постепенно понижают температуру. Таким образом атомы постепенно встают на нужные места в кристаллической решетке и на выходе мы получаем однородный металл без внутренних напряжений и легко поддающийся обработке. Собственно в ML что-то похожее, только вместо температуры learning rate, а вместо атомов веса модели.

  • @pasha-k-ai
    @pasha-k-ai 4 หลายเดือนก่อน

    Спасибо за вашу работу! Очень интересный формат, т.к. самому не хватает компетенций читать такие статьи)

  • @polina8076
    @polina8076 4 หลายเดือนก่อน +1

    Присоединяюсь к предыдущему комментатору: было бы очень интересно смотреть такой разбор статей на англ.яз., т.к. я не владею им настолько, чтобы свободно читать техническую литературу. Да и искать такие статьи нет времени, т.к. увлекаюсь Data Science в свободное от работы время, которого не так много.

  • @_profe_games3306
    @_profe_games3306 4 หลายเดือนก่อน

    Возможно не последовательно изучаю материал, но слушать про современные приемы и рекомендации обучения куда интереснее поэтапного изучения всех веток нейронных сетей и математики стоящей за ними. Жду продолжения

  • @wadyn95
    @wadyn95 4 หลายเดือนก่อน +1

    Спасибо, там кстати когда вы про позиционные эмбэдинги обсуждали на экране про RoPE написано😁

    • @razinkov
      @razinkov  4 หลายเดือนก่อน +1

      Так и есть) Обсуждали позиционные эмбеддинги как раз потому, что в школе работали именно с ними)

  • @fanisir
    @fanisir 4 หลายเดือนก่อน

    Давай еще)🔥

    • @razinkov
      @razinkov  4 หลายเดือนก่อน +2

      На следующей неделе будет продолжение)