Разработка LLM: сбор датасета с помощью GPT-4o | файнтюнинг Llama 3

แชร์
ฝัง
  • เผยแพร่เมื่อ 29 ธ.ค. 2024

ความคิดเห็น • 8

  • @stepanfilonov
    @stepanfilonov 6 หลายเดือนก่อน +3

    Молодец, хороший контент

  • @TheMr0day
    @TheMr0day 6 หลายเดือนก่อน +1

    Руслан, в очередной раз спасибо за то, что делишься столь полезной практической информацией!
    Если есть возможность, то расскажи насколько глубоко зашита цензура в llama 3 и насколько сложно изменить ее зацензуренный ответ на дообучении.
    Также еще хотелось бы увидеть промпты, которые во время бенчмарка были оценены низко, то есть GPT4 считает, что твоя модель не справилась с ответом. Это поможет понять слабые темы модели. А еще, возвращаясь к цензуре, у самой GPT4 хватает табуированных тем и она может ставить 1, даже если твоя модель ответила верно. Потом, если спросить GPT4, почему она оценила ответ на 1, то она скажет, что вообще на этот вопрос (по ее мнению) ответа давать нельзя, потому и 1. А это может снижать общую оценку бенчмарка из-за того, что сам арбитр весьма такой себе.

    • @ruslandev
      @ruslandev  6 หลายเดือนก่อน

      Насчёт цензуры тема действительно интересная. Спасибо за коммент, отмечу в планах для будущего контента

  • @astrauser-n4x
    @astrauser-n4x 6 หลายเดือนก่อน +1

    Интересно. Спасибо!

  • @mr.grixakrushkas5667
    @mr.grixakrushkas5667 6 หลายเดือนก่อน +2

    Про файнтюнинг нейронок для картинок будет? Там как раз SD3 вышла.

    • @ruslandev
      @ruslandev  6 หลายเดือนก่อน

      пока только про Diffusion Transformer (DiT) есть, дальше посмотрим...

  • @user-ey2vv1dl3n
    @user-ey2vv1dl3n 6 หลายเดือนก่อน

    а можно видео фантюна на каком нибудь кондовом железе, типа связки двух 3090 или 3 ох P40

    • @ruslandev
      @ruslandev  6 หลายเดือนก่อน

      Технически можно, но обучение будет медленным