Руслан, в очередной раз спасибо за то, что делишься столь полезной практической информацией! Если есть возможность, то расскажи насколько глубоко зашита цензура в llama 3 и насколько сложно изменить ее зацензуренный ответ на дообучении. Также еще хотелось бы увидеть промпты, которые во время бенчмарка были оценены низко, то есть GPT4 считает, что твоя модель не справилась с ответом. Это поможет понять слабые темы модели. А еще, возвращаясь к цензуре, у самой GPT4 хватает табуированных тем и она может ставить 1, даже если твоя модель ответила верно. Потом, если спросить GPT4, почему она оценила ответ на 1, то она скажет, что вообще на этот вопрос (по ее мнению) ответа давать нельзя, потому и 1. А это может снижать общую оценку бенчмарка из-за того, что сам арбитр весьма такой себе.
Молодец, хороший контент
Руслан, в очередной раз спасибо за то, что делишься столь полезной практической информацией!
Если есть возможность, то расскажи насколько глубоко зашита цензура в llama 3 и насколько сложно изменить ее зацензуренный ответ на дообучении.
Также еще хотелось бы увидеть промпты, которые во время бенчмарка были оценены низко, то есть GPT4 считает, что твоя модель не справилась с ответом. Это поможет понять слабые темы модели. А еще, возвращаясь к цензуре, у самой GPT4 хватает табуированных тем и она может ставить 1, даже если твоя модель ответила верно. Потом, если спросить GPT4, почему она оценила ответ на 1, то она скажет, что вообще на этот вопрос (по ее мнению) ответа давать нельзя, потому и 1. А это может снижать общую оценку бенчмарка из-за того, что сам арбитр весьма такой себе.
Насчёт цензуры тема действительно интересная. Спасибо за коммент, отмечу в планах для будущего контента
Интересно. Спасибо!
Про файнтюнинг нейронок для картинок будет? Там как раз SD3 вышла.
пока только про Diffusion Transformer (DiT) есть, дальше посмотрим...
а можно видео фантюна на каком нибудь кондовом железе, типа связки двух 3090 или 3 ох P40
Технически можно, но обучение будет медленным