LoRA SDXL локально на ПК/Установка/Настройка/Тест готовых моделей. Kohya_ss
ฝัง
- เผยแพร่เมื่อ 5 พ.ย. 2024
- В этом видео я покажу, как локально установить среду для тренировки LoRA на ПК (Kohya_ss), выполнить все необходимые настройки, запустить процесс обучения и протестировать готовые варианты моделей.
Пошаговый Чек-лист, где прописаны все пункты настройки Kohya_ss можно скачать у меня на Boosty: boosty.to/iren...
__________________________________________________________
🔗Ресурсы:
страница разработчика Kohya_ss): github.com/bma...
🔹 МОДЕЛИ:
базовая модель SDXL: huggingface.co...
модель чекпоинт "BetterThanWords": civitai.com/mo...
модель LoRa (для катаны): civitai.com/mo...
___________________________________________________________
В поле "Optimizer extra arguments" выражение:
scale_parameter=False relative_step=False warmup_init=False
Если вам понравилась моя работа, вы можете поддержать меня вот здесь: boosty.to/iren...
❗ВАЖНО❗ В названии папок не должно быть КИРИЛЛИЦЫ и ПРОБЕЛОВ.
как раз только что на этом прогорел и хотел дополнить, но чуть чуть опоздал)
огромное спасибо автору за его работу над этим видео! примечание: у меня была проблема после переноса файлов в папку lora, они не отображались в stable diffusion, у кого может быть так же, вот решение. stable видит только те Lora которые соответствуют выбранной модели либо SDXL или SD, все остальные скрывает. Можно отобразить все, зайди в stable diffusion
Settings\Extra Networks\Always show all networks on the Lora page
Поставь галочку и сохрани настройку, перегрузи интерфейс, все появится.
Огромное вам спасибо. Без мата, лишней "воды" и прочего мусора, максимально понятный гайд. По вашему руководству делал лору, получилась просто идеальная лора. Epoch ставил не 10 только, а 1, поскольку это сумма всех операций, производимых при тренировке - зачем комп мучить и прогонять проверку 10 и более раз - не понятно. Я бы тут уточнил, что важно найти грамотно сделанный под ваши желания базовый чекпоинт, на основе которого вы тренируете. И ещё, рекомендую, чтобы Чекпоинт и готовящаяся вами лора совпадали по формату\версии: 1, 5; 2.0; Pony; SDXL итд... Сам делаю под SDXL, ибо на 1,5 вышло не совсем то, что хотел, а XL - идеально все скомпилировал и понял (потому что чекпоинт был хороший и формат лоры был такой же, как у чекпоинта). Ещё, маленькая, но очень важная деталь: проверяйте, чтобы формат ваших картинок был одинаковый: JPG или PNG, а то из- за формата некоторых картинок в HTML у меня слетала тренировка.
В общем, добра вам И спасибо огромное.
Спасибо за хорошие слова и ценные дополнения!🤗 Уточню только по поводу нескольких лор: мне нравится выбирать и сравнивать, словно детектив с лупой рассматривает неочевидные различия:)... к тому же под разные задачи порой нужны разные лоры: недообученные\переобученные. К примеру, недотренированные лоры, мне кажется, более гибкие в настройках. Но тут сплошной компромисс между богатством выбора и мощностью железа🤔
Спасибо вам! И удачи!😊
Спасибо! У вас талант делать понятные уроки!
Спасибо!🤗
Благодарю за толковый гайд , то что надо для первого раза чтобы не читая ни чего запустить обучение лора.
Спасибо большое :)
6:56 тренировал модель для 1.5 SD и галку не ставил, так как негде и всё получилось
flux лоры прокатит через Kohya учить? Все-таки SDXL модели уже отходят далеко на задний план.
Спасибо!
В других туториалах никогда не говорили что нужно нажимать на промежуточные кнопки вроде Print training и т.д, не знаю в этом ли была причина, но у меня ничего не работало в итоге, а в вашем видео все учтено и у меня запустилось! ❤
Супер! Рада, что у вас всё получилось!😊👍
@@irinabondareva1 кстати, я ставил epoch 10, но у меня тренирует только две модели и останавливается 🤷♂
У тебя количество эпох 7 получилось, потому что в Max train steps у тебя стоит 1600 шагов, сколько kohya уместила эпох в эти шаги, столько и выдала. Поставь там 0 и будут тренироваться все шаги исходя из того, сколько повторов ты выставила раньше.
Здравствуйте! Спасибо за рассказ о процессе. А что было целью обучения лоры? И что получается без обучения?
Пожалуйста:) Обученная LoRA позволяет сгенерированным изображениям придать черты объекта (или нескольких объектов) или воспроизвести какой-либо стиль или сочетание стилей. Есть другие способы добиться этого, лора - один из способов - удобный, гибкий и хорошо настраиваемый.
На азиатах можно лоры не делать) И так нормально получается)) Пример не удачный, надо было взять кого-то из известных людей, например Питта, нарезать из какого нибудь фильма, проапскейлить и потом скормить кохья.
А так контент годный.
как писал разработчик kohya, не стоит использовать с базовой SDXL bf16
Большое спасибо за понятный гайд!
Спасибо, получилось!
Ура! Я очень рада👏
Спасибо огромнейшее за толковое объяснение!
До этого натыкался на видео по 40мин или по 1.5 часа, куча воды, ничего дельного, да и результат оставлял желать лучшего. Низкий поклон.
Однако есть вопрос: сталкивались ли вы с тем, чтобы персонаж был всегда в одной и той же одежде ?
Например, у меня есть несколько артов, где персонаж в более менее похожем наряде.
Как я могу обучить лору так, чтобы при ее использовании он всегда использовал один и тот же костюм ?
Везде говорят о том, чтобы персонаж был в разной одежде, но мне нужно совсем наоборот, чтобы образ всегда был одинаковый. Заранее благодарю!
Спасибо за слова!🤗 По поводу одежды персонажа: разнообразная одежда дает большую вариативность различных комбинаций при генерации. Если персонаж должен быть, к примеру, одет в серый камзол с золотым шитьем, то в текстовых описаниях к фото нужно как можно более точно указать это. Чтобы нейросеть понимала, что именно изображено на фото. Тогда с бОльшей вероятностью при описании одежды в промте она выдаст именно такое сочетание деталей одежды. Но, думаю, это не основной вариант. Лучше использовать IP-Adapter, где мы с детальной точностью показываем ту одежду, которая должна быть на персонаже. И, меняя вес ip-adaptera добиваемся большей или меньшей похожести. У меня на канале есть урок, где я одеваю персонажа в одежду "с вешалки из магазина".😊
@@irinabondareva1 Спасибо вам большое! Я пробовал использовать IP-Adapter, но, увы, почти никогда не получалось достигнуть 100% сходства. Видео обязательно посмотрю, может что-то упустил.
hi, could you also make a tutorial on how to create a pony checkpoint?
Max train steps 1600, когда выставляешь, не работает, а когда просто пустое поле, то работает. Как быть, что не так? Пишет total optimization steps 0, и всё, ничего не происходит!
все заработало оставил поле Max train epoch пустым и все заработало а в поле Max train steps поставил 1600 и все начло работать надеюсь кому то помог...просто если ставить 0 в первом поле и во втором 1600 то как и описывал не чего не работает...!
только вот теперь не одна шкала а вот так по порядку идет так должно быть? steps: 0%| | 2/1600 [01:23
вроде сделал всё как у тебя, но когда нажимаю старт, в консольки что-то пробегает и через пару секунд завершает работу. Подскажи пожалуйста из-за чего такое может быть
Тоже самое, как-то решили проблему?
Добрый день, Ирина. Спасибо за обзор. Возможно, у вас есть опыт создания Lora на стиль? Буду очень рад, если вы сделаете обзор на эту тему. Много читал про стили и часто советуют тренировать Lora на стиле той модели, которая больше подходит к тому стилю, который вы хотите получить.
Пожалуйста:) Я сейчас занимаюсь другим, но если будет время - обязательно запишу, у меня тоже возникают такие мысли)
Спасибо большое за гайд! Очень адекватно и актуально, выражаю респект!
Спасибо за респект!😊
спасибо за урок! я последнее время исползую adamw8bit он более быстрый чем Adafactor.
Ирина добрый вечер!Процесс обучения у меня запустился.Убрал кирилицу из названия папок.Появилась первая лора.Взял 12 фото друга.Но на выходе получился не очень хороший результат.Промпт был такой: а sci-fi boy, и лора первая. в итоге лицо какбы узнаваемое но почему никакго сайфая. и еще текст в панеле:A tensor with all NaNs was produced in VAE.
Web UI will now convert VAE into 32-bit float and retry.
To disable this behavior, disable the 'Automatically revert VAE to 32-bit floats' setting.
To always start with 32-bit VAE, use --no-half-vae commandline flag.
Рада, что получилось!😊
1. По поводу схожести: чтобы схожесть была максимальной, нужно в промте написать тот уникальный токен, который вы указывали в настройках (тот самый рандомный набор символов и class promt (слово "man"). В промте это будет выглядеть вот так (к примеру, у меня): "rgnhm man", а дальше "а sci-fi boy" и т.д.
2. Вы взяли первую лору - она может быть недообучена, но гибкая. Последние могут перетренированы. Для масиксимального сходства попробуйте взять лору из середины или чуть за середину. Но это неточно, тут нужно тестировать.
3. Сообщение о VAE выдается, скорее всего, потому, что вы забыли поставить галку "No half VAE".
Спасибо большое за очень полезную информацию. Это самое толковое видео на эту тему.Обучал lora на своё лицо, с параметрами из видео есть небольшое сходство, подскажите пожалуйста как повысить результат?
Спасибо за хорошие слова!🤗 Чтобы сходство было максимальным, в промте в начале нужно указывать тот самый уникальный токен, который вы придумали для этой модели и класс. К примеру, "rtyfgh man", и уже далее описывать персонажа. Эти два слова можно посмотреть либо во вкладке Lora, кликнув по значку настроек на конкретной Лоре, либо в текстовых файлах, которые автоматически создались для каждого фото😊
@@irinabondareva1 Большое спасибо. Успехов в Вашем творчестве.
@@ВладимирБондарь-т8ь Спасибо, и Вам желаю удачи!😊
@@irinabondareva1 Здравствуйте Ирина! Хочу ещё раз выразить Вам благодарность за подробный урок по созданию LoRA. После Вашего совета по корректировки промта результат превзошел все ожидания, некоторые генерации моя жена спутала с реальной фотографией, задав вопрос "А где ты сделал эту фотографию?"правдо перед этим я сделал пару штрихов а Фотошопе и сходство близко к 100 %. Если Вас не затруднит можите подсказать ещё модель XL для обучения LoRA в реалистичном стиле. Спасибо.
@@ВладимирБондарь-т8ь Очень рада, что вам удалось добиться впечатляющего результата - женщины в своих фотках разглядят малейшую черточку, невидимую невооруженным взглядом, и реакция вашей жены - лучший индикатор успеха!😁👍 По поводу модели... мне нравится вот эти две модели, хотя, конечно, во многом тут дело вкуса:)
civitai.com/models/133005/juggernaut-xl?modelVersionId=782002
civitai.com/models/122822/crystal-clear-xl?modelVersionId=133832
на 4070 с 12ю гигабайтами видео . начинает кушать 15 . и под это дело берет место с ОЗУ . Из за чего время на трейн уходит за 2 часа .
Есть ли способ не давать утечку в ОЗУ ?
Жёская!)
вы чудо!
хм, а у меня Кохая почему то обновилась до версии 24.1.4 и весь интерфейс изменился: теперь непонятно что, где и как
На какой видеокарте вы делаете 10 Epoch, на 4090 или у вас облачная тесла??? Тогда так и говорите. У меня 4070super на 12 гб, не самая медленная карта, стандартное время генерации для нее на SDXL 1024 на 1024 - 6.5 секунды, так вот, расчетное время для 10 Epoch она показывает около 5 часов!!! Плюс к тому же вы некорректно считаете эти эпоки, чтобы у вас делались все десять, а не 7 и не 5, вам нужно не 1600 указывать, а совсем другое значение.
4070super - ок, но 12 гб - это маловато. У меня RTX A4500, 28 GB RAM. Одна лора тренируется примерно 10 мин.
@@irinabondareva1 кстати, насколько я понял, один эпок это 320 степов, если делать 10 эпоков, то нужно 3200 ставить.
Подскажите плиз, любой тип модели на базе SDXL подойдет? На сайте Civitai не вижу моделей на "голом" SDXL. Есть, например "SDXL 1.0", "SDXL Turbo". Спасибо за видео! UPD: "SDXL 1.0" подошла, процесс запустился. За 20 минут у меня натренилась 3% первой эпохи, поэтому все скипнула. Кажется, это не для моей видюхи
sdxl 1.0 и есть голая модель, базовая.
все сделал перместил в папку но stble diffussion не видит во вкладке лора что делать
обновлял и пр\ерезагружал по несколько раз результата нет
А другие Лоры видит? Возможно, это из-за того, что у вас выбрана модель SD1.5. Раньше отображались все лоры в кучу. Теперь, после обновления, во вкладке отображаются только те лоры, которые соответствуют выбранной модели: sd1.5 или SDXL.
Спасибо за видео! подскажите а обязательно тренировать на оригинальной модели или можно взять любую модель на базе sdxl
Думаю, что результат на основе базовой модели будет "чище" и только ваш. Ведь если брать модель, которая уже была предварительно натренирована, то она уже несет в себе какие-то данные, и смешавшись с вашими, эффект может быть не совсем тот, что вы ожидали. Но попробовать интересно. Я не пробовала)) Поделитесь потом впечатлениями🤔
@@irinabondareva1 Я так на 1.5 тренировал модели, брал делиберате, прям супер получалось на 1.5 оригинальной, качество не то...
Вот такой текст в cmd панели: steps: 0%| | 0/1600 [00:00
Нашла такой же вопрос, как у вас. Человек пишет о проделанных шагах по отладке, и одним из пунктов пишет:
"Также я проверил папку: D:\訓練\log существует, это пустая папка."
Ему посоветовали изменить имя папки на английское. Вот ссылка по обсуждению такой ошибки: github.com/bmaltais/kohya_ss/issues/1850
почемуто-то не возникает строка epoch 1/7 много текста и в конценадпись что тренировка закончена
-Проверьте, не пишет ли в этом тексте ошибку, что не хватает видеопамяти, что-то типа "torch.cudaOutOfMemoryError: CUDA out of memory."
-В названиях папок не должно быть кириллицы и пробелов.
Это самые распространенные моменты, почему тренировка заканчивается безрезультатно.
Добрый день) спасибо за урок. У меня тренировка запустилась, но 27% 1-ой эпохи почти 4 часа обучалось. У меня эпох 3, а не 7 как у вас, хотя я все делала как в видео, только для тренировки 32 фото взяла. В чем может быть проблема? И еще gradio просит обновить до версии 45.29.0 это нужно делать? Если да, то как?
Параметры компа:
Процессор: Intel(R) Core(TM) i7-10700KF CPU @ 3,80GHz
ОЗУ: 32ГБ
Система: Windows 11 64-разряда
Видеокарта: Nivada GeForce RTX 4070
Корпус be quiet! Pure Base 500 BG035
Добрый день!:) А какой объем памяти у видеокарты? У меня RTX A4500 c 20ГБ. У вас видеокарта покруче, но вот какой объем памяти?🤔
32 фото для тренировки - это очень много. Здесь как раз тот случай, что больше - не значит лучше. Слишком большое количество фото может, наоборот, даже ухудшить итоговый результат. Для тренировки Лоры на базе модели SDXL лучше использовать 10-20, и, желательно, чтобы ракурс был разный.
Насчет gradio не могу дать совет, у меня версия 3.41.2
@@irinabondareva1 видеокарта 12Гб) Переделала с 12-ю фото, ушло почти 10 часов
Добрый вечер Ирина. У меня почему-то не возникает файл с расширением "safetensors" только joson и TOML на 3-4 килобайта. Хотя я повторил все действия в видео.
Здравствуйте) А у вас программа не пишет среди массива текста сообщение об ошибке...что-то типа "не хватает мощности видеокарты"? Если программа не дошла до строчки "epoch 1... steps", значит обучение не началось. И в массиве текста должно быть сообщение о причине этого. Поищите строчку: "torch.cuda.OutOfMemoryError: CUDA out of memory." Модель SDXL достаточно тяжеловесна и требует много ресурсов. Попробуйте изменить тип модели с sdxl на sd15, чтобы проверить, что проблема не из-за нехватки мощностей. Остальные настройки не меняйте, только тип модели. Вот в этом ролике я рассказываю о тренировке лоры в сервисе RunPod,и на 13 :11 мин. как раз говорю о возможной ошибке. th-cam.com/video/yZNIp6Bi-ow/w-d-xo.html
@@irinabondareva1 благодарю за ответ. Про нехватку видеопамяти панель не пишет, у меня RTX 3060 12 GB. Должно по идее хватать? Но я ещё раз попробую и еще раз почитаю логи.
Вот здесь, на странице разработчика есть обсуждения проблем, которые возникают в процессе настройки. Может, здесь есть ответ и на ваш вопрос:) github.com/bmaltais/kohya_ss/issues
Забыли сказать, что по пути установки не должно быть кириллицы и пробелов в названиях папок.
Согласна с замечанием. Это как раз пример того, что порой нам просто не приходит в голову отметить какой-то момент, который нам кажется очевидным, но который не очевиден для других. Бывает...🤔
Поему в конце на тренинге Лоры нет? а есть файлы toml?
Видимо, обучение лоры не началось по какой-то причине. Одна из причин - недостаточно памяти видеокарты. Поищите среди массива текста строчку: "torch.cuda.OutOfMemoryError: CUDA out of memory".
Модель SDXL требует досточно мощной видеокарты. Попробуйте в настройках поменять имя модели с sdxl на sd15 и запустите обучение, чтобы исключить тот вариант, что kohya_ss не хватило мощности.
Если это не тот случай, поищите в тексте еще сообщения об ошибке, что-то со словом "error".
@@irinabondareva1 я на 1.5 тренировал. Ошибки как бы не было, но посмотрю внимательно, спасибо.
Вот страница разработчика с обсуждением проблем, которые возникают у людей, может, пригодится) github.com/bmaltais/kohya_ss/issues
@@irinabondareva1 благодарю вас
D:\Kohya_training\kohya_ss>.\setup.bat
".\setup.bat" не является внутренней или внешней
командой, исполняемой программой или пакетным файлом. Что делать в такой ситуации?
У вас, видимо, не установлена программа Git, поэтому ваш компьютер не понимает эту команду.
Как быстро у вас проводится обучение? (Скачал файл для современных видео карт) У меня gtx 3060, запустил процесс обучение, видео карта загружена на 99%, примерное время 6 часов..
3060 это очень слабая карта для тренировки.
У меня A4500, и одна модель обучается примерно 10 мин. На тренировку 7-ми эпох потребовалось чуть больше часа.
А какой объем видеопамяти у вашей 3060?
@@arimanmagnarov1815 12г
Ты крута
Thanks😊
Есть способ всё это в гугл колабе сделать?
Есть, мне попадался ролик, где автор именно там и запускал. Но, к сожалению, я не сохранила его, так как не пользуюсь колабом
А если у меня уже стоит пайтон 3.10 м git мне не нужно их скачивать снова? я в марте автоматик установил
Не нужно:)
@@irinabondareva1 спасибо за ответ), я вчера не дождался его и установил кохью повторяя ваши действия по видео! У вас хороший педагогический дар))).
@@arimanmagnarov1815 спасибо!😀Рада быть полезной))
@@irinabondareva1 Ирина у вас какая видеокарта стоит? Вы на каком "железе" тренируете Лоры? Или у вас облачный сервис какой нибудь?
У меня на 4090 20 картинок 3 часа обучаются это смешно.
Что именно смешно? Здесь большое значение имеет не крутизна видеокарты, а объем ее оперативной памяти. У меня не самая мощная RTX A45000, но у нее 28 гигов. А если у вас 4090, но с 12-ю гигами, то обучение будет медленнее.
@@irinabondareva1 на 24гб, а смешно что такая видеокарта не вывозит какие-то картинки с разрешением 1024😪
@@СлесарьЛеха Поняла) Но если посмотреть на это с другой стороны🤔... какие-то три часа и у вас готовая модель(!), умеющая мимикрировать под определенную внешность с максимальной степенью сходства;))
у меня 500 картинок 9 часов.. если все как в настройках делать у автора...ртх3060 12гигов
При тренировке lora выдает такую ошибку, как ее исправить? CalledProcessError: Command '['D:\\Kohya-ss\\kohya_ss-master\\venv\\Scripts\\python.exe', 'D:/Kohya-ss/kohya_ss-master/sd-scripts/sdxl_train_network.py', '--config_file', 'D:\\lora\\Lora\\model/config_lora-20241012-175302.toml']' returned non-zero exit status 2.
Такая ошибка случается, если какой-то параметр выставлен неправильно. Проверьте, переключились ли на SDXL (возможно у вас стоит галка на sd1.5 или на v2.) Проверьте оптимайзер - должен быть "Adafactor". Названия папок должны быть на латинице и без пробелов. В общем, нужно проверить все параметры - где-то закралась ошибка.