Stable Cascade - НОВАЯ НЕЙРОСЕТЬ от создателей Stable Diffusion. Как установить на ПК
ฝัง
- เผยแพร่เมื่อ 19 ก.พ. 2024
- Паблик ВК: turbinskiy_artwork
Телеграм: t.me/turbinskiy_art
⭐ Поддержать великодушно:
www.donationalerts.com/r/alek... - แนวปฏิบัติและการใช้ชีวิต
На Civitai один из выложенных по каскаду воркфлоу содержит таблицу разрешений, очень удобно.
Собственно про сам каскад на сегодняшний день, это пока, если сравнивать с играми, бета версия. Модель по сути одна, хотя и состоит из отдельных частей, о чем показано в видео. Лор нет, ничего нет, населена роботами...но умеет работать со встроенными в Комфи стилями. Причем интересно, что ноды для стилей подходят только от SD. На XLевской вылазит та же ошибка совместимости с SD моделью, что и на обычной версии. Я так понял - основа SD?
По поводу использования видео памяти, на 8 все работает примерно так же как и на стандарте. Ни о каких больше 8гб речи нет. Но интересное происходит в нагреве видеокарты, при гораздо большей длительности генерации в каскаде температура ниже. Если при стандарте доходит до 72, то здесь не выше 57., хотя может и от видюхи зависит.
Что касается качества... добиться результатов на подобии того, что представлено в качестве примеров на странице каскада, не получилось. Скорее всего просто терпения не хватило разобраться, очень уж долго каскад генерирует, в итоге получается что то не слишком естественное. Ну и самое главное, на данный момент каскад не понимает того что понимает та же XL.То есть один и тот же промт в каскаде требует уточнять многие детали дополнительно. Наследие SD модели? Понимание сути из общей фразы, например когда в качестве промта пишешь текст стихов или песни, тут каскад смог справиться на хорошем уровне. Суть улавливает и это уже есть гуд.
Теперь пальцы, руки, ноги... Мало тестировал по причинам указанным выше, но в том что было криминала не увидел. Но если вы генерируете персонажа с предметом в руке (не с тем что вы подумали, каскад пока что в ЭТО не умеет никак), то готовьтесь к арсеналу как из мемной фотки с десантником. Если предмет в одной руке. то персонаж держит его правильно зажав пальцы. Если нужен предмет во 2й руке, то этот доп предмет слетает с позиционирования.
В итоге, продукт пока сырой, слишком массивный из-за структуры, когда нужны по сути 4 модели в одной пачке- VAE (он же а). b, c, CLIP и все это весит от 6 до 14гб по отдельности (интересно кто будет заморачиваться с созданием новых моделей в таком случае), требующий изначально минимум 2 прохода генерации по KSampler-у, помимо всех прочих обработок, что влияет существенно на время работы. А прибавьте сюда всяких обработчиков-улучшайзеров, да с контролнетами, да поболее, да что бы все в одном... В общем ждем оптимизацию и доработки.
Смотрел куча видео на английском на эту тему, у тебя самая лучшая информация. Спасибо!
Супер. Отличные результаты, благодарю за подсказки!
Теперь ждём, когда коммьюнити всё это дело дообучит, тогда посмотрим, как это всё будет выглядеть
Sdxl уже дождалось?)
Как в фильме Апгрейд
@@TovSpaskinКто знает, руки не одна нейронка с нуля не делает.
Только импаинтом.....
Думаю, Fooocus для меня сейчас более чем достаточно) Хотя, конечно, молодцы, что продолжают оптимизировать.
@@user-sq5rq7dx4x Это не так, все зависит от выбранного промта и модели.
Спасибо очень доступно и понятно, даже новичкам😌
получилось, спасибки)
спасибо большое, полезно
Спасибо!
Спасибо!!! Супер!!!!!
Подскажите, а можно ли нейросетью генерить надписи с красивыми шрифтами ? И если "да", то с помощью каких бесплатных нейросетей это возможно ?
Stable Diffusion умеет такое ?
Adobe Firefly предназначен для красивых генераций шрифтов. Stable Diffusion не умеет сам этого делать.
@@TURBINSKIY посмотрел, что в плане шрифтов умеет Adobe Firefly.
Сильно в детали не вдавался, но, исходя из того, что увидел - это не то, что нужно, увы.
Он, как я понял, генерит не стили и разновидности шрифтов, а заливку одного и того же шрифта разными графическими паттернами - шоколадками, грибочками, нитками, чешуёй и т.п. А нужна именно генерация надписей разными шрифтами - то, чего я не увидел в FireFly. (заливать паттернами сами буковки, конечно, тоже имеет значение, но это уже на втором месте).
это всё здорово, а что с руками и пальцами в итоге?) Последние фотки с девушками в этой сетке сделаны?
че вы до пальцев доебались, давно уже есть лоры для исправляения рук да и в целом все получше встало
@@user-ej2lm9vo5m с лорами мне не нужна новая нейронка, мне бы хотелось чтоб как они рекламируют - в один клик норм фотка, а не полчаса потом еще допиливать чем то, надоели костыли.
Только вышел Каскад да еще и не финальная версия, а уже стейбл дифужен 3 на подходе просто без слов...
народ, подскажите плиз: при генерации выдает ошибку CUDA out of memory, 8gb видеокарта 3070ti, 16 гигов оперативки. Кто-нибудь сталкивался с такой ошибкой?
Минимум 32 Гб оперативки надо, как и для SDXL.
Stability AI анонсировали Stable Diffusion 3! Столько громких новостей за последнее время... Ждём обзор
Есть ссылка ?
👍
Алгоритм под названием вюрстхен - это колбаска по-немецки
С большими разрешениями (15360*4320 с параметром "very good highly ultra‑detailed 16K" (но, требуется большое кол-во RAM, при 64Gb бывает в SWAP скидывает порядка 20Gb, при 128Gb SWAP не задействован, но оператива грузится на 80-90Gb; еще так-же, средствами реестра и BIOS расширена VRAM за счет RAM, хоть чуть-чуть лучше и стабильней работает, хотя 2-е видюшки, 2080 под нейросеть задействую и вспомогательная на 2-ой монитор RX5800XT, уже фильмы и прочее смотрю; единственное что плохо, в "Фокусе" не могу полностью проц задействовать, SD задействует и грузит проц на 70-80%, "Фокус" 2-5%, максимум до 10% (но это если еще и играть во что-то параллельно), было-бы идеально, задействовать Nv+Ati+CPU - но как это сделать...???)) пока единственное, что корректно может работать это "Fooocus". Все остальное, сколько не пробовал, огромные искажения и артефакты. Особенно с конечностями и лицами. Ну и конечно, размытость, расфокусировка, наложение.
Не вижу различий с SD
Я немного тестировал каскаду. Она лучше понимает промпт и получить с её помощью более сложную композицию легче. Как по мне это попытка приблизиться к миджорни в плане соответствия между подсказкой и результатом. До Dall E 3 всё ещё далеко.
По разрешению - проверь зависимость соответствия требования что бы стороны делились на 64.
Да, именно в подобном направлении надо копать
Установил себе попробовать версию, которая типа "в один клик". Встала без проблем. Интерфейс минимальный, но настроек там нет. По умолчанию было 1024х1024 и при 16гб оперативки и 16гб видео больше не смог ничего сгенерировать. Из 16гб забирает практически всё. У меня только после загрузки оболочки уже занято 13.7гб видео памяти. От результата хотелось получить "ВАУ!" Но на первый взгляд никаких плюсов не увидел. По скорости дольше, картинка похуже и только полное потребление ресурсов компьютера. Это заметно сразу. Может допилят, но пока по ресурсы-скорость-качество у меня Forge потом А1111 остальное на вкус и цвет😊😊😊
Forg? Не слышал. Это что?
видеокарту не бось костарт купил по видеопамяти?
Абсолютно с вами согласен!
@@CRYPTOLAVKA stable-diffusion-webui-forge - оптимизированная версия автоматика.
@@romanioamd5319 не совсем понял. Видеокарта с двумя вертушками RTX4060Ti 16gb если интересует это.
💯💯💯💯💣💣💣💣💥💣💥💥🔥🔥🔥👍👍👍👍
Все хорошо, но нет главного - нафик этот каскад нужен?
как \ понимаю, амд его не потянет, да?
Амд вообще не тянет нейросети
Тянет. У меня стоит sd адаптированный на амд. Правда, амд тянет слабо. 12гб тянет как будто 8гб из нвидиа
Постепенно, алаптируют на амд. Даже fooocus адаптировали на него. Неделю назад скачал и его тоже
Долго на амд, да и разрешение не тянет нормальное
вы бы хоть иногда системные требования говорили, и что без 32-64гб рам тут ловить нехер.🤔
у меня отлично работает и sc и sdxl на 16gb ram + 8gb vram
ты нищенка что ли? сходи купи 32 гб рам, если нет денег - заработай
20 Гб рам полет нормальный
Я не понимаю, для чего они делают нейронки которые генерят типа высокое разрешение, если sd 1.5 с апскеллером выдает такой же результат? Неужели нельзя было дальше простую sd развивать? (сам пользуюсь Delibrate)
Ваше непонимание совершенно понятно. Оно кроется в неспособности видеть, анализировать изображения и воспринимать элементарные отличия деталей. Также понимать отличия общего и частного. Проще говоря, примитивная нейронка в вашей голове не позволяет проводить сравнительные визуальные операции.
@@alexs1681 то есть я не вижу разницы, потому что я не вижу разницы… заебись, спасибо кэп😆
Ну нет уж, если невысокое разрешение апскейлить скажем в фул хд и выше, всплывают косяки.
@@funnyfun9017 инпайнт отдельных участков решает эту проблему.
Если конечно cascade без косяков бы рисовала сразу то было бы норм. А так и в том и другом случае все равно косяки исправлять. (Даже в видео 4-7 пальцев в конце эт несерьезно) А генерация на каскаде медленней.
Какой шанс портирования на телефоны
Нулевой
Какие вообще основные преимущества над Stable Diffusion у неё?
полезные
@@alexs1681 Как и твой комментарий)