GPT БОЛЬШЕ НЕ НУЖЕН! Разворачиваем Нейросеть локально за 10 минут

ZProger [ IT ]

มุมมอง 8 562

เพิ่มลงใน
- เพลย์ลิสต์ของฉัน
- ดูภายหลัง
แชร์

แชร์

ฝัง

ขนาดวิดีโอ:

แสดงแผงควบคุมโปรแกรมเล่น

เล่นอัตโนมัติ

เล่นใหม่

เผยแพร่เมื่อ 24 ม.ค. 2025

ความคิดเห็น • 120

@gambid98 13 ชั่วโมงที่ผ่านมา ⁺⁷
Интересны самые мощные модели, которые доступны. Некий топ. Да, некоторые компьютеры и сервера не вытянут, но увидеть самый топ, что доступно для личного пользования - было бы шикарно!
@zproger 12 ชั่วโมงที่ผ่านมา ⁺⁴
Насколько я знаю есть модельки 70b и вроде даже 150+, там уже мощности сопоставимы с коммерческими версиями openai, но запустить их у себя дома не представляется возможным, оборудование будет стоить около 200к$ для запуска.
Llama3.3 есть на 70b: ollama.com/library/llama3.3
А DeepSeek на 671b: ollama.com/library/deepseek-r1
Вот 671b это уже даже помощнее GPT4 будет, ибо среднее его потребление это 450млрд параметров. Но если брать полную мощность, то gpt4o дотягивает до 2трлн параметров.
@sergo5918 11 ชั่วโมงที่ผ่านมา ⁺²
> Интересны самые мощные модели, которые доступны.
> Некий топ. Да, некоторые компьютеры и сервера не вытянут
фигня вопрос, ставишь:
deepseeker 3.0 и все в ажуре!
но для локальной работы нужна видеокарта NVIDIA H100 80GB
примерно за $27,549
@Toondra128 8 ชั่วโมงที่ผ่านมา
Берёшь Phi-4 или Deepseek R1 Distill qwen 7b или 14b, квантование Q4_K_M. Готово (температуру инференса в 0). Уровень GPT-4o +- обеспечен.
@vladhanov1530 4 ชั่วโมงที่ผ่านมา
дистиллят deepseek
@Ввёлназваниеканала 14 ชั่วโมงที่ผ่านมา ⁺³
Спасибо за контент!
@zproger 14 ชั่วโมงที่ผ่านมา
Благодарю
@АнтонВебсайтовский 9 ชั่วโมงที่ผ่านมา ⁺¹
Все бы ничего, но то что мы используем с офф, там база более крупная и развивается всегда и с каждым запросом пополняется. а на локалке, ну такое себе, для генерации фОТО, еще можно юзать.
@roman352 5 ชั่วโมงที่ผ่านมา
Согласен. Да хайп на названии видоса . Уже бесит это , gpt не нужен , gpt самый лучший на рынке. За это автору 10 сек просмотра и дизлайк 😁
@TRX_144 8 ชั่วโมงที่ผ่านมา ⁺¹
Попробуй модели Ollama - тоже довольно легко ставится на пк плюс там можно использовать тот же мистраль и прочеее и более того можно модели несколько переделывать под себя и делать чтобы они работали с тобой отыгрывая определенную роль - в целом довольно большое поле для познания если ты такое любишь исследовать, Правда сравнивать эти модели с Чатом GPT а тем более заявлять что он теперь не нужен - это несколько некорректно - скажем так ими можно дополнить его и использовать для тех задачь где не особо можно использовать чат GPT но вот на полную замену понятно что эти модели не потянут - не тот размах. А в целом пытаешься зачем то изобретать велосипед - хотя уже все давно изобретено - если тебе нужен генератор картинок обрати внимание на Стейбл Дифьюжен там куча моделей и возможностей и на порядок выше качество твоих поделок)
@smetamobi8806 9 ชั่วโมงที่ผ่านมา
Пинокио побывали проверить?) по отзывам говорят что она как ОС, а как по вашему мнению?
@loonatik_official 14 ชั่วโมงที่ผ่านมา ⁺⁷
Круто! ждём полную раскладку на сплит клаву (хотя бы на гитхаб плзз) 🙌
видос про linux life hacks?
@zproger 14 ชั่วโมงที่ผ่านมา ⁺²
Можно сказать что и лайфхаки линукс) Под раскладкой вы подразумеваете corne? Так как Lily58 Pro уже давно на гитхабе
@loonatik_official 10 ชั่วโมงที่ผ่านมา
@ ага corne. после твоего видоса заказал, вот пару дней назад пришел. сейчас раскладку выбираю. думаю может colemak или sturdy попробовать. у вас qwerty?
лайфхаки линукс да))
@zproger 7 ชั่วโมงที่ผ่านมา ⁺¹
Постараюсь найти в ближайшее время и опубликовать в готовый репозиторий
@loonatik_official 5 ชั่วโมงที่ผ่านมา
@@zproger легенда! спасибо!
@Amandinscorner 7 ชั่วโมงที่ผ่านมา
Привет! Спасибо за видео, это очень интересно!
Скажите, а насколько этот интерфейс быстрый? Просто тот же Forge для SD сейчас активно оптимизируют, с него не слезаю...)
@Creepfall 10 ชั่วโมงที่ผ่านมา ⁺¹
А как называется шрифт который ты используешь в linux?
@zproger 10 ชั่วโมงที่ผ่านมา ⁺³
JetBrains Mono
@Creepfall 9 ชั่วโมงที่ผ่านมา
@@zproger Спасибо большое:) А какой именно от JetBrains их там очень много и я запутался:)
@b.c.2177 5 ชั่วโมงที่ผ่านมา
Чтобы развернуть что то локально нужны и соответствующие мощности, а это пока дорого и громоздко. Ждем более продвинутые процессоры с NPU, GPU ..
@Human738a 11 ชั่วโมงที่ผ่านมา ⁺¹
А почему данные модельки в общий доступ попадают? Ведь чтобы их обучаться нужно не мало ресурсов вложить.
@zproger 11 ชั่วโมงที่ผ่านมา ⁺²
Это опенсурс модельки
@АнтонВебсайтовский 9 ชั่วโมงที่ผ่านมา
верно, они как бы пустышки
@jetbrain9115 8 ชั่วโมงที่ผ่านมา ⁺¹
DeepSeek r1 на 32b парамеироа в ollama - модель размышления, у себя зарускал, сравнивал с mistral на генерацию кода, очень неплохо получилось, все сгенерировало и разжевало качество практически такое-же как у mistral.(железо - ноут, i5 12поколения, 64 озу, 3060 мобильная на 6 gb, примерно 2-4 токена в секунду.
@zproger 7 ชั่วโมงที่ผ่านมา
Очень круто, тоже потестирую в ближайшее время, если конечно озу хватит)
@Sharoplet 6 ชั่วโมงที่ผ่านมา
Напиши код который имитирует женскую логику... - АХАХАХАХАХ ты сделал мой день (на месте нейронки я бы просто обиделся и отказался бы работать)
@zzzzz-nj9cv 13 ชั่วโมงที่ผ่านมา
Как ты пользуешься браузером, если инкогнито не сохраняет пароли? Используешь обычный браузер для работы, а инкогнито для серфинга?
@zproger 13 ชั่วโมงที่ผ่านมา ⁺²
Инкогнито чисто для серфинга, чтобы не забивать историю миллиардами запросов, которые потом не удобно выбирать в предложениях из поиска
@EmoTilt 11 ชั่วโมงที่ผ่านมา
@@zproger историю чистить надо
@OddBit22 13 ชั่วโมงที่ผ่านมา ⁺¹
мне кажется для моего ноута с 4гб оперативы лучше всего использовать chat gpt...
@zproger 12 ชั่วโมงที่ผ่านมา ⁺¹
Можно еще попробовать mistral либо llama3.1:8b чисто ради теста
@taras7844 14 ชั่วโมงที่ผ่านมา
А какие свойства вашего ПК? Чтобы понимать какие модели мне светить запустить
@zproger 14 ชั่วโมงที่ผ่านมา
CPU: AMD Ryzen 7 6800H (16) @ 4.79 GHz
GPU 1: AMD Radeon RX 6650M [Discrete]
GPU 2: AMD Radeon 680M [Integrated]
Memory: 32 GiB
Но в целом я бы советовал скачать эти модельки из видео и протестировать самостоятельно, так как LM Studio изначально подсказывает какие модельки лучше всего подходят под ваше железо.
@taras7844 13 ชั่วโมงที่ผ่านมา
@@zproger Спасибо
@ВолодимирОлексієвич 11 ชั่วโมงที่ผ่านมา
Сколько времени ты уже занимаешься программированием ?
@zproger 10 ชั่วโมงที่ผ่านมา ⁺¹
Примерно 5 лет
@Spersonal77777 13 ชั่วโมงที่ผ่านมา ⁺⁵
Можно ли такие локальные модели обучать самому локально. Например скармливать им книги и получать выжимку из каждой гдавы или обучающего курса которые он тебе розжует и переделает под тебя. Или допустим какие-то краткие лекции с видео семинаров и других выступлений? Спасибо за ответ
@zproger 12 ชั่วโมงที่ผ่านมา ⁺²
Да, по идее можно, нужно только знать как) Можно у чат гпт попросить готовый код и скормить ему нужные данные для обучения.
@Spersonal77777 11 ชั่วโมงที่ผ่านมา
@zproger Интересно делал ли кто-то подобное. Ведь можно обучить его тому что тебе нужно)
@zproger 11 ชั่วโมงที่ผ่านมา ⁺¹
Проблема в том, что это не так просто как кажется) Обучить то можно, но чтобы он прям корректно отвечал, это нужно хорошенько попотеть.
@warmybo 8 ชั่วโมงที่ผ่านมา
ты опаздал уже есть такой сервис от яндекс 360 ии
@jetbrain9115 7 ชั่วโมงที่ผ่านมา ⁺¹
Если вам получить выжимки то не нужно обучать, нужно только правильный промпт составить + большой контекст передать (вашу книгу или главу..). Подобрать сетку с большим контекстом, qwen2.5 очень хорошие сетки (по сравнению с llama ми), deepseek r1 хороша, также архитектура вроде, пробовал 32b из репы ollama, работает на уровне mistral по генерации кода на python.
@gaymdev6144 8 ชั่วโมงที่ผ่านมา
А сделай гайд как на вдс запустить цпу модельку и шоб по апи можно было работать с ней.
@ДанилаМихеев-у5э 8 ชั่วโมงที่ผ่านมา
Я так и не смог завести Т банковские нейросетки. Говорят что супер пупер, но не получается у меня ее запустить
@GreeN_Noise 12 ชั่วโมงที่ผ่านมา
Блин, нужно комп помощнее купить, боюсь у меня не потянет львиную долю всех моделей, может если только самые простые. Можешь примерно сказать сколько нужно минимум ресурсов для работы с этими моделями?
@zproger 12 ชั่วโมงที่ผ่านมา ⁺¹
Я бы советовал скачать LM Studio и потестировать llama и mistral, так как очень сложно прогнозировать результаты. Llama 3.1 вроде от 4гб озу начинает работать.
@GreeN_Noise 12 ชั่วโมงที่ผ่านมา
@zproger спасибо, у меня 8 гб и проц i5 3-его поколения вроде, короче у меня ноут hp folio 9470m, что-нибудь может быть потянет
@adaeffsky 9 ชั่วโมงที่ผ่านมา
Мне понравился волк с 4 ноздрями
@zproger 7 ชั่วโมงที่ผ่านมา
:DDD
@zproger 7 ชั่วโมงที่ผ่านมา
Ну там надо допиливать и разбираться с промптами, как-то дойдут до этого руки и покажу нормальный пример
@Олег-б3ц9б 6 ชั่วโมงที่ผ่านมา
когда ии учился на цитатах волка...
@zproger 5 ชั่วโมงที่ผ่านมา
Ну а почему бы и нет))
@pechatnik 9 ชั่วโมงที่ผ่านมา
Да, отличный видос.
@zproger 7 ชั่วโมงที่ผ่านมา
Благодарю
@ПавелВеткин-о6щ 12 ชั่วโมงที่ผ่านมา ⁺¹
ComfUi то оболочек для генерации изображений
@zproger 12 ชั่วโมงที่ผ่านมา
Видел ролики с этим инструментом, как раз хочу изучить, ибо очень классные возможности :)
@proKaps 13 ชั่วโมงที่ผ่านมา
вот бы ещё с ней можно было бы общаться голосом как с ЧатГПТ
@zproger 12 ชั่วโมงที่ผ่านมา
По идее можно, но с доп.настройками. Надо будет поразбираться с HuggingFace, найти модельку и внедрить ее в LM Studio. Правда тут без кода не обойтись, можно написать на Python распознавание текста, передавать в LM, и оттуда возвращать на другую модельку и этот текст озвучивать.
@proKaps 12 ชั่วโมงที่ผ่านมา
@@zproger я слышал, что есть текст-речь, но как у ЧатГПТ такого ещё нет, ЧатГПТ может менять интонацию голоса и передавать эмоции в речи.
@Meowta 13 ชั่วโมงที่ผ่านมา ⁺¹
Самурай, ты ведь хотел попробовать посидеть на windows 2-3 дня и сделать ролик, уже не актуально? :(
@zproger 13 ชั่วโมงที่ผ่านมา ⁺³
Я вот не знаю будет ли это интересно людям) Так как одно дело когда показывают Linux, и людям интересно что это за зверь такой, а тут получается я покажу всем давно известную винду :D
@Meowta 13 ชั่วโมงที่ผ่านมา ⁺⁴
@zproger можно сравнить с Linux, рассказать о преимуществах и недостатках обоих систем, можно сделать 1 действие на windows и предположить как бы оно было на linux
@zproger 13 ชั่วโมงที่ผ่านมา ⁺³
Неплохая идея, может быть что-то придумаю
@Spersonal77777 13 ชั่วโมงที่ผ่านมา
@@zprogerНаоборот будет интересно.Тем более после опыта использования Арча. Честное сравнение + и - каждой ОС
@leguru 12 ชั่วโมงที่ผ่านมา ⁺¹
я после двух месяцев первого опыта линукса вернулся на винду, на которой провел всю жизнь, хочу обратно
@Interpolated. 14 ชั่วโมงที่ผ่านมา ⁺¹
стоитли переходить на линукс на 2025 или сидеть продолжать на винде
@cleanbaby72 14 ชั่วโมงที่ผ่านมา
Смотря какие цели
@zproger 14 ชั่วโมงที่ผ่านมา
Все зависит от цели, можете попробовать для начала на виртуалке, или же купить внешний SSD и поставить на него для тестов.
@Spersonal77777 13 ชั่วโมงที่ผ่านมา
@@zprogerА когда с ssd как вторая ОС, работает также как и вместо основной ОС, или есть нюансы?
@efoxxi 12 ชั่วโมงที่ผ่านมา
Я перешёл ещё в прошлом году полностью. Выбрал EndeavourOS (по сути Arch с графическим установщиком). До этого полностью не давало перейти то сырые Wayland с KDE 6, то недопиленные драйвера NVidia, то глюки с мыльными шрифтами и разнородными DPI на мультимониторной конфигурации. Винда стоит на соседнем разделе, в неё изредка лажу через VMware Workstation используя проброс реального раздела (сразу трёх виндовых) в виртуалку. Виндовые игрушки почти все работают в Linux через Steam или PortProton.
@mxmplk2190 14 ชั่วโมงที่ผ่านมา ⁺¹
Только вчера deepseek r1 вышел ай ай
@zproger 14 ชั่วโมงที่ผ่านมา ⁺¹
У меня он почему-то не работает) еще не разобрался как его запускать :D
@Toondra128 7 ชั่วโมงที่ผ่านมา ⁺¹
@@zproger Нужно обновить llama.cpp до версии 1.9.2 и выше, установить версию LM Studio 0.3.8.
@zproger 7 ชั่วโมงที่ผ่านมา
Благодарю
@mxmplk2190 5 ชั่วโมงที่ผ่านมา
@ у меня работает на маке, на винде не могу запустить тоже. 1.5B версия что то не сильно блещет крутостью =)
@SMETAverse 11 ชั่วโมงที่ผ่านมา ⁺¹
Очень рад и благодарен за ваш труд! четко быстро и содержательно, в первые вижу такой стиль.
Есть вопрос, что если у моего ПК 8 Гб ОЗУ но Видеокарта 16 Гб, потянет? или можно перенаправить вычисления на Видео процессор?
Благодарю.
@zproger 11 ชั่วโมงที่ผ่านมา ⁺¹
Благодарю. Если использовать тот же Mistral или CodeLamma, то благодаря большому объему видеопамяти должно раскрываться очень хорошо. Насколько помню, в настройках LM Studio можно сделать перенаправление, но это нужно поразбираться в этом.
@Andrei_Astral 8 ชั่วโมงที่ผ่านมา
Если есть запас в пару гигабайт ОЗУ, чтобы запустить саму программу, то можно. А вычисления можно полностью перенаправить на видеокарту (по крайней мере, так работает llama-cpp-python, которая основана на llama-cpp, лежащей в основе LM Studio)
@bega3 14 ชั่วโมงที่ผ่านมา ⁺¹
Хороший ролик
@zproger 14 ชั่วโมงที่ผ่านมา ⁺¹
Благодарю
@MASHINIST_8888 14 ชั่วโมงที่ผ่านมา ⁺¹
первый коментарий)
спустя 2 недели видео
@zproger 14 ชั่วโมงที่ผ่านมา
😎😎😎
@MASHINIST_8888 14 ชั่วโมงที่ผ่านมา
@@zproger :)
@wolfgrey3684 13 ชั่วโมงที่ผ่านมา
Тут)
@zproger 13 ชั่วโมงที่ผ่านมา
😎😎
@BOOsT13 4 ชั่วโมงที่ผ่านมา ⁺¹
А можно не заниматься гемороем и просто установить Jan с открытым исходным кодом🤡
@zproger 4 ชั่วโมงที่ผ่านมา
Впервые о таком слышу) Благодарю за подсказку, потестирую в ближайшее время.
@alexdrake913 13 ชั่วโมงที่ผ่านมา
Почему-то мне кажется, что автор куда-то спешит. Именно в этом видео очень скомканная кусками, и обрезанная по два слога речь, из-за этого не успеваешь за ходом мысли автора. Говорит как робот
@zproger 13 ชั่วโมงที่ผ่านมา
Да, я сам удивился когда пересмотрел видео сегодня)) Даже для меня быстро оказалось. Всегда одна и та же история, при озвучке стараюсь говорить как черепаха, на монтаже еще часа 2 трачу, чтобы доп.паузы расставить, пересматриваю и вроде гуд, а потом заливаю на ютуб и у меня тараторка под 200 бпм)
@alexdrake913 13 ชั่วโมงที่ผ่านมา
@@zproger В целом, на 0.8 скорости идеально заходит)
@maz1lovo 14 ชั่วโมงที่ผ่านมา ⁺¹
36 секунд назад 0-0
@zproger 14 ชั่วโมงที่ผ่านมา
😎😎😎
@ya.yakushev 13 ชั่วโมงที่ผ่านมา
братан людям голову не морочь, локалка это не вариант. И локального чатагпт нету))
@zproger 13 ชั่วโมงที่ผ่านมา ⁺²
Ну прям копии ChatGPT нет, потому что для GPT4 нужно 800млрд параметров, это надо машину стоимостью 2млн$. Но для чего-то простенького, по типу заметки в obsidian генерить, или отформатировать текст, или в свои ПО внедрить, это вполне достойная вещь как мне кажется :)
@Toondra128 7 ชั่วโมงที่ผ่านมา ⁺¹
Ошибаетесь. В настоящее время есть лёгкие LLM, у которых MMLU, HumanEval, и MATH очень близки к уровню тяжёлых моделей по типу Llama 3.1 405b, GPT-4o. Яркий пример - Phi-4.
@Wooondeer229 14 ชั่วโมงที่ผ่านมา ⁺¹
блин чел, термуху на проце замени! под 80 градусов на рабочем столе для - не нормально!
@zproger 14 ชั่วโมงที่ผ่านมา ⁺¹
Так я просто не показывал другие рабочие столы и фоновые задачи, у меня там на фоне был браузер, obsidian, телега, kdenlive, крутился lm studio с очень жирной моделькой и еще запись видео шла. Просто на рабочем столе у меня 40 градусов примерно :D
@Maks-vo3uo 13 ชั่วโมงที่ผ่านมา
При запущеном Юнити с проектом настоящим, АI вообще думать не хочет, у меня, это к вопросу о нагрузке на железо
@flyofk 13 ชั่วโมงที่ผ่านมา
Красавичк. Самый понятный гайд по этой теме.
@zproger 12 ชั่วโมงที่ผ่านมา
Благодарю!
@KniazObolonsky 13 ชั่วโมงที่ผ่านมา ⁺¹
Спасибо. Aide IDE прямо в тему к этим моделям.
@zproger 12 ชั่วโมงที่ผ่านมา ⁺¹
Благодарю!
@helios161 10 ชั่วโมงที่ผ่านมา
минус за озвучку.
бу-бу-бу, бу-бу-бу
@zproger 10 ชั่วโมงที่ผ่านมา
Согласен, надо исправлять)
@yastepan 13 ชั่วโมงที่ผ่านมา
скажу большее нейросети не нужны
@zproger 13 ชั่วโมงที่ผ่านมา ⁺¹
😎😎
@dlazder3937 11 ชั่วโมงที่ผ่านมา
Говори четче. Ты глотаешь буквы и звуки, интонация и речь у тебя ломанная. Слушать крайне неприятно.
@zproger 11 ชั่วโมงที่ผ่านมา ⁺²
Такой язык у меня, я каждую фразу повторяю по 10 раз, и потом на монтаже оставляю самые адекватные. Этот ролик был на 1.5 часов, но после того как обрезал фейлы, осталось 8 минут) Дикцию надо фиксить, упражнения помогают, но не настолько сильно, чтобы прям идеально выговаривать слова.
@wolfiedog5716 10 ชั่วโมงที่ผ่านมา ⁺¹
Автор, работай над речью, слушать очень тяжело
@zproger 10 ชั่วโมงที่ผ่านมา
Благодарю, потихоньку работаю над этим
@loonatik_official 10 ชั่วโมงที่ผ่านมา
мне заходит, наоборот нравится.
@vmenik3888 8 ชั่วโมงที่ผ่านมา
или от сюда лингвист лингвист хренов, всё норм у него

ต่อไป

เล่นอัตโนมัติ

Кодинг стал ИЗИ после этого открытия! Вот как я это сделал!