Файнтюнинг на примере Llama 3 + QLoRA. ПРОЩЕ и ЭФФЕКТИВНЕЕ чем когда-либо

Ruslan Dev

มุมมอง 8 159

เพิ่มลงใน
- เพลย์ลิสต์ของฉัน
- ดูภายหลัง
แชร์

แชร์

ฝัง

ขนาดวิดีโอ:

แสดงแผงควบคุมโปรแกรมเล่น

เล่นอัตโนมัติ

เล่นใหม่

เผยแพร่เมื่อ 18 ธ.ค. 2024

ความคิดเห็น • 57

@ruslandev 7 หลายเดือนก่อน ⁺¹
Вышла новая часть - Файнтюнинг и квантизация Llama-3-70B th-cam.com/video/ML4M1UQHxbU/w-d-xo.html
Я обучил самую большую пока Ламу на мультиязычном датасете, и она начала следовать инструкциям на русском.
А также я показал процесс квантизации модели с сохранением в формат gguf.
@ПетрФомин-щ9ж 7 หลายเดือนก่อน ⁺³³
Честно говоря я ожидал большего. В начале видоса был радостный возглас: "наконец-то мы получили модель сопоставимую по качеству с GPT-4"!!! Речь шла конечно о Llama-3-70b И потом автор с покер-фейсом просто берёт для своего фантюнинга модель Llama-3-8b-4bit. То есть не только модель в на порядок меньше так ещё и квантизованую по самое нибалуйся. Я ожидал увидеть процесс обучения 70b квантизованой до 8 бит модели на A100 GPU камне и понять примерно сколько времени это может занять. И дообучать чему-то полезному например вопросам и ответам на русском языке. В этом видосе кстати сам процесс обучения скипнут хотя это самое интересное можно было показать минуту начала и минуту конца. Просто так скипать весь процесс это не правильно потому что ради этого процесса все эти подготовительные танцы с бубном и проделывались.
@TheMr0day 7 หลายเดือนก่อน ⁺¹⁰
Согласен. Тоже хотелось бы увидеть работу с моделью 70B и обучение на русском датасете, потому что инференс на русском языке у llama 3 из коробки местами весьма корявенький (по крайней мере, то, что я увидел на 8B). Если аренда ресурсов под обучение 70B окажется довольно дорогой по стоимости, то показать хотя бы расчеты и минимально необходимые ресурсы для запуска.
В любом случае, ролик полезен и автору спасибо за то, что делится знаниями! Квантизацию и конвертацию в GGUF тоже ждем.
@dolotube 2 หลายเดือนก่อน
Оставлю здесь для истории ответ на вопрос "время дообучения 70b на одной А100 три эпохи" - около 5 дней (взято из следующего видео на канале).
Время также зависит от кода обучалки, объема докидываемой информации и прочего железа, но уже можно прикинуть порядок чисел для своего компа. Ну или стоимость аренды.
@kirillkirilenkov9610 7 หลายเดือนก่อน ⁺⁹
Квантизацию модели с последующей конвертацией в GGUF поддерживаю.
@MultiAccordionman 7 หลายเดือนก่อน ⁺⁹
Спасибо большое за ролик. Было бы здорово увидеть ролик про квантизацию и разбор Вашей библиотеки.
@ДмитрийГерасименко-м2е 7 หลายเดือนก่อน ⁺⁷
Было бы ещё Здорово эту модель залить на хостинг через фласк или Джанго чтобы она там отвечала на вопросы,(конечно в закрытом режиме для безопасности) также было бы интересно посмотреть как реализовывается Telegram бот с её помощью, конечно после того как квантизация будет сделана. Думаю что это были бы очень ценные ролики для многих.
@КравчукІгор-т2э 6 หลายเดือนก่อน ⁺²
Да это интересно. Спасибо за Вашу работу.
@infomed100 7 หลายเดือนก่อน ⁺⁴
Квантизацию модели с последующей конвертацией в GGUF поддерживаю!
@SuperKostick 22 วันที่ผ่านมา
Этоочень инетресное видео как и следующая тема, котороую мы будем очень сильно ждать!! ПРодолжай пожалуйста, очень не хватает информации подобной на рускоязычной части Ютуб
@astrauser-n4x 7 หลายเดือนก่อน ⁺¹
Хорошее видео, спасибо! Интересно увидеть продолжение видео.
@PhoenixDivus 26 วันที่ผ่านมา
Все чаще охота услышать шаг за шагом обучение нейронки добавление новых данных, как это работает и прочее.
@Alexandr_Ogorodnik 3 หลายเดือนก่อน
Это очень интересно спасибо
@150vit 7 หลายเดือนก่อน ⁺²
Квантизация очень интересна! И не сколько для мобильных устройств, сколько запуск тяжёлых моделей (70-30B) на 24Gb видеокартах, Tesla P40, например. Запуск на нескольких видеокартах, оптимизация под разные архитектуры...
@ValentinYefimov 7 หลายเดือนก่อน
Да. Очень интересно! Продолжи пожалуйста по квантизацию и создание gguf
@malysh86 3 หลายเดือนก่อน ⁺¹
Вот это контент) Только я почти ничего не понимаю. Например, я хочу обучить, что б она кодила. Что нужно? Какие то примеры из гит хаб, или простые функции?
@userpupkin499 7 หลายเดือนก่อน ⁺¹
Спасибо за видео. Да, интерересно было бы продолжение с получением gguf
@Александр-ь4и2ц 7 หลายเดือนก่อน ⁺¹
Интересно! И ещё полную подготовку датасета для обучения.
А если обучить на своём датасете по определённому домену, насколько хорошо она будет отвечать по этому домену без подгрузки контекста
@АнтонТай 7 หลายเดือนก่อน ⁺¹
Добрый день! Было бы очень интересно как вы конвертируете модель в формат для TensorRT и запускаете её, собственно на TensorRT. Особенно интересно было бы измерить прирост в скорости.
@alexanderponomarev8171 6 วันที่ผ่านมา
А можно ли на том сервисе дообученную модель загрузить потом не на Hugging Face, а к себе на комп? В Гугл коллабе вроде можно так сделать через гугл диск. И можно ли свой датасет сделать из текстовых файлов (книжек)?
@sergeykartyshov2846 7 หลายเดือนก่อน
Спасибо, очень интересно. Квантизацию поддерживаю. Интересно познакомиться поближе с библиотекой.
@ЛюКан-э7ч 7 หลายเดือนก่อน
Мужик спасибо. Давно хотел что-то подобное 🔥
@tetraocean 4 หลายเดือนก่อน
а что можно обучить на локальном компьютере? chatgpt предлагает использовать Bert для обучение своего ассистента. Можете ли подобное разобрать?
@ДмитрийЛеснов-ч5з 4 หลายเดือนก่อน
Привет! Спасибо за видео! Чем вы генерировали голос?
@sharksgangs 6 หลายเดือนก่อน
спасибо. это нужное видео
@СергейПетров-ц3ъ 7 หลายเดือนก่อน ⁺¹
Первое предложение автору. Если тебе не хватает денег на те или иные эксперименты, то предлагаю делать краудфандинг. Можно прям тут на ютубе - типа хотите посмотреть на файн-тюнинг и квантизацию llama 3 70b - скидывайте бабосы
@2009Spread 7 หลายเดือนก่อน ⁺²
Сколько ресурсов ест в процессе обучения, и сколько когда модель готова . Есть метрики?
@snowiedigga 7 หลายเดือนก่อน
Интересно, продолжай в том же духе 👍
@Ad-rc4dy 7 หลายเดือนก่อน ⁺¹
Отличное видео, спасибо!Можете подсказать какие ещё есть популярные датасеты для файнтюнинга кроме Саманты и их предназначение
@ruslandev 7 หลายเดือนก่อน
Dolphin - uncensored датасет от того же разработчика. В целом много чего есть на HF
@alnibl 5 หลายเดือนก่อน
Здравствуйте! Подскажите пожалуйста, какая лучше модель llm подойдет для задачи вытаскивания из текста названия книги, автора, года и издательства. Текст подается в промте, но он с ошибками и неточностями, так как распознается по фото книги моделью ocr)
@ruslandev 5 หลายเดือนก่อน ⁺¹
можно поискать на Huggingface модели для задач Named Entity Recognition. Но вообще любая LLM уровня GPT-3.5 и выше для этого подойдет
@IvanOldan 2 หลายเดือนก่อน
Я вот только не понял зачем ваш спонсор предлагает покупать 3090 за потинник в месяц?
@Roma_Ro-e3d 4 หลายเดือนก่อน
как сделать чтобы задавать вопросы голосом и получать ответы голосом ?
@softgpt 7 หลายเดือนก่อน
Всё интересно, квантизация тоже, но также интересует дообучение модели и практические рекомендации по сбору хорошего датасета для русского языка
@jonymnimonik-ff7dg 7 หลายเดือนก่อน ⁺¹
Да , интересно
@IT_psychopath 7 หลายเดือนก่อน
Да, было бы интересно. Так же было бы интересно стоимости на подобные обучения. и цены на развертывание обученных моделей. к примеру Llama3 8B и Llama3 70B в какую сумму влетит если развернуть на данном сервисе?
Заранее спасибо!
@mr.grixakrushkas5667 7 หลายเดือนก่อน ⁺¹
Было бы интересно про метрики и сравнение качества моделей, а то на глаз такое себе. Вдруг при обучении она позабыла все.
@ЯроміръТелгинъ หลายเดือนก่อน
Такъ какую кнопку мнѣ нажать? )
@СергейПетров-ц3ъ 7 หลายเดือนก่อน
Можешь показать, как сделать автономный, эффективный переводчик (чем больше языков, тем лучше, но для начала русский- английский хватило бы)? Какую модель лучше использовать и как?
@ДенисДавыдов-д8ц 6 หลายเดือนก่อน
Привет 👋 было бы круто если бы она в конце ответа не как обычно говорила бы чем ещё помочь а сначала бы предложила свой собственный вопрос для продления темы которая рассказывала только что, что бы вопрос её был на столько интересным от которого не возможно было-бы удержатся и сказать ей , да я хочу знать ответ на этот вопрос , тем самым она могла бы затягивать общение все глубже и обширней в той теме которая началась из начально !)
@goradiog8145 7 หลายเดือนก่อน ⁺¹
Как обучить whisper? Нигде не могу найти видео на эту тему. Мне постоянно необходимо расшифровывать аудиозаписи в текст. Необученный whisper плохо работает с русским языком. Хотелось бы допилить модель, но не знаю как.
@ПетрФомин-щ9ж 7 หลายเดือนก่อน ⁺¹
попробуй Silero она лучше русский распознаёт
@ruslandev 7 หลายเดือนก่อน ⁺²
на HF в разделе automatic speech recognition есть файнтюнинг-версии whisper, некоторые с кодом
@noino5458 7 หลายเดือนก่อน
Было бы интересно получить инструкцию по дообучения на своих данных. Например у меня есть excel таблица с данными, скормили эту таблицу LLM, а она после отвечает по таблице. Такое возможно?
@vlad-n-ag 7 หลายเดือนก่อน
Это возможно и уже реализовано в некоторых сервисах на основе LLM. Думаю они для этого могут не дообучать исходную модель, а конвертировать данные в векторную форму и хранить в векторной базе данных. Сервис, получая запрос пользователя, выполняет поиск в базе данных и передаёт близкие по смыслу вложения в качестве подсказки модели. На основе запроса, подсказки и собственных данных, модель формирует ответ.
@goga-pro2024 7 หลายเดือนก่อน
да хотим увидеть квантилизацию
@19_xyz 7 หลายเดือนก่อน
Добрый день а вашу модель можно скачать и потестить на мак ос в ml studio?
@19_xyz 7 หลายเดือนก่อน
Там как раз вроде бы guff если не ошибаюсь
@ruslandev 7 หลายเดือนก่อน ⁺¹
Следующее видео про квантизацию, файл gguf из него - на моем Huggingface
@19_xyz 7 หลายเดือนก่อน
@@ruslandev спасиб
@barkalov 7 หลายเดือนก่อน
Интересно запустить инференс на чем-нибудь вроде Raspberry pi
@newocom 7 หลายเดือนก่อน
Так, дуже цікаво!
@SeregaZinin 26 วันที่ผ่านมา
Я так и не понял, что такое Fine Tuning - это обучение на НОВЫХ данных, то есть к примеру о рассеянии света в атмосфере или просто примеры, как отвечать. Из видео ни черта не понятно.
@pacman777 6 หลายเดือนก่อน
привет,
hi, it's not clear. This is probably an advertisement for those in the know.нихера непонятно. Наверно это реклама или что?
@unzerror8208 7 หลายเดือนก่อน
Квантизацию модели с последующей конвертацией в GGUF поддерживаю.

ต่อไป

เล่นอัตโนมัติ