DeepSchool
DeepSchool
  • 51
  • 52 225
LLM. Илья Димов | Под Капотом
Записывайтесь на курс по LLM: deepschool.ru/llm?
Мы приглашаем в подкаст экспертов из различных областей, чтобы понять, как работают сложные системы изнутри. В этом выпуске мы говорили с Ильей Димовым, Senior NLP-инженером, о том, как сделать идеальную LLM под свои нужды и как они устроены внутри.
Присылайте ваши вопросы нам на почту: hello@deepschool.ru
Наш телеграм, в котором мы напоминаем теорию и делимся советами по обучению нейросетей: t.me/deep_school
Мы в linkedin: www.linkedin.com/school/deep-school
Подписывайтесь, чтобы развиваться в ML и DL вместе!
00:00:00 | Вступление
00:01:55 | Как Илья попал в мир LLM
00:07:45 | Создаём модель, которая избавит вас от депрессии
00:14:41 | Сводим модель общего назначения к выполнению частной задачи - учим её общаться как друга
00:16:23 | Как научить модель решать другие задачи
00:27:59 | Как LLM помогают лингвистам переводить малочисленные языки
00:30:33 | Что такое агенты и будут ли они править миром?
00:38:08 | Инструменты, которыми может пользоваться модель
00:41:36 | Как модель применяет функции компьютера, чтобы решать свои задачи
00:46:26 | Какие задачи решаются с помощью памяти LLM
00:56:23 | Как научить языковую модель видеть, добавив в неё модальность?
01:12:21 | Что будет после того, как мы достигнем лимит текстов для обучения модели?
01:21:10 | Топ лучших моделей по мнению Ильи
01:31:56 | Заключение
มุมมอง: 449

วีดีโอ

Pytest: от моков к docker compose
มุมมอง 4092 หลายเดือนก่อน
В DeepSchool мы повышаем квалификацию DL-инженеров: deepschool.ru/? Присоединяйтесь к курсу "Деплой DL-сервисов": deepschool.ru/deploy? Написать тест на простую функцию, которая ни от чего не зависит - одно удовольствие. Говорим, какие входы, какие выходы ... profit. Но как быть, если вы хотите протестировать функционал, который зависит от внешних сервисов? Ходить в production-базу во время тес...
Тимлидство и хакатоны. Валентин Мамедов | Под Капотом
มุมมอง 3332 หลายเดือนก่อน
В DeepSchool мы повышаем квалификацию DL-инженеров: deepschool.ru/? Записывайтесь на курс по LLM: deepschool.ru/llm? Мы приглашаем в подкаст экспертов, чтобы понять, как работают сложные системы изнутри. В этом выпуске к нам пришёл Валя Мамедов, LLM-инженер из SberDevices. Телеграм Вали: @vltnmmdv. В первой части мы поговорили про LLM: th-cam.com/video/fy1-ffagRe0/w-d-xo.htmlsi=7K6SrjBwMXPGdnec...
Гессиан, или методы второго порядка в численной оптимизации
มุมมอง 3022 หลายเดือนก่อน
В DeepSchool мы повышаем квалификацию DL-инженеров: deepschool.ru/? Наш курс "Ракета в Computer Vision": deepschool.ru/cvrocket? Методы второго порядка используют вторые производные функции потерь. Важный элемент этих методов - гессиан. Он и является второй производной по параметрам модели. Главная проблема гессиана - его долго считать. Учёные придумали различные методы для его аппроксимации, ч...
Спасаемся от самокатов при помощи Computer Vision | Релиз на салфетке
มุมมอง 3393 หลายเดือนก่อน
В DeepSchool мы повышаем квалификацию DL-инженеров: deepschool.ru/? Наш курс "Ракета в Computer Vision": deepschool.ru/cvrocket? В «Релизе на салфетке» мы решаем забавную задачку, как продуктовую, но без сроков, рамок и коммитментов. 😉 В этом выпуске мы спасались от самокатчиков, которые врезаются в прохожих. Начали с советов «да приклей зеркала и ходи-посматривай», а закончили ключевыми точкам...
Решаем LeetCode | Модульная арифметика
มุมมอง 3864 หลายเดือนก่อน
В этом видео Игорь Ильин разбирает задачу на модульную арифметику уровня medium. Игорь - Sr. CV-инженер в Kudan SLAM и спикер курса 3D CV. Прошли путь от наивного решения, которое работает за O(n^2) до оптимального, которое работает за линию по времени. Обсудили структуры данных и сложность операций над ними, чем плоха рекурсия и когда можно от неё избавиться. Это видео школы DeepSchool, мы пов...
Fine-tuning, RAG, Llama, prompt-engineering, LLM-арены | Что происходит в LLM
มุมมอง 9K5 หลายเดือนก่อน
Записывайтесь на курс по LLM: deepschool.ru/llm?! Если вы проспали бум вокруг LLM и хотите разобраться, что сейчас в них происходит простыми словами, от инженера инженеру, мы подготовили для вас видео! 00:00:00 | Что такое LLM и как их используют 00:02:00 | Как сделать своего ассистента дома: модели и дообучение 00:04:20 | Веб-интерфейсы и видеопамять для обучения и обученные модели 00:05:20 | ...
LLM. Валентин Мамедов | Под Капотом
มุมมอง 3.3K5 หลายเดือนก่อน
#largelanguagemodels #llm #deeplearning #career #nlp #ai Записывайтесь на курс по LLM: deepschool.ru/llm? Мы приглашаем в подкаст экспертов из различных областей, чтобы понять, как работают сложные системы изнутри. В этом выпуске мы говорили с Валей Мамедовым, инженером из SberDevices, про LLM. Телеграм Вали: @vltnmmdv. Ещё мы упоминали: Канал Янника: th-cam.com/users/yannickilcher Ollama: olla...
11 вопросов CTO про ускорение нейросетей
มุมมอง 5735 หลายเดือนก่อน
Присоединяйся к курсу «Ускорение нейросетей»: deepschool.ru/speedup? Хэдлайнер нашего курса ответил на разные вопросы, связанные с ускорением нейросетей. Почему нельзя просто взять маленькую модель? Не скучно ли ускорять модели? А можно сделать NAS NMS на NPU? #computervision #deeplearning #datascience #career
Используй VGG в 2024 | Вредные советы в Data Science
มุมมอง 1.1K6 หลายเดือนก่อน
Используй VGG в 2024 | Вредные советы в Data Science
Решаем проблемы белок с помощью Computer Vision | Релиз на салфетке
มุมมอง 1K6 หลายเดือนก่อน
Решаем проблемы белок с помощью Computer Vision | Релиз на салфетке
Edge Inference | Антон Мальцев | Лекция DeepSchool
มุมมอง 1.1K6 หลายเดือนก่อน
Edge Inference | Антон Мальцев | Лекция DeepSchool
Генеративный Computer Vision. Кирам Аль-Харба | Под Капотом
มุมมอง 1.6K7 หลายเดือนก่อน
Генеративный Computer Vision. Кирам Аль-Харба | Под Капотом
Под Капотом | Игорь Ильин: будущее, work-life-balance, нетворкинг. Часть 2/2
มุมมอง 6468 หลายเดือนก่อน
Под Капотом | Игорь Ильин: будущее, work-life-balance, нетворкинг. Часть 2/2
Кухонная академия: научники, статьи и нейронки в играх
มุมมอง 4688 หลายเดือนก่อน
Кухонная академия: научники, статьи и нейронки в играх
Под Капотом | Игорь Ильин о мире 3D CV, SLAM и лидарах. Часть 1
มุมมอง 1.6K8 หลายเดือนก่อน
Под Капотом | Игорь Ильин о мире 3D CV, SLAM и лидарах. Часть 1
Своя Игра ML/DL. Выпуск 2: Игорь Ильин, Ренат Баширов, Дима Чудаков
มุมมอง 674ปีที่แล้ว
Своя Игра ML/DL. Выпуск 2: Игорь Ильин, Ренат Баширов, Дима Чудаков
Своя Игра ML/DL. Выпуск 1: Дима Чудаков, Андрей Шадриков, Оля Гребенькова
มุมมอง 1.3Kปีที่แล้ว
Своя Игра ML/DL. Выпуск 1: Дима Чудаков, Андрей Шадриков, Оля Гребенькова
Подкаст с Софией Потаповой
มุมมอง 474ปีที่แล้ว
Подкаст с Софией Потаповой
Обзор архитектуры Detection Transformer (DETR)
มุมมอง 1.8Kปีที่แล้ว
Обзор архитектуры Detection Transformer (DETR)
Валидация данных на Python при помощи Pydantic
มุมมอง 1.8Kปีที่แล้ว
Валидация данных на Python при помощи Pydantic
Подкаст с Артёмом Санакоевым
มุมมอง 2.6Kปีที่แล้ว
Подкаст с Артёмом Санакоевым
Подкаст с Мишей Моисеевым
มุมมอง 587ปีที่แล้ว
Подкаст с Мишей Моисеевым
NeRF: Neural Radiance Fields. Два NeRF-a, чтобы править всем 3D
มุมมอง 844ปีที่แล้ว
NeRF: Neural Radiance Fields. Два NeRF-a, чтобы править всем 3D
Подкаст с Владом Лялиным
มุมมอง 629ปีที่แล้ว
Подкаст с Владом Лялиным
Подкаст с Андреем Шадриковым
มุมมอง 458ปีที่แล้ว
Подкаст с Андреем Шадриковым
Ускорение инференса: фьюзинг и дистилляция
มุมมอง 9822 ปีที่แล้ว
Ускорение инференса: фьюзинг и дистилляция

ความคิดเห็น

  • @goodman3325
    @goodman3325 วันที่ผ่านมา

    Залгался, про отечественный npu. Вы же не обладаете технологией

  • @Альвархайруллин
    @Альвархайруллин 3 วันที่ผ่านมา

    Я думал, что 4 ребус это обучение с учителем

  • @hsqlk
    @hsqlk 21 วันที่ผ่านมา

    LLM всегда предсказывает следующий токен

  • @БоряДикий
    @БоряДикий 21 วันที่ผ่านมา

    Оченьк коротко и очень по делу! Благодарочка!

  • @nz792006
    @nz792006 หลายเดือนก่อน

    видео вода и мусор, картинки - ты бы сел у консоли и всё бы проделал сам, не ебя мозги нам 14 минут, просто говорящая голова которая в нейросетях нихуя не петрит от слова совсем.

  • @nz792006
    @nz792006 หลายเดือนก่อน

    th-cam.com/video/sbMzUOXcyWw/w-d-xo.htmlsi=cdafvuNBMpHBxjfk&t=736 а ссылку на эту байду нахуя зажилил?

  • @baxai_
    @baxai_ 2 หลายเดือนก่อน

    Кайф, а можно ссылочку на гитхаб?)

  • @Ульрих-я1ж
    @Ульрих-я1ж 2 หลายเดือนก่อน

    Эта вторая моделька, которая цензурирует, обходится на раз-два. Сначала учишь основную модель шифровать информацию, потом общаешься шифровками и модель-сторож ничего не понимает. Подкаст очень интересный 👍🏻 спасибо 🫶🏻

  • @debitos
    @debitos 2 หลายเดือนก่อน

    нельзя одушевлять инструменты

  • @IvanLesnov
    @IvanLesnov 2 หลายเดือนก่อน

    Как дообучить модель в оффлайне?

  • @ВлалЛклк-п1ж
    @ВлалЛклк-п1ж 2 หลายเดือนก่อน

  • @Gav-nuke
    @Gav-nuke 2 หลายเดือนก่อน

    Спасибо за видео. А как все эти методы борятся с попаданием а локальный минимум? Мы же ищём глобальный.

    • @deep_school
      @deep_school 2 หลายเดือนก่อน

      По-настоящему глобальных методов в нелинейной оптимизации нет. Большинство методов локальные, и часто мы довольны, когда находим хороший локальный минимум. Среди рассмотренных методов методы нулевого порядка - наиболее глобальные, потому что они семплируют множества точек в пространстве параметров. Так мы примерно понимаем, где находится (или может находиться) хороший локальный минимум. Аналогично для методов первого и второго порядков - мы можем задавать множество разных инициализаций и выбирать из них ту, у которой лосс минимальный. Однако это приведёт к тому, что нам нужно будет решать несколько задач оптимизации.

  • @antonmanukyan3307
    @antonmanukyan3307 2 หลายเดือนก่อน

    А где цены на курс?

    • @deep_school
      @deep_school 2 หลายเดือนก่อน

      Запись на курс мы открываем за несколько недель до старта, тогда же публикуем изменения в программе и цены. Вы можете оставить свои контакты в анкете предзаписи deepschool.ru/llm - чтобы мы сообщили вам о новом потоке и условиях в первую очередь :)

  • @thirteeenth
    @thirteeenth 3 หลายเดือนก่อน

    Супер. Благодарность до 7го неба ) А скажи , просто оч интересно , какая у тебя профильная деятельность ? чем ты занимаешься в основном ?

    • @deep_school
      @deep_school 2 หลายเดือนก่อน

      Илья занимается обучением различных LLM-моделей, любит распределённое обучение и нейросети, еще Илье очень нравится рассказывать об этом студентам)

  • @atli4nikk160
    @atli4nikk160 3 หลายเดือนก่อน

    Ксиати ориентацию самокатчика было бы норм определять)

  • @userpupkin499
    @userpupkin499 3 หลายเดือนก่อน

    2 вопроса: 1 как вы увидите заднее колесо для трекинга у наезжающего сзади самоката? 2 если самокат виден под углом, а вы хотите считать расстояние по размеру квадрата в котором самокат, как вы отличите отличите 2 случая: самокат под углом и далеко или он едет прямо на вас и уже рядом?

  • @mylittledrone
    @mylittledrone 3 หลายเดือนก่อน

    Классный формат. Тут можно оставить свой вопрос для разбора на следующую салфетку?

    • @userpupkin499
      @userpupkin499 3 หลายเดือนก่อน

      Пусть они прототип этого лучше сделают

    • @deep_school
      @deep_school 3 หลายเดือนก่อน

      Можно написать сюда, либо нам на почту hello@deepschool.ru :)

  • @userpupkin499
    @userpupkin499 3 หลายเดือนก่อน

    А прототип будет?

  • @Mustafazadeh.E
    @Mustafazadeh.E 3 หลายเดือนก่อน

    Спасибо!!!

  • @AndrewDre-n7e
    @AndrewDre-n7e 4 หลายเดือนก่อน

    Спасибо, очень интересно! Такой вопрос, можно ли загрузить в нейронку 20 документов с ГОСТами и суммировать информацию по конкретной ситуации? Куда копать?

    • @Indyxx87
      @Indyxx87 3 หลายเดือนก่อน

      в RAG

  • @RaveZH
    @RaveZH 4 หลายเดือนก่อน

    Пацаны, видос прикольный. Мне интересно. Вот бы перевод в сабах, ну, штоп не паузить каждую секунду и не идти в переводчик. Ну, или ссылку скиньте на нейронку, которая бы вас переводила в потоке на общедоступный великий и могучий😊

  • @romanbolgar
    @romanbolgar 4 หลายเดือนก่อน

    Сколько мучений. Оно то конечно интересно но отвлекает. Как говорится сапожник без сапог. Хотя я вообще видео не делаю потому что вот из-за этого. Всё никак не найду бесплатного диктора с искусственным интеллектом желательно чтобы говорил моим голосом. Ну это опять же надо обучать. Кстати этот текст в комментарии я тоже говорю. Но это уже другая технология. Речь в текст. В принципе уже давно есть и текст в речь Тоже давно пользуюсь. Но многим режет слух Голос робота. Хотя сейчас вроде уже и голоса есть хорошие. Более того есть сервисы на базе того же искусственного интеллекта Которые видеоряд подбирают. А то тема сложная не всё понятно.

  • @fodezargames
    @fodezargames 4 หลายเดือนก่อน

    У меня 2080 super и 32 гб памяти, какую модель смогу запустить? так чтоб не фигня была, а чтото умела

    • @daniyarkalmanbetov7271
      @daniyarkalmanbetov7271 4 หลายเดือนก่อน

      Gemma2 - 8b?

    • @Zganshin
      @Zganshin 2 หลายเดือนก่อน

      У меня вообще видеокарты нет, сервер dell r430 с одним слабым xeon процом, ну и апиративы 64 стоит последняя лама от Nvidia, всё работает , но медленно , сообщение может минут 10 писать, у тебя на GPU будет в разы быстрей ​@@daniyarkalmanbetov7271

    • @nz792006
      @nz792006 หลายเดือนก่อน

      поставь LM Studio и проверь, что религия не позволяет?

  • @eduardmart1237
    @eduardmart1237 4 หลายเดือนก่อน

    Главное максимально быстро жать на кнопку

  • @therealv1etcong
    @therealv1etcong 4 หลายเดือนก่อน

    27:00 это с каких это пор в fp16 или bf16 нельзя тренировать модели? А третью лламу в какой точности учили?

    • @ВалентинМамедов-ы3ф
      @ВалентинМамедов-ы3ф 4 หลายเดือนก่อน

      Спасибо за вопрос! Там в основном используют mixed precision «Чистая» тренировка в фп16/бф16 в целом норм для небольшого тюна. Но претрейны получаются значительно слабее, чем с использованием смешанной точности

  • @usersimple562
    @usersimple562 4 หลายเดือนก่อน

    как же заработать на макбук

  • @TheFemenistka
    @TheFemenistka 4 หลายเดือนก่อน

    спасибо! такое милое видео! звучит очень интересно, надеюсь получиться записаться на ваш курс

    • @deep_school
      @deep_school 4 หลายเดือนก่อน

      Спасибо! Будем рады видеть вас на курсе)

  • @internetnickname8923
    @internetnickname8923 4 หลายเดือนก่อน

    Расскажите плз, как можно слить 2 LLM в 1, если есть необходимость объединить знания обеих моделей и получить гибрид)

    • @deep_school
      @deep_school 4 หลายเดือนก่อน

      Есть хороший блогпост на эту тему huggingface.co/blog/mlabonne/merge-models Сливают обычно модели одной и той же архитектуры, например вариации того же Mixtral-8x7b. Делается это зачастую линейной интерполяцией весов между двумя моделями с различными параметрами. Есть различные инструменты - какие-то требуют задать параметры руками, какие-то пытаются откалибровать эти параметры проходом по датасету. В некоторых merged (слитых) моделях авторы пишут, каким подходом и какие модели они объединяли, например huggingface.co/vicgalle/Merge-Mixtral-Prometheus-8x7B Список инструментов (не полный): github.com/Gryphe/BlockMerge_Gradient github.com/arcee-ai/mergekit github.com/Gryphe/MergeMonster

    • @internetnickname8923
      @internetnickname8923 4 หลายเดือนก่อน

      @@deep_school Супер) А есть способ выжать из модели полный датасет, на которой она обучалась?

    • @daniyarkalmanbetov7271
      @daniyarkalmanbetov7271 4 หลายเดือนก่อน

      Пни если ответят плиз ​@@internetnickname8923

  • @stask7258
    @stask7258 4 หลายเดือนก่อน

    Срастбо.

  • @MrGoudvin
    @MrGoudvin 4 หลายเดือนก่อน

    ролик в духе "скелетон" )

  • @makmakmakk
    @makmakmakk 5 หลายเดือนก่อน

    Симп Валентин

  • @muchomores7793
    @muchomores7793 5 หลายเดือนก่อน

    Ценнейшая информация, с удовольствием посмотрел. Жду продолжения!!

    • @deep_school
      @deep_school 5 หลายเดือนก่อน

      Спасибо! Готовим вторую часть :)

  • @mr.dartemon
    @mr.dartemon 5 หลายเดือนก่อน

    Спасибо, очень насыщенно и понятно. Картинки от души 😄

  • @bakaai445
    @bakaai445 5 หลายเดือนก่อน

    Интересно

  • @boynext_door8251
    @boynext_door8251 5 หลายเดือนก่อน

    Очень интересно, но гость похож не ленивца из зверополиса (без обид)

  • @ТихомировСтепан
    @ТихомировСтепан 5 หลายเดือนก่อน

    Очень полезный формат, продолжайте!

    • @deep_school
      @deep_school 5 หลายเดือนก่อน

      Спасибо! Уже отсняли второй выпуск 😉

  • @Indyxx87
    @Indyxx87 5 หลายเดือนก่อน

    Подкаст огонь, с удовольствием послушал. Записывайте обязательно еще, хоть и мало просмотров, но инфа крайне ценная. Спасибо!

    • @deep_school
      @deep_school 5 หลายเดือนก่อน

      Спасибо! Очень приятно такое читать!)

  • @griddlebone44
    @griddlebone44 5 หลายเดือนก่อน

    на 20 минут очень приятное объяснение. спасибо!

  • @hsqlk
    @hsqlk 5 หลายเดือนก่อน

    Ммм, очень странно конечно хранить данные на своем пк

  • @hsqlk
    @hsqlk 5 หลายเดือนก่อน

    За трендом тоже не надо гнаться, classical CV сперва возможно надо попробовать и потом уже по возрастанию, вдруг метрики будут на норм уровне

  • @АлекроОоо
    @АлекроОоо 6 หลายเดือนก่อน

    80% слов не понял

  • @palyashuk42
    @palyashuk42 6 หลายเดือนก่อน

    почему пользуетесь макбуками а не ноутами с nvidia видеокартами на борту (linux)?

    • @rtm-h5b
      @rtm-h5b 6 หลายเดือนก่อน

      На ноуте часто ничего серьёзного не посчитаешь. Потому что туда влезет одна не оч крутая видюшка, а не серьезный сетап. Поэтому с ноутов просто часто подрубаются к сервакам (которые на линухе) с серьёзным железом и там крутят эксперименты. А ось ноута уже становится не так важна

  • @atli4nikk160
    @atli4nikk160 6 หลายเดือนก่อน

    Марк, пошли пиво пить

  • @rtm-h5b
    @rtm-h5b 6 หลายเดือนก่อน

    И весело и полезно. Классные ребята и формат, спасибо) p.s.: вставки картинки Марка на места стикеров - топ))

    • @deep_school
      @deep_school 6 หลายเดือนก่อน

      Спасибо!

  • @leoromanovich
    @leoromanovich 6 หลายเดือนก่อน

    Имхо, ценно смотреть, как профессионалы из твоей области подходят к решению новых для них задач, как мыслят, о каких ограничениях говорят, какие подходы упоминают, какие из них критикуют. Я в таких дискуссиях и себя валидирую (а решал бы я так же?) и новое узнаю.) Круто сделали!

    • @deep_school
      @deep_school 6 หลายเดือนก่อน

      Леонид, спасибо! Такой фидбек заряжает:)

  • @Анастасия-л5т2з
    @Анастасия-л5т2з 6 หลายเดือนก่อน

    Классный формат! Снимайте еще❤

    • @deep_school
      @deep_school 6 หลายเดือนก่อน

      Спасибо, рады, что понравилось!

  • @ИгорьСондорс
    @ИгорьСондорс 6 หลายเดือนก่อน

    Чел хорош! Продолжай!!!

  • @ailabinsev
    @ailabinsev 6 หลายเดือนก่อน

    Спасибо, очень интересно!

  • @МихаилГольт-ж7т
    @МихаилГольт-ж7т 6 หลายเดือนก่อน

    Отличное видео!