022 Классификация изображений. Часть 15. ViT (Vision Transformer) (2020)

Мотькин ИИ

มุมมอง 760

เพิ่มลงใน
- เพลย์ลิสต์ของฉัน
- ดูภายหลัง
แชร์

แชร์

ฝัง

ขนาดวิดีโอ:

แสดงแผงควบคุมโปรแกรมเล่น

เล่นอัตโนมัติ

เล่นใหม่

เผยแพร่เมื่อ 22 ต.ค. 2024

ความคิดเห็น • 25

@georgevonfloydmann1797 2 หลายเดือนก่อน
Attention is all you need! Спасибо за видео. Действительно, трансформеры буквально "трансформировали" область компьютерного зрения)
@Motskin_AI 2 หลายเดือนก่อน ⁺¹
Да и не только компьютерное зрение. На NLP ещё больше воздействие оказали трансформеры
@ostrov11 5 หลายเดือนก่อน ⁺²
спасибо Классификация изображений.появление трансформера в компьютерном зрении работы Внимания и Трансформеров компьютерном зрении работы Внимания и Трансформеров
@Motskin_AI 5 หลายเดือนก่อน ⁺¹
Пожалуйста.
Что-то похоже на теги. Наверное вы помогаете мне в продвижении моих трудов. Очень приятно, Спасибо.
@zaharvarfolomeev1536 5 หลายเดือนก่อน ⁺²
Мне кажется очень важно под каждым видео писать теплые слова благодарности.
Пламенное спасибо за контент такого качества! Речь, последовательность инфы, объяснение и примеры, все супер.
@Motskin_AI 5 หลายเดือนก่อน ⁺³
Действительно тёплые слова важны.
Ведь если Вам (всем кто смотрит) нравится контент, и вы хотели бы, чтобы я, или мне подобные, продолжали вкладывать в это свои силы, то нужно поддерживать хотя бы лайком. А то вдруг подумаю, что зря трачу время и мало кому нужно то что делаю и начну тратить свою энергию на что-то другое, не связанное с Ютюб каналом.
Ясное дело, что подписчиков не будет десятки-сотни тысяч. Компьютерное зрение - это сильно узкое направление. Да, со временем будет расширяться, но однозначно нас не много.
Кстати, спасибо, что РЕЧЬ отметили. Да, я могу что-то не правильно произносить, включая слова на родном языке, но я прикладываю огромные усилия, чтобы звук был хороший, без помех. Аудио дорожка вычищается от звуков и слов паразитов. Удаляю паузы, тем самым трачу своё время, чтобы сэкономить много вашего.
В общем, большое спасибо за поддержку.
@zaharvarfolomeev1536 5 หลายเดือนก่อน
@@Motskin_AI Полностью с Вами согласен, я на самом деле тоже немножко делаю всякий контент по ML и стараюсь улучшить все, что только можно и до предела моих возможностей.
Моя ниша это обработка звука с помощью ML, но многое другое из ML тоже интересно. Скоро буду выступать на конференции DataFest2024 даже :)
Нашел ваш канал случайно и очень приятно удивился, ценная находка! Рекомендую его студентам и другим ребятам в разных сообществах, я в плане нетворкинга весьма активный)
В общем, Ваша работа очень ценна, это легко осознать, очевидно, что вы очень стараетесь. Есть люди которые ждут каждое видео и такое количество будет только расти, я этому тоже поспособствую!
@dimasi6675 หลายเดือนก่อน
Очень круто и доступно объясняешь. Спасибо чувак! Лайк, подписка.
@Motskin_AI หลายเดือนก่อน
спасибо, приятного просмотра
@MatankaK 3 หลายเดือนก่อน
Очень доступная подача материала, спасибо. Время пролетело незаметно. Довольно бодрый монтаж для ведения по нему конспекта, но привычный для обзоров чего-либо не очень научного - от этого и воспринимается как что-то повседневное, что не сильно тебя нагружает - ты не устаешь и не успеваешь заскучать, все понимаешь. Спасибо 😊. Когда ждать детекторов?
@Motskin_AI 3 หลายเดือนก่อน
Спасибо за тёплые слова и за такой развёрнутый комментарий. Ведь интересно узнать, что ощущают зрители. Что касается вашего вопроса, то детекция и сегментация есть в планах, но ещё не определился что будет следующее. Поэтому пока не могу обещать.Тем более что ещё трэк классификации не завершил (актуально на начала июля 2024).
@MatankaK 3 หลายเดือนก่อน
@@Motskin_AI Можно еще пробовать обучение на неразмеченных данных осветить, продолжая тему классификации
@Motskin_AI 3 หลายเดือนก่อน
@@MatankaK Согласен, было бы интересно, но не уверен, что у меня будут вычислительные ресурсы на этот тип задачи.
@glukis7970 5 หลายเดือนก่อน ⁺¹
Спасибо за проделанную большую работу, было очень интересно. Если сдвинуть изображения пикселей на 7 по вертикали и горизонтали чтобы разрезка на патчи пришлась по другим местам изображения может тогда изменится распознавание ошибочных изображений?
@Motskin_AI 5 หลายเดือนก่อน ⁺²
Спасибо за Спасибо.
Должен заметить, что на вход программы поступают изображения размером 250 на 250 пикселей. Но моделе нужны изображения 224 на 224 пикселя. Поэтому выполняется случайный Crop. Т.е. на каждой эпохе обучения, изображение может быть условно смещено аж на 26 пикселей. А значит трансформер будет нарезать в других местах.
Получается что, вами упомянутые 7 пикселей, уже учтены случайной аугментацией.
@glukis7970 5 หลายเดือนก่อน
@@Motskin_AI Думал, что вся аугментация до начала обучения происходит, пересмотрю еще раз ваш код. Благодарю за новые знания.
@alexanderskusnov5119 5 หลายเดือนก่อน
Кроме обыденного слова "внимание" можно было упомянуть и понятный всем обработчикам сигналов термин "корреляция" (т.е. близость).
@Motskin_AI 5 หลายเดือนก่อน ⁺¹
Я слову "корреляция" (близость) придаю немного другой смысл (моё понимание). Для меня это понятие лучше всего относится к задаче, использующей в основе тот же метрик лёрнинг. На этом принципе я выполнял один из коммерческих проектов. И для нас слово "близость" определяло физическое расстояние между эмбедингами двух изображений в N-мерном пространстве.
Хотя, конечно, соглашусь внимание и близость в трансформерах почти как синонимы.
В любом случае, если вы можете порекомендовать какие-то работы, книги, где attention обозначается словом "корреляция", то было бы здорово узнать.
Но в любом случае, и это только моё мнение, термин "внимание" наилучшим образом подходит для передачи смысла оригинального слова attention.
Спасибо
@circle5846 3 หลายเดือนก่อน
Отличное видео, помог разобраться с трансформерами для cv, спасибо))). Если сталкивался с фильтром Калмана в cv можешь рассказать, пожалуйста)
@Motskin_AI 3 หลายเดือนก่อน
Спасибо за тёплые слова. Пока не сталкивался с фильтром Калмана.
@alexanderskusnov5119 5 หลายเดือนก่อน
Удастся осилить Reinforcement Learning (обучение с подкреплением)?
@Motskin_AI 5 หลายเดือนก่อน
Пока не пересекался с задачей, где бы нужно было самому заниматься обучением с подкреплением. Но как только такая задача появится, то запишу видео. Например, хотелось бы наконец-то добраться до роботов (JetBot, JetRacer). Там скорее всего пересекусь с задачей обучения с подкреплением.
@OlegGerbylev 6 วันที่ผ่านมา
Можете подсказать, что за дата сет показан на видио с военой техникой?
@Motskin_AI 6 วันที่ผ่านมา ⁺¹
Конечно могу, это мной созданный датасет, я его называю Арма. Все подробности вы сможете узнать в первых видео этого плейлиста. И в частности видео "th-cam.com/video/cV2CQ77QgDw/w-d-xo.html"
@OlegGerbylev 6 วันที่ผ่านมา
@@Motskin_AI Спасибо

ต่อไป

เล่นอัตโนมัติ

023 Классификация изображений. Часть 16. EfficientNet v2 (2021)