Мотькин ИИ
Мотькин ИИ
  • 71
  • 163 265
01 Тестовое задание CV. Поиск таблицы на изображении и чтение данных из неё (Python, OpenCV, Pandas)
В этом видео идёт разбор тестового задания на позицию Computer Vision инженер. Фактически нужно было найти таблицу на изображении и, на основе данных из этой таблицы, нужно было сформировать выходной json.
Задача выполняется с помощью элементов классического компьютерного зрения (фактически просто две функции). Всё остальное выполняется на табличных данных, полученных в качестве исходных данных, после операции OCR.
Таймкоды:
00:00 | Введение
01:14 | Предыстория собеседований
02:25| Условия задачи и первые мысли
06:35 | Реализация в коде
29:20 | Заключение
มุมมอง: 114

วีดีโอ

Jetson Orin NX. Что за зверь? Испытаем на Yolo v8 и сравним с десктопными видеокартами.
มุมมอง 144หลายเดือนก่อน
Ссылка на это же видео на платформе: plvideo.ru/watch?v=Thz7xBMIRELa В этом видео мы познакомимся с Jetson Orin NX. Начнём от комплекта покупки, далее рассмотрим какие они бывают и кратко чем отличаются. Взглянем на то, что есть в железе и на программное обеспечение. А на последок проведём большой эксперимент на понимания производительности Jetson Orin NX на выполнении задачи сегментации кубика...
CVAT. Путешествие по рассылке. Часть 2 (март 2024 - май 2024)
มุมมอง 62หลายเดือนก่อน
Ссылка на это же видео на Платформе: plvideo.ru/watch?v=kN49hOc3WBo6 Это продолжение путешествия по рассылке от CVAT. Посмотрим какая там есть информация. Что нового добавили о чём я ещё не знаю. Заодно выскажу своё мнение. Ещё будет продолжение. В этом видео даже наеду на содержимое рассылки от CVAT. Таймкоды: 00:00 | Введение 00:30 | Как получить формат YOLOv8 04:45| Самые известные датасеты ...
100. Segment Anything Model 2. Обзор возможностей.
มุมมอง 161หลายเดือนก่อน
это видео на Платформе: plvideo.ru/watch?v=-Xm-7kiyjgXG Вот только на днях вышла вторая версия модели Segment Anything Model. Когда впервые увидел первую модель, то я был ей восхищён. Поэтому, как только вышла модель, я сразу пошёл смотреть как она работает и главное, что может делать. В этом видео я пройдусь по тем примерам, которые представили авторы модели, а также пример, который сделали Ro...
CVAT. Путешествие по рассылке. Часть 1 (ноябрь 2023 - март 2024)
มุมมอง 130หลายเดือนก่อน
Вот есть такое развлечение, приезжаешь на вокзал и берёшь билет на первый поезд, самолёт. Так сказать, полагаешься на случай. Вот и я решил поиграть в такую игру. Рассматривать то, что присылает в рассылке CVAT. Изначально думал, что там только то, что касается самой программы разметки. Но оказалось, что есть ещё интересные статьи. В этом видео я проделаю путь по той информации, которую CVAT пр...
Искусственный интеллект для бизнеса. О сложностях внедрения. (Динамичное видео)
มุมมอง 4192 หลายเดือนก่อน
Видео в первую очередь создано для тех, кто хочет внедрять искусственный интеллект (ИИ) в свой бизнес. Я, как ML инженер, собрал в это видео ту информацию, о чём бизнес должен понимать. Информация разделена на блоки, каждый из которых описывает определённый элемент, с которым бизнес будет сталкиваться в большей или меньшей степени. Также это видео будет полезно абсолютно всем, кто интересуется ...
025 Классификация изображений. Часть 18. ConvNeXt (2022)
มุมมอง 3183 หลายเดือนก่อน
Мы рассмотрели уже много моделей на основе свёрточных сетей и только 2 модели на основе трансформера. И могло сложиться впечатление, что в компьютерном зрении эпоха свёрток заканчивается и начинается эра трансформеров. Но команда от Facebook AI Research провела большое исследование и смогла доказать, что современная архитектура ещё может строиться на свёртках. Авторы за основу взяли уже старень...
024 Классификация изображений. Часть 17. Swin Transformer (2021)
มุมมอง 1.2K3 หลายเดือนก่อน
Второй представитель трансформерной архитектуры, который мы рассмотрим - модель Swin (Shifted Windows). Причём рассмотрим как первую, так и вторую версию. Даже случится так, что сначала в первой версии введём определённую идею, а уже во второй версии заменим её. Данное видео создавалось с предположением, что вы уже видели видео про Vision Transformer. И если вы ещё не смотрели про Vision Transf...
023 Классификация изображений. Часть 16. EfficientNet v2 (2021)
มุมมอง 2573 หลายเดือนก่อน
Ранее рассматривали первую версию EfficientNet. А теперь пришла очередь второй версии. Если сравнивать эти две версии, то конечно вторая версия лучше. Хотя вторая версия построена на основе первой, но с некоторыми изменениями. Также в научной статье был упомянут прогрессивный метод обучения модели. В этом видео мы затронем принципы такого обучения, а заодно познакомимся с двумя аугментациями Ra...
022 Классификация изображений. Часть 15. ViT (Vision Transformer) (2020)
มุมมอง 6744 หลายเดือนก่อน
Вот мы и добрались до очередной революции в области искусственного интеллекта - появление трансформера. В том числе в компьютерном зрении начинаем с модели Vision Transformer. В этом видео будет много новой информации. Начнём с разбора особенностей ViT модели. А затем углубимся в принципы работы Внимания и Трансформеров. Причём с трансформером будем разбираться сразу на задаче компьютерного зре...
021 Классификация изображений. Часть 14. RegNet (2020)
มุมมอง 2794 หลายเดือนก่อน
Интересное исследование провели авторы. Мало того, что они поэтапно сокращали пространство поиска, так ещё проделанные эксперименты должны быть очень полезны для научного сообщества. Например, раньше считали, что чем глубже этап (stage) в нейронной сети, тем лучше. Но авторы показали, что для их сети лучше всего работали модели у которых глубина была 20 блоков. В PyTorch есть порядка 15 моделей...
020 Классификация изображений. Часть 13. EfficientNet v1 (2020)
มุมมอง 2494 หลายเดือนก่อน
Мы уже прошли много различных архитектур моделей для задачи классификации изображений. В каждом видео что-то новое изучали. И вот добрались до EfficientNet v1. И если вы регулярно смотрели серию про классификацию изображений, то обнаружите, что логика EfficientNet для вас будет предельно понятна. Даже активация SiLU и то по факту swish-1, которую разбирали в предыдущем видео. Также в это видео ...
019 Классификация изображений. Часть 12. MobileNet v3 (2019)
มุมมอง 1654 หลายเดือนก่อน
Чтобы упростить описание архитектуры MobileNet было принято решение разделить объяснение архитектуры 3-й версии от других версий. Это тот случай, когда желательно двигаться в хронологическом порядке. Конечно, на 2019 год MobileNet версии 3 смог показать наилучшую точность по сравнению с другими архитектурами, предназначенным для мобильных устройств. В этом видео рассмотрим основные принципы пол...
018 Классификация изображений. Часть 11. MnasNet (2019)
มุมมอง 1175 หลายเดือนก่อน
В этом видео мы уделим большое внимание разбору процесса автоматического поиска лучшей архитектуры сети, т.е. понятие «neural architecture search». Если до этого авторы научных статей фактически вручную создавали свои модели. То авторы MnasNet, для классификации изображений для использования на мобильных устройствах, предложили использовать автопоиск гиперпараметров архитектуры нейронной сети, ...
017 Классификация изображений. Часть 10. MobileNet v2 (2019)
มุมมอง 3435 หลายเดือนก่อน
В этом видео мы познакомимся с архитектурой MobileNet. Причём познакомимся как с первой версией так и со второй. Но для работы с датасетом Арма будет использоваться вторая версия. Также отмечаю, что уже существует и 3-я версия MobileNet. О 3-й версии будет рассказано в одном из ближайших видео. А в этом видео мы подробно познакомимся с архитектурой модели. Также закрепим знания формул для расчё...
016 Классификация изображений. Часть 9. ShuffleNet (2018)
มุมมอง 1975 หลายเดือนก่อน
016 Классификация изображений. Часть 9. ShuffleNet (2018)
015 Классификация изображений. Часть 8. DenseNet (2018)
มุมมอง 4775 หลายเดือนก่อน
015 Классификация изображений. Часть 8. DenseNet (2018)
014 Классификация изображений. Часть 7. Wide ResNet (2017)
มุมมอง 1565 หลายเดือนก่อน
014 Классификация изображений. Часть 7. Wide ResNet (2017)
013 Классификация изображений. Часть 6. ResNeXt (2017)
มุมมอง 2355 หลายเดือนก่อน
013 Классификация изображений. Часть 6. ResNeXt (2017)
012 Классификация изображений. Часть 5. SqueezeNet (2016)
มุมมอง 2386 หลายเดือนก่อน
012 Классификация изображений. Часть 5. SqueezeNet (2016)
011 Рефакторинг кода классификации. Часть 1 (жизненный опыт и программирование)
มุมมอง 4116 หลายเดือนก่อน
011 Рефакторинг кода классификации. Часть 1 (жизненный опыт и программирование)
010 Классификация изображений. Часть 4. ResNet (2015)
มุมมอง 4126 หลายเดือนก่อน
010 Классификация изображений. Часть 4. ResNet (2015)
009 Классификация изображений. Часть 3.2. Inception_v3 (2015)
มุมมอง 4956 หลายเดือนก่อน
009 Классификация изображений. Часть 3.2. Inception_v3 (2015)
008 Классификация изображений. Часть 3.1. GoogLeNet (2014)
มุมมอง 2667 หลายเดือนก่อน
008 Классификация изображений. Часть 3.1. GoogLeNet (2014)
007 Классификация изображений. Часть 2. VGG (VGG-16, VGG-19, VGG-16_bn)
มุมมอง 3767 หลายเดือนก่อน
007 Классификация изображений. Часть 2. VGG (VGG-16, VGG-19, VGG-16_bn)
006 Классификация изображений. Часть 1. AlexNet.
มุมมอง 6867 หลายเดือนก่อน
006 Классификация изображений. Часть 1. AlexNet.
005_Нарезка изображений для задачи классификации. (Data-engineering. Программируем)
มุมมอง 3807 หลายเดือนก่อน
005_Нарезка изображений для задачи классификации. (Data-engineering. Программируем)
004_Разметка изображений. (Делюсь практическим опытом; Data-annotation)
มุมมอง 6847 หลายเดือนก่อน
004_Разметка изображений. (Делюсь практическим опытом; Data-annotation)
003_Сравнение датасетов для задачи классификации с датасетом Арма. (Аналитика)
มุมมอง 2417 หลายเดือนก่อน
003_Сравнение датасетов для задачи классификации с датасетом Арма. (Аналитика)
002_Наводим порядок в структуре датасета. Data-engineering. Программируем.
มุมมอง 3097 หลายเดือนก่อน
002_Наводим порядок в структуре датасета. Data-engineering. Программируем.