Распознавание текста с картинки. Python Tesseract ORC + OpenCV

แชร์
ฝัง
  • เผยแพร่เมื่อ 7 ก.พ. 2025
  • Как распознать текст с фото? За счет языка Python и библиотеки OpenCV + Tesseract ORC это можно сделать за несколько строк кода. За урок мы разработаем систему для считывания данных из любого фото.
    🚀 🚀 🚀
    Ссылка на бесплатный интенсив «Как выбрать направление ИИ» от GeekBrains: geekbrains.ru/...
    🚀 🚀 🚀
    ✅ Полезные ссылки:
    🏛 Плейлист по нейронным сетям: • Изучение нейронных сет...
    ✏️ Официальный сайт Tesseract: tesseract-ocr....
    📺 Tesseract для Windows: tesseract-ocr....
    🔑 Языки для Tesseract: tesseract-ocr....
    ✏️ Статья с кодом: itproger.com/n...
    🕰 Тайм-коды:
    00:00 - Начало
    00:30 - Что мы сделаем за урок?
    01:19 - Установка библиотеки
    02:19 - Создание проекта
    03:03 - Работа с OpenCV
    04:45 - Считывание данных
    05:35 - Формирование надписей
    07:07 - Заключительная часть
    ✔ Сообщество программистов: itproger.com/
    ✔ -------------
    Вступай в группу Вк - prog_life 🚀
    Группа FaceBook - goo.gl/XW0aaP
    Инстаграм itProger: / itproger_official
    Instagram: / gosha_dudar
    Telegram: t.me/itProger_o...
    Twitter - / goshadudar
    Уроки от #GoshaDudar 👨🏼‍💻
    Все уроки по хештегу #goshaLessons

ความคิดเห็น • 104

  • @iambread666
    @iambread666 5 หลายเดือนก่อน

    Долго мучился с установкой, а тут все подробно рассказали, спасибо

    • @gammahilla
      @gammahilla 5 หลายเดือนก่อน

      нифига подробного на винде, уже 4-ый день сижу не могу понять от куда что скачивать как добавить в PyCharm, если есть возможность объясните
      что делать я скачать PyCharm, а дальше ничего не получается

  • @blwashere
    @blwashere 4 ปีที่แล้ว +24

    можно поступить проще: в терминале(cmd) установить pip и написать: pip install tesseract

    • @musa_usmanov
      @musa_usmanov 3 ปีที่แล้ว +2

      pip install opencv-python

    • @blwashere
      @blwashere 3 ปีที่แล้ว +2

      @@musa_usmanov Так тоже ожно)

    • @timofey-0307
      @timofey-0307 2 ปีที่แล้ว

      Это не так работает. Нужно проинсталлировать библиотеку + установить tesseract на компьютер

  • @ЕгорБеляев-ы4щ
    @ЕгорБеляев-ы4щ 4 ปีที่แล้ว +12

    Нету файла для скачивания pytesseract ocr на сайте пишет что нет актуальной версии для установки что делать?

  • @olzhasshabdenov3362
    @olzhasshabdenov3362 4 ปีที่แล้ว

    Гоша, красавчег👍

    • @msmesh5666
      @msmesh5666 4 ปีที่แล้ว +1

      Это даже не он сделал - th-cam.com/video/6DjFscX4I_c/w-d-xo.html

  • @gooddo1852
    @gooddo1852 4 ปีที่แล้ว +3

    Ты супер! Продолдай в томже духе

  • @kirill_bykov
    @kirill_bykov 3 ปีที่แล้ว +3

    6:02 ну зачем? Делается слайс [1:] и всё.

  • @baukaalimgazy2989
    @baukaalimgazy2989 4 ปีที่แล้ว

    Круто, у меня вчера была идея сделать комментатор бота ВК с искусственным интеллектом который считывает данные с поста и пишет наиболее подходящий коммент и через определенное время проверять сколько лайков набралось и в зависимости от кол-ва лайков менять веса и другие параметры нейросети, но я конечно же отказался от этой идеи, так как не знал считывать текст с картинки и множество других проблем, вот и решена одна проблема, если другие тоже сами по себе решатся, то может сделаю)

    • @NeuralAIM
      @NeuralAIM 4 ปีที่แล้ว +1

      Зачем тебе тогда нейросеть? Парсер странички нужен для получения данных, так быстрее, точнее и менее ресурсозатратнее. Не быть тебе программистом)
      И уж даже если ты и накодишь нейронку (Даже через тот же tensor) то тебе этого не хватит (Она все равно будет тупой, сколько бы ты данных не вливал) А данных для обучения нужно больше чем пару тысяч фраз...

    • @puturoi
      @puturoi 4 ปีที่แล้ว

      судя по твоему комменту, не особо ты сечешь, как работает нс, бот и т.д. Чтобы считать текст из поста вообще нвхрен не нужен computervision c tesseractom.

    • @baukaalimgazy2989
      @baukaalimgazy2989 4 ปีที่แล้ว

      @@NeuralAIM лол нейросеть из видео нужен, чтобы разпознать текст из картинок, а в ВК большинство постов в виде картинки. И я написал в комменте что ещё много заморочек кроме этого, но для генерации комментария GMT2 или 3, который может генерировать текст или статью а не то что коммент, просто если ему дать тему. Или можно ещё что то самому придумать.

    • @baukaalimgazy2989
      @baukaalimgazy2989 4 ปีที่แล้ว

      @@puturoi лол, я же написал в "ВК", в ВК много постов в виде картинки, и там текст в картинке и либа с этого видео только для того что распознать текст с постов в виде картинки. И я ещё я дополнил что много проблем кроме распознавания текстов и ТД. И я хоть и практический не делал нормальные проекты с нейросетями, но знаю как сделать перцептрон и обратное распространение ошибки, и знаю какие ограничения у вк, у официального или у неофициальных VK API для бота и с ними тоже работал, делал разных ботов ВК

    • @stoparb357
      @stoparb357 4 ปีที่แล้ว

      @@baukaalimgazy2989 а, ты тип хочешь быть самым первым комментатором под постами чи шо

  • @konstbespr619
    @konstbespr619 4 ปีที่แล้ว +9

    Гоша, сделай пожалуйста видео на тему интеграции оплаты в телеграм бота! Нигде нет инфы на эту тему

    • @Cloudy-zq5yx
      @Cloudy-zq5yx 4 ปีที่แล้ว

      Есть.

    • @konstbespr619
      @konstbespr619 4 ปีที่แล้ว

      @@Cloudy-zq5yx линк?

    • @Cloudy-zq5yx
      @Cloudy-zq5yx 4 ปีที่แล้ว

      ​@@konstbespr619 physics is simple aiogram набери

    • @MrDlop
      @MrDlop 4 ปีที่แล้ว

      Может там как в ВК боте?

    • @MrDlop
      @MrDlop 4 ปีที่แล้ว

      Я просто не помню, давно этим не интересовался

  • @43oiurtjkn9gfds8y98r
    @43oiurtjkn9gfds8y98r 4 ปีที่แล้ว +1

    Спасибо

  • @zemf4you731
    @zemf4you731 4 ปีที่แล้ว +2

    Параметры запуска тессеракта абсолютно не за то отвечают, что ты сказал. Oem - способ распознавания, psm (page segmentation mode) - режим сегментации страницы (в основном тессеракт с документами работает, при выщове помощи можно просмотреть все режимы сегментации)
    Вместо enumerate и проверку индекса можно было сделать срез, так как нам всё равно необходимо будет хранить считанные данные в памяти, нет смысла пытаться сохратить итератор

    • @amidl
      @amidl 2 ปีที่แล้ว +1

      Больше всего меня удивило, что автор использует аббревиатуру ORC, хотя общепринятой является OCR (о чем автор даже в названии библиотеки мог увидеть).

  • @dedpihto680
    @dedpihto680 2 ปีที่แล้ว +1

    из 7 минутного видео полторы минуты реклама и никчемное вступление, потом еще и посреди ролика впихнул рекламу. топчик

  • @АрманМеликбекян-е4ш
    @АрманМеликбекян-е4ш 4 ปีที่แล้ว +9

    Сделай курс по data science на python или про ИИ на python. В крайнем случае про нейросеть.

  • @СаятЕралы-я9з
    @СаятЕралы-я9з 4 ปีที่แล้ว +2

    ого круто.

  • @ВладиславБогер
    @ВладиславБогер 4 ปีที่แล้ว

    Спасибо.

  • @YanchikDev
    @YanchikDev 4 ปีที่แล้ว +1

    Жду видео про template matching

  • @иваниванов-к5т4е
    @иваниванов-к5т4е 3 ปีที่แล้ว +3

    Спасибо все супер. Скажи можно ли из js передать картинку в питон который обрабатывает фото и результат отдаёт назад в js?

  • @stariy_bog
    @stariy_bog 4 ปีที่แล้ว +3

    Как сделать что бы распознавал русский текст ?

    • @the..egoisto
      @the..egoisto 4 ปีที่แล้ว

      Он же сказал что надо выбрать при загрузке и русский

    • @stariy_bog
      @stariy_bog 4 ปีที่แล้ว

      @@the..egoisto скачал а где подключить
      Подключаю после конфига выдает ошибку

    • @Dikobrother
      @Dikobrother 4 ปีที่แล้ว +1

      @@stariy_bog Там где конфиг он подключал пишешь , lang='rus'. Перед эти закидываешь файл с языком в папку tessdata с самим тессерактом

  • @villainmadless1503
    @villainmadless1503 4 ปีที่แล้ว +4

    OCR же, OCR!

  • @gennady3935
    @gennady3935 4 ปีที่แล้ว

    Может кто подсказать, в AWS Textract можно написать price и он выведет только стоимость если она указана, т.е. сопоставляет данные и выводит именно тот текст, который нам нужен. В tesseract есть такое?

  • @МаксОгн
    @МаксОгн 3 ปีที่แล้ว

    Того файла на сайте нету про Tesseract

  • @TblKBA_Z
    @TblKBA_Z 3 ปีที่แล้ว

    помогите пж, нужно создавать скрины определённой области, загружать их в скрипт, находить символы и их-же писать (как send в ahk, не в командную строку)

  • @qwer5822
    @qwer5822 4 ปีที่แล้ว +1

    Видео о том как взломать чужой компьютер - th-cam.com/video/XtMgEfcZgZo/w-d-xo.html

  • @Гриша-ф1б
    @Гриша-ф1б 4 ปีที่แล้ว

    Ребят подскажите что делать вылазит вот эта ошибка
    img = cv2.cvtColor(img, cv2.COLOR_BGR2RGB)
    cv2.error: OpenCV(4.4.0) /private/var/folders/nz/vv4_9tw56nv9k3tkvyszvwg80000gn/T/pip-req-build-2rx9f0ng/opencv/modules/imgproc/src/color.cpp:182: error: (-215:Assertion failed) !_src.empty() in function 'cvtColor'

    • @hinomuratomisaburo4901
      @hinomuratomisaburo4901 4 ปีที่แล้ว

      фотку название файла обрежь коротким название сделай типо temp.png

    • @Гриша-ф1б
      @Гриша-ф1б 4 ปีที่แล้ว

      @@hinomuratomisaburo4901 не получилось

    • @imperria392
      @imperria392 3 ปีที่แล้ว

      тоже самое, ты если понял как это сделать скажи мне пожалуйста

    • @imperria392
      @imperria392 3 ปีที่แล้ว

      вообщем я понял, там к нему нужно путь написать

  • @konstantin9888
    @konstantin9888 4 ปีที่แล้ว

    Гоша. скинь пжл ссылки на репозиторий, тех программ которые ты использовал в качестве примера при работе с OpenCV

  • @ОООГеобур
    @ОООГеобур 2 ปีที่แล้ว

    а можно с нескольких картинок собирать данные в Excel

  • @CalmVideo
    @CalmVideo 4 ปีที่แล้ว +1

    Всё конечно очень круто, но до того, чтобы понять, мне далековато. :)
    Хочу тоже этому научиться (создавать нейросети), но пока чёт не очень получается, но ничего!

    • @rustc2p256
      @rustc2p256 4 ปีที่แล้ว

      Для начало изучи основы

    • @CalmVideo
      @CalmVideo 4 ปีที่แล้ว

      @@rustc2p256 , стараюсь.

    • @kirillusenko
      @kirillusenko 4 ปีที่แล้ว

      Это сложно, но вот курс по которому я пытался изучать tensorflow: th-cam.com/play/PLtPJ9lKvJ4oiz9aaL_xcZd-x0qd8G0VN_.html

    • @CalmVideo
      @CalmVideo 4 ปีที่แล้ว

      @@kirillusenko , спасибо!

  • @XEROS282
    @XEROS282 3 ปีที่แล้ว

    А как сканировать баркоды через Django?

  • @MrFog124
    @MrFog124 4 ปีที่แล้ว

    Давай видос по считыванию потокового видео с программы и распознавании собственных объектов

  • @DictorDialog
    @DictorDialog 2 ปีที่แล้ว

    Всё это будет работать пока фон под текстом не будет пёстрым

  • @casuale1200
    @casuale1200 4 ปีที่แล้ว

    круть

  • @sergeisuslov773
    @sergeisuslov773 ปีที่แล้ว

    Сами же говорите оптикал кхеректал рекгнишн, а потом аббревиатура меняет порядок символов на о-эр-си, когда на самом деле оно о-си-ар

  • @ЕгорБеляев-ы4щ
    @ЕгорБеляев-ы4щ 4 ปีที่แล้ว

    Гошаааа видео супер но у меня проблема. Тесеракт поставился а вот с opencv проблемы. При написании просто в терминале пайчарма через pip выдаёт ошибку. Проблема с логами. Я не особо сведующий в логировании да и вообще в программировании. Прошу помощи либо у тебя либо друзья подписчики подскажите что сделать чтобы установить opencv. Заранее спасибо

    • @drfclub777
      @drfclub777 ปีที่แล้ว

      получилось?

  • @diasoralbekov6465
    @diasoralbekov6465 4 ปีที่แล้ว

    где ссылка на виндовс инсталер

  • @sergozar
    @sergozar 3 ปีที่แล้ว

    А как распознать символы типо "·ê ·Ë· »ê ³ ·³¼ ·Ë"?

  • @Lucerbius
    @Lucerbius ปีที่แล้ว +1

    ОэрСи, боже, чувак не может три буквы OCR прочитать в правильном порядке...
    А по уроку выпадает ошибка:
    cv2.error: OpenCV(4.8.1) D:\a\opencv-python\opencv-python\opencv\modules\highgui\src\window.cpp:1272: error: (-2:Unspecified error) The function is not implemented. Rebuild the library with Windows, GTK+ 2.x or Cocoa support. If you are on Ubuntu or Debian, install libgtk2.0-dev and pkg-config, then re-run cmake or configure script in function 'cvShowImage'

    • @L3M-carx
      @L3M-carx 9 หลายเดือนก่อน

      А ты не лучше, почитать ошибку можешь а не в комы вставлять. Переустанови библиотеку блять умник

  • @СергейКитин
    @СергейКитин 4 ปีที่แล้ว

    Уху питон 🐍

  • @БогданКислов-ж2ж
    @БогданКислов-ж2ж 4 ปีที่แล้ว

    Когда будет видио про создания игр?

    • @FDev404
      @FDev404 4 ปีที่แล้ว +1

      У него этих видео жопой ешь

  • @dictatorsupreme5447
    @dictatorsupreme5447 4 ปีที่แล้ว

    Гоша, сделай пожалуйста видео на тему Перенос HTML сайта на WordPress ?

  • @KuKuRuuZa
    @KuKuRuuZa 3 ปีที่แล้ว +2

    И не ORC а правильно OCR

  • @VladKochetov
    @VladKochetov 4 ปีที่แล้ว

    @Гоша Дударь, попробуй сделать урок по numba

  • @sunmaxplay6491
    @sunmaxplay6491 4 ปีที่แล้ว

    как быть с 4 строчкой на линуксе?

    • @Crd51409
      @Crd51409 4 ปีที่แล้ว

      Не нужна

  • @ДмитрийКлочков-ж8ю
    @ДмитрийКлочков-ж8ю 4 ปีที่แล้ว +1

    А она может комбинировать языки? К примеру код естественно написан на английском языке ,но у него есть комментарии на русском.

    • @mikelieber7256
      @mikelieber7256 4 ปีที่แล้ว

      Да, можно. На C#, если воспользоваться библиотекой для тессеракта, ты можешь при инициализации тессеракта указать, например, RUS+ENG, но качество OCR будет чуть ниже.

  • @zaralx
    @zaralx 4 ปีที่แล้ว

    Блен ты прям вот во время как раз пишу прошу для бота в игре

  • @ДаниилФотеев-ы1й
    @ДаниилФотеев-ы1й 3 ปีที่แล้ว

    Мой коммент будет явно удален, но что я хочу сказать: Гоша, тебе простительно что ты не ученый в сфере компьютерного зрения и машинного обучения. Но готовься пожалуйста лучше. Многая терминология неточна или неверная + про функции питона немного неверно говоришь)

  • @tarantinPipka
    @tarantinPipka 9 หลายเดือนก่อน

    твои видео все до единого не рабочие , не заработало не чего .. хз , я уже скоко их не смотрел.. вродь пробелма в опен сиви ... она у твоему коде кривая ..щас комент вставлю что пиет джипити

    • @tarantinPipka
      @tarantinPipka 9 หลายเดือนก่อน

      Кажется, возникла проблема с библиотекой OpenCV, которая используется для отображения изображений. Ошибка указывает на то, что функция cv2.imshow() не реализована. Это может быть вызвано неправильной установкой или версией OpenCV.
      Попробуйте переустановить OpenCV или обновить его до последней версии. Возможно, вам также потребуется установить зависимости для поддержки графического интерфейса, если вы используете его на Windows.

  • @shadowcode7752
    @shadowcode7752 4 ปีที่แล้ว +1

    Запишы курс по rust.

  • @a1exlovser136
    @a1exlovser136 4 ปีที่แล้ว

    digi.bib.uni-mannheim.de/tesseract/tesseract-ocr-setup-3.05.02-20180621.exe возможно вот этот файл нужный

  • @nikolaydd6219
    @nikolaydd6219 4 ปีที่แล้ว +1

    Но ведь не удобно работать с Питоном, гораздо удобней было бы сделать программу с интерфейсом, окном и кнопками .

  • @FDev404
    @FDev404 4 ปีที่แล้ว

    У тебя как то разрозненно всё. Я не очень люблю питухон, но могу сказать, что нужно тебе делать видео более подробные по нему. Расскажи про всё что знаешь. Smtplib, json, datetime, request, tkinter, socket, os, time. Сними самую подробную серию видео по питухону на рутубе и я думаю добьёш 1млн подписчиков к весне 21!!!

  • @PythononPapyrusRU
    @PythononPapyrusRU 4 ปีที่แล้ว

    Круто!
    Неужели ты не любишь его😭😭??? Я про Python. А если и любишь, то почему не подписан на мой канал? Исправь это🤙😎

  • @yes_ss
    @yes_ss 2 ปีที่แล้ว

    PermissionError: [WinError 5] Отказано в доступе

  • @wad_code
    @wad_code 4 ปีที่แล้ว

    Начал с ORC закончит RAC

  • @nikolaydd6219
    @nikolaydd6219 4 ปีที่แล้ว +3

    Тесеракт довольно хреновое решение. Сам им пользуюсь и проблем с ним - полно. Хорошее решение это Yandex Vision, но капец какой дорогой.

  • @dmitriy2502
    @dmitriy2502 3 ปีที่แล้ว

    Здравствуйте! А подскажите, можно ли этим методом распознавать цифры из потока видео? Например спортивное электронное табло с временем, время минуты +секунды?

    • @unknown_youtube_user
      @unknown_youtube_user 3 ปีที่แล้ว

      Метод показанный в видео работает с картинками, если ты разработаешь программу которая будет делать скриншоты и вставлять для считывания, то вполне возможно.

  • @irgendwer234
    @irgendwer234 4 ปีที่แล้ว +1

    Cnacubo

  • @АнтонКруглышев-к4ц
    @АнтонКруглышев-к4ц 4 ปีที่แล้ว

    Плохо работает с русским языком.

  • @pirozhekN
    @pirozhekN 4 ปีที่แล้ว

    Тессеракт орк

  • @СтаниславАлямов
    @СтаниславАлямов 3 ปีที่แล้ว

    дохлый движок он распознает с кракозябрами.. это капитализм.. хорошие движки платные.. тоже с говорилками...про браузеры вообще молчу.. по моему нам слили чтобы началась гражданская война до того раздражает тупизм некоторого ПО ..вместо нормального функционала команд в консоли приходится лезть черт знает куда...

  • @pavelkross
    @pavelkross 4 ปีที่แล้ว

    даешь тоже самое только на C#!!