Pytesseract ve Opencv ile resimden yazı okuma - optik karakter tanıma- Bölüm 1

Mr Çilek

มุมมอง 6 691

เพิ่มลงใน
- เพลย์ลิสต์ของฉัน
- ดูภายหลัง
แชร์

แชร์

ฝัง

ขนาดวิดีโอ:

แสดงแผงควบคุมโปรแกรมเล่น

เล่นอัตโนมัติ

เล่นใหม่

เผยแพร่เมื่อ 19 ก.ย. 2024
Pytesseract ve Opencv ile resimden yazı okuma ( optik karakter tanıma, OCR)
tesseract.exe dosyasını içeren uygulamayı yüklemek için web linki:
github.com/UB-...
gerekli Python kütüphanelerini yüklemek için terminalde yazılacak komutlar:
pip install pytesseract
pip install opencv-python
Python kodu:
--------------------------------------------------------------
import pytesseract
import cv2
yol = "C:\\Users\\bseze\\Downloads\\pytesseract\\elyazisi.jpg"
pytesseract.pytesseract.tesseract_cmd = "C:\\Users\\bseze\\AppData\\Local\\Programs\\Tesseract-OCR\\tesseract.exe"
resim = cv2.imread(yol)
metin = pytesseract.image_to_string(resim)
print(metin)
cv2.imshow("resim", resim)
cv2.waitKey(0)

ความคิดเห็น • 64

@hercaici ปีที่แล้ว ⁺²
Bir dersin 2 yıl sonra bile işe yaraması ne kadar güzel..Emekleriniz için çok teşekkürler hocam...
@elifozcan7571 3 ปีที่แล้ว ⁺¹
Hocam çok teşekkür ederim. Çok faydalı bir çalışma olmuş gerçekten bende farklı görseller üzerinde uyguladım(2 paragraflık bir metni jpg olarak kaydettim ve jpg paragrafı text olarak Pyhton bana yazdı :)) Umarım bu videonun devamı gelir :)
@mrcilek4454 ปีที่แล้ว
Teşekkürler
@betulaykaba7602 7 หลายเดือนก่อน ⁺¹
Hocam elinize kolunuza aklınıza sağlık
@mrcilek4454 7 หลายเดือนก่อน
Teşekkürler
@zulfikarozmeral520 ปีที่แล้ว
Hocam çok teşekkür ederim ellerinize sağlık...
@mrcilek4454 ปีที่แล้ว
teşekkürler
@FoRkeN 2 ปีที่แล้ว ⁺¹
hocam selamlar, bu işlemi fotoğraf yerine bir internet sitesinden nasıl çekebilirim
@mrcilek4454 2 ปีที่แล้ว
pyautogui kütüphanesini kullanarak internetteki bir resmin ekran görüntüsünü kaydederek bu resmi kullanabilirsiniz.
@Oyundabilgi ปีที่แล้ว
Hocam merhabalar, bunu mobil bir uygulama ile kameradan çekilen veya galeriden seçilen bor fotoğrafı üzerinde nasil yapabiliriz
@mrcilek4454 ปีที่แล้ว
mobil android uygulama geliştirme ile ilgili Mr Çilek kanalında videolar mevcut. kamera görüntüsü için cv2.videoCapture komutu ile fotoğraf için de cv2.imread komutu ile okutarak bu işlemleri yapabilirsiniz.
@tolgayldrm8620 ปีที่แล้ว
hocam programa bir ekran kordinati girsek ve o koordinattan screenshot alsa bu aldığı screen shotu okuyup ona göre bir işlem yaptırabilir miyiz? ayrıca tesseract ve opencv visual studioda daha iyi çalışmaz mı?
@mrcilek4454 ปีที่แล้ว ⁺¹
pyautogui kütüphanesi ile ekrandan ekran görüntüsü (screenshot) alabilirsiniz. sonra bu resim üzerinden metinleri okutabilirsiniz. opencv ve tesseract visual studio ile de çalıştırılabilir. henüz bunu yapmadım, ama bahsettiğiniz gibi daha verimli ve iyi olur mu bilmiyorum. eğer siz tecrübe ederseniz buradan bizimle paylaşırsanız sevinirim.
@hulusialtntop ปีที่แล้ว
optik okuyucu yapmam lazım. sınav kağıtları okumak için. bana bir yol gösterseniz hocam.
@mrcilek4454 ปีที่แล้ว ⁺¹
şu linke bakabilirsiniz: github.com/Python-Egitici-Egitimi-OOP-Grup-8/Optik-Form-Okuyucu
@hulusialtntop ปีที่แล้ว ⁺¹
@@mrcilek4454 çok teşekkür hocam Allah razı olsun. uzun bir kod uğraşacam
@aryaaktas7589 ปีที่แล้ว
Pycharm üzerinden yol = plaka bağlantısını kopyalayamıyorum nasıl yapabilirim
@mrcilek4454 ปีที่แล้ว
Yolun doğru formatta olması gerekiyor. Bazen tek slash yerine çift slash yazmak sorunu çözebilir
@bahrituna8008 ปีที่แล้ว
merhaba hocam bir konuda yardıma ihtiyacım var pyton kodunuz ile bir dosya yolu üzerindeki fotoğrafı text çevirdi ancak benim yapmak istediğim ise internet üzerinde çalışan bir program üzerinde daha önceden taranmış ve internet üzerinden açılan belge, resim, tif dosyalarını okuyup dosyasına kayıt edip diğer belgeyi okumak. birden fazla gerçek zamanlı bir tanıma nasıl yapabilirim
@mrcilek4454 ปีที่แล้ว
Python PyQt kütüphanesi ile web sayfasında ekran görüntüsü alabilirsiniz. Örnek için şu linke bakabilirsiniz: stackoverflow.com/questions/1197172/how-can-i-take-a-screenshot-image-of-a-website-using-python
@bahrituna8008 ปีที่แล้ว
Ekran görüntüsü almadan açık olan ekranın sol tarafını okutamazmıyım
@mrcilek4454 ปีที่แล้ว
@@bahrituna8008 tabi olur, resimin sadece ilgili alanını seçerek (roi) yapabilirsiniz. roi seçimi ve kodlaması için şu linke bakabilirsiniz: stackoverflow.com/questions/15424852/region-of-interest-opencv-python
@elifozcan7571 3 ปีที่แล้ว
Merhaba hocam, belge üzerinden istediğimiz yazıları çıktı olarak görebilmek için ne yapmak gerekiyor? Örneğin bir sözleşme üzerinden sadece kişinin isim ve soy ismini ve adres bilgilerini çıktı olarak ekranda görmek istesek ve sözleşme üzerindeki diğer bilgileri çıktı olarak görmek istemesek nasıl bir yol izleyebiliriz? Böyle bir sözleşmeden 1000 adet olduğunu düşünürsek veya kimlik üzerinden ele alsak hocam siz ocr videonuzda kimlik denetlemesi yapmıştınız ama kimlik numarasının olduğu yeri kırpıp ayrı bir jpg olarak tanımlama yapmıştınız işte ben her bir resim için kırpma yapmadan kimliğin ham haliyle istenilen tanımlamayı gerçekleştirmesini istiyorum. Umarım böyle birşeyi yapabilmenin yolu vardır.Teşekkür ederim.
@mrcilek4454 3 ปีที่แล้ว ⁺¹
eğer tüm belgelerde hep aynı bölgeyi tanıtmak isterseniz sadece o bölgenin pixel alanını opencv ile seçtirebilirsiniz. fakat her seferinde farklı bir alan tanıması gerekiyorsa bunu otomatize etmek zor olur.
@mrcilek4454 2 ปีที่แล้ว
@@Transistor730 teşekkürler
@atillaklc8570 2 ปีที่แล้ว ⁺¹
@@mrcilek4454 tüm içeriği alıp, örneğin "adi:" dan sonrasını parse edebilirsiniz. Bi projede pdf üzerinden personelin, pasaport, çalışma izni vs gibi bir cok dosyası üzerinden bu şekilde db ye aldık.
@mrcilek4454 2 ปีที่แล้ว ⁺¹
@@atillaklc8570 bilgi ve paylaşımınız için teşekkürler
@abdulkadirbesen8740 2 ปีที่แล้ว
pyhcarm içerisinde pytesseract kütüphanesi bulamadım hocam proje benim için çok öenmli yardımcı olur musunuz?
@mrcilek4454 2 ปีที่แล้ว
şimdi kontrol ettim. python 3.8 versiyonda pytesseract mevcut. versiyonu 0.3.9
@aryaaktas7589 ปีที่แล้ว
Merhaba, Jupyter notebook üzerinden çalışma yapıyorum ama hata veriyor tesseract bağlantısını kopyaladığım Kısımda nasıl düzeltebilirim
@mrcilek4454 ปีที่แล้ว
Tesseract kütüphanesini Jüpiter notebook da yüklemeniz gerekir
@aryaaktas7589 ปีที่แล้ว
Teşekkür ederim jupyter notebook yerine hangi notebooku kullanabilirim siz hangisini kullanıyorsunuz
@mrcilek4454 ปีที่แล้ว ⁺¹
@@aryaaktas7589 genelde pycharm kullanıyorum
@muratyldrm6977 2 ปีที่แล้ว
hocam terminalden pip install tesseract dedikten sonra bir uyarı verdi bende. sürümle alakalı bir uyarı. bu uyarı yüzünden kodum çalışmıyor cv2yi tanımıyor. aynı uyarı terminalde sizde de vardı. nasıl çözebilirim
@mrcilek4454 2 ปีที่แล้ว
pycharm kullanabilirsiniz. videolarda anlattığımız gibi pycharm settings kısmından girerek uygun olan versiyonu indirebilirsiniz.
@muratyldrm6977 2 ปีที่แล้ว ⁺¹
@@mrcilek4454 pycharmda da aynı problem oldu ama visual studio code'da hallettim hocam çok teşekkür ederim, sağlıklı günler
@mrcilek4454 2 ปีที่แล้ว
@@muratyldrm6977 teşekkürler
@softmusic4473 2 ปีที่แล้ว
Slm hocam teşekkürler.Tesseract ile basit chaptha kodları okutabilirmiyiz ?
@mrcilek4454 2 ปีที่แล้ว
bence bu mümkün fakat oldukça zor bir iş. çünkü bu kodlar yazı karakterini çok fazla değiştirebiliyor. bazen insanlar bile hangi karakter olduğunu anlayamayabiliyor.
@sercancan2314 2 ปีที่แล้ว
hocam çok teşekkürler, tesseract.exe MacOs sürümünü nasıl yükleyebilirim doğru içeriği bulamadım
@mrcilek4454 2 ปีที่แล้ว
şu linke bir bakmanızı öneririm: stackoverflow.com/questions/55235369/where-is-the-tesseract-executable-file-located-on-macos-and-how-to-define-it-in
@arafgamings ปีที่แล้ว
Hocam e postanızı rica edebilir miyim bir konu hakkında danışacaktım lütfen bana yardım edin. Konu özetle şu şekilde, tarayıcıdan tarattığım ve .jpg olarak kaydettiğim evrağın içindeki örneğin"Adi,Soyadi,Unvani" gibi bilgilere değer atayıp daha sonrasında belirli bir websitesindeki sisteme .jpg uzantılı evraktaki yazılı olan metinlere atadığım verileri id'lerine sahip olduğum textboxlara girecek bir program yapmaya çalışıyorum. Yani oto kayıt sistemi tarzı bir şey olacak. Benim mantığımı zorlayan kısım, .jpg uzantılı bir belgenin içindeki yazılı metinlere nasıl değer atarım "Görevlendirilen Personel Adı : Nayif Pehlivan" o nayif pehlivan' a değer atayıp selenium ile web sitesinde "Görevlendirilen Personel Adı :" yanındaki textboxa girsin istiyorum kısaca. Mümkün mü biraz ilerleme kaydettim.
@mrcilek4454 ปีที่แล้ว
Jpg dosyasından isim soyad vb. okutmanız mümkün . Sonra bu bilgiyi websitesi üzerinde bir değer ile eşleştirerek yazdırmak istiyorsanız bunun için ilgili veritabanına erişerek bunu yapmanız gerekir. Eğer ilgili web sayfasında bilgi güncellemesi yapılacaksa o sayfanın verilerinin bulunduğu koda erişmek ve orada değişiklik yapmak gerekir
@arafgamings ปีที่แล้ว
@@mrcilek4454 hangi metod ile mümkün hocam arada kaldığım kısım orası. adı ve soyadı'nın yanındaki isim ve soyadına nasıl tanıtacagım programa her taramada değişecek çünkü
@mrcilek4454 ปีที่แล้ว
@@arafgamings eğer sürekli değişecek ise o zaman her defasında ekran görüntüsünü alıp, metni okutup bir ad değişkenine atamanız gerekir. şu linke bakabilirsiniz: stackoverflow.com/questions/1197172/how-can-i-take-a-screenshot-image-of-a-website-using-python
@mehmetcanozturk8119 2 ปีที่แล้ว
Merhaba hocam, bu kulandığınız pytesseract kütüphanesini ben pycharm da kurmak istiyorum navigator olarak da anaconda kullanıyorum, python ınterpreter da kütüphaneyi görüntüleyemiyorum sebebi konusunda bir bilginiz var mıdır ? Konu hakkında yardımcı olursanız çok mutlu olurum, teşekkürler :)
@mrcilek4454 2 ปีที่แล้ว
şimdi Pycharm da kontrol ettim. pyttesseract kütüphanesi bulunuyor. versiyon 0.3.9. belki kütüphane ismini yazarken yanlış yazmış olabilirsiniz.
@mehmetcanozturk8119 2 ปีที่แล้ว
@@mrcilek4454 Çok teşekkür ederim problemi çözdüm.
@mehmetcanozturk8119 2 ปีที่แล้ว
@@mrcilek4454 Merhaba tekrardan , sormak istediğim birşey daha var. Bir kamerayla çizgi takip edecek ve çizgi üzerinde yazılan A1....A999, B1...B999 gibi yazıları görünce dönüş yapacak bir araba yapmak istiyorum. Bu yazıları okumak ve işlemek için pytesseract kütüphanesi kullanmak mı yoksa neural network kullanmak mı daha mantıklı olur sizce ? Vereceğiniz cevaplar için şimdiden teşekkür ederim
@mrcilek4454 2 ปีที่แล้ว
@@mehmetcanozturk8119 her ikisi de olabilir. böyle bir şey denemedim ama ilk kez deneyecek olsam herhalde neural network ile özel karakterlerle önceden eğitilmiş bir model kullanmayı tercih ederdim diye düşünüyorum.
@mehmetcanozturk8119 2 ปีที่แล้ว ⁺¹
@@mrcilek4454 çok teşekkürler hocam 🙏🙏🙏
@yusufbulbul9434 ปีที่แล้ว
bunun canlı ekrandan okuyanını nası yaparız?
@mrcilek4454 ปีที่แล้ว ⁺¹
Canlı görüntü için bir while döngüsü içinde görüntüyü cap read ile kare kare okutarak bu resim üzerinde yazıyı okutabilirsiniz. Bu konuda içinde webcam yazan videolarımız dan herhangi birini örnek olarak kullanabilirsiniz
@yusufbulbul9434 ปีที่แล้ว
@@mrcilek4454 bakıyorum teşekkür ederim :)
@turkler1 7 หลายเดือนก่อน
peki bunu bir uygulama iiçinde çalıştrmak mümkünmü pythona eklenti yapmak mümkünmü +
@mrcilek4454 7 หลายเดือนก่อน
Evet mümkün, bunu bir modül olarak farklı bir Python programından çağırabilir
@turkler1 7 หลายเดือนก่อน
@@mrcilek4454 fakat captcha linkini bulamıyorum hocam nasıl çıkabilirim işin içinden bi yardımcı olma şansın varmı
@busraerdem1038 ปีที่แล้ว
bunu pdf'lerin içinde arama yapmak için kullanabilir miyiz?
@mrcilek4454 ปีที่แล้ว ⁺¹
evet kullanılabilir
@busraerdem1038 ปีที่แล้ว
@@mrcilek4454 teşekkür ederim. Nasıl kullanılacağını araştıracağım
@mertcanbalc5708 2 ปีที่แล้ว
abi sana ulaşmam lazım yardımcı olabilir misin kısa bir konuda
@mrcilek4454 2 ปีที่แล้ว
buradan sorabilirsiniz
@enes9898 ปีที่แล้ว
pytech hakkında bilgisi olan var mı acaba

ต่อไป

เล่นอัตโนมัติ

PYTHON VE DERİN ÖĞRENME İLE RESİMDEKİ YAZIYI OKUMAK