Tesseract vs Keras-OCR vs Easy-OCR Hangisi daha iyi ?

kerasocr,easyocr,tesseract

Tesseract vs Keras-OCR vs EasyOCR

OCR (Optical Character Recognition) için hangisi daha iyi ?

Optical Character Recognition – Optik Karakter Tanıma derin öğrenmede yaygın kullanıma sahiptir. Örnek vermek gerekirse: alışveriş fişi üzerindeki ifadeleri karakterlerine dönüştürme, Plaka Tanıma sistemi uygulamaları, PDF ya da resimden text dönüşümü, vb..

Günümüzde markette, OCR için çeşitli çok iyi ücretli API servisleri bulunmaktadır. (Amazon, Textract, Microsoft cognitive service, Google cloud vision vb.) Aynı zamanda, PyTesseract, Easyocr, Keras-OCR açık kaynaklı erişilebilir API’lerdir. Bunlarda diğer ödemeli API servisleri gibi hemen hemen benzer sonuçlara sahiptir. Bu makalede açık kaynak ve ücretsiz olan KerasOCR, tesseract, easyOcr kurulumlarını ele alacağız, sonrasında performanslarına göz atacağız.

Keras-Ocr Yükleme işlemi :

!pip install keras-ocr

Keras dahili pipeline’a sahiptir Image url’leri input-girdi olarak daha sonra işlenmek üzere verilir.

import keras_ocr from matplotlib import pyplot as plt pipeline=keras_ocr.pipeline.Pipeline()

Tahmin/Prediction :

prediction_groups=pipeline.recognize(images)

Varsayılan olarak, tahminleri girdi olarak sağladığımız resimler üzerinde çizecek.

#plot the predictions fig,axs=plt.subplots(nrows=len(images),figsize=(20,20)) for ax image, predictions in zip(axs,images,prediction_groups):      keras_ocr.tools.drawAnnotations(image=image,predictions=predictions,ax=ax)

Aynı zamanda bu text’leri dışarı çıkartıp yazdırabiliriz.

Tesseract Kurulumu :

Tesseract için, tesseract-ocr yüklemesine ihtiyaç duyulmaktadır. Tesseract için tam yol sağlanmalıdır.

EasyOCR Kurulumu :

İsminde olduğu gibi, EasyOCR basit hafif OCR kütüphanesidir. EasyOCR’ın çok sayıda dil desteği de bulunmaktadır.

Tek satır kod ile tahmin yapılarak sonuç döndürülür.

Performans Kıyaslaması [Tesseract vs Keras-OCR vs EasyOCR] :

Resimlerde elle yazılmış metinler, araç plakası, metinler Tesseract, Keras-OCR ve EasyOCR kütüphaneleri ile  test edilerek kıyaslanmıştır ve sonuçlar aşağıdaki gibidir.

Sonuç :

OCR tahmini yalnızca modele bağlı değildir, diğer birçok faktör bulunmaktadır. Netlik, gri renk uzayında resim, hiperparametre, verilen ağırlık vb.

Tesseract yüksek çözünürlüklü resimlerde iyi performans sergiliyor. Bazı morfolojik işlemler örneğin dilation, erosion, OTSU Binarization vb pytesseract performansının artmasına yardımcı olur.

EasyOCR hafif bir model olduğu gibi reçete/fiş, pdf dosyalarında iyi performans sergiliyor. Düzenli dosyalarda örneğin fiş, reçete, pdf metin dosyası gibi daha yüksek sonuçlar sağlıyor.

Keras-OCR, resim spesifik OCR aracıdır. Resmin içinde dağınık, farklı renk ve fontlarda metinsel öğelerde, Keras-OCR iyi sonuç üretiyor.

Kaynak : https://medium.com/mlearning-ai/tesseract-vs-keras-ocr-vs-easyocr-ec8500b9455b adresinde yayınlanan makale İngilizce’den Türkçe’ye çevrilmiştir.

İlk yorum yapan olun

Bir yanıt bırakın