ответ

0

Использование pytesseract не кажется, лучшая идея иметь место, но вы можете сделать это:

from pytesseract import pytesseract 
pytesseract.run_tesseract('image.png', 'output', lang=None, boxes=False, config="hocr") 
0

Положение символ можно найти следующим образом.

import csv 
import cv2 
from pytesseract import pytesseract as pt 

pt.run_tesseract('bw.png', 'output', lang=None, boxes=True, config="hocr") 

# To read the coordinates 
boxes = [] 
with open('output.box', 'rb') as f: 
    reader = csv.reader(f, delimiter = ' ') 
    for row in reader: 
     if(len(row)==6): 
      boxes.append(row) 

# Draw the bounding box 
img = cv2.imread('bw.png') 
h, w, _ = img.shape 
for b in boxes: 
    img = cv2.rectangle(img,(int(b[1]),h-int(b[2])),(int(b[3]),h-int(b[4])),(255,0,0),2) 

cv2.imshow('output',img) 

При использовании этого метода можно пропустить некоторые тексты. Для получения лучших результатов потребуется предварительная обработка (вычитание фона) изображения.

Смежные вопросы