2013-10-04 4 views
3

У меня есть изображение, в котором есть текст. Я хочу отправить изображение в OCR, но изображение имеет белый шум в нем, поэтому результаты OCR не так уж велики. Я пытался поднять/расширять изображение, но не мог получить идеальный порог для работы. Так как весь текст на изображениях будет совершенно горизонтальным, я попробовал преобразование Хафа.Обрезка изображений в opencv

Вот как выглядит изображение, когда я запускаю программу преобразования hough-образца в комплекте с OpenCV.

Вопрос

  • Как я могу вычеркнуть все кроме, где красные линии? OR Как я могу вырезать отдельные изображения для каждой из областей, выделенных красными линиями?

  • Я хотел бы сосредоточиться только на горизонтальных линиях, я могу отбросить диагональные линии.

Любой вариант будет работать для меня при отправке в OCR. Тем не менее, я хотел бы попробовать оба, чтобы увидеть, какие из лучших результатов.

ответ

2

МЕТОДИЧЕСКИХ/с выходом

  • Как черное все, кроме случаев, когда красные линии?
    • dotess2()
    • ['Footel text goes he: e\n', 'Some mole hele\n', 'Some Text Here\n']
  • ИЛИ Как я могу обрезать отдельные изображения для каждого из областей, выделенных красными линиями?
    • dotess1()
    • ['Foolel text goes he: e\n', 'Some mole hele\n', 'Some Text Here\n', 'Directions\n']

код

# -*- coding: utf-8 -*- 
import cv2 
import numpy as np 
import math 
import subprocess 
import os 
import operator 

#some clean up/init blah blah 
junk='\/,-‘’“ ”?.\';!{§[email protected]#$%^&*()_+-|:}»£[]¢€¥°><' 
tmpdir='./tmp' 
if not os.path.exists(tmpdir): 
    os.makedirs(tmpdir) 
for path, subdirs, files in os.walk(tmpdir): 
    for name in files: 
     os.remove(os.path.join(path, name))  

#when the preprocessor is not pefect, there will be junk in the result. this is a crude mean of ridding them off 
def resfilter(res): 
    rd = dict() 
    for l in set(res): 
     rd[l]=0. 

    for l in rd: 
     for i in l: 
      if i in junk: 
       rd[l]-=1 
      elif i.isdigit(): 
       rd[l]+=.5 
      else: 
       rd[l]+=1 
    ret=[] 
    for v in sorted(rd.iteritems(), key=operator.itemgetter(1), reverse=True): 
     ret.append(v[0]) 
    return ret 

def dotess1(): 
    res =[] 
    for path, subdirs, files in os.walk(tmpdir): 
     for name in files: 
      fpath = os.path.join(path, name) 
      img = cv2.imread(fpath) 
      gray = cv2.cvtColor(img,cv2.COLOR_BGR2GRAY) 

      ''' 
      #if the text is too small/contains noise etc, resize and maintain aspect ratio 
      if gray.shape[1]<100: 
       gray=cv2.resize(gray,(int(100/gray.shape[0]*gray.shape[1]),100)) 
      '''  
      cv2.imwrite('tmp.jpg',gray) 
      args = ['tesseract.exe','tmp.jpg','tessres','-psm','7', '-l','eng'] 
      subprocess.call(args, stdin=subprocess.PIPE, stdout=subprocess.PIPE, stderr=subprocess.PIPE) 
      with open('tessres.txt') as f: 
        for line in f: 
         if line.strip() != '': 
          res.append(line) 
    print resfilter(res) 


def dotess2(): 
    res =[] 
    args = ['tesseract.exe','clean.jpg','tessres','-psm','3', '-l','eng'] 
    subprocess.call(args, stdin=subprocess.PIPE, stdout=subprocess.PIPE, stderr=subprocess.PIPE) 
    with open('tessres.txt') as f: 
      for line in f: 
       if line.strip() != '': 
        res.append(line) 
    print resfilter(res) 

''' 
start of code 
''' 
img = cv2.imread('c:/data/ocr3.png') 
gray=cv2.cvtColor(img,cv2.COLOR_BGR2GRAY) 
canny=cv2.Canny(gray,50,200,3) 
cv2.imshow('canny',canny) 

#remove the actual horizontal lines so that hough wont detect them 
linek = np.zeros((11,11),dtype=np.uint8) 
linek[5,...]=1 
x=cv2.morphologyEx(canny, cv2.MORPH_OPEN, linek ,iterations=1) 
canny-=x 
cv2.imshow('canny no horizontal lines',canny) 

#draw a fat line so that you can box it up 
lines = cv2.HoughLinesP(canny, 1, math.pi/2, 50,50, 50, 20) 
linemask = np.zeros(gray.shape,gray.dtype) 
for line in lines[0]: 
    if line[1]==line[3]:#check horizontal 
     pt1 = (line[0],line[1]) 
     pt2 = (line[2],line[3]) 
     cv2.line(linemask, pt1, pt2, (255), 30) 

cv2.imshow('linemask',linemask) 

''' 
* two methods of doing ocr,line mode and page mode 
* boxmask is used to so that a clean image can be saved for page mode 
* for every detected boxes, the roi are cropped and saved so that tess3 can be run in line mode 
''' 

boxmask = np.zeros(gray.shape,gray.dtype) 
contours,hierarchy = cv2.findContours(linemask,cv2.RETR_LIST,cv2.CHAIN_APPROX_SIMPLE) 
idx=0 
for cnt in contours: 
    idx+=1 
    area = cv2.contourArea(cnt) 
    x,y,w,h = cv2.boundingRect(cnt) 
    roi=img[y:y+h,x:x+w].copy() 
    cv2.imwrite('%s/%s.jpg'%(tmpdir,str(idx)),roi) 
    cv2.rectangle(boxmask,(x,y),(x+w,y+h),(255),-1) 


cv2.imshow('clean',img&cv2.cvtColor(boxmask,cv2.COLOR_GRAY2BGR)) 
cv2.imwrite('clean.jpg',img&cv2.cvtColor(boxmask,cv2.COLOR_GRAY2BGR)) 
cv2.imshow('img',img) 

dotess1() 
dotess2() 
cv2.waitKey(0) 
+1

вы можете прочитать документы онлайн, которые включают в себя фотографии (не вики, это ужасный беспорядок). как этот http://www.cs.ukzn.ac.za/~sviriri/COMP702/COMP702-6.pdf. и попробуйте op opv в opencv с элементами diff struct. В этом случае мы хотим оставить только строки и, следовательно, элемент структуры должен иметь строку @ в центре. это не обязательно (11,11). (11,9), (15,11) с рядом одного в центре все должно работать. вы указываете минимальную ширину линии по размеру матрицы. более толстые линии также могут быть обнаружены путем указания толстой строки типа 'linek [4, ...] = 1; linek [5, ...] = 1; linek [6, ...] = 1' –

Смежные вопросы