2012-06-30 6 views
3

Я использую библиотеку AForge.NET для обработки изображений. Используя эту библиотеку, я могу обнаружить основные фигуры внутри изображения. Как определить текст в изображении с помощью библиотеки AForge.NET?Обнаружение текста на картинке

ответ

2

Вам необходимо будет использовать Optical Character Recognition (OCR). Одна ссылка, которую я нашел при ее использовании с AForge, можно посетить here. Некоторый код по ссылке:

// "K" letter, but a little bit noised 
float[] pattern = new float [] { 
     0.5f, -0.5f, -0.5f, 0.5f, 0.5f, 
     0.5f, -0.5f, 0.5f, -0.5f, 0.5f, 
     0.5f, 0.5f, -0.5f, -0.5f, -0.5f, 
     0.5f, -0.5f, 0.5f, -0.5f, -0.5f, 
     0.5f, -0.5f, -0.5f, 0.5f, -0.5f, 
     0.3f, -0.5f, -0.5f, 0.5f, 0.5f}; 

// get network's output 
float[] output = neuralNet.Compute(pattern); 

int i, n, maxIndex = 0; 

// find the maximum from output 
float max = output[0]; 
for (i = 1, n = output.Length; i < n; i++) 
{ 
    if (output[i] > max) 
    { 
     max = output1[i]; 
     maxIndex = i; 
    } 
} 

// 
System.Diagnostics.Debug.WriteLine(
    "network thinks it is - " + (char)((int) 'A' + maxIndex)); 

Единственный способ, которым я могу думать делать это, использует Tessaract-OCR, который может читать широкий спектр форматов изображений и преобразовывать их в текст на более чем 40 языках. Есть также много других способов сделать это там, включая using Microsoft Office, или Emgu cv.

Есть еще одна ссылка, которая может работать. Он определяет игровые карты в AForge, и при этом читает цифры или J, Q и K в углу. You may have seen it already.

+0

последняя ссылка мертва :( – h3n

+0

@ H3N, что это слишком плохо! Вы можете просмотреть короткий фрагмент, который был отправлен [здесь] (http://channel9.msdn.com/coding4fun/blog/Forging-Player-Card-Detection-and-Recognition-program-with-AForgeNet). В этом видео есть видео ссылка, которая является частной, но может быть [это видео] (http://tune.pk/video/2546933/playing-card-recognition-using-aforgenet). – SuperPrograman

0

Использование Microsoft Cognitive Services - Computer Vision API

оптического распознавания символов (OCR) распознает текст на изображении и извлекает распознанных слов в потоке символов машиночитаемой

Смежные вопросы