2017-01-17 3 views
1

Я пытаюсь извлечь изображения слов из изображения, в основном содержащего предложения в шрифтах разных типов. Например, рассмотрим следующий сценарий:

enter image description hereКак извлечь отдельные изображения слов из картинки?

Теперь я хотел бы выделить отдельные образы слов Клинтон, улицы и так далее, как это:

enter image description here

Я пытался применять двоичную дилатацию, но расстояние между белым и черным областями было почти незначительным, чтобы вырезать слова. Тем не менее, был небольшой успех, когда я впервые обрезал пустую область в исходном изображении, а затем повторно выполнил бинарное расширение на обрезанное изображение с более низким значением F1.

Каким должен быть лучший и высокоточный подход для выделения изображений слов с этой картины?

Пс: Я следую за этим блогом post, чтобы помочь мне выполнить задачу.

Спасибо
Fennec

ответ

1

С дилатацией, я получаю это: result

Это не является удовлетворительным для вас из-за того, что линии могут быть слишком близко и слились вместе с дилатацией (например, это вроде бы происходит для последних двух строк)?

Другие вещи, чтобы попробовать, из верхней части моей головы:

-clustering.

-уровень уровня, в котором вы подсчитываете количество пикселей в каждой строке, чтобы узнать, где находятся линии, а затем подсчитайте пиксели в каждом столбце, чтобы выяснить, где находятся слова в каждой строке.

+0

@Solitus Большое спасибо за эту информацию. Я думаю, что смогу использовать его и достичь своих окончательных результатов. – Fennec

Смежные вопросы