2012-01-28 2 views
0

Я ищу алгоритм для обнаружения линий (например, из таблиц) и ограничивающих слова в документах.сегментирование изображений документа

В настоящее время я сегментирую изображение, выполняя чередующиеся горизонтальные и вертикальные выступы и проверяя полученную гистограмму на наличие зазоров. Хотя это работает для некоторых документов, это не для тех, которые содержат таблицы со строками снаружи, так как гистограмма не содержит пробелов, которые позволили бы провести дополнительную сегментацию. Поэтому я ищу более сложный алгоритм.

+0

Не ответ, но вы можете ознакомиться с документами по адресу http://www.djvu.org/resources/. Предполагается, что DjVu хорош в этом. – user450018

ответ

0

Не уверен, что полностью понял ваш вопрос. Было бы лучше, если бы вы добавили изображение, о котором говорите.

В любом случае, используйте функцию cvHoughLines для обнаружения линий на изображении.

Кроме того, opencv поставляется с образцом для обнаружения квадратов. Измените его немного, чтобы обнаружить блокировки слов.

Смежные вопросы