Я ищу алгоритм для обнаружения линий (например, из таблиц) и ограничивающих слова в документах.сегментирование изображений документа
В настоящее время я сегментирую изображение, выполняя чередующиеся горизонтальные и вертикальные выступы и проверяя полученную гистограмму на наличие зазоров. Хотя это работает для некоторых документов, это не для тех, которые содержат таблицы со строками снаружи, так как гистограмма не содержит пробелов, которые позволили бы провести дополнительную сегментацию. Поэтому я ищу более сложный алгоритм.
Не ответ, но вы можете ознакомиться с документами по адресу http://www.djvu.org/resources/. Предполагается, что DjVu хорош в этом. – user450018