Я хочу сравнить два скриншота, содержащие текст. В основном оба скриншота содержат довольно симпатичный отформатированный текст. Я хочу сравнить, отражается ли такое же форматирование как на изображениях, так и на том же тексте, отображаемом в одном и том же месте на обоих изображениях.установка ограничивающей рамки вокруг текста на изображении
Как я делаю это прямо сейчас -
1. Apply bilateral filters to remove the underlines of text.
2. Apply threshold with value 180 as min value and clear them out
3. Apply Gaussian blur on the image to remove the unfilled space between the characters.
4. Apply threshold again with value 250 as min value.
5. Compute contours in the images
6. Draw rectangle bounding box around contours
7. use O(n^2) algo to find out max overlapped rectangle and compare text within it.
Однако проблема заключается в контуры, появляющиеся в обоих изображениях разные, то есть в одном из image number of contours are 38 while other contains 53
. Я хочу иметь общее решение и не хочу зависеть от содержимого изображения. Однако, несомненно, изображение содержит хорошо отформатированный текст.
Благодаря
Спасибо за ответ. Почему я делаю это, я хочу проверить, содержит ли два изображения один и тот же текст в одном и том же формате, то есть форматирование одинаково. Я должен быть в состоянии сказать, если они не являются и насколько далеко. Можете ли вы предложить несколько разных способов, если вы имеете в виду. – codeomnitrix
Если единственное преобразование между двумя снимками экрана - это только перевод, вы можете использовать взаимную корреляцию. если они одинаковы, максимум должен быть равен сумме квадрата одного изображения. Вы могли бы знать, является ли текст тем же, но я не думаю, что он будет очень надежным. Вы можете использовать мой предыдущий ответ, чтобы подсчитать количество слов, сравнить поверхность для каждого слова (по одному) –