2010-12-16 3 views
2

Я хочу иметь возможность сравнивать результаты, которые я получаю от запуска OCR на том же документе три раза. Есть ли какие-нибудь инструменты, которые я могу использовать, чтобы это произошло?Множественный механизм принятия решений для повышения точности распознавания

Я хотел бы сравнить три документа и на основании того, какие символы являются одинаковыми 3/3 раза или 2/3 раза, создать четвертый документ с выходом этого решения. Я использую читателя Abby Fine, который дал мне отличные результаты, но я стараюсь делать все возможное, чтобы добраться до 100%.

Я знаю, что слово microsoft имеет функцию «сравнить документы», и я хотел бы иметь возможность делать этот тип анализа в более крупном масштабе с помощью надежного алгоритма.

любые идеи?

Спасибо за ваше время!

ответ

1

Если выход представляет собой простой текстовый файл, вы можете использовать команду bash diff и простой сценарий оболочки для их сравнения. Возможно, вы могли бы использовать несколько более сложный сценарий оболочки для анализа через выходной файл и создания окончательного документа.

Смежные вопросы