Я использую tesseract-ocr (в .NET), который работает хорошо. Изображения, которые я пишу, это только ascii (A-z0-9). Есть ли способ, который я могу сказать, чтобы не использовать специальные символы?tesseract-ocr использовать ascii только?
ответ
Существует a new thread об этом вопросе на форуме Google, указанном выше. В первом ответе делается вывод, что, вероятно, это невозможно.
Насколько я знаю, это правильно, если вы используете файлы данных языка, которые упакованы вместе с Tesseract. Тем не менее, вы можете легко ограничить выходные символы, если вы training on your own box files. Это практически автоматическое: если unicharset_extractor
не находит в файлах без символов ASCII, вы никогда не увидите символы, отличные от ASCII.
Я был так же расстроен всеми interpuncts и другими unusual characters в моем выпуске, когда я впервые начал использовать Tesseract, и обучение в моих собственных файлах ящиков решило проблему. Вы можете использовать Tesseract training data в качестве отправной точки.
используйте параметр конфигурации tessedit_char_whitelist.
- 1. PHP TesseractOCR работает только в командной строке
- 2. Использование TesseractOCR в Laravel
- 3. TesseractOCR с Zend Framework, 2
- 4. Ошибка выполнения команды TesseractOCR PHP
- 5. Как скомпилировать Tesseractocr для ARM Beagle Bone
- 6. Разрешить только символы ascii VBA
- 7. Non-ASCII только с кодом ASCII (\ x83 символов)
- 8. Когда использовать какое представление ASCII
- 9. Как использовать нестандартные ASCII-атрибуты
- 10. Ограничить текстовый ввод kivy только символами ascii
- 11. строки с только символами ascii php
- 12. Добавление 2 только к определенным значениям ascii
- 13. 'Преобразование' ascii Строка только для положительных чисел
- 14. Обратить строку ASCII, используя только макросы C
- 15. Regex для проверки, если только ASCII символы
- 16. Создайте только ASCII-EPS с eps2write
- 17. Только для удаления символов, отличных от ASCII
- 18. Убедитесь, что строка содержит только символы ASCII?
- 19. Есть ли только файлы изображений ASCII?
- 20. Как использовать функцию ascii в Python 3?
- 21. ASCII или просто использовать символ/Character
- 22. Какой из них использовать, utf8 или Ascii
- 23. Невозможно использовать пространство ascii в пакетном файле
- 24. Возможно ли использовать код ASCII в .MoveEndUntil?
- 25. Преобразование не-ASCII пунктуации ASCii
- 26. Как определить символы Unicode в PHP, используя только ASCII?
- 27. Java Charset.forName («ASCII») или Charset.forName («US-ASCII»)
- 28. Проверка, что строка содержит только символы ASCII и цифру
- 29. позволяют использовать только алфавиты для UITextField
- 30. Соответствует, если строка содержит только набор символов ASCII
У этого есть активный форум, хорошее место, чтобы спросить: http://groups.google.com/group/tesseract-ocr/ –