Я планирую разработать приложение, такое как Word Lens. Может ли кто-нибудь предложить хорошую библиотеку, которую я могу использовать? или кто-нибудь объясняет технологию, лежащую в основе приложения Word Lens? это совпадение времени изображения барабана или OCR? Я знаю некоторую библиотеку обработки изображений, такую как OpenCv, tesseract ... Любая помощь приветствуется ...Real TIme Image Processing (OCR)
15
A
ответ
42
Я один из создателей Word Lens. Несмотря на то, что там есть некоторые библиотеки OCR (например, tesseract), мы решили сделать наши собственные, чтобы добиться лучших результатов и производительности. Наш общий алгоритм выглядит следующим образом:
- копию изображения с камеры и получить его в оттенках серого компонента
- выравнивать изображение, поэтому текст четко выделяется на фоне
- отрисовки коробки вокруг вещей, которые выглядят как символы & предложения
- do OCR: сопоставить пиксели в каждом поле с базой данных символов - это на самом деле довольно сложно!
- собрать символы в слова, посмотреть в словаре (это трудно тоже, потому что будут ошибки в OCR)
- рисуют результаты обратно на изображение
соответствие изображения сам по себе не достаточно хорошо, из-за огромного разнообразия шрифтов, слов и языков.
OpenCV - отличная библиотека, с которой можно начать и работать, и узнать больше о компьютерном зрении в целом. Я бы рекомендовал строить свои примеры и играть там. Повеселись!
Смежные вопросы
- 1. Real Time Cuda Image Processing advice
- 2. real time refreshing in processing
- 3. Iphone Image Processing Image APIS
- 4. Android Real-Time Plotting
- 5. Kendo Real Time Chart
- 6. PHP Real-Time Bandwidth
- 7. Asp.NET Real Time Game
- 8. Python - Real Time Plotting
- 9. Заменить слово «real time»
- 10. Android Image Processing
- 11. C# Image Processing Whitespace
- 12. Android Image Processing Library
- 13. Php time offset mysql real time
- 14. LabVIEW Real Time Time Timed Loop resolution
- 15. Boost logging in real time
- 16. DHL Real Time Калькулятор доставки
- 17. C# Real Time Try Catch
- 18. Racket Real Time Plot/Chart
- 19. Android Real Time Location Tracking
- 20. Сервер Real Time на сайте
- 21. Datameer for Real Time Querying
- 22. PHP и Twilio Real-time?
- 23. Рекомендованный .Net soft real-time
- 24. java real time design rtsj
- 25. Real Time Нажмите/ссылку счетчик
- 26. Arduino Real Time Timer Device
- 27. Slack Real-Time-Messaging websocket
- 28. OCR Image preprocessing
- 29. Достаточно ли Image Processing Toolbox?
- 30. Python + OpenCV: OCR Image Segmentation
Вы бы получили лучшие результаты, объединив 4 и 5 в некотором роде? Как аутсайдер для OCR, мне кажется, что вы потеряли информацию на «5», которая может быть полезна в трудных случаях. –
martin: совершенно верно; например, «O» очень похож на «0» или даже на «8» и «B», поэтому он помогает сохранять списки возможностей, а затем обрезать их на следующих этапах, когда доступна более подробная информация об устранении неоднозначности (простой вид обратной связи) –
@jd. Спасибо за ваш комментарий .. могу я знать, сколько времени вам понадобилось для создания Word Lens? не могли бы вы предложить хорошие учебные пособия для OCR? –