InftyReader - единственное, что я знаю. Это НЕ бесплатное программное обеспечение (кажется, деньги идут на некоммерческую организацию, IIRC).
http://www.sciaccess.net/en/InftyReader/
Я не знаю, почему PDF не может иметь метаданные в LaTeX? Как и в: положите в него уравнение LaTeX! Это так сложно? (Я ничего не знаю о синтаксисе PDF, но я думаю, что это можно сделать).
Синтаксис LaTeX - ОДИН ТРИ И ИСТИННЫЙ СТАНДАРТ для обозначения математики. Кажется удивительно глупым, что люди, которые произвели MathML и другие вещи, не учитывают это. InftyReader генерирует синтаксис MathML или LaTeX.
Если я хочу HTML (чистый), я затем использую TTH для чтения синтаксиса LaTeX. Просто работает.
ABBYY FineReader (большая программа OCR) утверждает, что вы можете обучить программу по математике, но это очень Braindead (у кого есть время?)
и Unicode имеет множество математических символов. То, что сегодняшние читатели OCR не могут их разглядеть, показывает жалкое состояние программного обеспечения и дефицит мозга в этой деятельности.
Что касается «одного символа за раз», TeX, очевидно, имеет правила относительно того, где он будет размещать символы. Они не могут писать программное обеспечение, которое знает эти правила ?! TeX - это даже общественное достояние! Они могут просто «использовать его» в своих коммерческих продуктах.
Являются ли ваши формулы рукописными или печатными? – Jasper
напечатано сейчас отлично. и в противном случае это может быть слишком сложно), и я думаю, что какой-то движок, способный обрабатывать рукописные формулы, также сможет обрабатывать печатные. – Albert
Вы нашли решение? – tan9p