2015-06-12 4 views
-1

У нас есть много файлов, которые необходимо преобразовать для создания возможности поиска/выделения слов в веб-браузере и индексации поисковых слов на стороне сервера.Преобразование HTML в PDF и сохранение расстояния между буквами

Я использовал http://pdf.investintech.com онлайн-сервис (шаг 1, шаг 2 на странице со ссылками) для преобразования PDF в HTML. Я тоже пробовал других.

PDF-файлы имеют таблицы с затенением фона. Этот конвертер использует абсолютное позиционирование для каждой строки текста, которая работает хорошо, но отображаемая строка текста немного длиннее, заставляя ее выходить за пределы затененной области фона.

Есть ли решение, которое вы могли бы указать мне на то, что сохранит пробел между буквами, поэтому я могу преобразовать в HTML без такой аномалии, как изменение длины предложения? Важное значение имеет также вертикальное выравнивание, но абсолютное позиционирование отдельного div на линию прекрасно позаботится об этом.

ответ

0

После некоторых дополнительных поисковых запросов Google я нашел этот проект, который кажется более надежным, чем любой другой, который я мог найти. Это особенно хорошо при выравнивании текста и обработке выбора.

https://github.com/coolwanglu/pdf2htmlEX

Смежные вопросы