Примечание: на самом деле не ответ, но некоторые предложения.
Звучит так, что Crystal Reports не соответствует спецификации PDF достаточно близко.
Я бы удостоверился, что CR полностью обновлен/исправлен и попробовал переустановить другой файл, убедившись, что «тегирование» включено - тегирование определяет структуру макета. У меня нет копии CR, но вам, возможно, придется определить шаблон дистиллятора, поэтому при печати в PDF вы можете выбрать этот вариант задания.
Вы также можете сообщить о своем плохом PDF-файле, используя Preflight в Acrobat, он говорит, что нет структуры тегов, и вы можете сделать это вручную (вытащите боксы вокруг каждого элемента ...). Кроме того, нет языкового набора, и он каким-то образом совместим с Acrobat 1.3? который больше не поддерживается и должен быть 4 на самом низком уровне?
После того, как у вас есть «хороший» pdf, вы можете экспортировать в xml/word и импортировать, чтобы преуспеть. Кроме того, с помощью Acrobat 8+ вы можете выделить инструмент выбора, щелкнуть правой кнопкой мыши и выбрать Open As SpreadSheet. Возможно, вам удастся просто выделить весь документ, хотя я надеюсь, что подход xml будет лучше.
Able2Extract делает некоторую OCRing и сложную нечеткую логику не только для определения тегов/макета, что позволяет экспортировать ее, но также позволяет избежать любого шрифта, кодирования и т. Д. - по крайней мере, насколько мне известно.
В редком случае, когда вы не можете получить новый файл, тогда экспорт в обычный текст/доступ, кажется, создает хороший текстовый файл. Вы можете написать vbscript для его анализа (добавления разделителя) и импортировать его в excel.
Я не сделал создайте отчет. Значит, похоже, что рестайлинг это единственное решение? – babonk
обновление .. моя попытка добавить теги через Advanced-> Accessiblity-> Добавить теги в документ не работает – babonk