2011-01-24 2 views
0

Мне удастся получить текст из pdf с помощью оператора TJ, Tj Обратные вызовы ... но некоторые тексты по-прежнему отсутствуют, которые кодируются в формате h-h .. как преобразовать его в текст/NSString ???Как получить текст из идентификатора-h, закодированного из pdf

ответ

2

Кодировка Identity-H подразумевает шрифт Type0 (также известный как шрифт с CID-ключом), поэтому вам нужно проконсультироваться со встроенным отображением ToUnicode. Символы, которые вы получаете в TJ, Tj, одинарная кавычка и двойная кавычка (четыре текстовых оператора), не являются юникодами, а скорее произвольными символьными идентификаторами, которые имеют мало значения вне текущего шрифта.

Документ спецификации PDF является очень четким, но довольно требовательным.

Смежные вопросы