2010-12-14 3 views
0

Я видел эту ссылку: http://www.lucidimagination.com/Community/Hear-from-the-Experts/Articles/Content-Extraction-Tika Что я получил, это чистый текст без какого-либо стиля от Tika для Solr для поиска. Возможно ли иметь текст со своим стилем от Solr? Другими словами, нам нужно показать текст с его оригинальным стилем после поиска solr.Solr Tika, Текст в стиле

ответ

0

Если вы думаете об этом, что такое «оригинальный стиль» в pdf? Какие компоненты «стиля» вы хотите сохранить?

Это не только шрифт и вес, это штрих, заполнение, угол, путь, графика, отслеживание, прозрачность, преобразования и многое другое. ЕСЛИ вы получили все это, как бы вы отображали его в своем интерфейсе/Интернете?

Вы не можете воспроизвести оригинальный стиль любым способом, кроме отображения исходного PDF. Так что люди обычно делают это, если хотят оригинального форматирования.

В противном случае они просто используют чистый текст.

Смежные вопросы