2015-08-10 4 views
-1

У меня есть крошечный вопрос, который вы наверняка очистите через 30 секунд! ;-)Java PDFBox, извлекать данные из определенной строки таблицы

Я пытаюсь прочитать определенную строку графика .PDF.

Пример:

New York: 06:30/07:00/10:15/12:30 

Boston:  07:30/08:00/11:15/01:30 

Chicago: 08:30/09:00/12:15/02:30 

Я имею в виду, что topic и попытаться адаптировать его, но он не работает!

Если я хорошо понимаю комментарий в конце линии

String lines[] = text.split("\\r?\\n"); // give you all the lines separated by new line 

в моем случае String lines[] = text.split("Boston"); должны извлечь все столбцы Boston, но это не так.

Так как я мог получить все бостонские времена (07:30, 08:00, 11:15, 01:30 и т. Д.)?

Любая помощь будет оценена по достоинству.

EDIT:

Я, очевидно, говоря о туземцев pdfbox функций

В противном случае, я могу анализировать построчно извлеченный текст из файла PDF, конечно, но я предполагаю, что это не было бы тихо оптимизировано /быстро.

ответ

0

Если я хорошо понимаю комментарий в конце линии

String lines[] = text.split("\\r?\\n"); // give you all the lines separated by new line 

в моем случае String lines[] = text.split("Boston"); должны извлечь все столбцы Boston, но это не так.

Нет, ваши операции разбиваются на text при каждом появлении строчки «Бостон». В вашем случае, следовательно, это приводит к двум Струны

New York: 06:30/07:00/10:15/12:30 

и

:  07:30/08:00/11:15/01:30 

Chicago: 08:30/09:00/12:15/02:30 

Так как я мог получить все времена Бостон (7:30, 8:00, 11:15, 01:30 и т. Д.)?

Поиск String text для подстроки «Бостона:», получим следующую подстроку до следующего конца строки-, и разделить его вокруг слэш символов.

Я, очевидно, говоря о туземцев pdfbox функций

Нет, вы начали с разговора о split, который является методом класса Java String, и ваша задача, как вы представить его чистый анализ строк в Ява.

Если вы говорили о функциях Pdfbox, вы должны сосредоточиться на настройке PdfTextStripper.

Поскольку вы не знаете, где находятся линии Бостона до того, как текст будет извлечен, вам вряд ли удастся до того, как текст будет извлечен.

+0

Хорошо спасибо за ваш ответ ;-) – Steph68

Смежные вопросы