Я пытаюсь преобразовать PDF в файл csv. PDF-файл имеет данные в табличном формате с первой строкой в виде заголовка. Я достиг уровня, на котором я могу извлечь текст из ячейки, сравнить исходный текст в таблице и обнаружить новую строку, но мне нужно сравнить границы таблицы, чтобы обнаружить начало таблицы. Я не знаю, как обнаружить и сравнить строки в PDF. Может кто-нибудь мне помочь?Как обнаружить начало таблицы в itextSharp?
Спасибо !!!
+1; Я согласен с общим описанием. Что касается способа проверки содержимого страницы, я бы предложил использовать пакет анализатора iText вместо ручного осмотра содержимого страницы. – mkl
Есть ли парсер для фигур/линий в iText? –
Пока нет, но классы пакета парсеров достаточно просты, чтобы также предоставлять информацию о путях. Более важно, однако, классы парсеров предоставляют довольно точную информацию о ширинах и позициях текста для RenderListeners. Чтобы получить одну и ту же информацию вручную, необходимо будет принять во внимание некоторые возможные операторы. – mkl