Я использую iTextSharp PDFReader для чтения PDF-файла с 18 страницами, но каждый раз, когда я увеличиваю номер страницы, он начинается с начала pdf, вместо того, чтобы читать только эту конкретную страницу , Если я установил значение «x» в значение pdfReader.NumberOfPages, он будет читать только последнюю страницу. Я хотел бы прочитать каждую страницу отдельно и добавить данные в список строк s. Я также просматриваю папку, читая каждый файл pdf, но сначала тестирую только один.C# iTextSharp PDFReader читает с начала PDF всегда
List<string> s = new List<string>();
while (z < filePaths.Count())
{
PdfReader pdfReader = new PdfReader(filePaths[z]);
ITextExtractionStrategy strategy = new SimpleTextExtractionStrategy();
for (int x = 1; x <= pdfReader.NumberOfPages; x++)
{
string currentText = "";
currentText = PdfTextExtractor.GetTextFromPage(pdfReader, x, strategy);
s.Add(currentText);
}
z++;
pdfReader.Close();
}
это всегда читать только первую страницу, на последнюю страницу, кроме, или это все от первого до хх страниц каждого читать? основной метод workhorse 'ProcessContent (int pageNumber, E renderListener)' явно должен делать то, что вы намерены ... какую версию ITextSharp вы используете? –
dlatikay
, используя 5.5.10.0, он всегда начинается с первой страницы и читается до xth страницы – AWooster
, чтобы убедиться, что ... вы ожидаете, что 's' будет содержать все страницы всех файлов, одну страницу для текста на элемент списка, когда внешний контур завершен? – dlatikay