Вы можете использовать Docotic.Pdf library для поиска текста в PDF-файлах.
В примере ниже показано, как найти указанные строки в файле PDF и соответствующие номера страниц:
static void searchForTextStrings()
{
string path = "";
string[] stringsToFind = new string[] { };
using (PdfDocument pdf = new PdfDocument(path))
{
for (int i = 0; i < pdf.Pages.Count; i++)
{
string pageText = pdf.Pages[i].GetText();
foreach (string s in stringsToFind)
{
int index = pageText.IndexOf(s, 0, StringComparison.CurrentCultureIgnoreCase);
if (index != -1)
Console.WriteLine("'{0}' found on page {1}", s, i);
}
}
}
}
регистрозависимой поиск может проводиться, если удалить третий аргумент метода IndexOf.
Отказ от ответственности: Я работаю над Bit Miracle, продавцом библиотеки.
Спасибо за код! Однако этот пример требует установки Adobe Professional. По причинам, связанным с лицензированием лицензий, я бы предпочел иметь компонент для этого. – splattne