У нас есть несколько библиотек, которые могут дать мне эту функцию? Может быть, iTextSharp может помочь? Я попытался использовать Windows.Data.Pdf (UWP), но он просто возвращает растровое изображение, я не могу выбрать текст. Будет лучше, если lib свободен и поддерживает UWP. Благодарю.Pdf читатель с возможностью выбора текста
ответ
Существует большое Lib, что отлично работает для меня: http://www.squarepdf.net/pdfbox-in-net
Вот examplecode для выпуска:
using org.apache.pdfbox.pdmodel;
using org.apache.pdfbox.util;
// ...
private static string ExtractTextFromPdf(string path)
{
PDDocument doc = null;
try {
doc = PDDocument.load(path)
PDFTextStripper stripper = new PDFTextStripper();
return stripper.getText(doc);
}
finally {
if (doc != null) {
doc.close();
}
}
}
Это, как вы интегрировать его в проект: http://www.squarepdf.net/how-to-convert-pdf-to-text-in-net Его свободный Aswell ,
Спасибо за ваш ответ, у меня есть несколько вопросов 1. Как я могу извлечь текст с определенной страницы, потому что он содержит много страниц? 2. Может ли это вернуть другие объекты (изображения и т. Д.), Потому что мне нужно отображать страницу (а не просто извлекать текст)? – Serg046
1.) PDPage doc = document.getPage (pageNum); Я думаю, это должно сработать для вас. 2.) Как я знаю, есть способ извлечь изображения только для Google. Я никогда не работал с изображениями в pdfs (Подсказка: PdfBox - это lib, который был определен в java, чтобы вы могли смотреть java api PdfBox .. работает одинаково для C#) – Truntle
Я буду использовать Pdfium
родную dll. Он имеет растровый рендерер (FPDF_RenderPageBitmap_Start
) и извлекает текстовые инструменты (FPDFText_GetCharIndexAtPos
, FPDFText_GetUnicode
и т. Д.).
Если вы не хотите работать с родным lib напрямую, есть обертка PdfiumViewer, но похоже, что она не предоставляет функцию выбора текста. Вы можете разветвить его и расширить.
Также есть lib Pdfium.Net SDK, который предоставляет функцию выбора текста на основе Pdfium, но не является бесплатным.
- 1. PDF читатель с CGPDFDocumentRef
- 2. Pdf-читатель с функцией
- 3. IOS: читатель для PDF
- 4. tesseract v3.03 render PDF с возможностью поиска текста пример
- 5. ExpertPdf - как сгенерировать PDF с возможностью маркировки текста из HTML
- 6. DatePicker с возможностью выбора диапазона
- 7. Календарь с возможностью выбора диапазона
- 8. Android layout как кнопка с возможностью выбора
- 9. Быстрый читатель метаданных PDF Python
- 10. Как проверить читатель PDF установлен с Java
- 11. Форма JSF с возможностью загрузки файлов и возможностью множественного выбора
- 12. Как сделать PDF с возможностью поворота страницы?
- 13. Как создать UITableView с возможностью выбора?
- 14. Javafx TableView с возможностью выбора нескольких фильтров
- 15. Android - скрытый, но с возможностью выбора EditText
- 16. Карта Android с возможностью выбора pushpin
- 17. Datapicker с возможностью выбора нескольких дней
- 18. Bootstrap прокручивать колонка с возможностью выбора
- 19. Создание графического элемента с возможностью выбора частей
- 20. ПЕЧАТНЫЕ ПАНЕЛИ с возможностью выбора флажка ТОЛЬКО
- 21. Специальные символы отображаются с возможностью выбора запроса
- 22. IOS PDF Reader с возможностью поиска, аннотирования и закладки
- 23. Отсканированное изображение/PDF для изображения с возможностью поиска/PDF
- 24. Создайте PDF с возможностью поиска из другого PDF или изображения
- 25. Создание PDF с возможностью использования фильтра в разных PDF-файлах
- 26. Преобразование PDF с возможностью поиска в PDF, не подлежащий поиску
- 27. Jquery selectmenu плагин с возможностью ввода текста
- 28. Itextsharp pdf читатель только определенных страниц в pdf
- 29. питон CSV читатель выбора конкретных строк
- 30. Преобразование PDF с возможностью поиска для поиска PDF/A с помощью Ghostscript
Под «select a text» вы имеете в виду «извлечь текст»? – mkl
Нет. Когда я открываю PDF в Foxit Reader, Adobe Reader или IE, он предоставляет мне возможность выбирать текст. – Serg046
Как с помощью мыши и перетаскивания мышью? Итак, вы ищете библиотеку, которая предоставляет компонент просмотра PDF, в котором вы можете выбрать текст? Должен ли текст быть выбран только в программе просмотра? Или вы также хотите получить текст или его позицию? – mkl