Как получить текст из pdf-документа с помощью скрипта? Я использую окна, а иногда и linux.Получить текст из pdf-документа, используя скрипт
ответ
В большинстве дистрибутивов Linux вы должны иметь pdftohtml
. Как следует из названия, он может конвертировать PDF в HTML. Преобразование HTML в обычный текст может быть выполнено многими способами, например, с использованием lynx -dump file.html
Спасибо. Но инструмент не может копировать текст, если в документе отключено копирование текста ... У меня действительно длинный документ, который я хочу читать в голосовой программе. – user1141649
Спасибо. Но инструмент не может копировать текст, если в документе отключено копирование текста или если он содержит пароль? – user1141649
Я не знаю, я не пробовал это с помощью текстовой-отключенной pdf. Вы попробовали? – uzsolt
Если целью является использование мыши для захвата текста из PDF, вы должны запустить xpdf
. Кажется, что он не обращает внимания на настройки безопасности. По крайней мере, версия, которую я запускаю на моем Mac, нет.
- 1. Получить текст UIWebView PHP-скрипт
- 2. PyQt Невозможно получить текст из QLineEdit, используя текст()
- 3. Скрипт Google Apps: как получить текст из textArea? (replaceText)
- 4. Получить текст из URL
- 5. Получить конкретную строку из текстового файла, используя только скрипт оболочки
- 6. получить динамически вставленный скрипт как текст
- 7. Получить индийское стандартное время, используя скрипт java
- 8. стандартизировать текст, используя phonetic
- 9. Выделить текст, используя ReactJS
- 10. Получить файлы, содержащие конкретный текст, используя Linux
- 11. Получить текст из элемента, используя его атрибут в выражении XPath?
- 12. Как получить текст из стиля div, используя JSOUP
- 13. Получить текст из PDF, хранящегося в LocalFolder, используя iTextSharp
- 14. Получить текст из всех пространств в div, используя jQuery
- 15. Получить выделенный текст из выпадающего списка, используя атрибут name jQuery
- 16. получить текст из нескольких интервалов, используя селектор классов
- 17. Получить текст из списка
- 18. извлекать текст из изображения используя asprise ocr
- 19. Неправильный синтаксис около «-», используя скрипт из LoginUserRolePermission.zip
- 20. Прочитайте скрипт python из файла, используя fread
- 21. Невозможно получить текст центра, используя CSS
- 22. Выберите элемент из выпадающего списка, используя текст
- 23. Получить текст из Html.DropDownListFor
- 24. Получить текст из QLineEdit
- 25. Получить текст из TextView
- 26. получить текст из HTMLbox
- 27. Получить текст из textarea
- 28. Получить текст из ListView
- 29. Получить текст из Collapsingtoolbarlayout
- 30. Получить текст из массива
Это не показывает много усилий по поиску в Google, поэтому я просто брошу TIKA здесь (http://tika.apache.org/) – mindandmedia