Прямо сейчас я пишу программу на питоне, которая требует от вас открыть определенный .pdf-файл, элемент управления + A (для выбора всех), управление C и управление V (для копирования и вставки) в .txt-файле, а затем запустить программу.Создание файлов .txt из pdf-файлов
Мне было интересно, если можно каким-либо образом пропустить шаг и запустить программу, не выполняя эту последовательность шагов, просто ссылаясь на файл pdf внутри программы.
Что-то вроде:
##does the procedure above and saves it on a notes.txt file##
FILE_NAME = 'notes.pdf'
read_pdf(FILE_NAME,'notes.txt')
Попробуйте здесь код может быть: HTTP: //code.activestate. com/recipes/511465-pure-python-pdf-to-text-converter/ –
Существуют определенные утилиты, такие как 'pdftotext'. Возможно, вам захочется исследовать их. – devnull
+1 для 'pdftotext'. Это очень удобно. Скорее всего, вам придется выполнять некоторую предварительную обработку текста (в частности, если текст содержит символы не-ascii). – michaelmeyer