Я пытаюсь использовать Python для запуска pdftotext, но по какой-то причине мой код не работает. Если я запустил ниже, я ожидаю, что переменная содержимого будет содержать содержимое PDF, но результат, который я получаю, - это просто пустая строка.subprocess ничего не выводит
Кто-нибудь знает, что мне не хватает?
def getPDFContent(path):
path = "/path/to/a valid/pdffile.pdf"
process = subprocess.Popen(["pdftotext", path], shell=False,
stdout=subprocess.PIPE, stderr=subprocess.STDOUT)
content, err = process.communicate()[0:2]
return content, err
Обратите внимание, что прием '[0: 2]' срез не является необходимым; 'communication' всегда возвращает длину-два кортежа. –
Ах, действительно, спасибо. – mlissner