Как указано другие плакаты, сначала нужно извлечь текст из. файл pdf. PDF-файлы теперь являются открытым форматом, поэтому вы можете найти парсер через Google.
Затем вы должны извлечь текст, который хотите преобразовать в речь из файла, игнорируя такие вещи, как названия рисунков, заголовки страниц, оглавление и т. Д.
После того, как вы получили текст, вам необходимо преобразовать его в речь. Это, наверное, самая сложная часть.
Некоторое время назад я возился с генерацией голосовой информации для игрового мод, так как я гнилой голос актера.
У Cepstral были лучшие конвертеры TTS, которые я мог найти. (У бесплатных есть раздражающая тенденция вставлять рекламные объявления Cepstral в речь, но я мог бы вручную отредактировать это для того, что я делаю.)
Оказывается, существует язык разметки синтеза речи, который может быть использован для предоставления ключи к преобразователю TTS, о которых слог расставить акценты и т.д. Вот Linky:
http://www.w3.org/TR/speech-synthesis/
Как вы идете об автоматическом добавлении SSML в текст немного за меня.
В любом случае, конвертер TTS будет производить звуковой файл, а последним шагом будет сжатие звука с требуемой скоростью передачи в формате mp3.
Сначала я, хотя это была шутка, а потом я понял, что вы имели в виду слушать текст :) – Zifre
Я предпочел бы использовать Acrobat reader! –
@ Zifre - слава богу, ты прояснился, что я собирался взорваться этим! – joshcomley