Как читать файл .pdf программно и преобразовывать его в аудио (формат .mp3)?

Я хочу проанализировать PDF-файл из моего приложения C# и создать из него аудиофайл. Как я могу это сделать?Как читать файл .pdf программно и преобразовывать его в аудио (формат .mp3)?

Я особенно ищу хорошую pdf-версию для текстовой библиотеки или способ снять файл PDF с его текста.

источник

2009-06-06 Attilah

Сначала я, хотя это была шутка, а потом я понял, что вы имели в виду слушать текст :) – Zifre

Я предпочел бы использовать Acrobat reader! –

@ Zifre - слава богу, ты прояснился, что я собирался взорваться этим! – joshcomley

Я думаю, это трудная задача. Во-первых, вам нужно прочитать текст в этом pdf, а затем использовать какой-то механизм синтетического генерации голоса для создания аудиоконтента. Затем вы должны сохранить его как mp3.

источник

2009-06-06 13:40:34

Вам нужен речевой SDK от Microsoft. Прочтите инструкцию here

источник

2009-06-06 13:42:10 jao

Festival для текста в речь. Различные pdf в текст api существуют ...

источник

2009-06-06 13:42:30 dicroce

Как вы можете использовать фестиваль для создания аудиофайлов? Я все еще пытаюсь понять это. –

В Mac OS X вы можете извлечь текст pdf, а затем передать его в «say». Вы должны найти эквивалентные синтезаторы на других ОС.

источник

2009-06-06 13:44:30 SnippyHolloW

Это не так уж сложно сделать, если вы не изобретаете колесо, но вместо этого просто повторно используете существующую технологию (например, текстовые движки, такие как фестиваль), а также механизмы OCR для обработки файлов PDF ,

Самым сложным, вероятно, является работа с различными макетами PDF (столбцы, строки, встроенная графика, нотные заметки, URL-адреса и т. Д.), Которые могут запутать процесс распознавания текста.

Однако, в общем случае (если это не должен быть опыт обучения), это, конечно, проще всего прибегнуть к использованию существующих программных решений:

источник

2009-06-06 13:46:39 none

В качестве входного документа желательно иметь документ tagged PDF. Это означает, что документ содержит теги для разметки логической структуры документа (обычно документ PDF будет содержать только визуальную информацию).

Этот PDF может быть затем преобразован в формат DAISY, который является стандартом для цифровых говорящих книг, то есть промежуточного формата XML, хранящего текст книг вместе с логической структурой и функциями навигации.

Этот формат Daisy XML может быть либо converted to an audio format, либо вы можете использовать устройство Daisy, физическое устройство, например MP3-плеер, для прослушивания книги.

Существует презентация доступна на веб-сайте Daisy объясняющий принципы этого набора инструментов:

Accessible PDF to DAISY/NIMAS Conversion

источник

2009-06-06 13:52:42

Как указано другие плакаты, сначала нужно извлечь текст из. файл pdf. PDF-файлы теперь являются открытым форматом, поэтому вы можете найти парсер через Google.

Затем вы должны извлечь текст, который хотите преобразовать в речь из файла, игнорируя такие вещи, как названия рисунков, заголовки страниц, оглавление и т. Д.

После того, как вы получили текст, вам необходимо преобразовать его в речь. Это, наверное, самая сложная часть.

Некоторое время назад я возился с генерацией голосовой информации для игрового мод, так как я гнилой голос актера.

У Cepstral были лучшие конвертеры TTS, которые я мог найти. (У бесплатных есть раздражающая тенденция вставлять рекламные объявления Cepstral в речь, но я мог бы вручную отредактировать это для того, что я делаю.)

Оказывается, существует язык разметки синтеза речи, который может быть использован для предоставления ключи к преобразователю TTS, о которых слог расставить акценты и т.д. Вот Linky:

http://www.w3.org/TR/speech-synthesis/

Как вы идете об автоматическом добавлении SSML в текст немного за меня.

В любом случае, конвертер TTS будет производить звуковой файл, а последним шагом будет сжатие звука с требуемой скоростью передачи в формате mp3.

источник

2009-06-06 13:59:10 billmcc

Если ваша единственная задача - прослушивать синтезированный текст из PDF, как насчет функции Acrobat «Читать вслух» в нижней части меню «Вид»?

источник

2009-06-06 14:17:22 spender

Как читать файл .pdf программно и преобразовывать его в аудио (формат .mp3)?

ответ

Смежные вопросы