2009-06-06 2 views
5

Я хочу проанализировать PDF-файл из моего приложения C# и создать из него аудиофайл. Как я могу это сделать?Как читать файл .pdf программно и преобразовывать его в аудио (формат .mp3)?

Я особенно ищу хорошую pdf-версию для текстовой библиотеки или способ снять файл PDF с его текста.

+1

Сначала я, хотя это была шутка, а потом я понял, что вы имели в виду слушать текст :) – Zifre

+0

Я предпочел бы использовать Acrobat reader! –

+1

@ Zifre - слава богу, ты прояснился, что я собирался взорваться этим! – joshcomley

ответ

0

Я думаю, это трудная задача. Во-первых, вам нужно прочитать текст в этом pdf, а затем использовать какой-то механизм синтетического генерации голоса для создания аудиоконтента. Затем вы должны сохранить его как mp3.

2

Вам нужен речевой SDK от Microsoft. Прочтите инструкцию here

4

Festival для текста в речь. Различные pdf в текст api существуют ...

+0

Как вы можете использовать фестиваль для создания аудиофайлов? Я все еще пытаюсь понять это. –

0

В Mac OS X вы можете извлечь текст pdf, а затем передать его в «say». Вы должны найти эквивалентные синтезаторы на других ОС.

0

Это не так уж сложно сделать, если вы не изобретаете колесо, но вместо этого просто повторно используете существующую технологию (например, текстовые движки, такие как фестиваль), а также механизмы OCR для обработки файлов PDF ,

Самым сложным, вероятно, является работа с различными макетами PDF (столбцы, строки, встроенная графика, нотные заметки, URL-адреса и т. Д.), Которые могут запутать процесс распознавания текста.

Однако, в общем случае (если это не должен быть опыт обучения), это, конечно, проще всего прибегнуть к использованию существующих программных решений:

5

В качестве входного документа желательно иметь документ tagged PDF. Это означает, что документ содержит теги для разметки логической структуры документа (обычно документ PDF будет содержать только визуальную информацию).

Этот PDF может быть затем преобразован в формат DAISY, который является стандартом для цифровых говорящих книг, то есть промежуточного формата XML, хранящего текст книг вместе с логической структурой и функциями навигации.

Этот формат Daisy XML может быть либо converted to an audio format, либо вы можете использовать устройство Daisy, физическое устройство, например MP3-плеер, для прослушивания книги.

Существует презентация доступна на веб-сайте Daisy объясняющий принципы этого набора инструментов:

Accessible PDF to DAISY/NIMAS Conversion

2

Как указано другие плакаты, сначала нужно извлечь текст из. файл pdf. PDF-файлы теперь являются открытым форматом, поэтому вы можете найти парсер через Google.

Затем вы должны извлечь текст, который хотите преобразовать в речь из файла, игнорируя такие вещи, как названия рисунков, заголовки страниц, оглавление и т. Д.

После того, как вы получили текст, вам необходимо преобразовать его в речь. Это, наверное, самая сложная часть.

Некоторое время назад я возился с генерацией голосовой информации для игрового мод, так как я гнилой голос актера.

У Cepstral были лучшие конвертеры TTS, которые я мог найти. (У бесплатных есть раздражающая тенденция вставлять рекламные объявления Cepstral в речь, но я мог бы вручную отредактировать это для того, что я делаю.)

Оказывается, существует язык разметки синтеза речи, который может быть использован для предоставления ключи к преобразователю TTS, о которых слог расставить акценты и т.д. Вот Linky:

http://www.w3.org/TR/speech-synthesis/

Как вы идете об автоматическом добавлении SSML в текст немного за меня.

В любом случае, конвертер TTS будет производить звуковой файл, а последним шагом будет сжатие звука с требуемой скоростью передачи в формате mp3.

2

Если ваша единственная задача - прослушивать синтезированный текст из PDF, как насчет функции Acrobat «Читать вслух» в нижней части меню «Вид»?

Смежные вопросы