2011-02-08 4 views
5

Как они реализовали текст в речь (TTS)? Есть ли бесплатный API для синтеза TTS? Я знаю о Google Translate, но лицензия мне не понятна (другая проблема заключается в том, что они блокируют запрос, если он содержит реферер). Есть идеи?Текст в речь на Quizlet.com

ответ

11

Majdron,

Я ведущий разработчик в Quizlet. Мы используем комбинацию собственной технологии и лицензирования/покупки программного обеспечения TTS от нескольких разных компаний.

Есть некоторые с открытым исходным кодом TTS двигателей/голоса:

Удачи!

0

Google только что представил браузерный доступ к его речевому движку через HTML5.

http://slides.html5rocks.com/#speech-input

Чтобы получить эту страницу, чтобы работать, я запустил браузер Chromium следующим образом в Ubuntu:

$ chromium-browser --enable-speech-input 

Я не уверен, если это работает в других операционных системах.

Еще один интересный проект WAMI из MIT:

http://wami.csail.mit.edu

+0

Это в сторону распознавания голоса, а не сторона TTS, о которой спрашивал OP. Quizlet также использует WAMI MIT. – philfreo

2

голоса звучат точно так же, как и http://www.neospeech.com. Кроме того, их список языков точно соответствует.

Это не бесплатно, вы должны лицензировать его.

0

Я не знаю, какой конкретный движок Quizlet используется, но при условии, что он использует бесплатную услугу, тогда это может быть TTS-API (http://tts-api.com/), который недавно был показан в Hacker News.

Из того, что я знаю, является единственным «бесплатным в использовании» веб-интерфейсом TTS. Прошу прокомментировать ниже, если я ошибаюсь - мне бы хотелось найти похожие бесплатные услуги. Есть много платных услуг, но очень мало действительно свободных.

С момента получения информации о TTS-API на HN я успешно использовал его в недавнем проекте приложения. Поскольку TTS - это только HTTP-выбор, я смог быстро интегрировать его как в iOS, так и в Android-версии моего приложения. Служба представляется очень быстрой, поэтому никаких жалоб пока нет :-)

0

Никто не дал правильного ответа. У них есть собственный движок TTS, который подключен к одному файлу, расположенному по адресу http://quizlet.com/tts/en.mp3. Файл принимает аргументы с ним, поэтому url http://quizlet.com/tts/en.mp3?v=14&b=QXJlYSBvZiBwYXJhbGxlbG9ncmFt&s=m5dx52Q. говорит «Площадь параллелограмма» благодаря первой строке base64, помеченной буквой b. Я не обнаружил, для чего используются v или s, но я знаю, что они необходимы для того, чтобы заставить файл говорить. Я сделаю больше исследований и вернусь к этому ответу.

0

jj b является правильным. Насколько я могу судить, основным движком речевых функций Quizlet является Neospeech, и использует VTML (VoiceText [TM] Markus Neospeech).

+0

Это было бы более уместно в качестве комментария к существующему ответу jj b (или, поскольку вы еще не можете прокомментировать ответы, которые не являются вашими, простой * upvote * был бы уместным). – JonK

Смежные вопросы