Как они реализовали текст в речь (TTS)? Есть ли бесплатный API для синтеза TTS? Я знаю о Google Translate, но лицензия мне не понятна (другая проблема заключается в том, что они блокируют запрос, если он содержит реферер). Есть идеи?Текст в речь на Quizlet.com
ответ
Majdron,
Я ведущий разработчик в Quizlet. Мы используем комбинацию собственной технологии и лицензирования/покупки программного обеспечения TTS от нескольких разных компаний.
Есть некоторые с открытым исходным кодом TTS двигателей/голоса:
- http://www.cstr.ed.ac.uk/projects/festival/
- http://www.babelfish.org/tts-free.htm
- http://espeak.sourceforge.net/
- http://freetts.sourceforge.net/docs/index.php
- http://mary.dfki.de/
Удачи!
Google только что представил браузерный доступ к его речевому движку через HTML5.
http://slides.html5rocks.com/#speech-input
Чтобы получить эту страницу, чтобы работать, я запустил браузер Chromium следующим образом в Ubuntu:
$ chromium-browser --enable-speech-input
Я не уверен, если это работает в других операционных системах.
Еще один интересный проект WAMI из MIT:
голоса звучат точно так же, как и http://www.neospeech.com. Кроме того, их список языков точно соответствует.
Это не бесплатно, вы должны лицензировать его.
Я не знаю, какой конкретный движок Quizlet используется, но при условии, что он использует бесплатную услугу, тогда это может быть TTS-API (http://tts-api.com/), который недавно был показан в Hacker News.
Из того, что я знаю, является единственным «бесплатным в использовании» веб-интерфейсом TTS. Прошу прокомментировать ниже, если я ошибаюсь - мне бы хотелось найти похожие бесплатные услуги. Есть много платных услуг, но очень мало действительно свободных.
С момента получения информации о TTS-API на HN я успешно использовал его в недавнем проекте приложения. Поскольку TTS - это только HTTP-выбор, я смог быстро интегрировать его как в iOS, так и в Android-версии моего приложения. Служба представляется очень быстрой, поэтому никаких жалоб пока нет :-)
Никто не дал правильного ответа. У них есть собственный движок TTS, который подключен к одному файлу, расположенному по адресу http://quizlet.com/tts/en.mp3. Файл принимает аргументы с ним, поэтому url http://quizlet.com/tts/en.mp3?v=14&b=QXJlYSBvZiBwYXJhbGxlbG9ncmFt&s=m5dx52Q. говорит «Площадь параллелограмма» благодаря первой строке base64, помеченной буквой b. Я не обнаружил, для чего используются v или s, но я знаю, что они необходимы для того, чтобы заставить файл говорить. Я сделаю больше исследований и вернусь к этому ответу.
jj b является правильным. Насколько я могу судить, основным движком речевых функций Quizlet является Neospeech, и использует VTML (VoiceText [TM] Markus Neospeech).
Это было бы более уместно в качестве комментария к существующему ответу jj b (или, поскольку вы еще не можете прокомментировать ответы, которые не являются вашими, простой * upvote * был бы уместным). – JonK
- 1. Речь на текст C#
- 2. Голос/речь на текст
- 3. Речь в текст на эмуляторе
- 4. Речь на текст в WSR
- 5. Речь на текст в C#
- 6. речь на текст в android
- 7. TextField Вход через речь (речь в текст)?
- 8. серебристый текст в речь?
- 9. Windows 8 речь в текст и текст в речь API
- 10. Текст в речь сбоев
- 11. андроид, текст в речь
- 12. Текст в речь Android
- 13. Android текст в речь
- 14. Быстрый текст в речь
- 15. titanium текст в речь
- 16. Google текст в речь
- 17. Cordova Текст в речь
- 18. Текст на текст в тексте отключает другой текст в речь
- 19. Текст в речь в ASP.NET
- 20. Текст в речь в Emacs
- 21. текст в речь на хинди для android
- 22. Речь на текст в телефоне Windows 7
- 23. Арабский текст в речь на iphone
- 24. Речь на текст в моем списке Android
- 25. повторить текст в речь на Onclicklistner android
- 26. Улучшенный текст в речь на Android
- 27. Android текст в речь на разных языках
- 28. Речь на текст в iOS Titanium
- 29. Речь на текст на нескольких языках
- 30. служебное соединение просочилось на текст-на-речь
Это в сторону распознавания голоса, а не сторона TTS, о которой спрашивал OP. Quizlet также использует WAMI MIT. – philfreo