Я разработчик Android, который живет с нарушением слуха, и сейчас я изучаю возможность сделать речь в текстовом приложении с помощью Speech Recognizer API в Android. Телефоны с закрытыми субтитрами и Innocaption недоступны в моей родной стране. Потенциальные приложения могут быть похожими на субтитры во время телефонных звонков.транскрипция в реальном времени на Android
https://developer.android.com/reference/android/speech/SpeechRecognizer.html
API-интерфейс предназначен для захвата голосовых команд, а не для реального времени на переписывание. Я даже могу реализовать его как службу, но мне постоянно нужно перезапустить его после того, как он дал результат или частичный результат, что невозможно в диалоговом режиме (слова теряются при перезапуске службы).
Обратите внимание, что для этого приложения мне не нужна 100% -ная точность. Многие люди с нарушениями слуха считают полезным иметь какой-то контекст беседы, чтобы помочь им. Поэтому мне действительно не нужны комментарии о том, как это не будет точно.
Есть ли способ реализовать распознаватель речи в непрерывном режиме? Я могу создать текстовое представление, которое постоянно обновляется, когда новый текст возвращается из службы. Если этот API не тот, на что я должен смотреть, есть ли какая-нибудь рекомендация? Я тестировал CMUSphinx, но обнаружил, что он слишком зависит от блоков фраз/предложений, которые вряд ли будут работать для такого приложения, которое я имею в виду.
Интересно. Так что мне нужно изменить акустическую модель CMUSphinx на телефон 8Hhz? Попробуем и отчитаемся. – Lorteld
Попробуйте этот http://sourceforge.net/projects/cmusphinx/files/Acoustic%20and%20Language%20Models/US%20English%20Generic%20Acoustic%20Model/en-us-8khz.tar.gz/download и этот http: //sourceforge.net/projects/cmusphinx/files/Acoustic%20and%20Language%20Models/US%20English%20Generic%20Language%20Model/cmusphinx-5.0-en-us.lm.dmp/download –
Благодарим за комментарий. Я пробовал использовать общую акустическую модель, а также модель 8khz, и признание плохого для общей речи. Теперь я изучаю использование sphinx4 на сервере. – Lorteld