Теперь я в процессе создания словарного приложения, использующего голос. Я сделал этот словарь, и есть около 100000 слов в качестве базы данных. Этот словарь нужно искать по голосу. Для этого я использую Sphinx4/cmusphinx в качестве инструмента для использования. Я читал ссылки на связанные сайты и успешно запускал образцы приложений. Затем я реализую ту же методологию в этом примере (HelloWorld) в словарь. Раньше я уже поместил 100000 слов в грамматику (.gram). Когда я пытаюсь запустить его, мой словарь замерзает и через 5 минут позже, затмение шоу «Java Heap Size из памяти»Извлечение из базы данных с помощью Sphinx4
конфигурация грамматики
#JSGF V1.0;
grammar hello;
public <database> = ([<Words>])*;
<Words>= 100000 words split by "|"
Для sphinx4, я использовал эту версию http://sourceforge.net/projects/cmusphinx/files/sphinx4/1.0%20beta6/
Является ли мой метод правильной речевой речи в моем словаре?
Есть ли хорошие ссылки для построения такой поисковой системы с большой базой данных слов (приблизительно 100000 слов)?
Надеюсь, вы могли бы мне помочь.
Спасибо за ваш ответ. Я уже увеличил jvm до 1024 и до сих пор не получаю ожидаемого. Когда я говорил «Привет», ничего не случилось, вместо того, чтобы печатать сказанное слово. это очень трудно читать 100000 слов? .. после того, как я прочитал http://cmusphinx.sourceforge.net/wiki/tutoriallm, я смущен о формате dmp и формате lm. В образце приложения (HelloNGram), который используется .lm. Мой вопрос в том, что между этими двумя? что лучше ? , Для dmp-формата, как я могу реализовать dmp-формат в моей программе? я не мог найти его в приведенных ссылках. – davinma06
Прежде всего, пожалуйста, обновите до последней версии. Затем вам необходимо загрузить акустическую модель en-us-generic для лучшей точности. Я не уверен, что вы подразумеваете под «внедрением формата dmp в мою программу». Формат Lm и формат dmp являются эквивалентными представлениями языковой модели. Формат lm - текстовый, а формат dmp - двоичный. Существует инструмент, который преобразует их, как описано в учебнике. –
Привет, Николай. Есть что-то, что я хочу спросить о вашем комментарии в этом http://stackoverflow.com/questions/26925322/cmusphinx-live-speech-recognition-too-slow. Мне очень интересно об этих четырех значениях в config.xml. Как эти вещи могут влиять на скорость и точность sphinx4? и если эти вещи влияют, то я хочу отредактировать это значение, чтобы попытаться получить наилучшую настройку в терминах точности и скорости. есть ли какие-либо ссылки или руководство по его изменению? Я уже загрузил и использовал последний английский язык модели (.dmp), но точность все еще не та, что я ожидал. Я использовал Sphinx4-5 alpha. – davinma06