2014-11-24 2 views
1

Теперь я в процессе создания словарного приложения, использующего голос. Я сделал этот словарь, и есть около 100000 слов в качестве базы данных. Этот словарь нужно искать по голосу. Для этого я использую Sphinx4/cmusphinx в качестве инструмента для использования. Я читал ссылки на связанные сайты и успешно запускал образцы приложений. Затем я реализую ту же методологию в этом примере (HelloWorld) в словарь. Раньше я уже поместил 100000 слов в грамматику (.gram). Когда я пытаюсь запустить его, мой словарь замерзает и через 5 минут позже, затмение шоу «Java Heap Size из памяти»Извлечение из базы данных с помощью Sphinx4

конфигурация грамматики

#JSGF V1.0; 
grammar hello; 
public <database> = ([<Words>])*; 
<Words>= 100000 words split by "|" 

Для sphinx4, я использовал эту версию http://sourceforge.net/projects/cmusphinx/files/sphinx4/1.0%20beta6/

Является ли мой метод правильной речевой речи в моем словаре?

Есть ли хорошие ссылки для построения такой поисковой системы с большой базой данных слов (приблизительно 100000 слов)?

Надеюсь, вы могли бы мне помочь.

ответ

0

Подход в порядке.

Если не хватает памяти для виртуальной машины Java, вы можете увеличить его с опцией -Xmx

Для точного поиска, лучше создать модель Юниграмма язык с частотами слов, а не только простой список. Смотрите подробности

http://cmusphinx.sourceforge.net/wiki/tutoriallm

Для лучшей точности, лучше использовать последнюю версию высокого уровня API см подробности

http://cmusphinx.sourceforge.net/wiki/sphinx4

+0

Спасибо за ваш ответ. Я уже увеличил jvm до 1024 и до сих пор не получаю ожидаемого. Когда я говорил «Привет», ничего не случилось, вместо того, чтобы печатать сказанное слово. это очень трудно читать 100000 слов? .. после того, как я прочитал http://cmusphinx.sourceforge.net/wiki/tutoriallm, я смущен о формате dmp и формате lm. В образце приложения (HelloNGram), который используется .lm. Мой вопрос в том, что между этими двумя? что лучше ? , Для dmp-формата, как я могу реализовать dmp-формат в моей программе? я не мог найти его в приведенных ссылках. – davinma06

+0

Прежде всего, пожалуйста, обновите до последней версии. Затем вам необходимо загрузить акустическую модель en-us-generic для лучшей точности. Я не уверен, что вы подразумеваете под «внедрением формата dmp в мою программу». Формат Lm и формат dmp являются эквивалентными представлениями языковой модели. Формат lm - текстовый, а формат dmp - двоичный. Существует инструмент, который преобразует их, как описано в учебнике. –

+0

Привет, Николай. Есть что-то, что я хочу спросить о вашем комментарии в этом http://stackoverflow.com/questions/26925322/cmusphinx-live-speech-recognition-too-slow. Мне очень интересно об этих четырех значениях в config.xml. Как эти вещи могут влиять на скорость и точность sphinx4? и если эти вещи влияют, то я хочу отредактировать это значение, чтобы попытаться получить наилучшую настройку в терминах точности и скорости. есть ли какие-либо ссылки или руководство по его изменению? Я уже загрузил и использовал последний английский язык модели (.dmp), но точность все еще не та, что я ожидал. Я использовал Sphinx4-5 alpha. – davinma06

Смежные вопросы