2014-01-04 3 views
0

Я пишу (офлайн) приложение для распознавания голоса. У меня есть CMU Sphinx4, настроенный и работающий, используя некоторые из включенных демо-словарей. Однако они ограничены (например, числа, города и т. Д.).Есть ли хранилище грамматик для CMU Sphinx?

Есть ли более всеобъемлющая грамматика? Или, может быть, хранилище большего количества этих ограниченных грамматик? Я пытаюсь исчерпать любые другие варианты, прежде чем создавать свои собственные.

Спасибо

ответ

2

грамматики всегда специфичны для конкретной цели, так что это не имеет смысла делить их. Даже такой простой вопрос, как цифры, может варьироваться между конкретными приложениями: мы используем «ноль» и «о» для обозначения «0» в обычной речи, в то время как ученые также используют «не» для этой же цели.

Sphinx4 поддерживает форматы JSGF и GRXML, вы можете легко найти технические характеристики обоих.

+0

Спасибо. С уважением, я не соглашусь - я думаю, что все же имеет смысл делиться ими для других людей с одинаковой целью. –

+0

Тем не менее, моя программа - это своего рода экспериментальный пассивный слушатель. Таким образом, всеобъемлющая грамматика подходит для моей цели. HTML5 Web Speech API использует такую ​​грамматику, но доступен только через веб-службу. Еще раз спасибо –

+1

Разве вы не смешиваете грамматику со словарной или языковой моделью? В Sphinx4 грамматика представляет собой набор правил, описывающих окончательную гипотезу. –

0

Вы, кажется, ошибаетесь в грамматике со словарями. Это совершенно разные вещи.

Sphinx поддерживает не только грамматики, но и модели языка n-gram. Вы можете найти их более универсальными. Такая модель может быть автоматически сгенерирована и будет работать, если будет задано большое количество корпусов, отражающих реальные предложения по использованию.

Что касается словарей - создание их для английского языка относительно просто. Можно даже подумать о инструменте, который читает фонетическое представление слова из онлайн-словаря и преобразует его в формат sphinx. Единственным входом будет список слов.

0

Я считаю, что this paper пригодится для ваших усилий. Эта статья влечет за собой создание грамматики и словаря для нового языка, суахили

Смежные вопросы