2010-01-18 5 views
0

Я хочу сделать небольшую апликацию, знает ли кто-нибудь о хорошем динамическом распознавании речи с помощью sdk. (Не речь в текст ENGINS)Динамическая система распознавания речи с помощью sdk

спасибо,

Efrat

+2

В чем разница между «распознавания речи» и «речи в текст»? Они звучат одинаково для меня. – davr

ответ

0

Просьба уточнить. Какая платформа? Какой размер лексики? Какие ограничения производительности? Непрерывный? Полунепрерывное? Что вы подразумеваете под словом "not speech to text engine"?

Если вам нужно что-то простое и маленькое, вы можете попробовать EARS, написанный на C, и не очень большой, вероятно, хорошо для новичков.

1

Sphinx, вероятно, соответствует тем, что вы ищете. Это платформа распознавания речи с открытым исходным кодом и постоянный проект в Университете Карнеги-Меллона.

+0

Sphinx - это надмножество того, что ищет OP. Sphinx очень приятный, но он нацелен на самую сложную проблему: большой словарь с непрерывной независимой от речи распознаванием речи. Следовательно, он требует значительной вычислительной мощности для распознавания - не лучший выбор для небольших (вычислительных) ситуаций с ограничением мощности. –

0

есть динамики, зависящие от громкоговорителей, они более примитивны, как и у сотовых телефонов. не пытайтесь преобразовать в текст, они просто выполняют сравнение сигналов. и что мне нужно.

+0

См. Обновление моего ответа - EARS –

+1

Если вы хотите уточнить свой вопрос, вы должны отредактировать свой вопрос напрямую. Вместо этого вы добавили ответ, который многие люди могут не видеть. – davr

1

Я использовал sphinx-4, чтобы получить acccuracy 82.25%. Я выясняю, как увеличить его более чем на 95%. Я транскрибирую только голос одного человека, поэтому, если система, зависящая от динамиков, будет полезна, это будет здорово. Словарь составляет около 40 000 слов. У меня есть двухъядерная система, и я мог бы легко запускать декодер sphinx-train и sphinx4, хотя тренер проводит день, чтобы тренировать 40 часов аудио, которые у меня есть, и декодер в реальном времени.

Я хочу знать, есть ли продукт/библиотека с открытым исходным кодом, которую я могу использовать, чтобы увеличить процент моей точности.

Спасибо, Dharani

Смежные вопросы