1

Я разрабатываю приложение, использующее речевое сообщение для преобразования текста в текст. Точность низкая. Некоторые предложения не имеют никакого значения. Есть ли способ повысить точность речи в текст?Точность распознавания речи IBM Watson низкая

Вот пример:

http://book.vidalab.co/books/alice-in-wonderland

Алиса в стране чудес, в разделе 2:

«над дома, чтобы пойти белой пешки таким образом, вы видите рекламу» должны быть «более дома идти белую пешку таким образом, вы видите Алису»

„крысу в белом“ должен быть„красно-белые“

«и белая армия пытается выиграть и красные на Trice близнеца» должен быть «и белой армии пытается выиграть и красная армия пытается выиграть»

+0

это не ИИ. Посмотрите, как он справляется с этим стихотворением: http://www.waylink-english.co.uk/?page=16100 –

+0

Я бы не ожидал, что он будет разбирать стихи. Но это не так хорошо с литературой. Может быть, литература тоже не связана? –

ответ

1

Вы можете попробовать различные услуги, например, Speechmatics , это не очень хорошо получать акустические системы, но слова гораздо более точно, чем от Уотсона, результат таков:

признания
Credits of Alice in Wonderland by Alice girs Timberg this is a box recording all of her vocal recordings are in the public domain for more information or volunteer. Please visit libber Vox dot org. 
I just listed stage directions read by McKayla Curtis Lewis Carroll. 
Read by Shannon Brown Alice read by Amanda Friday the Red Queen read by Shauna canat White Queen read by Elizabeth Klatt White Rabbit read by Todd Humpty Dumpty read by Jeff Machado written read by Brett Hirsch. 
The Mock Turtle read by Ted the alarm Mad Hatter read by Elliot gage the March Hare by Charlotte Duckett's dormouse read by Kimberly Krauss frog read by Larry Wilson Duchess read by L.A. Cheshire Cat read by Sarah Herschell Tweedle-Dee read. 
By Charlotte Brown. 
Do you do do I read by the sea a solo the King of Hearts read by Ted alarm the Queen of Hearts read by eating Ray Headrick knave by glorious Joe Carter pillar back at 2 loss to spot read by Dave Harris. 
Five Spot read by Dave Harith. Seven of spades read by Dave Hereth end of credits. 

Фамилии является очень сложной задачей, не многие компании делают это правильно.

0

В любой системе STT есть две основные части: акустическая модель и языковая модель. Первый из них касается звука и динамика и обрабатывает такие вещи, как: шум, произношения, акценты и т. Д. Языковая модель - это структура данного языка и слова, используемые в речи.

Если вы хотите протестировать STT, используйте записи, которые максимально приближены к вашей целевой речи. Система, которая очень хорошо работает для общей речи или, например, медицинской транскрипции, может быть не очень хороша в речи о археологии или поэзии.

Смежные вопросы