У меня есть некоторые wav-файлы, в которых говорят целые числа. Мне нужно обнаружить эти отдельные целые числа и преобразовать в строку. вы можете скачать mp3 файл с: hereречь к тексту из wav-файла C#
Использование Microsoft SpeechRecognitionEngine
, я с трудом могу обнаружить целое число из любого из файлов wav.
Это SRE настройки:
sre.SetInputToWaveFile("D:\\Speeches\\Best3.wav");
sre.BabbleTimeout = new TimeSpan(Int32.MaxValue);
sre.InitialSilenceTimeout = new TimeSpan(Int32.MaxValue);
sre.EndSilenceTimeout = new TimeSpan(100000000);
sre.EndSilenceTimeoutAmbiguous = new TimeSpan(100000000);
Вы можете загрузить пользовательскую грамматику, содержащую только целые числа 0-9 или любой диапазон, который будет включен. Тогда будут распознаны только эти числа, а не любые нецелые числа, если они существуют. Граммары могут быть довольно сложными, но я сделал это для пользовательской грамматики, чтобы открывать элементы в списке на основе номера строки, поэтому это можно сделать – pinkfloydx33