2017-02-10 5 views
3

Я сделал вызов API нормально с правильно отформатированным запросом JSON с mp3-файлом, и я ожидаю, что данные JSON будут включать объект «результаты» с объектом «альтернативы» с «расшифровкой» и «уверенностью» " значения.google speech api Пустые результаты JSON

Вместо этого я получаю результат «{}" (пустой объект JSON).

Операционная система, использующая is ubuntu15.04.

файл запрос JSON с текстом создается, и сохранить его в качестве синхронизации request.json простого текстового файла:

{ 
    "config": { 
    "encoding": "LINEAR16", 
    "sampleRate": 16000, 
"languageCode": "en-US" 
    }, 
    "audio": { 
    "uri": "gs://audiobucketceino/Learn English - Lesson 41- Hi How are you - Pronunciation-[AudioTrimmer.com].mp3" 
    } 
} 

завитка используется, чтобы сделать речь: запрос syncrecognize является:

curl -s -k -H "Content-Type: application/json"  -H "Authorization: Bearer [access-token]"  https://speech.googleapis.com/v1beta1/speech:syncrecognize -d @sync-request.json 

Тестовый файл прилагается в:

https://drive.google.com/file/d/0B7cqXnHXm78bLWdyYWhpVEdkT0U/view?usp=sharing

+0

Возможный дубликат [Google API речевого распознавания ошибок пуст] (http://stackoverflow.com/questions/38906527/google-speech-recognition-api-result-is-empty) –

ответ

2

API-интерфейс google speech не поддерживает файлы MP3 напрямую. Он поддерживает только the five listed in the documentation. Проще всего было бы конвертировать mp3 файл в файл WAV с помощью Сокс или аналогичного инструмента (sudo apt-get install sox):

sox lesson41.mp3 lesson41.wav 

файл WAV должен быть совместим с LINEAR16 кодирующим вы указали. Вы захотите убедиться, что частота дискретизации равна 16k, а образцы - 16 бит. Чтобы обезопасить себя, попробуйте следующее:

sox lesson41.mp3 -r 16000 -c 1 -b 16 lesson41.wav 

Если у вас есть какие-либо проблемы получения sox Есть lots of other tools that should be able to do the conversion too.

Смежные вопросы