API распознавания речи Google не прослушивается

Я пытался использовать код распознавания речи ниже с помощью API Google Speech.API распознавания речи Google не прослушивается

#!/usr/bin/env python3 
# Requires PyAudio and PySpeech. 

import speech_recognition as sr 

# Record Audio 
r = sr.Recognizer() 
with sr.Microphone() as source: 
    print("Say something!") 
    audio = r.listen(source) 

# Speech recognition using Google Speech Recognition 
try: 
    # for testing purposes, we're just using the default API key 
    # to use another API key, use `r.recognize_google(audio, key="GOOGLE_SPEECH_RECOGNITION_API_KEY")` 
    # instead of `r.recognize_google(audio)` 
    print("You said: " + r.recognize_google(audio)) 
except sr.UnknownValueError: 
    print("Google Speech Recognition could not understand audio") 
except sr.RequestError as e: 
    print("Could not request results from Google Speech Recognition service; {0}".format(e))

Но я получаю только это.

[email protected]:~/scr$ python3 scr.py 
Say something!

Несмотря на то, что я что-то говорю, ничего не происходит.

У меня нет внешнего микрофона. Я думаю, что этот скрипт будет работать с встроенным микрофоном моего ноутбука.

Я проверил микрофон моего ноутбука here. Он работает нормально.

Я ничего не пропустил?

источник

2017-02-12 jophab

Nice title ...;) – BlackBear

Вы можете проверить, что pyAudio находит микрофон, выполнив следующие действия:

"""PyAudio example: Record a few seconds of audio and save to a WAVE file.""" 

import pyaudio 
import wave 

CHUNK = 1024 
FORMAT = pyaudio.paInt16 
CHANNELS = 2 
RATE = 44100 
RECORD_SECONDS = 5 
WAVE_OUTPUT_FILENAME = "output.wav" 

p = pyaudio.PyAudio() 

stream = p.open(format=FORMAT, 
       channels=CHANNELS, 
       rate=RATE, 
       input=True, 
       frames_per_buffer=CHUNK) 

print("* recording") 

frames = [] 

for i in range(0, int(RATE/CHUNK * RECORD_SECONDS)): 
    data = stream.read(CHUNK) 
    frames.append(data) 

print("* done recording") 

stream.stop_stream() 
stream.close() 
p.terminate() 

wf = wave.open(WAVE_OUTPUT_FILENAME, 'wb') 
wf.setnchannels(CHANNELS) 
wf.setsampwidth(p.get_sample_size(FORMAT)) 
wf.setframerate(RATE) 
wf.writeframes(b''.join(frames)) 
wf.close()

И играть получившийся output.wav файл.

После того, как вы уверены, что вы получаете некоторые аудио Я хотел бы добавить несколько операторов печати к исходному коду, чтобы найти, как далеко вы получаете, то есть:

print("Audio captured!") # before trying to recognise see if you have something

print('Recognition Ended') # at the end of the script

Это позволит вам увидеть, как далеко вы добираетесь.

Далее вам может понадобиться, чтобы узнать, что аудиоустройство по умолчанию с:

import pyaudio 
print(pyaudio.pa.get_default_input_device())

Который должен сказать вам устройство ввода по умолчанию, это был один на моей машине так использовал это:

with sr.Microphone(1) as source: # Specify which input device to use 
    r.adjust_for_ambient_noise(source, 1) # Adjust for ambient 
    print("Say something!") 
    audio = r.listen(source, 2) # 2 Second time out 
print('Done Listening sample size =', len(audio.frame_data))

источник

2017-02-12 06:46:13

Я пробовал это, и я могу услышать файл output.wav. Поэтому pyaudio обнаруживает мой микрофон. Тогда в чем может быть проблема с моим кодом? – jophab

@jophab добавил еще пару предложений. –

Что такое len (аудио)? звуковая переменная не используется ранее. – jophab

API распознавания речи Google не прослушивается

ответ

Смежные вопросы