Я работаю с предоставленными фрагментами кода из Google Speech API, здесь. Кода должно быть достаточно, чтобы преобразовать файл .wav в расшифрованный текст.
Блок интереса здесь:
def transcribe_file(speech_file):
"""Transcribe the given audio file."""
from google.cloud import speech
speech_client = speech.Client()
with io.open(speech_file, 'rb') as audio_file:
content = audio_file.read()
audio_sample = speech_client.sample(
content=content,
source_uri=None,
encoding='LINEAR16',
sample_rate_hertz=16000)
alternatives = audio_sample.recognize('en-US')
for alternative in alternatives:
print('Transcript: {}'.format(alternative.transcript))
Во-первых, я думаю, возможно, код старый, и sample_rate_hertz=16000
нужно было изменить на sample_rate=16000
.
После этого я получил ошибку для этой строки:alternatives = audio_sample.recognize('en-US')
которая читаласьAttributeError: 'Sample' object has no attribute 'recognize'
Мне интересно, как это исправить. Я не могу найти документацию по этому методу. Возможно, его тоже нужно заменить.