Я пытаюсь загрузить аудиофайл в python и обработать его с помощью распознавания речи Google.
Проблема в том, что в отличие от C++, python не показывает типы данных, классы и не дает вам доступа к памяти для преобразования между одним типом данных и другим путем создания нового объекта и переупаковки данных.
Я не понимаю, как можно преобразовать один тип данных в другой в python.
Код, о котором идет речь, приведен ниже,
import speech_recognition as spr
import librosa
audio, sr = librosa.load('sample_data/metal.mp3')
# create a speech recognition object
r = spr.Recognizer()
r.recognize_google(audio)
Ошибка:
audio_data must be audio data
Как преобразовать аудиообъект для использования в распознавании речи Google