Пытаясь обучить нейронную сеть работе с аудиоданными, я хотел бы оценить некоторые ее внутренние представления. Один из них представляет собой спектрограмму магнитуды без информации о фазе, но с большим перекрытием между окнами Ханна.
Есть ли способ использовать tf.contrib.signal.inverse_stft
для генерации аудиосигнала из этой спектрограммы только для величины? Если нет, есть ли какой-то другой простой способ (например, что-то, влияющее на сумму полосовых фильтров на белом шуме) для этого?