Расчет количества параметров в модуле и слое LSTM

LSTM - это тип рекуррентной нейронной сети, которая широко используется в задачах обработки естественного языка. Архитектура модуля LSTM сложна для освоения.

Было бы больше уверенности в понимании параметров слоя, который мы используем в нашей модели. Итак, в этом блоге мы рассмотрим, как рассчитываются параметры для слоя LSTM.

В приведенном ниже примере мы использовали уровень LSTM из 100 единиц, и мы видим, что ниже на бэкэнде задействовано 53200 параметров. К концу этого блога мы сможем раскрыть, что это за параметры 53200.

Функции в модуле LSTM: -

Параметры в модуле LSTM связаны с функциями, участвующими в вычислении. Итак, давайте рассмотрим функции, задействованные в модуле LSTM.

Ячейка LSTM имеет четыре функциональных блока -

  • 3 сигмоида (функции f, i, o ниже)
  • 1 Тан (функция c ниже)

Мы можем обобщить все эти 4 функции -

Sig / tanh (W.x + U.h + b)

Где W, U, b - параметры, x - входные данные, а h - значения скрытого слоя, рассчитанные с использованием вышеуказанных параметров.

Используя формулу 4 * (n + m + 1) * m, количество параметров в приведенном ниже примере будет 4 * (32 + 100 + 1) * 100 = 4 * 133 * 100 = 53200.

Надеюсь, вы смогли получить четкое представление о параметрах, задействованных в слое LSTM. Пожалуйста, не стесняйтесь делиться своими комментариями и дайте мне знать, если вы хотите прочитать статью на любую другую тему.

Ссылки: -



Https://www.youtube.com/watch?v=l5TAISVlYM0&feature=youtu.be