Код обратного распространения (во времени) в Tensorflow

Где я могу найти код обратного распространения (через время) в Tensorflow (API Python)? Или используются другие алгоритмы?

Например, когда я создаю сеть LSTM.

python tensorflow backpropagation

Alex 20.04.2016 источник

Ответы (2)

arrow_upward
11
arrow_downward

Все обратное распространение в TensorFlow реализовано путем автоматического дифференцирования операций в прямом проходе сети и добавления явных операций для вычисления градиента в каждой точке сети. Общую реализацию можно найти в tf.gradients(), но конкретная используемая версия зависит от того, как реализован ваш LSTM:

Если LSTM реализован как развернутый цикл для конечного числа временных шагов, обычный подход — это усеченное обратное распространение во времени, в котором используется алгоритм из tf.gradients() для построения развернутого цикла обратного распространения в противоположном направлении.

Если LSTM реализован как tf.while_loop(), он использует дополнительную поддержку дифференциации циклов в control_flow_grad.py.

mrry 20.04.2016

comment

Пожалуйста, взгляните на этот stackoverflow.com/q/66185202/14337775 и выскажите свое мнение - Lawhatre; 17.02.2021

arrow_upward
0
arrow_downward

Я не уверен в этом, но это может сработать:

Поскольку RNN можно обучать так же, как сети с прямой связью, код очень похож. Вот как вы тренируете сеть с прямой связью: (X - вход)

train = tf.train.GradientDescentOptimizer(learning_rate).minimize(error)

# Session
sess = tf.Session()
sess.run(tf.initialize_all_variables())

for i in range(epochs):
    sess.run(train, feed_dict={X: [[0, 0, 1], [1, 1, 1], [1, 0, 1], [0, 1, 1]], labels: [[0], [1], [1], [0]]})

Единственная разница в обратном распространении во времени состоит в том, что каждая эпоха теперь имеет вложенный цикл времени.

Это код для обучения простого rnn:

train = tf.train.GradientDescentOptimizer(learning_rate).minimize(error)

time_series = [1, 0, 1, 0, 1, 0, 1, 0, 1, 0, 1, 0, 1, 0, 1]
for i in range(number_of_epochs):
    for j in range(len(time_series) - 1):
        curr_X = time_series[j+1]
        curr_prev = time_series[j]
        lbs = curr_prev
        sess.run(train, feed_dict={X: [[curr_X]], prev_val: [[curr_prev]], labels: [[lbs]]})

В этом коде rnn изучает временной ряд с альтернативными единицами и нулями.

Paramdeep Singh Obheroi 30.05.2017

Код обратного распространения (во времени) в Tensorflow

Ответы (2)

Похожие вопросы