tensorflow.python.framework.errors_impl.InvalidArgumentError: вы должны указать значение для тензора-заполнителя

Я определил и обучил модель автоэнкодера следующим образом:

input_enc = Input(batch_shape=(batch_size, seq_len, n_features), name='encoder_input')
first_enc = LSTM(32, activation='tanh', dropout=0.1, recurrent_dropout=0.1, return_sequences=True, stateful=True, name='encoder_first_layer')(input_enc)
if output_dropout:
    first_enc = Dropout(0.2)(first_enc)
encoded, hidden_state, cell_state = LSTM(14, activation='tanh', dropout=0.1, recurrent_dropout=0.1, return_sequences=False, return_state=True , stateful=True, name='encoded')(first_enc)
decoder_input = RepeatVector(28, name='repeatVector')(encoded)
first_dec = LSTM(32, return_sequences=True, name='decoder_first_layer')(decoder_input)
out_decoder = LSTM(1, return_sequences=True, name='decoder_output_layer')(first_dec)

autoencoder_model = Model(input_enc, out_decoder)
encoder_model = Model(inputs=input_enc, outputs=[encoded, hidden_state, cell_state])

Входная форма для модели автоэнкодера — (n_samples, seq_len=28, n_features=1) и batch_size = 138. После попытки автоэнкодера я загружаю часть кодировщика и использую ее в качестве входных данных для другой модели.

input_layer = Input(batch_shape=(batch_size, seq_len, n_features), name='ae_prediction_input')
encoder_first_layer = encoder.layers[1](input_layer)
encoded_layer, h_state, c_state = encoder.layers[2](encoder_first_layer)
first_layer = Dense(24, input_dim=28, activation=activation, name="first_dense_layer")(h_state)
if dropout:
    first_layer = Dropout(0.2, name="first_dropout_layer")(first_layer)
second_layer = Dense(12, activation=activation, name="second_dense_layer")(first_layer)
if dropout:
    second_layer = Dropout(0.2, name="snd_dropout_layer")(second_layer)
out = Dense(1, name='output_layer')(second_layer)
new_model = Model(input_layer, out)
new.compile(loss='mean_squared_error', optimizer=rmsprop_optimizer)
history = new_model.fit(train_data, train_y, epochs=5, callbacks=[earlyStopping], batch_size=batch_size
                        , validation_data=(validation_data, validation_y), shuffle=False)

Сначала я пытался использовать входной слой кодировщика, но выдает мне эту ошибку: ValueError: Layer encoder_first_layer was called with an input that isn't a symbolic tensor. Received type: <class 'eras.engine.input_layer.InputLayer'>.Full input: [<keras.engine.input_layer.InputLayer object at 0x13b97ced0>]. All inputs to the layer should be tensors. Вместо этого я создаю новый входной слой, а поверх него добавляю первый слой LSTM предварительно обученного режима кодировщика. Когда я пытаюсь установить new_model, запускается первая эпоха, и в конце первой эпохи я получаю следующую ошибку:

tensorflow.python.framework.errors_impl.InvalidArgumentError: You must feed a value for placeholder tensor 'encoder_input' with dtype float and shape [138,28,1]
     [[{{node encoder_input}} = Placeholder[dtype=DT_FLOAT, shape=[138,28,1], _device="/job:localhost/replica:0/task:0/device:CPU:0"]()]]

В чем проблема? Почему запускаются первые эпохи, а после этого запоминается, что входной слой кодировщика не получает значений?

ОБНОВЛЕНИЕ. Похоже, проблема связана с проверочными данными. В конце последней эпохи Keras проверяет данные проверки и запускает их. Вот и выдает эту ошибку.


person Birish    schedule 06.04.2019    source источник
comment
Не могли бы вы привести полный пример кода. Под полным я подразумеваю, как вы запускаете этот график (например, как вы используете model.fit или model.train_on_batch)?   -  person thushv89    schedule 08.04.2019
comment
Одна из причин, о которой я могу думать, заключается в том, что ошибка появляется в конце первой эпохи, поскольку вы специально указываете batch_shape, ваша последняя партия входных данных, вероятно, содержит меньше данных (т.е. менее 138 записей), что может вызвать исключение вы заметили. Вы можете попробовать 2 вещи: 1. Вместо batch_shape используйте shape, где вам не нужно определять размер пакета 2. Если у вас большой объем данных, просто игнорируйте последний пакет данных.   -  person thushv89    schedule 08.04.2019
comment
@thushv89 Спасибо за ваш комментарий. batch_size=138 разделяет как данные обучения, так и данные проверки. training.shape=(49956,28,1), validation.shape=(16422,28,1), test.shape=(8004,28,1). Я попытался удалить validation_data=(validation_data, validation_y) из fit(), он работает и обучает модель без ошибок! Но затем не удается запустить new_model.evaluate(train_data, train_y, verbose=0, batch_size=batch_size) с той же ошибкой, что и раньше.   -  person Birish    schedule 08.04.2019
comment
@ thushv89 Он жалуется на передачу данных на первый уровень предварительно обученного кодировщика, encoder_input, который я не загрузил для создания new_model. Вместо этого я использую новый слой Input(). Это неправильно?   -  person Birish    schedule 08.04.2019
comment
Хм, другая причина, о которой я могу думать, заключается в том, что способ создания модели прогнозирования (то есть new_model) должен измениться. Вместо того, чтобы получать model.layers[x], попробуйте создать новый слой, например. LSTM(....), а затем используйте model.layers[x].get_weights() и используйте его для set_weights нового слоя в модели прогнозирования.   -  person thushv89    schedule 08.04.2019


Ответы (1)


Благодаря ответу @thushv89 я исправил код следующим образом:

encoder = load_model(encoder_path)

input_enc = Input(batch_shape=(batch_size, seq_len, n_features), name='ae_prediction_input')
first_enc = LSTM(encoder.layers[1].units, activation=activation, dropout=encoder.layers[1].dropout, recurrent_dropout=encoder.layers[1].recurrent_dropout, return_sequences=True, stateful=encoder.layers[1].stateful)(input_enc)
encoded, hidden_state, cell_state = LSTM(encoder.layers[2].units, activation=activation, dropout=encoder.layers[2].dropout, recurrent_dropout=encoder.layers[2].recurrent_dropout , return_sequences=False, stateful=encoder.layers[2].stateful)(first_enc)

first_dense = Dense(24, input_dim=28, activation=activation,name="first_dense_layer")(h_state)
if dropout:
    first_dense = Dropout(0.2, name="first_dropout_layer")(first_dense)
second_layer = Dense(12, activation=activation, name="second_dense_layer")(first_dense)
if dropout:
    second_layer = Dropout(0.2, name="snd_dropout_layer")(second_layer)
out = Dense(1, name='output_layer')(second_layer)

model = Model(input_enc, out)
model.layers[1].set_weights(encoder.layers[1].get_weights())
model.layers[2].set_weights(encoder.layers[2].get_weights())
person Birish    schedule 12.05.2019