Я определил и обучил модель автоэнкодера следующим образом:
input_enc = Input(batch_shape=(batch_size, seq_len, n_features), name='encoder_input')
first_enc = LSTM(32, activation='tanh', dropout=0.1, recurrent_dropout=0.1, return_sequences=True, stateful=True, name='encoder_first_layer')(input_enc)
if output_dropout:
first_enc = Dropout(0.2)(first_enc)
encoded, hidden_state, cell_state = LSTM(14, activation='tanh', dropout=0.1, recurrent_dropout=0.1, return_sequences=False, return_state=True , stateful=True, name='encoded')(first_enc)
decoder_input = RepeatVector(28, name='repeatVector')(encoded)
first_dec = LSTM(32, return_sequences=True, name='decoder_first_layer')(decoder_input)
out_decoder = LSTM(1, return_sequences=True, name='decoder_output_layer')(first_dec)
autoencoder_model = Model(input_enc, out_decoder)
encoder_model = Model(inputs=input_enc, outputs=[encoded, hidden_state, cell_state])
Входная форма для модели автоэнкодера — (n_samples, seq_len=28, n_features=1)
и batch_size = 138
. После попытки автоэнкодера я загружаю часть кодировщика и использую ее в качестве входных данных для другой модели.
input_layer = Input(batch_shape=(batch_size, seq_len, n_features), name='ae_prediction_input')
encoder_first_layer = encoder.layers[1](input_layer)
encoded_layer, h_state, c_state = encoder.layers[2](encoder_first_layer)
first_layer = Dense(24, input_dim=28, activation=activation, name="first_dense_layer")(h_state)
if dropout:
first_layer = Dropout(0.2, name="first_dropout_layer")(first_layer)
second_layer = Dense(12, activation=activation, name="second_dense_layer")(first_layer)
if dropout:
second_layer = Dropout(0.2, name="snd_dropout_layer")(second_layer)
out = Dense(1, name='output_layer')(second_layer)
new_model = Model(input_layer, out)
new.compile(loss='mean_squared_error', optimizer=rmsprop_optimizer)
history = new_model.fit(train_data, train_y, epochs=5, callbacks=[earlyStopping], batch_size=batch_size
, validation_data=(validation_data, validation_y), shuffle=False)
Сначала я пытался использовать входной слой кодировщика, но выдает мне эту ошибку: ValueError: Layer encoder_first_layer was called with an input that isn't a symbolic tensor. Received type: <class 'eras.engine.input_layer.InputLayer'>.Full input: [<keras.engine.input_layer.InputLayer object at 0x13b97ced0>]. All inputs to the layer should be tensors.
Вместо этого я создаю новый входной слой, а поверх него добавляю первый слой LSTM предварительно обученного режима кодировщика. Когда я пытаюсь установить new_model
, запускается первая эпоха, и в конце первой эпохи я получаю следующую ошибку:
tensorflow.python.framework.errors_impl.InvalidArgumentError: You must feed a value for placeholder tensor 'encoder_input' with dtype float and shape [138,28,1]
[[{{node encoder_input}} = Placeholder[dtype=DT_FLOAT, shape=[138,28,1], _device="/job:localhost/replica:0/task:0/device:CPU:0"]()]]
В чем проблема? Почему запускаются первые эпохи, а после этого запоминается, что входной слой кодировщика не получает значений?
ОБНОВЛЕНИЕ. Похоже, проблема связана с проверочными данными. В конце последней эпохи Keras проверяет данные проверки и запускает их. Вот и выдает эту ошибку.
batch_shape
, ваша последняя партия входных данных, вероятно, содержит меньше данных (т.е. менее 138 записей), что может вызвать исключение вы заметили. Вы можете попробовать 2 вещи: 1. Вместоbatch_shape
используйтеshape
, где вам не нужно определять размер пакета 2. Если у вас большой объем данных, просто игнорируйте последний пакет данных. - person thushv89   schedule 08.04.2019batch_size=138
разделяет как данные обучения, так и данные проверки.training.shape=(49956,28,1), validation.shape=(16422,28,1), test.shape=(8004,28,1)
. Я попытался удалитьvalidation_data=(validation_data, validation_y)
изfit()
, он работает и обучает модель без ошибок! Но затем не удается запуститьnew_model.evaluate(train_data, train_y, verbose=0, batch_size=batch_size)
с той же ошибкой, что и раньше. - person Birish   schedule 08.04.2019encoder_input
, который я не загрузил для созданияnew_model
. Вместо этого я использую новый слойInput()
. Это неправильно? - person Birish   schedule 08.04.2019new_model
) должен измениться. Вместо того, чтобы получатьmodel.layers[x]
, попробуйте создать новый слой, например.LSTM(....)
, а затем используйтеmodel.layers[x].get_weights()
и используйте его дляset_weights
нового слоя в модели прогнозирования. - person thushv89   schedule 08.04.2019