как комбинировать (объединять) разные регрессионные модели

Я работаю над обучением различных моделей для различной оценки проблем позы человека. на самом деле мне нужно получить разные результаты регрессионной модели для разных суставов человеческого тела. После того, как я провел поиск этой проблемы, я пришел к выводу, что у меня есть два пути:

обучение различных моделей и объединение их конечных результатов.
тренировочные модели в виде цепочки. (Вход второй модели является выходом первой модели и...)

Я знаю, что в Keras есть функция concatenate, которая представляет собой такой слой для объединения двух выходных данных моделей. Но если я не хочу использовать Keras, возможно ли иметь 6 моделей, а затем объединить их таким образом, чтобы окончательная обученная модель могла сразу оценить все выходные данные этих разных моделей?

мои модели примерно такие (они разные в зависимости от разных наборов данных, которые у меня есть):

 ## conv1 layer
 W_conv1 = weight_func([3, 3, 1, 32])  
 b_conv1 = bias_func([32])
 h_conv1 = tf.nn.relu(conv2d(x_image, W_conv1) + b_conv1) 
 # h_pool1 = max_pool_2x2(h_conv1)     
 #h_drop1 = tf.nn.dropout(h_conv1, keep_prob) 

 ## conv2 layer
 W_conv2 = weight_func([3, 3, 32, 64])  # patch 2x2, in size 32, out size 64
 b_conv2 = bias_func([64])
 h_conv2 = tf.nn.relu(conv2d(h_conv1, W_conv2) + b_conv2)
 #h_drop2 = tf.nn.dropout(h_conv2, keep_prob)

 ## conv3 layer
 W_conv3 = weight_func([3, 3, 64, 128])  
 b_conv3 = bias_func([128])
 h_conv3 = tf.nn.relu(conv2d(h_conv2, W_conv3) + b_conv3)  
 #h_drop3 = tf.nn.dropout(h_conv3, keep_prob)  

 ## conv4 layer 
 W_conv4 = weight_func([3, 3, 128,256])  # patch 3*3, in size 32, out size 64
 b_conv4 = bias_func([256])
 h_conv4 = tf.nn.relu(conv2d(h_conv3, W_conv4) + b_conv4) 
 #h_drop4 = tf.nn.dropout(h_conv4, keep_prob)  

 ## fc1 layer
 W_fc1 = weight_func([6 * 6 * 256, 9216])
 b_fc1 = bias_func([9216])

 h_pool2_flat = tf.reshape(h_conv4, [-1, 6 * 6 * 256]) 
 h_fc1 = tf.nn.relu(tf.matmul(h_pool2_flat, W_fc1) + b_fc1)
 h_fc1_drop = tf.nn.dropout(h_fc1, keep_prob) 

 # fc2 layer 
 W_fc2 = weight_func([9216, 1])
 b_fc2 = bias_func([1])

 prediction = tf.add(tf.matmul(h_fc1_drop, W_fc2) , b_fc2, name= 'output_node')
 cross_entropy = tf.reduce_mean(tf.reduce_sum(tf.square(ys - prediction), reduction_indices=[1]))

tara 03.09.2020 источник

comment

У вас есть один вход для всех моделей или разные входы для разных моделей? - Aniket Bote 03.09.2020

comment

@AniketBote У меня разные входные данные - tara 03.09.2020

comment

@AniketBote Есть ли у вас какие-либо предложения, если я изменю свои наборы данных, чтобы они были одинаковыми для всех моделей? - tara 03.09.2020

comment

Если у вас есть один вход, создайте один входной слой и передайте его вход всем скрытым слоям. - Aniket Bote 03.09.2020

comment

Ответ сработал? - Aniket Bote 03.09.2020

comment

@AniketBote Нет, в моем случае это не работает. Кстати, я пытаюсь проверить другие подходы. - tara 04.09.2020

comment

Давайте продолжим это обсуждение в чате. - Aniket Bote 04.09.2020

comment

Я отправил новую ошибку и код. заранее спасибо - tara 04.09.2020

Ответы (1)

arrow_upward
1
arrow_downward

Для этого вы можете использовать функциональный API. Я добавил простой пример, который вы можете адаптировать к более сложным моделям в соответствии с вашими вариантами использования.

Код:

import tensorflow as tf
import numpy as np

# Here I have generated to different data and labels containing different number of features.
x1 = tf.constant(np.random.randint(50, size =(1000,13)), dtype = tf.float32)
y1 = tf.constant(np.random.randint(2, size =(1000,)), dtype = tf.int32)

x2 = tf.constant(np.random.randint(50, size =(1000,6)), dtype = tf.float32)
y2 = tf.constant(np.random.randint(2, size =(1000,)), dtype = tf.int32)

# Creation of model
def create_model3():
    input1 = tf.keras.Input(shape=(13,), name = 'I1')
    input2 = tf.keras.Input(shape=(6,), name = 'I2')
    
    hidden1 = tf.keras.layers.Dense(units = 4, activation='relu')(input1)
    hidden2 = tf.keras.layers.Dense(units = 4, activation='relu')(input2)
    hidden3 = tf.keras.layers.Dense(units = 3, activation='relu')(hidden1)
    hidden4 = tf.keras.layers.Dense(units = 3, activation='relu')(hidden2)
    output1 = tf.keras.layers.Dense(units = 2, activation='softmax', name ='O1')(hidden3)
    output2 = tf.keras.layers.Dense(units = 2, activation='softmax', name = 'O2')(hidden4)
    
    model = tf.keras.models.Model(inputs = [input1,input2], outputs = [output1,output2])
    
    model.compile(optimizer='adam',
                  loss='sparse_categorical_crossentropy',
                  metrics=['accuracy'])
    return model
model = create_model3()

tf.keras.utils.plot_model(model, 'my_first_model.png', show_shapes=True)

Архитектура модели:

Вы можете обучить эту модель, используя model.fit() следующим образом:

history = model.fit(
    x = {'I1':x1, 'I2':x2}, 
    y = {'O1':y1, 'O2': y2},
    batch_size = 32,
    epochs = 10,
    verbose = 1,
    callbacks = None,
#     validation_data = [(val_data,new_val_data),(val_labels, new_val_labels)]
)

Примечание. Для обучения работе количество выборок во всех ваших входных данных должно быть одинаковым. т.е. x1 содержит 1000 строк, поэтому x2 также должен содержать 1000 строк.

Вы можете прогнозировать, используя эту модель, следующим образом:

model.predict(x = {'I1':x1, 'I2':x2})

Aniket Bote 03.09.2020

как комбинировать (объединять) разные регрессионные модели

Ответы (1)

Похожие вопросы