H2O randomForest column / feature selection

В h2o.randomForest, допустим, у меня есть 5 входных функций x = c («A», «B», «C», «D», «E»), есть ли способ заставить алгоритм всегда выбирать A, B И одна из оставшихся функций?


person Mahdi Mohammadi    schedule 24.03.2017    source источник


Ответы (1)


В этом случае h2o.randomForest просто просит вас передать правильный x (список столбцов для использования в прогнозировании) и y (имя столбца для прогнозирования), поэтому все, что вы передадите, будет использоваться в качестве входных данных.

Вы задаете вопрос, связанный с питоном. Как вы хотите передать список столбцов, вам нужно будет написать для него логику. Вы можете определить следующую функцию и использовать ее по мере необходимости.

import random
myframe = ["a","b","c","d","e"] 
//You can also set myframe as column name list
//myframe.remove(_use_response_column_name) this will make it generic
selectedkeys  = ["a","b"]
for item in selectedkeys:
    if item in myframe:
        myframe.remove(item)
selectedkeys.append(random.choice(myframe))    
print(selectedkeys)
print(myframe)

Вам просто нужно передать выбранные ключи в качестве входных данных для X.

person AvkashChauhan    schedule 25.03.2017