как TreeBagger обрабатывает отсутствующие значения

Мне было интересно, знает ли кто-нибудь, как TreeBagger (Matlab) обрабатывает отсутствующие значения. Похоже, что в литературе и Брейманом описаны два метода. Один из них (по-видимому, лучший) использует рекурсивный / итерационный метод для вычисления пропущенного значения.

Кто-нибудь знает (наверняка) какой метод реализован? Для этого нет доступных параметров. Я попытался просмотреть код, но не могу понять, где это обрабатывается и как это обрабатывается.


person D3GAN    schedule 20.07.2014    source источник


Ответы (1)


Не уверен, что вы имеете в виду под пропущенными значениями. Я имею в виду, что отсутствующие значения во входной матрице, MatLab, похоже, игнорирует их:

Из документации MatLab 2011a:

Рабочий процесс и алгоритмы контролируемого обучения (машинного обучения)

Все контролируемые методы обучения начинаются с матрицы входных данных, обычно называемой здесь X. Каждая строка X представляет одно наблюдение. Каждый столбец X представляет одну переменную или предиктор. Представьте пропущенные записи со значениями NaN в X. Алгоритмы контролируемого обучения Statistics Toolbox могут обрабатывать значения NaN, либо игнорируя их, либо игнорируя любую строку со значением NaN.

С уважением,

Эрнст Ян

person EJG89    schedule 21.07.2014