Балансирует ли weka наборы поездов / тестов по классам при перекрестной проверке?

Когда я выполняю n-кратную перекрестную проверку для m классов, сбалансированы ли в каждом из них обучающий и тестовый наборы? Под сбалансированным я подразумеваю спросить, есть ли (почти) одинаковый набор образцов из каждого класса в обучающих и тестовых наборах.


person gopalkoduri    schedule 31.01.2013    source источник


Ответы (1)


Если я правильно понимаю эту часть:

Я хочу спросить, есть ли (почти) одинаковый набор образцов от каждого класса в обучающих и тестовых наборах.

... Я думаю, вы имеете в виду стратифицированную перекрестную проверку: где пропорции классов для каждой складки такие же, как пропорции классов для всего набора данных.

Да, в Weka это возможно, но вы можете ознакомиться с документацией. Могут ли они помочь?

http://weka.wikispaces.com/Primer

http://weka.wikispaces.com/Generating+cross-validation+folds+(Java+approach)

http://weka.sourceforge.net/doc/weka/filters/supervised/instance/StratifiedRemoveFolds.html

person Steve Tjoa    schedule 31.01.2013
comment
Спасибо за ссылки, я знаю, что можно. Но мне было интересно, что делает weka, когда мы проводим перекрестную проверку в экспериментаторе. - person gopalkoduri; 31.01.2013
comment
Weka по умолчанию выполняет стратифицированную перекрестную проверку при использовании графического интерфейса пользователя (Weka Explorer). В этом можно убедиться, просмотрев текст выходных данных классификатора и увидев фразу === Stratified cross-validation ===. Надеюсь это поможет. - person Wesley Baugh; 02.02.2013