Когда я выполняю n-кратную перекрестную проверку для m классов, сбалансированы ли в каждом из них обучающий и тестовый наборы? Под сбалансированным я подразумеваю спросить, есть ли (почти) одинаковый набор образцов из каждого класса в обучающих и тестовых наборах.
Балансирует ли weka наборы поездов / тестов по классам при перекрестной проверке?
Ответы (1)
Если я правильно понимаю эту часть:
Я хочу спросить, есть ли (почти) одинаковый набор образцов от каждого класса в обучающих и тестовых наборах.
... Я думаю, вы имеете в виду стратифицированную перекрестную проверку: где пропорции классов для каждой складки такие же, как пропорции классов для всего набора данных.
Да, в Weka это возможно, но вы можете ознакомиться с документацией. Могут ли они помочь?
http://weka.wikispaces.com/Primer
http://weka.wikispaces.com/Generating+cross-validation+folds+(Java+approach)
http://weka.sourceforge.net/doc/weka/filters/supervised/instance/StratifiedRemoveFolds.html
person
Steve Tjoa
schedule
31.01.2013
Спасибо за ссылки, я знаю, что можно. Но мне было интересно, что делает weka, когда мы проводим перекрестную проверку в экспериментаторе.
- person gopalkoduri; 31.01.2013
Weka по умолчанию выполняет стратифицированную перекрестную проверку при использовании графического интерфейса пользователя (Weka Explorer). В этом можно убедиться, просмотрев текст выходных данных классификатора и увидев фразу
=== Stratified cross-validation ===
. Надеюсь это поможет.
- person Wesley Baugh; 02.02.2013