ELKI Обнаружение выбросов на одномерных данных

Я пытался получить LOF для 1D-данных на основе евклидова расстояния. Но я продолжаю получать «Не удалось оценить результаты с выбросами, так как я не смог найти метку меньшинства». Ошибка. Пожалуйста, смотрите ниже. Данные выглядят так: 0.366959 0.134065 0.54 0.292419 0.449071 0.42 0.208460 0.336666

Вот команда, которую я даю:

 -dbc.in C:\Users\...\Adata.txt -algorithm clustering.em.EM,outlier.lof.LOF -em.k 3 -lof.k 3

Кластеризация выполняется правильно, но при обнаружении выбросов происходит сбой. Я что-то упустил здесь?


person Ira    schedule 28.08.2015    source источник


Ответы (1)


Это не ошибка, а предупреждение.

ELKI пытается автоматически оценить, но может сделать это только в том случае, если у него есть помеченные данные.

Попробуйте записать вывод в файл. Вероятно, это сработало, и вы просто не заметили, потому что у него нет хорошей визуализации точечной диаграммы для одномерных данных.

-resulthandler ResultWriter -out someFolder
person Erich Schubert    schedule 28.08.2015
comment
Привет! Благодарю. Да, теперь я вижу выбросы в файле lof-outlier_order.txt. Как я могу увидеть это как эти красивые графики рассеяния с обведенными выбросами? - person Ira; 31.08.2015
comment
Хорошо, теперь я понял. ELKI нужен еще один столбец, чтобы нарисовать точечную диаграмму. Я дал индексы точек наблюдения как столбец 0, и это работает. Спасибо! - person Ira; 01.09.2015
comment
Эти круговые диаграммы действительно имеют смысл только для многомерных данных. Не добавляйте индексы в столбец 0! Это изменяет результат, и индексы, вероятно, не имеют смысла для использования в вычислениях расстояний! В качестве хака вы можете продублировать имеющийся у вас столбец; но тогда, очевидно, все точки будут на диагональной линии. - person Erich Schubert; 14.09.2015