Я использую weka.classifiers.bayes.HMM, чтобы попытаться классифицировать некоторые из моих данных, но я не могу найти каких-либо примеров того, как именно должен выглядеть мой файл ARFF... документация мне не очень понятна. .
Итак, я понимаю, что для HMM требуются данные временных рядов, мой вопрос заключается в том, как представить это в моем наборе данных? Должен ли я добавить еще один «Числовой» индекс перед каждой строкой признаков? Например, вот 3 моих характерных строки (всего их десятки тысяч, но все они имеют такой формат):
2,2.217950,2.235440,0.031252,2.224833,2.301141,0.093227,1.940765,1.973835,0.064434,1 2,2.216870,2.235608,0.035570,2.217950,2.235440,0.031252,2.023161,2.531513,0.623939,1 2,2.216577,2.246109,0.045806,2.216870,2.235608,0.035570,2.497010,2.529199,0.050049,1
Каждая строка содержит несколько показаний энергии, и все они перечислены в последовательном порядке: 1-я строка идет первой, 2-я строка идет через 1 секунду, 3-я строка, через 1 секунду после показания второй строки и т. д.
Как мне использовать HMM в Weka для тренировки на этом наборе? (Да, я знаю, что мне понадобится отдельный тестовый набор данных, который также является временным рядом)
Спасибо!!