Я работаю с кластеризацией текста. Я хочу выбрать определенные документы (как вектор) в качестве centroID для k-средних.
Я создал TF-IDF для своего набора данных с помощью Mahout, и я хотел бы выбрать начальные кластеры из векторов TFIDF.
У кого-нибудь есть идея, как я могу указать начальные центроиды в Mahout?