У меня есть функция, которая принимает две строки и выдает значение сходства косинуса, которое показывает взаимосвязь между обоими текстами.
Если я хочу сравнить 75 текстов друг с другом, мне нужно сделать 5625 одиночных сравнений, чтобы все тексты сравнивались друг с другом.
Есть ли способ уменьшить это количество сравнений? Например, разреженные матрицы или k-средние?
Я не хочу говорить о своей функции или способах сравнения текстов. Как раз об уменьшении количества сравнений.