У меня есть код, который запускает базовый векторизатор TF-IDF для коллекции документов, возвращая разреженную матрицу D X F, где D - количество документов, а F - количество терминов. Без проблем.
Но как мне найти оценку TF-IDF определенного термина в документе? т.е. есть ли какой-то словарь между терминами (в их текстовом представлении) и их положением в результирующей разреженной матрице?