sklearn.feature_extraction.text.CountVectorizer Расчет вручную

Как сделать ручной расчет CountVectorizer из scikit-learn? Или любой источник, который может мне помочь.


person em Fadlizi    schedule 13.07.2018    source источник
comment
CountVectorizer просто подсчитывает количество слов в документах и ​​больше ничего. Вы проверили документацию? Вот мой ответ 1 с шагами и мой ответ 2 с простым примером.   -  person Vivek Kumar    schedule 13.07.2018
comment
о, теперь я понял, большое спасибо, сэр.   -  person em Fadlizi    schedule 13.07.2018
comment
@VivekKumar Похоже, это дубликат. Если это так, пожалуйста, проголосуйте за закрытие как дубликат.   -  person Makyen♦    schedule 13.07.2018


Ответы (1)


Countvectorizer просто подсчитывает частоту каждого слова всего корпуса в заданной строке. пожалуйста, проверьте документы для получения дополнительной информации.

person Ravi    schedule 14.07.2018