Я работаю в ИР.
Может ли кто-нибудь помочь мне, как реализовать языковую модель в Whoosh
. Я уже Применял TD-IDF и BM25. Я новичок в ИР.
Например, простейшая форма языковой модели просто отбрасывает весь обусловливающий контекст и оценивает каждый термин независимо. Такая модель называется моделью языка униграмм:
P_{uni}(t_1t_2t_3t_4) = P(t_1)P(t_2)P(t_3)P(t_4)
Существует много более сложных типов языковых моделей, таких как языковые модели биграмм, которые обуславливают предыдущий термин,
P_{bi}(t_1t_2t_3t_4) = P(t_1)P(t_2\vert t_1)P(t_3\vert t_2)P(t_4\vert t_3)