Прогнозирование тем с помощью LDA

Я пытаюсь извлечь тематические задания из подгонки, которую я создаю с помощью пакета R 'lda'. Я создал посадку:

fit <- lda.collapsed.gibbs.sampler(documents = documents, K = K, vocab = vocab, 
    num.iterations = G, alpha = alpha, eta = eta, initial = NULL, 
    burnin = 0, compute.log.likelihood = TRUE)

... и хотел бы извлечь вероятность для каждого задания тема-документ или просто наиболее вероятную тему для каждого документа. С пакетом topicmodel я могу просто позвонить

topics(fit)

чтобы получить это (как в LDA с моделями тем, как я могу узнать, к каким темам относятся разные документы?)

Как я могу получить то же самое с lda?


person Sylvia    schedule 29.09.2015    source источник


Ответы (1)


Я не использовал пакет 'lda' для R, но я использую пакет 'topicmodels' в R. Я создаю lda, подходящую, скажем, для 5 тем, используя

topic.fit ‹- LDA (матрица документов-терминов, 5)

теперь, если вы хотите извлечь вероятность каждого назначения темы-документа, используйте

topic.fit@gamma [1: 5,], гамма содержит матрицу документ-тема

и чтобы получить наиболее подходящую тему, вы можете использовать

most.likely.topic ‹- темы (topic.fit, 1)

Надеюсь, что это ответ на ваш вопрос.

person prateek    schedule 26.10.2015