Как рассчитать startProbabilitise в скрытой марковской модели для POS-тегов? это означает: (# повторений одного тега)/(# повторений всех тегов)? или (количество предложений, начинающихся с одного тега)/(все предложения)? если нет, то что?
startProbability в скрытых марковских моделях
Ответы (1)
Учитывая HMM второго порядка, оценка максимального правдоподобия дает:
P(SomeTag | <BOS>,<BOS>) = count(<BOS>,<BOS>,SomeTag) / count(<BOS>,<BOS>)
Это соответствует вашему второму предложению:
(количество предложений, начинающихся с одного тега)/(все предложения)
person
Pierre
schedule
23.06.2014