startProbability в скрытых марковских моделях

Как рассчитать startProbabilitise в скрытой марковской модели для POS-тегов? это означает: (# повторений одного тега)/(# повторений всех тегов)? или (количество предложений, начинающихся с одного тега)/(все предложения)? если нет, то что?


person Hamed    schedule 23.06.2014    source источник


Ответы (1)


Учитывая HMM второго порядка, оценка максимального правдоподобия дает:

P(SomeTag | <BOS>,<BOS>) = count(<BOS>,<BOS>,SomeTag) / count(<BOS>,<BOS>)

Это соответствует вашему второму предложению:

(количество предложений, начинающихся с одного тега)/(все предложения)

person Pierre    schedule 23.06.2014