Я пытаюсь найти сходство между двумя словами (например, «дом» и «дом») с помощью lesk.
Я выполнил демонстрационный код для поиска значения lesk, заданного здесь, и я также нашел значение, используя онлайн-демонстрацию ws4j здесь
Оба они дают разные значения, т.е.
Значения при выполнении демонстрационного кода, приведенного в ws4j:
WuPalmer = 0,4
JiangConrath = 0,08467941109843881
LeacockChodorow = 1,1349799328389845
Lin = 0,1652854610118411636
Path Resnik = 0,11111636 1111636 1111636
= 0,1111111111111111
Lesk = 0,0
HirstStOnge = 0,0
Значения из онлайн-демонстрации:
wup( home#n#8 , house#n#10 ) = 1,0000
jcn( home#n#8 , house#n#10 ) = 12876699,5
lch( дом#n#8 , дом#n#10 ) = 3,6889
lin( дом#n#8 , дом#n#10 ) = 1,0000
res( дом#v# 1 , дом#v#2 ) = 9,0735
путь( дом#n#8 , дом#n#10 ) = 1,0000
lesk( дом#n#8 , дом#n#10 ) = 1571
hso( дом#n#8 , дом#n#10 ) = 16
Почему такая огромная разница между этими двумя, когда они оба используют один и тот же ws4j ?? Есть ли проблемы с демо-кодом ??