Существует ли алгоритм сопоставления строк, похожий на звук, реализованный на голландском языке?

Я знаю об алгоритмах Soundex и Double-Methaphone для "звукоподобного" сопоставления строк на английском языке. Где я могу найти аналогичный алгоритм или порт одного из алгоритмов для голландского языка?


person Paco    schedule 11.11.2009    source источник
comment
Вам повезло (шесть лет спустя)?   -  person Jonas Byström    schedule 08.08.2015


Ответы (1)


Если вам нужен только алгоритм, я бы проверил nltk. Если вы предоставите данные, вы сможете протестировать некоторые из них с помощью FST (преобразователей конечных состояний), созданных Эдвардом Лопером и Стивеном Бердом. Или, возможно, использовать данные из "Alpino Dutch Treebank", который распространяется вместе с nltk.

person Jonas Byström    schedule 11.11.2009