Изучение движков фильтров

Существуют ли какие-либо «интеллектуальные» или «обучающиеся» движки, способные идентифицировать «злые» фразы в текстах (может быть, что-то вроде обучающегося спам-фильтра... например, используемого в Thunderbird?)

Например, если я хочу фильтровать тексты с почтовыми адресами:

asdasd asd as d dgfdgfdgfdg sadasd(at)asfsdf.com

Сначала инструмент не распознал бы это как адрес электронной почты ... но если пользователь «обучил» (например, нажал кнопку «текст содержит почтовый адрес») инструмент несколько раз, этот текст, который содержит такие фразы, как «xxxxx( at)xxxxx.xx" подозрительно, он "узнает", что должен автоматически помечать этот текст в будущем...

Вопрос: Есть ли что-то подобное на рынке? Я нашел некоторые библиотеки (например, SpamAssasin и т. д.), но они «специализировались» на электронных письмах...


person David    schedule 02.12.2009    source источник


Ответы (2)



Да, это хорошее начало: http://nbayes.codeplex.com/ ( C# реализация байесовский алгоритм)

person David    schedule 02.12.2009