Анализ английских текстовых предложений для обнаружения рифм в PHP

Я не уверен, возможно ли это, но есть ли способ (предварительно написанная библиотека или известная схема научного обнаружения) проанализировать несколько предложений текста и определить, рифмуются ли предложения? Коллега предложил сравнить первое и последнее слово и использовать тезаурус, но я не совсем понимаю, как это будет работать.

Высокая точность - это не то, к чему я стремлюсь, точность даже 20% была бы потрясающей, это для бесполезной идеи небольшого веб-приложения. У меня нет ничего важного, просто подумал, что это было бы круто.

Я готов попробовать другие языки, возможно, даже Python, который, как я слышал, отлично подходит для анализа текста, но PHP был бы предпочтительнее.


person Dwayne Charrington    schedule 13.04.2012    source источник
comment
Извините, Хакре, да, только для английского текста.   -  person Dwayne Charrington    schedule 13.04.2012


Ответы (1)


Метафон http://www.php.net/manual/en/function.metaphone.php

Вы можете классифицировать ввод по фонетике (звукам), а затем проверить, часто ли появляется один и тот же звук. Поскольку каждый из них должен совпадать со слогами, вы можете рассчитать расстояние Левенштейна (посчитать слоги между совпадениями), чтобы увидеть, соответствуют ли они какому-то известному шаблону, т.е. хайку.

http://www.php.net/manual/en/function.levenshtein.php

http://php.net/manual/en/function.soundex.php

person msigman    schedule 13.04.2012
comment
Вау просто вау. Я даже не знал, что такие функции существуют в PHP. Я думаю, что вы на что-то здесь. Учитывая, что в основе рифмы лежат похожие по звучанию слова, комбинация этих трех функций действительно обеспечивает очень высокую точность определения рифмы. - person Dwayne Charrington; 13.04.2012
comment
@Dwayne: Оставьте ссылку здесь, если у вас что-то заработает, даже если это что-то только в песочнице. - person hakre; 13.04.2012
comment
Не беспокойся, Хакре, я планировал это. Для него уже куплено доменное имя. Я пытаюсь создать 1-часовое приложение раз в неделю в качестве упражнения для разработки, чтобы помочь вырваться из ежедневной рутинной работы. Надеюсь, получится, может быть весело. Идея состоит в том, чтобы генерировать рифмы на основе твитов в Твиттере. - person Dwayne Charrington; 13.04.2012
comment
@Dwayne Мне было бы очень интересно посмотреть, что ты придумаешь, удачи! - person msigman; 13.04.2012
comment
@DwayneCharrington Есть ли шансы, что ваш проект все еще жив? - person Math; 26.01.2017