Я работаю над проектом, в котором пользователь добавляет некоторый текст в базу данных, а при сохранении также добавляет теги к своей записи, чтобы другие могли искать, используя эти теги.
ПРИМЕР:
ТЕКСТ: «Следующая гонка Формулы-1 пройдет в Испании»
ТЭГИ: "Формула-1", "гонка", Испания
если какой-либо пользователь будет искать эти теги, он получит эту запись в результатах.
Но я хочу, чтобы пользователи, которые ищут «Спорт», «Автоспорт» или «Европа», также получили эту запись, хотя эти теги не были явно помечены в записи, но связаны, потому что «Формула 1» является типом «Автоспорт». ", что является типом "Спорт", а "Испания" находится в "Европе".
На данный момент в моей форме отправки пользователи пишут свой текст в одном текстовом поле, а затем пишут свои теги во втором текстовом поле ниже и отправляют.
эти теги позже классифицируются администратором вручную. Таким образом, в приведенном выше случае администратор вручную поместит «Испанию» в качестве дочернего элемента «Европа». (Столбец иерархии MS SQL Server)
Я думаю, что это может быть достигнуто с помощью некоторого программного обеспечения Ontologies. dotNetRdf, OWL... но не уверен. Я просто узнаю об этой стороне мира несколько дней назад, и я не уверен, как это может мне помочь. Это решение, или я ищу совершенно не то? Любые предложения для достижения вышеизложенного?
Кроме того, перед категоризацией я хотел бы автоматически выбирать теги из текста и заполнять нижнее текстовое поле как теги.
Думаю, для этого мне придется использовать какой-нибудь сервис НЛП? Есть идеи, какой из них использовать, или любое другое предложение?