Пришедшее из биологических наук слово «онтология» представляет собой очень простую идею, но определяется другими менее часто используемыми словами.
формальное представление знаний набором понятий в предметной области и отношениями между этими понятиями
- Представление знания или модель
- Домен или тема
- Набор понятий или вещей в предметной области
- Набор отношений между понятиями
Итак, с точки зрения информатики, это граф, в котором узлы соответствуют вещам, которые являются частью одной и той же темы, аннотированы данными, относящимися к теме, и связаны с другими узлами ребрами, аннотированными отношениями.
Поскольку эта модель плохо вписывается в реляционные базы данных, если вы собираетесь хранить онтологию, вы можете использовать базу данных графов или один из популярных методов хранения графов реляционных баз данных.
Основная причина, по которой онтологизация не превзошла реляционные базы данных во всех аспектах, заключается в том, что реляционные базы данных предоставляют простые, хотя и менее гибкие, средства соединения двух элементов — внешнего ключа. Хотя этот ключ не позволяет использовать большое количество аннотаций для описания отношений, он ограничивает количество подходов к структурированию данных, не позволяя людям создавать любые виды отношений (что, к счастью, означает ограничение количества расточительных отношений).
Например, в базе данных генеалогического древа на основе онтологий
- Домен — это одно семейное дерево
- Модель - это люди и их отношения в генеалогическом древе.
- Понятия - это люди в семье.
- Отношения были бы ребрами, указывающими на мать, отца, докучницу, сестру и т. д.
Обратите внимание, что теперь начинается сложная часть. У тебя есть мать и отец, а как насчет родителей? Если вы опустите parent, ваша логика поиска будет более сложной, поэтому давайте добавим новую родительскую связь, что означает, что мать человека теперь имеет две связи, мать и родитель (как и отец).
А дедушка? Опять же, это логически оставляет часть информации вне базы данных, но ее хранение увеличивает накладные расходы на обслуживание базы данных.
дядя, тетя, зять, тесть и т. д. — все добавляют одно новое отношение, и сила онтологий заключается в том, что вы не ограничены в отношении того, какие виды отношений вы хотите добавить; однако трудности заключаются в знании того, какие отношения напрямую влияют на решение (и общее отсутствие производительности, если вы не сохраняете отношения напрямую, поскольку вам нужно выполнить несколько поисков в базе данных, чтобы найти составное отношение).
person
Edwin Buck
schedule
24.08.2020