Я работаю над проектом, который пытается использовать контекстно-свободные грамматики для анализа изображений. Мы пытаемся построить деревья сегментов изображений, а затем использовать машинное обучение для анализа изображений с использованием этих визуальных грамматик.
Я нашел SVM-CFG, который выглядит идеально, проблема в том, что он предназначен для синтаксического анализа строки, где каждый терминал в строке имеет не более двух соседей (слова до и после). В нашей визуальной грамматике каждый сегмент может находиться рядом с произвольным количеством других сегментов.
Каков наилучший способ анализа этих визуальных грамматик? В частности, могу ли я кодировать свои данные для использования SVM-CFG? Или мне придется написать свою собственную библиотеку ядра/парсинга?