в настоящее время я занимаюсь внедрением CBIR-системы для распознавания объектов (детальная классификация объектов), и теперь, поскольку у меня есть несколько работающих детекторов функций и дескрипторов, я пытаюсь найти лучший способ обработки этих функций для задачи на основе контента поиск изображения.
Насколько я знаю, есть два основных направления для этой задачи: дискретный и непрерывный подход. Где дискретные обозначают такие методы, как набор визуальных слов и кодовые книги для построения инвертированных индексов для применения методов, относящихся к текстовому поиску, а непрерывные обозначают такие методы, как поиск наилучшего бина сначала с деревьями k-d и классификацией ближайших соседей.
Таким образом, одно из основных различий между этими двумя подходами заключается в том, что один работает с дополнительным представлением для таких функций, как визуальные слова, а другой работает с n-D функциями, вычисленными из дескриптора.
Теперь мой вопрос: есть ли какое-либо сравнение между двумя методами CBIR, которое могло бы помочь мне найти лучший подход для моей задачи?