CBIR с функциями, аналогичными SIFT, дискретный и непрерывный подход

в настоящее время я занимаюсь внедрением CBIR-системы для распознавания объектов (детальная классификация объектов), и теперь, поскольку у меня есть несколько работающих детекторов функций и дескрипторов, я пытаюсь найти лучший способ обработки этих функций для задачи на основе контента поиск изображения.

Насколько я знаю, есть два основных направления для этой задачи: дискретный и непрерывный подход. Где дискретные обозначают такие методы, как набор визуальных слов и кодовые книги для построения инвертированных индексов для применения методов, относящихся к текстовому поиску, а непрерывные обозначают такие методы, как поиск наилучшего бина сначала с деревьями k-d и классификацией ближайших соседей.

Таким образом, одно из основных различий между этими двумя подходами заключается в том, что один работает с дополнительным представлением для таких функций, как визуальные слова, а другой работает с n-D функциями, вычисленными из дескриптора.

Теперь мой вопрос: есть ли какое-либо сравнение между двумя методами CBIR, которое могло бы помочь мне найти лучший подход для моей задачи?


person hans    schedule 22.05.2012    source источник


Ответы (1)


Полный ответ на этот вопрос был бы довольно сложным и длинным. но, как правило, непрерывный метод может дать вам более точные результаты, но он медленнее, так как вы можете эффективно построить поисковый индекс, и вам нужно работать с большими дескрипторами.

вам следует рассмотреть комбинацию, которая использует дискретные функции (визуальные слова) для начальных результатов, а затем фильтрует набор результатов, используя непрерывные методы.

person Ophir Yoktan    schedule 20.07.2012
comment
Спасибо за ответ! И все же я полностью с вами согласен. Тем временем я нашел хорошую статью об этом. Для моих нужд непрерывный подход — мой выбор. Для всего остального я использую flann matcher ;-) - person hans; 20.07.2012