У меня есть набор простых жестких 3D-объектов, которые я хочу обнаружить и распознать по изображению (скажем, от 5 до 10 классов). Объекты просты в том смысле, что они представляют собой цилиндры одного цвета или прямоугольники с простым узором (например, полосы) или какую-либо аналогичную простую форму. Объекты существенно отличаются друг от друга (например, нет двух классов, где один представляет собой большой цилиндр, а другой такой же, но меньший цилиндр). Поскольку текстуры довольно просты (сплошные тела и/или простые узоры), подход «мешок слов» не работает (они не содержат значительного количества уникальных ребер).
Хотя одним из возможных подходов является ручное кодирование каждого классификатора (ручное извлечение признаков и т. д.), существует ли простой подход, основанный на данных (например, классификатор Хаара/LBP), который будет работать? Если Хаар или LBP хороши для решения этой проблемы, как можно решить проблему неизвестной относительной точки зрения (и таким искажением перспективы, вращением и т. д.)? Сойдется ли просто предоставление положительных изображений со всех возможных точек зрения на объект или есть что-то еще, что обычно делается? Обнаружение и распознавание должны работать в режиме реального времени.