Отслеживание — это классическая проблема компьютерного зрения, которой до сих пор посвящены исследования в компьютерных науках; вы можете быстро получить представление о состоянии дел в этой области, проверив список принятых документов на CVPR 2010 (ежегодной крупнейшей конференции по компьютерному зрению), и вы увидеть, что по этой теме все еще публикуется активная работа (ищите слово «отслеживание» в списке).
Стандартный конвейер обработки решения проблемы отслеживания работает следующим образом. Сначала изображение анализируется для извлечения значимых дескрипторов, которые охватывают соответствующие углы и другие характерные особенности изображения. Эти дескрипторы позже передаются онлайн-классификатору, который обучен обнаруживать вероятные экземпляры интересующего вас объекта в каждом кадре. Дескриптор вашего объекта может быть известен априори (т. е. вычислен в автономном режиме) из предыдущих примеров того, как выглядит объект, но обычно он обновляется в каждом кадре в соответствии с тем, что система видит с течением времени, чтобы сделать обнаружение адаптивным. к динамическому виду объекта. Наконец, чтобы выбрать из пула возможных кандидатов в каждом кадре (из тех, которые были обнаружены), такие параметры, как положение и скорость ваших объектов, оцениваются по отношению к предыдущим кадрам с использованием последовательного статистическая модель.
Существует обширная литература по компьютерному зрению о хороших дескрипторах изображений, но одними из самых популярных являются SIFT, SURF или HOG. Для классификации наиболее успешными являются два метода: машины опорных векторов или группы классификации (например, ускорение или случайные леса), а для части оценки большинство людей по-прежнему используют фильтры Калмана (это разновидность последовательных марковская модель), фильтры частиц или, в более общем плане, модели оценки плотности.
Конкретный случай, который вы описали, немного проще, чем более общая и сложная проблема отслеживания объекта с произвольной камерой и движением объекта в естественных наружных сценах, поэтому вы можете найти код в Интернете, который может работать сразу в ваших условиях, но Я сомневаюсь в этом. Как отмечали другие (насколько мне известно), не существует стандартной библиотеки, которая сразу работала бы со всеми видами объектов, фонов и движущихся пространств. Тем не менее, вы, вероятно, можете найти код для отдельных компонентов стандартного общего конвейера, описанного выше (классификаторы, банки фильтров/функций, марковские модели оценки) в Интернете.
Мое предложение: если вы заинтересованы в создании хорошей системы (т. е. такой, которая действительно работает), посмотрите веб-сайты авторов самых последних статей на ведущих ежегодных конференциях по компьютерному зрению, таких как CVPR, ICCV, ECCV и SIGGRAPH. У них, как правило, есть онлайн-код для их последней работы с некоторыми видео-примерами, и это может помочь вам понять, как их методы работают в реальных условиях.
person
Community
schedule
15.01.2011