Сегодня ICCV 2019 объявила награды за лучшую бумагу в трех категориях. ICCV (Международная конференция IEEE по компьютерному зрению) - это ведущая международная конференция по компьютерному зрению, проводимая два раза в год, включающая в себя основную конференцию и несколько совмещенных семинаров и учебных пособий. ICCV 2019 получил 4 303 документа - более чем в два раза больше, чем было подано на ICCV 2017 - и принял 1075 документов, что составляет примерно 25 процентов.

Премия за лучшую работу (Приз Марра): SinGAN: изучение генеративной модели из единственного естественного изображения

Авторы: Тамар Ротт Шахам и Томер Микаэли из Израильского технологического института и Тали Декель, Google Research.

Аннотация: Мы представляем SinGAN, безусловную генеративную модель, которую можно узнать из одного естественного изображения. Наша модель обучена фиксировать внутреннее распределение пятен в изображении, а затем может генерировать высококачественные разнообразные образцы, которые несут тот же визуальный контент, что и изображение. SinGAN содержит пирамиду полностью сверточных GAN, каждая из которых отвечает за изучение распределения патчей в разном масштабе изображения. Это позволяет генерировать новые образцы произвольного размера и соотношения сторон, которые имеют значительную вариативность, но при этом сохраняют как глобальную структуру, так и тонкие текстуры тренировочного изображения. В отличие от предыдущих схем GAN с одним изображением, наш подход не ограничивается изображениями текстур и не является условным (т.е. он генерирует выборки из шума). Пользовательские исследования подтверждают, что сгенерированные образцы часто принимают за реальные изображения. Мы проиллюстрируем полезность SinGAN в широком спектре задач обработки изображений.

Награда за лучшую студенческую работу: PLMP - Минимальные проблемы в точках для полной видимости в нескольких режимах

Авторы: Тимоти Дафф и Антон Лейкин из математической школы Технологического института Джорджии; Кэтлен Кон (KTH) и Томаш Пайдла CIIRC из Чешского технического университета в Праге

Аннотация: Мы представляем полную классификацию всех минимальных проблем для общего расположения точек и линий, полностью наблюдаемых калиброванными перспективными камерами. Мы показываем, что всего существует всего 30 минимальных задач, не существует проблем для более чем 6 камер, для более чем 5 точек и более чем для 6 строк. Мы представляем последовательность тестов для обнаружения минимальности, начиная с подсчета степеней свободы и заканчивая полной символьной и числовой проверкой репрезентативных примеров. Для всех обнаруженных минимальных проблем мы указываем их алгебраические степени, то есть количество решений, которые измеряют их внутреннюю сложность. Он показывает, как именно возрастает сложность задач с количеством просмотров. Важно отметить, что несколько новых минимальных задач имеют небольшую степень, которая может быть практичной при сопоставлении изображений и трехмерной реконструкции.

Лучшие почетные упоминания в газете

Бумага: Асинхронное однофотонное трехмерное изображение

Авторы: Анант Гупта, Атул Ингл и Мохит Гупта из Университета Висконсин-Мэдисон.

Аннотация: Однофотонные лавинные диоды (SPAD) становятся популярными во время пролета по глубине из-за их уникальной способности захватывать отдельные фотоны с пикосекундным временным разрешением. Однако окружающий свет (например, солнечный свет), падающий на 3D-камеру на основе SPAD, приводит к серьезным нелинейным искажениям (наложению) в измеряемой форме волны, что приводит к большим ошибкам глубины. Мы предлагаем асинхронную однофотонную трехмерную визуализацию, семейство схем сбора данных для уменьшения наложения во время сбора данных. Асинхронный сбор данных приводит к временному смещению окон измерения SPAD, и лазер циклически проходит через детерминистически предопределенные или рандомизированные смещения. Наше ключевое понимание заключается в том, что искажения наложений можно «усреднить» путем выбора последовательности смещений, охватывающих весь диапазон глубин. Мы разрабатываем обобщенную модель формирования изображения и проводим теоретический анализ, чтобы исследовать пространство асинхронных схем сбора и разработки высокопроизводительных схем. Наши симуляции и эксперименты демонстрируют повышение точности глубины на порядок по сравнению с современными технологиями в широком диапазоне сценариев визуализации, включая сценарии с высоким потоком окружающей среды.

Бумага: Определение атрибутов и взаимосвязей объекта при создании интерактивной сцены

Авторы: Орон Ашуал из Тель-Авивского университета и Лиор Вольф из Тель-Авивского университета и Facebook AI Research)

Аннотация: мы представляем метод генерации изображений из входного графа сцены. Метод разделяет внедрение макета и встраивание внешнего вида. Двойное встраивание приводит к сгенерированным изображениям, которые лучше соответствуют графу сцены, имеют более высокое визуальное качество и поддерживают более сложные графы сцены. Кроме того, схема встраивания поддерживает несколько и разнообразных выходных изображений для каждого графа сцены, что может дополнительно контролироваться пользователем. Мы демонстрируем два режима управления объектами: (i) импорт элементов из других изображений и (ii) навигация в пространстве объектов путем выбора архетипа внешнего вида.

ICCV также объявил награды Технического комитета по анализу шаблонов и машинного интеллекта (PAMI TC) за фундаментальный вклад в компьютерное зрение. Премия Гельмгольца присуждается работам CVPR, написанным десять лет назад, которые с тех пор оказали значительное влияние на исследования в области компьютерного зрения. В этом году победителями стали Строим Рим за один день Самира Агарвала, Ноя Снавели, Иана Саймона, Стивена М. Зейтца и Ричарда Селиски из Вашингтонского университета, Корнельского университета и Microsoft Research соответственно; и Классификаторы атрибутов и сходств для проверки лиц Нираджа Кумара, Александра С. Берга, Питера Н. Белхумера и Шри К. Наяра из Колумбийского университета.

Премия PAMI TC Азриэля Розенфельда за заслуги перед жизнью, присуждаемая выдающимся исследователям, внесшим значительный вклад в компьютерное зрение на протяжении долгой карьеры, была присуждена Шимону Ульману, профессору информатики в Институте науки Вейцмана, Израиль, и адъюнкт-профессору отдела мозга Массачусетского технологического института. и когнитивных наук.

Более 7500 человек посетят недельную конференцию ICCV, в которой примут участие 72 экспонента, 60 семинаров и 12 учебных пособий. Список номинаций на лучшую работу, включающий семь работ, не вошедших в финал, был опубликован на сайте ICCV 2019.

Журналист: Юань Юань | Редактор: Майкл Саразен

Мы знаем, что вы не хотите пропустить ни одной истории. Подпишитесь на наш популярный Synced Global AI Weekly , чтобы получать еженедельные обновления AI.

Нужен всесторонний обзор прошлого, настоящего и будущего современных исследований в области искусственного интеллекта? Отчет Тенденции развития технологий искусственного интеллекта вышел!

Вышел Отчет об адаптивности AI для публичной компании Fortune Global 500 за 2018 год!
Приобретите отчет в формате Kindle на Amazon.
Подайте заявку на участие в Партнерской программе Insight, чтобы получить бесплатный полный отчет в формате PDF.