В каждой ячейке создается фиксированное количество (B) ограничивающих прямоугольников с их оценками достоверности. Оценки достоверности вычисляются путем умножения вероятности каждого объекта и их пересечения на объединение предсказанного блока и наземного блока истинности. Каждый ограничивающий прямоугольник обозначен 5 числами: четверкой (x; y; w; h) и оценкой достоверности прямоугольника. x и y - координаты центра прямоугольника, а w и h - ширина и высота прямоугольника соответственно. Эти четыре числа являются значениями с плавающей запятой относительно абсолютной ширины и высоты изображения, и они могут быть где-то между 0,0 и 1,0. Оценка достоверности указывает на вероятность того, что коробка содержит объект. Каждая ячейка сетки содержит условные вероятности классов для количества различных классов, и, следовательно, для каждой категории объектов существует одна вероятность в каждой ячейке, независимо от значения B. Обратите внимание, что вероятность условного класса означает, что вероятность объект, принадлежащий к определенному классу, обусловлен блоком, содержащим объект. Таким образом, для каждой ячейки сетки есть числа размером B × 5, указывающие информацию об ограничивающем прямоугольнике и вероятности класса C. Эта информация прогнозирования кодируется как тензор в форме (S; S; B × 5 + C).
Как упоминалось в документе:
предсказания кодируются как тензор S × S × (B * 5 + C). Для оценки YOLO на PASCAL VOC мы используем S = 7, B = 2. PASCAL VOC имеет 20 помеченных классов, поэтому C = 20. Наш окончательный прогноз - тензор 7 × 7 × 30.
Поскольку набор данных содержит 20 классов и у вас есть 2 ограничивающих прямоугольника в каждой ячейке, у вас будет: B × 2 + 20 = 2 × 5 + 20 = 30. Эти 20 вероятностей классов, которые могут быть равны 0. В тензоре вы помещаете 5 нулей, поэтому я предполагаю, что у вас есть 5 классов объектов. Итак, в этом случае:
B × 2 + 5 = 9, и если ваше S равно 7 в качестве значения по умолчанию в YOLO, ваш тензор будет иметь длину: 7 × 7 × 9 = 4989. Итак, для каждого ограничивающего прямоугольника у вас есть 9 значений, и все эти векторы длины 9 прикреплены друг к другу. На ваш вопрос вариант A кажется более верным.
Этот рисунок предназначен для YOLOv3, и в вашем случае для каждой ячейки у вас есть 2 ограничивающих прямоугольника и 20 классов (в отличие от рисунка, где есть 5 прямоугольников и 6 классов). Но идея похожая.
person
Hadi GhahremanNezhad
schedule
01.08.2019