Публикации по теме 'batch-normalization'


Обзор статьи: Высокопроизводительное распознавание крупномасштабных изображений без пакетной нормализации
Обучить глубокую сеть очень сложно, так как сети склонны к исчезновению или взрыву градиентов. Эта проблема была решена введением остаточных блоков и пакетной нормализацией. Эти два подхода привели к успешному обучению более глубоких сетей с большей точностью на обучающем и тестовом наборах. Высокопроизводительное крупномасштабное распознавание изображений без пакетной нормализации, авторы Эндрю Брок, Сохам Де, Сэмюэл Л. Смит, Карен Симонян в 2021 году. В этом документе объясняется, как..

Разрушение льда с помощью пакетной нормализации
Что ж, пакетная нормализация всегда витала в воздухе, но у меня не было много возможности опробовать и испытать ее силу до недавнего времени, когда я тренировал 3D-модель CNN, и применение пакетной нормализации уменьшило потери при проверке / тестировании и стабилизировало мою модель, поскольку она было указано в документе нормализации партии. Чтобы понять суть пакетной нормализации, давайте сначала обсудим среднюю нормализацию входных данных. Итак, как указано в литературе, большинство..

Вопросы по теме 'batch-normalization'

Как следует использовать слой BatchNorm в кафе?
Я немного не понимаю, как мне использовать / вставлять слой "BatchNorm" в свои модели. Я вижу несколько разных подходов , например: ResNets : _2 _ + _ 3_ (без разделения параметров) За "BatchNorm" слоем сразу следует "Scale" слой:...
12796 просмотров

Отключить пакетную нормализацию / стандартизацию Keras
Я использую простую модель Кераса для прогнозирования рядов. Я кормлю его входными данными, нормализованными по всей серии. Во время обучения точность прогноза модели кажется правильной. Однако, когда я рисую выходные данные функции...
1257 просмотров

Нормализация партии во время тестирования
Для пакетной нормализации во время тестирования, как рассчитать среднее значение и дисперсию каждого входа активации (в каждом слое и входном измерении)? Нужно ли записывать средние значения и отклонения от обучения, вычислять средние значения и...
11830 просмотров

Как реализован слой BatchNormalization в keras на этапе тестирования?
Недавно я хотел использовать пакетную нормализацию в keras для построения нейронной сети. Как упоминалось в оригинальной статье, пакетная нормализация ведет себя по-разному во время тестирования и обучения. Я проверяю документацию:...
1503 просмотров
schedule 11.10.2022

Tensorflow - Невозможно импортировать замороженный график с помощью batchnorm: неинициализированное значение batch_normalization / moving_mean
Я пытаюсь заморозить в файле pbtxt контрольную точку, содержащую слои batchnorm (tf 1.1.0). Для этого следуйте этим сообщениям и вопросам: https://github.com/davidsandberg/facenet/issues/161...
1267 просмотров
schedule 05.08.2022

Что такое правильная функция нормализации пакетов в Tensorflow?
В tensorflow 1.4 я нашел две функции, которые выполняют пакетную нормализацию, и они выглядят одинаково: tf.layers.batch_normalization ( ссылка ) tf.contrib.layers.batch_norm ( ссылка ) Какую функцию следует использовать? Какой из них...
16983 просмотров

Tensorflow и Batch Normalization with Batch Size == 1 = ›Выводит все нули
У меня вопрос о понимании BatchNorm (позже BN). У меня хорошо работает свертка, я писал тесты для проверки формы и диапазона выходных данных. И я заметил, что когда я устанавливаю batch_size = 1, моя модель выводит нули (логиты и активации). Я...
7642 просмотров

Соглашение об импульсе BatchNorm PyTorch
Правильно ли соглашение об импульсе батчнорма (по умолчанию = 0.1) как и в других библиотеках, например Tensorflow вроде обычно 0,9 или 0,99 по умолчанию? Или, может быть, мы просто используем другое соглашение?
4725 просмотров

Как использовать tf.layers.batch_normalization во время тестирования? Как справиться с движущейся дисперсией и средним значением?
Я пытаюсь реализовать пакетную нормализацию в тензорном потоке, используя tf.layers.batch_normalization. Алгоритм отлично работает для обучения, но не работает при тестировании, я много искал на веб-сайтах, но не мог понять ошибку, так как я новичок...
777 просмотров
schedule 13.10.2022

Почему уровень пакетной нормализации следует за уровнем масштабирования в кафе?
Я заметил, что уровень пакетной нормализации следует за уровнем масштабирования в мобильной сети. Кажется, слой BN и слой масштабирования представляют собой пару. И слой свертки + слой BN + слой масштабирования + слой ReLU работают хорошо. Так что же...
618 просмотров

Где применить пакетную нормализацию
У меня есть входные данные, и я передаю их через скрытый слой. Я хотел спросить, где мне применить пакетную нормализацию? Ниже представлена ​​архитектура модели: def function(self, data): hidden_layer = F.relu((self.layer1(data))) pred =...
126 просмотров

Различия между подгонкой и оценкой в ​​керасе
Я использовал 100000 образцов для обучения общей модели в Keras и достижения хорошей производительности. Затем для конкретной выборки я хочу использовать обученные веса в качестве инициализации и продолжить оптимизацию весов для дальнейшей...
689 просмотров

тонкая настройка с пакетной нормализацией в keras
Я успешно обучил модель более 100000 образцов, которая хорошо работает как в наборе поездов, так и на тестовом наборе. Затем я попытался точно настроить его для одной конкретной выборки (одной из 100000 выборок) и использовать обученные веса в...
3598 просмотров

Слой Keras BatchNorm дает странные результаты во время обучения и вывода
У меня проблема с Keras, где функция оценки дает другое значение потерь при обучении (намного выше) и точность (намного ниже) по сравнению со значением, которое я получаю во время обучения. Я знаю, что этот вопрос уже задавался в нескольких местах (...
1041 просмотров

Keras BatchNormalization работает только для постоянного затемнения партии, когда ось = 0?
В следующем коде показан один способ, который работает, а другой — нет. BatchNorm на оси = 0 не должен зависеть от размера партии, а если и зависит, то это должно быть явно указано в документах. In [118]: tf.__version__ Out[118]: '2.0.0-beta1'...
153 просмотров

Проблема с обновлением running_mean и running_var в пользовательском Batchnorm, встроенном в Pytorch?
Я пытался реализовать настраиваемую функцию пакетной нормализации, чтобы ее можно было расширить до версии с несколькими графическими процессорами, в частности до модуля DataParallel в Pytorch. Пользовательский батчнорм работает нормально при...
1123 просмотров