Руководство для начинающих по нейронным сетям, часть 1

Нейронные сети состоят из связанных узлов (нейронов), через которые проходят данные. Узел объединяет данные, отправленные ему от других узлов, а затем выводит объединенные данные на узлы дальше по нейронной сети. Узлы содержатся в слоях. Нейронные сети имеют входной слой (наши функции) и выходной слой (наши метки). Нейронные сети отличаются тем, что находится между входным и выходным слоями — скрытыми слоями.

Существует 3 основных класса (типа) нейронной сети.

Си-Эн-Эн
РНН
ГАН

CNN (Сверточные нейронные сети)

Сверточные нейронные сети (CNN) представляют собой класс глубоких нейронных сетей, в основном используемых в приложениях компьютерного зрения и обработки изображений.

Convolutional относится к данным предварительной обработки сети для вас. Эту задачу традиционно программировали специалисты по данным. Нейронная сеть может научиться выполнять предварительную обработку, применяя фильтры для таких вещей, как обнаружение границ.

Softmax — это функция активации, используемая в нейронных сетях. CNN обычно используют softmax на последних уровнях модели классификации, потому что softmax выводит вероятности для нескольких классов. Это оказалось весьма успешным для мультиклассовых классификаций с использованием CNN и других глубоких нейронных сетей.

Пример, где мы можем использовать CNN

Распознавание лиц на изображении и видео
Обнаружение объектов на изображении и видео
Обнаружение речи

RNN (рекуррентная нейронная сеть)

Некоторые проблемы могут потребовать от нас просмотра последних данных, чтобы помочь в проведении текущего анализа — например, анализ связанного почерка.

Рекуррентная нейронная сеть (RNN) — это класс нейронной сети, который превосходен, когда ваши данные можно рассматривать как последовательность — например, текст, музыку, распознавание речи, связанный почерк или данные за период времени.

RNN может анализировать или предсказывать слово на основе предыдущих слов в предложении — они позволяют установить связь между предыдущей информацией и текущей информацией. Это нейронные сети с циклами, позволяющие временно сохранять данные для последующего анализа.

RNN содержат ячейки, в которых может храниться дополнительное состояние. Это полезно, потому что RNN может запоминать важную информацию, используемую для прогнозов, например прошедшее время. Если в начале предложения пользователь написал «Мы собирались», RNN может вспомнить, что слово were стоит в прошедшем времени внутри единицы, поэтому может вывести «Мы собирались лететь в Канаду» вместо « Мы собирались лететь в Канаду».

Стандартные RNN испытывают трудности, когда существует большой разрыв между релевантными предыдущими данными и текущими данными. Для решения этой проблемы практикующие специалисты по ИИ обычно используют два похожих типа RNN — сети с долговременной кратковременной памятью (LSTM) и сети с повторяющимися блоками (GRU).

Анализ текста
НЛП
Музыкальный анализ
Обнаружение речи
Языковой перевод

Есть 2 подкласса RNN

ЛСТМ

2. ГРУ

Я добавлю больше контента в Часть-1. Часть-2 мы будем запускать привет мир.

Руководство для начинающих по нейронным сетям, часть 1

CNN (Сверточные нейронные сети)

RNN (рекуррентная нейронная сеть)

Похожие вопросы