Нейронные сети состоят из связанных узлов (нейронов), через которые проходят данные. Узел объединяет данные, отправленные ему от других узлов, а затем выводит объединенные данные на узлы дальше по нейронной сети. Узлы содержатся в слоях. Нейронные сети имеют входной слой (наши функции) и выходной слой (наши метки). Нейронные сети отличаются тем, что находится между входным и выходным слоями — скрытыми слоями.
Существует 3 основных класса (типа) нейронной сети.
- Си-Эн-Эн
- РНН
- ГАН
CNN (Сверточные нейронные сети)
Сверточные нейронные сети (CNN) представляют собой класс глубоких нейронных сетей, в основном используемых в приложениях компьютерного зрения и обработки изображений.
Convolutional относится к данным предварительной обработки сети для вас. Эту задачу традиционно программировали специалисты по данным. Нейронная сеть может научиться выполнять предварительную обработку, применяя фильтры для таких вещей, как обнаружение границ.
Softmax — это функция активации, используемая в нейронных сетях. CNN обычно используют softmax на последних уровнях модели классификации, потому что softmax выводит вероятности для нескольких классов. Это оказалось весьма успешным для мультиклассовых классификаций с использованием CNN и других глубоких нейронных сетей.
Пример, где мы можем использовать CNN
- Распознавание лиц на изображении и видео
- Обнаружение объектов на изображении и видео
- Обнаружение речи
RNN (рекуррентная нейронная сеть)
Некоторые проблемы могут потребовать от нас просмотра последних данных, чтобы помочь в проведении текущего анализа — например, анализ связанного почерка.
Рекуррентная нейронная сеть (RNN) — это класс нейронной сети, который превосходен, когда ваши данные можно рассматривать как последовательность — например, текст, музыку, распознавание речи, связанный почерк или данные за период времени.
RNN может анализировать или предсказывать слово на основе предыдущих слов в предложении — они позволяют установить связь между предыдущей информацией и текущей информацией. Это нейронные сети с циклами, позволяющие временно сохранять данные для последующего анализа.
RNN содержат ячейки, в которых может храниться дополнительное состояние. Это полезно, потому что RNN может запоминать важную информацию, используемую для прогнозов, например прошедшее время. Если в начале предложения пользователь написал «Мы собирались», RNN может вспомнить, что слово were стоит в прошедшем времени внутри единицы, поэтому может вывести «Мы собирались лететь в Канаду» вместо « Мы собирались лететь в Канаду».
Стандартные RNN испытывают трудности, когда существует большой разрыв между релевантными предыдущими данными и текущими данными. Для решения этой проблемы практикующие специалисты по ИИ обычно используют два похожих типа RNN — сети с долговременной кратковременной памятью (LSTM) и сети с повторяющимися блоками (GRU).
- Анализ текста
- НЛП
- Музыкальный анализ
- Обнаружение речи
- Языковой перевод
Есть 2 подкласса RNN
- ЛСТМ
2. ГРУ
Я добавлю больше контента в Часть-1. Часть-2 мы будем запускать привет мир.