Что такое нейронная сеть? : 101 руководство по искусственным нейронным сетям

С развитием машинного обучения искусственный интеллект шагнул далеко вперед. Глубокое обучение считается самой передовой технологией, созданной для решения сложных проблем с использованием массивных наборов данных. Этот блог о том, что такое нейронные сети, познакомит вас с основными концепциями нейронных сетей и тем, как они могут решать сложные задачи, связанные с данными.

Вот список тем, которые будут рассмотрены в этом блоге:

Что такое нейронная сеть?
Что такое глубокое обучение?
Разница между AI, ML и DL
Потребность в глубоком обучении
Пример использования глубокого обучения
Как работают нейронные сети?
Нейронная сеть на примере

Простое определение нейронной сети

Нейронная сеть, созданная по образцу человеческого мозга, имитирует функции человеческого мозга. Человеческий мозг представляет собой нейронную сеть, состоящую из нескольких нейронов, аналогично искусственная нейронная сеть (ИНС) состоит из нескольких перцептронов (поясняется позже).

Нейронная сеть состоит из трех важных слоев:

Входной уровень: Как следует из названия, этот уровень принимает все входные данные, предоставленные программистом.
Скрытый слой: между входным и выходным слоями находится набор слоев, известных как скрытые слои. На этом уровне выполняются вычисления, в результате которых получается результат.
Выходной уровень: входные данные проходят серию преобразований через скрытый слой, что в конечном итоге приводит к выходу, который доставляется через этот уровень.

Прежде чем мы углубимся в принцип работы нейронной сети, давайте разберемся, что такое глубокое обучение.

Что такое глубокое обучение?

Глубокое обучение - это продвинутая область машинного обучения, в которой используются концепции нейронных сетей для решения высокопроизводительных сценариев использования, которые включают анализ многомерных данных. Он автоматизирует процесс извлечения признаков, гарантируя минимальное вмешательство человека.

Так что же такое глубокое обучение?

Глубокое обучение - это расширенная область машинного обучения, в которой используются алгоритмы, основанные на структуре и функциях мозга, которые называются искусственными нейронными сетями.

Разница между AI, ML и DL (искусственный интеллект, машинное обучение и глубокое обучение)

Люди часто думают, что искусственный интеллект, машинное обучение и глубокое обучение - это одно и то же, поскольку у них есть общие приложения. Например, Siri - это приложение для искусственного интеллекта, машинного обучения и глубокого обучения.

Так как же связаны эти технологии?

Искусственный интеллект - это наука о том, как заставить машины имитировать поведение людей.
Машинное обучение - это разновидность искусственного интеллекта (ИИ), цель которой - заставить машины принимать решения путем передачи им данных.
Глубокое обучение - это разновидность машинного обучения, в которой для решения сложных проблем используется концепция нейронных сетей.

Подводя итог, ИИ, машинное обучение и глубокое обучение - взаимосвязанные области. Машинное обучение и глубокое обучение помогают искусственному интеллекту, предоставляя набор алгоритмов и нейронных сетей для решения проблем, связанных с данными.

Теперь, когда вы знакомы с основами, давайте разберемся, что привело к необходимости глубокого обучения.

Потребность в глубоком обучении: ограничения традиционных алгоритмов и методов машинного обучения

Машинное обучение стало крупным прорывом в техническом мире, оно привело к автоматизации монотонных и трудоемких задач, помогло в решении сложных проблем и принятии более разумных решений. Однако в машинном обучении было несколько недостатков, которые привели к появлению глубокого обучения.

Вот некоторые ограничения машинного обучения:

Невозможно обработать многомерные данные. Машинное обучение может обрабатывать только небольшие размеры данных, которые содержат небольшой набор переменных. Если вы хотите анализировать данные, содержащие сотни переменных, машинное обучение использовать нельзя.
Разработка функций выполняется вручную. Рассмотрим вариант использования, когда у вас есть 100 переменных-предикторов, и вам нужно сузить круг только до значимых. Для этого вам нужно вручную изучить взаимосвязь между каждой из переменных и выяснить, какие из них важны для прогнозирования результатов. Эта задача чрезвычайно утомительна и требует много времени для разработчика.
Не идеально для выполнения обнаружения объектов и обработки изображений. Поскольку для обнаружения объектов требуются данные большого размера, машинное обучение нельзя использовать для обработки наборов данных изображений, оно идеально подходит только для наборов данных с ограниченным числом функций. .

Прежде чем мы углубимся в нейронные сети, давайте рассмотрим реальный вариант использования, в котором реализовано глубокое обучение.

Пример использования глубокого обучения / приложения

Знаете ли вы, что PayPal обрабатывает платежи на сумму более 235 миллиардов долларов в результате четырех миллиардов транзакций своих более чем 170 миллионов клиентов? Он использует этот огромный объем данных для выявления возможных мошеннических действий среди других причин.

С помощью алгоритмов глубокого обучения PayPal собирал данные из истории покупок своих клиентов в дополнение к изучению шаблонов вероятного мошенничества, хранящимся в его базах данных, чтобы предсказать, является ли конкретная транзакция мошеннической или нет.

Компания полагается на технологии глубокого обучения и машинного обучения около 10 лет. Первоначально группа по мониторингу мошенничества использовала простые линейные модели. Но со временем компания перешла на более совершенную технологию машинного обучения под названием Deep Learning.

Ке Ван, менеджер по рискам мошенничества и специалист по данным PayPal, цитирует:

«Что нам нравится в более современном, продвинутом машинном обучении, так это его способность потреблять намного больше данных, обрабатывать слои и уровни абстракции и иметь возможность« видеть »то, что более простая технология не сможет увидеть, даже люди могут не видеть ».

Простая линейная модель способна использовать около 20 переменных. Однако с помощью технологии Deep Learning можно обрабатывать тысячи точек данных. Таким образом, внедрив технологию Deep Learning, PayPal может, наконец, проанализировать миллионы транзакций для выявления любых мошеннических действий.

Теперь давайте углубимся в нейронные сети и разберемся, как они работают.

Как работает нейронная сеть?

Чтобы понять нейронные сети, нам нужно разбить их и понять самую базовую единицу нейронной сети, то есть персептрон.

Что такое перцептрон?

Персептрон - это однослойная нейронная сеть, которая используется для классификации линейных данных. Он состоит из 4 важных компонентов:

Входы
Вес и смещение
Функция суммирования
Функция активации или трансформации

Основная логика персептрона следующая:

Входные данные (x), полученные от входного слоя, умножаются на их присвоенные веса w. Затем умноженные значения складываются для формирования взвешенной суммы. Затем взвешенная сумма входов и их соответствующие веса применяются к соответствующей функции активации. Функция активации сопоставляет вход с соответствующим выходом.

Веса и смещения в глубоком обучении

Почему мы должны назначать веса каждому входу?

После того, как входная переменная подается в сеть, в качестве веса этого входа назначается случайно выбранное значение. Вес каждой точки входных данных указывает, насколько важны эти входные данные для прогнозирования результата.

С другой стороны, параметр смещения позволяет настроить кривую функции активации таким образом, чтобы получить точный выходной сигнал.

Функция суммирования

Как только входам присваивается некоторый вес, берется произведение соответствующих входных данных и веса. Сложение всех этих продуктов дает нам взвешенную сумму. Это делается функцией суммирования.

Функция активации

Основная цель функций активации - отобразить взвешенную сумму на выходе. Функции активации, такие как tanh, ReLU, sigmoid и т. Д., Являются примерами функций преобразования.

Прежде чем мы завершим этот блог, давайте рассмотрим простой пример, чтобы понять, как работает нейронная сеть.

Нейронные сети на примере

Рассмотрим сценарий, в котором вы должны построить искусственную нейронную сеть (ИНС), которая классифицирует изображения на два класса:

Класс A: содержит изображения нездоровых листьев.
Класс B: содержит изображения больных листьев.

Итак, как создать нейронную сеть, которая классифицирует листья на больные и здоровые культуры?

Процесс всегда начинается с обработки и преобразования ввода таким образом, чтобы его можно было легко обработать. В нашем случае каждое изображение листа будет разбито на пиксели в зависимости от размера изображения.

Например, если изображение состоит из 30 на 30 пикселей, то общее количество пикселей будет 900. Эти пиксели представлены в виде матриц, которые затем передаются на входной уровень нейронной сети.

Точно так же, как в нашем мозгу есть нейроны, которые помогают создавать и связывать мысли, в ИНС есть перцептроны, которые принимают входные данные и обрабатывают их, передавая их из входного слоя в скрытый и, наконец, выходной.

Когда входные данные передаются от входного слоя к скрытому слою, каждому входу присваивается начальный случайный вес. Затем входные данные умножаются на их соответствующие веса, и их сумма отправляется в качестве входных данных на следующий скрытый слой.

Здесь каждому перцептрону присваивается числовое значение, называемое смещением, которое связано с весом каждого входа. Кроме того, каждый перцептрон проходит через функцию активации или преобразования, которая определяет, активируется ли конкретный перцептрон или нет.

Активированный перцептрон используется для передачи данных на следующий уровень. Таким образом, данные распространяются (прямое распространение) через нейронную сеть, пока перцептроны не достигнут выходного слоя.

На выходном уровне выводится вероятность, которая определяет, принадлежат ли данные классу A или классу B.

Звучит просто, не правда ли? Что ж, концепция, лежащая в основе нейронных сетей, основана исключительно на функционировании человеческого мозга. Вам необходимы глубокие знания различных математических концепций и алгоритмов.

Обязательно обратите внимание на другие статьи в этой серии, которые объяснят различные другие аспекты глубокого обучения.

1. Учебное пособие по TensorFlow

2. Учебное пособие по PyTorch

3. Алгоритм обучения персептрона.

4. Учебник по нейронной сети

5. Что такое обратное распространение?

6. Сверточные нейронные сети

7. Капсульные нейронные сети

8. Рекуррентные нейронные сети

9. Учебник по автоэнкодерам

10. Ограниченное руководство по машине Больцмана

11. PyTorch против TensorFlow

12. Глубокое обучение с помощью Python

13. Учебник по искусственному интеллекту

14. Классификация изображений TensorFlow

15. Приложения искусственного интеллекта

16. Как стать инженером по искусственному интеллекту?

17. Q Learning

18. Априорный алгоритм.

19. Цепи Маркова с Python

20. Алгоритмы искусственного интеллекта

21. Лучшие ноутбуки для машинного обучения

22. 12 лучших инструментов искусственного интеллекта

23. Вопросы на собеседовании по искусственному интеллекту (ИИ)

24. Теано против TensorFlow

25. Обнаружение объектов в TensorFlow

26. Распознавание образов.

27. Альфа-бета-обрезка в искусственном интеллекте

Первоначально опубликовано на https://www.edureka.co 28 августа 2019 г.