Французский исследователь искусственного интеллекта Янн ЛеКун однажды сказал: Сможем ли мы использовать новые методы для создания интеллекта человеческого уровня, вероятно, нам предстоит взобраться еще на 50 гор, включая те, которые мы пока даже не видим. Мы поднялись только на первую гору. [1]

ИИ сегодня — это инженерная дисциплина, основанная на неполной фрагментарной науке. Настоящий ИИ станет возможен после гораздо более глубокого понимания мозга. Не нужно реконструировать человеческий мозг, но настоящая машина ИИ должна будет эмулировать определенные аспекты мозга. Исследование человеческого мозга можно сравнить с исследованием нового континента.

В 1492 году итальянский мореплаватель Христофор Колумб повел флот из трех испанских кораблей, чтобы пересечь Атлантику, используя китайский компас. Их целью было установить новый торговый путь в Индию. Колумб и его моряки так и не добрались до Индии. Они высадились на Багамах, а затем на Кубе. Колумб вернулся в Испанию, чтобы сообщить испанской королеве о своем открытии и перспективах будущего богатства. Он совершил еще три путешествия на Карибские острова, достигнув материка Нового Света только в своем последнем путешествии. Колумб считал, что достиг Азии.

Другой итальянский исследователь, А. Веспуччи, понял, что Колумб достиг нового континента. Печатный станок был представлен Европе немецким изобретателем Иоганном Гутенбергом в 1440 году нашей эры. В 1507 году немецкий картограф Мартин Вальдземюллер опубликовал первую карту Нового Света, основанную на журналах Веспуччи. Он назвал новый континент именем Америго Веспуччи. В последующие десятилетия имя Америго закрепилось за Америкой. В конце 16 века Америка была в основном неизведанной территорией для европейских исследователей. Исследования продолжались и в 19 веке, через множество циклов больших ожиданий, за которыми следовали неудачи.

После ряда крупных открытий ученые, занимающиеся искусственным интеллектом, сегодня, вероятно, знают о мозге столько же, сколько первые исследователи знали об Америке в начале 16 века. Путь к искусственному интеллекту человеческого уровня будет долгим, полным больших успехов, неудач, непреднамеренных негативных последствий, случайных открытий, математических теорий, ведущих к технологическим прорывам, и больших возможностей покончить с монотонным трудом в огромном количестве областей.

ИИ развивался как смесь слоев из разных областей знаний, разных уровней абстракции различных аспектов мозга. В искусственном интеллекте было в основном два основных подхода.

I. Теории символического ИИ рассматривают разум в основном как машину логического вывода или символического ИИ. Следуя парадигме классического программирования, машины с символическим ИИ реализовывали правила логического рассуждения для обработки определенных знаний о мире. В машинном переводе, основанном на правилах, кодируются все грамматические правила данного языка и вся лексика этого языка, взаимная корреляция их с правилами другого языка. Например, чтобы перевести предложение с английского на немецкий, пользователь вводил данное предложение в машину. Машина проанализировала все соответствующие грамматические правила и словарный запас и составила соответствующее предложение на немецком языке.

Символический ИИ сделал важные прорывы. Экспертные системы, впервые представленные в 1965 году и утратившие популярность в конце 1980-х годов, проложили путь современным механизмам бизнес-процессов. Современная компьютерная игра в шахматы также стала возможной благодаря достижениям в области символического ИИ. Но машины с символическим ИИ было сложно программировать, они не могли многому научиться самостоятельно. Чистый символический ИИ оказался неэффективным для перевода и многих задач обработки естественного языка (NLP). Каждый человеческий язык имеет грамматические правила и исключения из-за истории эволюции этого языка. А иногда значение слова зависит от контекста: слово «яблоко» может относиться к фруктам, к компьютерной компании, к городу Нью-Йорку (Большому яблоку) или к пословице «яблоки и апельсины», которая при буквальном переводе на другом языке может не передавать то же значение.

II- Коннекционизм (также известный как машинное обучение) пытается объяснить психические явления с помощью концепции нейронных сетей. Вдохновленный взаимосвязями нейронов в мозге, здесь основное внимание уделяется тому, чтобы позволить машинам учиться с нуля, перерабатывая огромные объемы данных. Этот подход известен как глубокое обучение. В 1965 году советский математик Алексей Ивахненко опубликовал первые общие рабочие алгоритмы обучения для глубоких нейронных сетей. [2] В 1971 году в другой статье была описана восьмислойная нейронная сеть. [3]

С математической точки зрения нейронная сеть представляет собой хорошо структурированный набор тысяч умножений матриц, выполняемых в быстрой последовательности в иерархии многоуровневых фильтров. Каждый последующий уровень сети ищет шаблон в предыдущем слое, и для этих процессов важнее быть быстрыми, чем точными. В машинном обучении пользователь предоставляет входные данные и соответствующие выходные данные, а нейронная сеть формирует свои собственные статистические правила, которые будут применяться к новым пакетам входных данных. После развертывания системы машинного обучения ее необходимо обучать, а не программировать. Нейронные сети могут учиться на больших наборах данных, выявляя закономерности.

В медицинских приложениях машина ИИ не должна быть запрограммирована с априорным знанием того, как выглядит опухоль. После обработки огромного количества фотографий, помеченных людьми, показывающих варианты того, как выглядит данная опухоль, машина может распознавать новые экземпляры этой опухоли. Чем больше у вас обучающих данных, тем лучше результаты.

Несмотря на достижения 1980-х годов, ИИ какое-то время в основном ограничивался областью исследований. Искусственные нейронные сети (ИНС) наконец-то преодолели многие проблемы, с которыми сталкивается символический ИИ. Таким образом, коннекционистский подход получил поддержку в 1990-х годах. Nuance Verifier (2001 г.), один из первых продуктов ANN, был основан на исследованиях, проведенных в Стэнфордском исследовательском институте (SRI). [4] Он использовался для аутентификации голоса говорящего при распознавании речи на основе телефонии.

После периода относительного разочарования корабль ИИ получил новый импульс благодаря доступности массивных наборов данных и достижений в графических процессорах (GPU), которые сделали параллельную обработку более мощной, быстрой и дешевой. Начиная с 2012 года работы Юргена Шмидхубера, Яна Лекуна, Йошуа Бенджио, Джеффа Хинтона, Эндрю Нг и других наконец дали результаты. Статьи Ciresan et al. и Крижевский и др. показал, как сверточные нейронные сети могут улучшить показатели зрения по сравнению с другими методами машинного обучения. [5]

С 2015 года темпы инноваций ускорились. Глубокие нейронные сети позволили совершить прорыв в большом количестве областей, включая автономное вождение, распознавание изображений (например, для медицинской диагностики, обработки деловых документов) и машинный перевод.

[1]

[2] https://www.studmed.ru/ivahnenko-ag-lapa-vg-kiberneticheskie-predskazyvayuschie-ustroystva_302f07ded3f.html

[3] http://people.idsia.ch/~juergen/firstdeeplearner.html, по состоянию на 11 апреля 2020 г.

[4] https://www.microsoft.com/en-us/research/wp-content/uploads/2000/01/1-s2.0-S0167639399000771-main.pdf

[5] https://arxiv.org/abs/1202.2745 и https://papers.nips.cc/paper/4824-imagenet-classification-with-deep-convolutional-neural-networks.pdf