Обзор АИ-2016

Как понять, что ты в Кембридже? Может быть, это впечатляющий силуэт Королевского колледжа, который вы можете увидеть издалека. Это также может быть выше средней доли китайских туристов, приезжающих посетить Камень «Прощание с Кембриджем». В моем случае было очевидно, что я нахожусь в Кембридже после того, как обнаружил плакат, рекламирующий чат-бота с искусственным интеллектом рядом с йогой или частными языковыми занятиями.

Я снова поехал в Кембридж, чтобы посетить конференцию AI-2016, как вы можете догадаться из вступления. На три дня международное сообщество ученых и практиков (или гибрид в моем случае) собралось в историческом Питерхаус-колледже для обмена идеями в области искусственного интеллекта. В этом посте я подведу итоги конференции и немного остановлюсь на темах, которые показались мне наиболее интересными.

В первый день было проведено четыре разных семинара в двух разных потоках. Я посетил два воркшопа Разбор потока данных и Глубокое обучение встречает семантическую паутину. Отобранные документы затем были представлены в течение следующих двух дней в потоке технических и прикладных программ. Майкл Гливс из Hartree Centre провел очень интересную программную лекцию о факторах, влияющих на внедрение технологий машинного обучения в промышленности. В то время как прошлогодняя панельная сессия была посвящена рискам ИИ, в этом году панельная сессия была направлена на то, чтобы пролить свет на возможные преимущества ИИ.

Интеллектуальный анализ потока данных

В быстро меняющихся средах крайне важно иметь возможность поддерживать скорость поступающих данных. Эти данные могут поступать из социальных сетей, сенсорных данных от машин или данных о сетевом трафике. Очень интересное приложение представил Хьюго Хромик из Национального университета Ирландии. В сотрудничестве с RTÉ, национальной телекомпанией Ирландии, было исследовано, можно ли использовать социальные сети для улучшения взаимодействия с пользователем, избегая информационной перегрузки, адаптивного контента и соответствующих программных рекомендаций. Однако настройка для этого случая была ограничена из-за отсутствия личных данных зрителя. Здесь в игру вступает Твиттер. Вкратце, действия пользователей в Твиттере извлекаются и объединяются с данными телекаталога о программах. Набор данных является основой для программных рекомендаций и адаптивного контента. Все это должно происходить практически в режиме реального времени.

Хотя я определенно приветствую подходы, которые делают телепрограммы более актуальными, я считаю также важным учитывать возможные риски. При предлагаемом подходе наблюдается уклон в сторону присутствующей мобильной аффинной аудитории. Документ семинара доступен здесь.

Глубокое обучение встречается с семантической паутиной

Доктор Мерседес Аргуэлло Кастельейро из Манчестерского университета представила свои текущие исследования на стыке глубокого обучения и изучения онтологии. В одном из ее экспериментов основной целью было извлечение без присмотра биомедицинских терминов из большого корпуса. Встраивание слов было рассчитано с помощью нейронных языковых моделей на основе 14 миллионов публикаций в PubMed. Золотой стандарт был создан путем извлечения и аннотирования названий генов и белков из 25 отобранных статей. Всего было извлечено 107 терминов. Затем сравнили два метода для получения вариантов терминов для генов и белков. Первый подход вернул 12 наиболее похожих терминов в отношении косинусного расстояния вложений слов. Второй подход использовал существующую онтологию сердечно-сосудистых заболеваний (CVDO). Аннотированные вручную термины из золотого стандарта были дополнены терминами из CVDO. Затем эти дополнительные термины использовались вместе с исходными терминами для извлечения 12 наиболее похожих слов из вложений слов. Эксперты предметной области в конечном итоге оценили оба подхода, классифицировав каждое из 12 извлеченных слов как вариант термина, вариант частичного термина или вариант без термина. При первом подходе можно было извлечь до 151 варианта термина. Второй подход вернул еще больше вариантов термина: 194, оцененных одним из экспертов предметной области. Полная информация об экспериментах доступна здесь.

Мне очень понравился этот семинар. Проблема в узкой области решается творчески, с использованием машинного обучения и существующих ресурсов, аннотированных человеком. Я думаю, что этот подход стоит оценить и в других областях.

ИИ и закон

Предположим, что самоуправляемый автомобиль стал причиной аварии, кто несет ответственность за причиненный ущерб? Водитель ведь не вмешивался, а вместо этого предпочитал смотреть фильм во время езды? Или производитель автомобиля? Это также может быть компания, которая разработала управляющее программное обеспечение - скорее всего, стартап глубокого обучения из долины ;-) Но почему не отдельный разработчик, который намеренно добавил какой-то ошибочный код в основную ветку программного обеспечения? Предполагая, что мы привносим некое сознание в системы ИИ, почему бы не относиться к агентам ИИ как к сущностям? Если бы мы это сделали, как бы мы привлекли агента ИИ к ответственности за ранее упомянутую автомобильную аварию? Должно ли это быть уголовное или гражданское право? Как мы можем оправдать агента ИИ от каких-либо злонамеренных намерений?

Как и в случае с каждым новым изобретением, наше законодательство должно адаптироваться, чтобы идти в ногу с новыми ситуациями. В статье под названием Искусственный интеллект и юридическая ответственность доктор Джон Кингстон из Брайтонского университета пролил свет на юридические последствия ИИ. Он не дал определенных ответов в своей статье, а вместо этого задал правильные вопросы. Было бы здорово, если бы законодатели подняли эти вопросы для последующего обсуждения. Одним из поводов может быть Международная конференция по искусственному интеллекту и праву в Лондоне в июне этого года.

Человеческое обучение

По оценкам, для достижения статуса эксперта в любой конкретной области требуется до 10 000 часов специального обучения. Однако эта оценка не всегда верна, и возникает вопрос, почему одни люди усваивают сложные понятия и навыки быстрее или медленнее, чем другие? Как можно объяснить индивидуальные различия в скорости обучения? Некоторые факторы, перечисленные в литературе, включают преднамеренную практику, интеллект, генетику, мотивацию и педагогику.

Доктор Филипп Шасси из Ливерпульского университета Хоуп провел эксперименты с искусственными нейронными сетями, чтобы критически переоценить вышеупомянутые факторы. Автор предполагает, что проведение параллелей между биологическими и искусственными нейронными сетями является правильным подходом. Для его эксперимента искусственная нейронная сеть должна была определить различные шахматные стратегии. В частности, его исследовательский вопрос заключался в том, чтобы понять, насколько начальное состояние сети влияет на скорость обучения.

Вход в сеть состоит из 64 входов, представляющих шахматную доску, и каждая шахматная фигура представлена различным целочисленным значением. Пустое поле имеет значение 0, конь 2, ферзь 5 и т. д. 500 различных сетей были инициализированы случайным образом и обучены до тех пор, пока не будет достигнут стоп-критерий работоспособности. Исходное состояние после случайной инициализации представляет собой уровень новичка, состояние после достижения критерия остановки — уровень эксперта. Как и ожидалось, производительность 500 сетей на уровне новичка была плохой и близкой к случайности. В среднем искусственные нейронные сети достигли экспертного уровня через 9,7 эпохи. Но что очень интересно, эта цифра колеблется от 5 до 23 и не имеет нормального распределения. Автор говорит, что экспериментальные результаты воспроизводят человеческие различия в скорости обучения, чтобы достичь экспертного уровня. Делая вывод о биологических нейронных сетях на основе этих результатов, можно сделать вывод, что разница в скорости обучения не может быть обусловлена исключительно факторами практики, интеллекта, генетики, мотивации и педагогики, а может быть вызвана индивидуальными различиями в нейронной проводке. Документ доступен здесь.

Оглядываясь назад, теперь многое имеет смысл. Некоторые из моих плохих оценок в более молодом возрасте были не результатом моей лени или отсутствия мотивации, а просто потому, что мои нейроны были подключены немного невыгодно ;-)

Панельная сессия

Какие преимущества ИИ может, принесет или должен принести миру в ближайшие 10 лет?

В отличие от прошлогодней панельной сессии, в этом году панельная дискуссия была направлена на рассмотрение возможных преимуществ ИИ. Однако было забавно заметить, что мы довольно быстро снова заговорили об опасностях, исходящих от ИИ. Учитывая текущую ситуацию в большинстве западных стран с постоянно стареющим населением в сочетании с резким сокращением государственных расходов, разумное использование ИИ может решить многие проблемы. Такие вещи, как роботы, которые заботятся о пожилых людях, нейронные сети, способные выявлять раковые опухоли, или приложения, которые выявляют проблемы с психическим здоровьем, заставляют меня очень позитивно относиться к будущему, сформированному ИИ.

Но что, если та же самая технология используется со злыми намерениями? Автономные боевые роботы в руках банд, террористических организаций или государств могут вызвать серьезные разрушения. Это звучит слишком надуманно? В октябре прошлого года U.S. Министерство обороны успешно запустило 103 автономных дрона, способных демонстрировать такое поведение, как коллективное принятие решений, адаптивный групповой полет и самовосстановление. Я оставляю на усмотрение читателя, что могут делать эти автономные дроны, оснащенные руками.

Наряду с угрозой автономных боевых роботов есть еще одна опасность, о которой стоит упомянуть. Не кто иной, как глава Банка Англии Марк Карни недавно предупредил, что до 15 миллионов рабочих мест только в Великобритании могут быть заменены роботами. И это касается не только рабочих мест. Совсем недавно японская страховая компания Fukoku Mutual Life заменила 34 своих сотрудников системой искусственного интеллекта.

Однако некоторые члены группы возражали против того, что это скорее политическая проблема, чем технологическая. Политики должны обеспечить справедливое распределение богатства, создаваемого автоматизацией, и заботу общества о тех, кто остался без работы. Выступавший в аудитории — если я правильно помню, профессор Макс Брамер — очень правильно возразил, что за последние 500 лет ни разу богатство не распределялось после появления прорывной новой технологии. Группа пришла к выводу, что правительству следует создавать не комиссию по рискам ИИ, а комиссию по имущественному равенству. Мне нечего добавить к этому.

Моя презентация

Несмотря на все эти предсказания конца света и негативную прессу, мне до сих пор нравится заниматься исследованиями в этой области. Итак, я представил результаты экспериментов, которые мы провели с многозадачным обучением. Традиционный подход в машинном обучении состоит в том, чтобы разбить сложную задачу на более простые, которые затем решаются отдельно. Многозадачное обучение, напротив, предполагает параллельное решение нескольких связанных задач. Эту концепцию можно проиллюстрировать на упрощенном примере. Страховая компания может быть заинтересована в перекрестных продажах страхования жизни своим клиентам, а также наблюдать за тем, подвержены ли хорошие клиенты риску оттока. При традиционном подходе будут созданы две отдельные модели: одна для перекрестных продаж страховок жизни, а другая для прогнозирования оттока. Однако при многозадачном обучении обе задачи решаются параллельно с помощью одной модели. Удивительно, но многозадачное обучение работает очень хорошо и повышает эффективность обобщения классификатора. Это происходит потому, что обучающие сигналы связанных задач вызывают смещение, которое помогает избежать переобучения. Статья доступна на Springer.