Что научив робота распознавать волосы темнокожих женщин, я узнал о будущем ИИ

Новые доступные платформы помогают недостаточно представленным группам создавать столь необходимые модели машинного обучения.

Как 30-летний технарь с ранним облысением по мужскому типу, уход за волосами для меня обычно означает делать все возможное, чтобы удалить то немногое, что у меня есть, как можно чаще. Имея это в виду, может показаться неожиданным, что несколько недель назад я решил создать первую модель машинного обучения, которая может определять и классифицировать прически чернокожих женщин.
Вот почему я это сделал.

Предвзятость моделей машинного обучения в отношении женщин и цветных людей - явление, настолько хорошо задокументированное, что пытаться раскрыть его здесь означало бы как можно меньше использовать ваше время. По мере того как человечество стремительно движется в будущее, где машинное обучение дает информацию о решениях, влияющих на жизнь людей в дороге, на работе и в домах, авторы этой технологии все еще не представляют общества, в которых технология будет распространяться.

Еще несколько месяцев назад было обнаружено, что наиболее эффективные системы распознавания лиц общего назначения правительства США неправильно идентифицируют цветных людей в 5-10 раз чаще, чем белые люди. Фактически, очень мало было достигнуто в обучении моделей машинного обучения для точного распознавания черт лица чернокожих женщин после памятного анализа закодированного взгляда Джой Буоламвини в 2015 году.

Помня об этом контексте, я решил обучить модель машинного обучения на наборе данных, который обслуживает исключительно чернокожих женщин: наименее представленных демографических групп в области машинного обучения. То, что изначально начиналось как акт преднамеренной исключительности ради репрезентации, превратилось в процесс исключительности как вопрос выживания.

Идея, время которой пришло

В страстном сообщении в социальной сети пользователь blackgirlhair.js поделилась своими усилиями по поиску релевантного контента в Интернете. Она рассказала о своем опыте, заявив:

«… Для того, чтобы сопоставить и обобщить информацию в Интернете, которая этнически связана со мной, я должен ввести слова« черный + женщина »в поисковом запросе. Я знаю, это утомительно и, честно говоря, меня просто бесит ».

Ее история знакома и обращается к поколению интернет-пользователей с глобального юга, чей опыт алгоритмической персонализации заключается в том, что с ними обращаются как с гражданами второго сорта на платформах, которые, похоже, без проблем обслуживают их коллег по всему миру.

В настоящее время в Африке наблюдается самый быстрый рост проникновения интернета по сравнению с любым другим регионом: к 2025 году ожидается, что к 2025 году впервые подключатся к Интернету 300 миллионов новых пользователей. К сожалению, несмотря на успехи технологических компаний, которые предпринимаются для предоставления персонализированных Интернет меня, многие из новых подключенных к сети стран Африки к югу от Сахары будут делать это в интерактивном режиме, управляемом алгоритмами, не имеющими права голоса, поскольку обездоленные в мире продолжают пожинать незнакомые плоды централизованного Интернета.

Именно здесь на помощь приходят доступные платформы машинного обучения, такие как Teachable Machine от Google.

Это инструмент, созданный командой Creative Lab NYC, и он помогает вам обучить компьютер распознавать ваши собственные изображения, звуки и позы. Teachable Machine, созданная на базе Tensorflow.js, представляет собой простой в использовании веб-интерфейс без излишеств для нетехнических специалистов, позволяющий быстро освоить машинное обучение.

Что мне нравится в таких платформах, так это то, что они демистифицируют процесс машинного обучения, позволяя разработчикам вместо этого сосредоточить свои усилия на копировании наборов данных и последующем создании значимого опыта. Что еще более важно, меня воодушевляет перспектива того, что африканские авторы будут использовать знакомые им данные для создания новых моделей машинного обучения, которые помогут решить насущные социально-экономические проблемы.

Сразу приходит на ум пример дерматологии и возможности, которые такие платформы предоставляют практикующим врачам для сбора собственных данных и обучения столь необходимых моделей для выявления потенциально смертельных состояний кожи без присмотра.
Чтобы понять, почему это важно, мы можем взглянуть на то, как афроамериканцы с пятилетней выживаемостью 73% имеют самый высокий уровень смертности от рака кожи по данным Американской академии дерматологии, но лишь немногие врачи, практикующие в Соединенных Штатах, обучаются именно этому типу кожи. Кроме того, модели машинного обучения, которые часто хвалят за их способность точно обнаруживать меланомы на светлой коже, часто неэффективны при выполнении того же самого на темнокожих пациентах.
Благодаря усердию и сотрудничеству мелкие игроки по всему региону могут легко курировать критически важное сообщество наборы данных и обучите их с помощью таких инструментов, как Teachable Machine, в соответствии с рекомендациями ПРООН по использованию ИИ для достижения целей в области устойчивого развития.

Использование обучаемой машины

Шаг 1. Сбор данных

Уловка любой хорошей модели машинного обучения - это качество данных. Teachable Machine упрощает процесс обучения, а итоговая модель становится доступной для использования сразу после этого. Это позволяет очень легко проверить точность вашей модели и получить четкое представление о том, какие части ваших данных нуждаются в очистке.

Для моей модели классификации изображений я использовал Проект изображения Teachable Machine. Чтобы получить данные о прическах, я соскребал популярные веб-сайты с каталогами изображений на предмет изображений причесок чернокожих женщин и сохранял изображения в соответствующих папках на своем рабочем столе. Затем я просмотрел каждую папку, проверяя и удаляя неправильно маркированные изображения.

После этого я обрезал каждое изображение в формате 1: 1 (квадрат), убедившись, что прическа является фокусом изображения. Teachable Machine делает это автоматически, но автоматическая обрезка, конечно, не всегда будет точной. Также хорошей практикой является подготовка собственных наборов данных.

Шаг 2. Обучение модели

Я загрузил свои изображения в соответствующий класс на Teachable Machine и нажал «Модель поезда». Как только это было сделано, моя модель была готова к экспорту для использования на моем веб-сайте или в приложении.

Вот и все. Это действительно просто.

Обучение

Хотя решение Teachable Machine само по себе заслуживает гор похвалы, именно вопросы, которые оно подняло, заставили меня сесть и обратить на него внимание.

Во-первых, что означает для недостаточно обслуживаемых сообществ наконец-то доступ к интуитивно понятным средствам обучения модели машинного обучения и курирования наборов данных? Как будет выглядеть курирование наборов данных сообщества в этом будущем, особенно когда сообщество все еще ограничено географически?

Как начинающий технолог, создающий инструменты для Африки будущего, я взволнован перспективой появления децентрализованных алгоритмов, учитывая, как универсальные модели машинного обучения продолжают подводить тех, чья кожа на несколько оттенков бледна.
С практической точки зрения. , когда технологические гиганты распространяют свои трансатлантические щупальца дальше от африканских берегов, именно эти локализованные модели позволят беспилотным автомобилям видеть африканские дороги и обучат уши цифровых помощников каждому щелчку нгуни и интонации йоруба.

Приближая мои взгляды к настоящему, этот набег в мир машинного обучения с расширенным графическим интерфейсом также научил меня, что для модели машинного обучения нормально знать, как делать только одну вещь, если она делает это хорошо. История научила нас, что общие модели приложений плохо масштабируются за пределы лаборатории Массачусетского технологического института и едва ли соответствуют требованиям будущего.

Благодаря использованию новых демократических платформ, таких как Teachable Machine, часто игнорируемые сообщества могут наконец овладеть средствами производства и проложить путь к безотлагательному и актуальному технологически усовершенствованному будущему.