Мы сотрудничаем с Гуманитарной командой OpenStreetMap, Facebook и Microsoft, чтобы создать инструменты картографии на основе ИИ, чтобы расширить возможности картографов по всему миру. Мы считаем, что это поможет волонтерам правильно использовать свое время и улучшить качество карты там, где оно больше всего необходимо.

За последние несколько недель мы создали ключевой элемент конвейера AI-Assist, названный ML Enabler. ML Enabler, как следует из названия, позволяет приложениям использовать машинное обучение. Он организует и эффективно хранит данные карты, полученные с помощью машинного обучения, поэтому диспетчер задач и другие инструменты могут использовать эту информацию через стандартный API и расширять свои собственные функции. Для дальнейшего объяснения того, как Tasking Manager и iD будут использовать данные, полученные из машинного обучения, ознакомьтесь с нашим предыдущим постом и недавним объявлением от HOT. С помощью ML Enabler мы надеемся предоставить больше моделей, чтобы лучше поддержать области задач плана менеджера проекта и помочь волонтерам быстрее добавлять новые функции карты.

Реестр образцов общественного блага

Одна из основных целей ML Enabler - служить реестром общедоступных и частных моделей машинного обучения. Реестр важен, потому что сами модели представляют собой независимые проекты с разными целями и жизненным циклом. Например, наша зеркальная модель предсказывает только площадь застройки, в то время как API зданий от Microsoft выводит следы. Интегрировать их один за другим в такие инструменты, как диспетчер задач, далеко не идеально. Однако реестр ML Enabler позволит нам отслеживать множество различных моделей из разрозненных организаций в одном месте и использовать все их преимущества. Если вы хотите получить точную картину городских районов в Восточной Африке, представьте, что вы можете использовать модель машинного обучения, которая очень хороша для прогнозирования зданий в Уганде и еще одной модели в Кении. ML Enabler может отслеживать несколько версий, метаданные, такие как область охвата и показатели успешности, и делать их доступными для диспетчера задач через один и тот же API.

Общий язык для существующих картографических инструментов

Нет одинаковых моделей машинного обучения. Модели имеют разные схемы для входных данных и прогнозов выходных данных. ML Enabler предоставляет стандартные утилиты для работы с любой моделью, а также устанавливает некоторые ожидания от модели. Эти ожидания тщательно выбираются нашей командой машинного обучения. Например, модели должны иметь версии, и должен быть API для взаимодействия с выходными данными модели. В нашей модели Looking Glass используется технология TensorFlow Serving. Любой аналогичный API отлично подойдет для интеграции с ML Enabler.

Прогнозы на основе модели могут не оказаться напрямую полезными для таких инструментов, как диспетчер задач. Например, Looking Glass прогнозирует площадь застройки в регионе. Эта информация актуальна для картографа только в том случае, если мы можем сравнить ее с OSM, чтобы определить, какие регионы на карте должны быть приоритетными. Looking Glass прогнозирует при увеличении 18, что, возможно, слишком детально для диспетчера задач. ML Enabler предоставляет базовые функции и интерфейс для дополнения и агрегирования прогнозов, при необходимости, через командную строку. В API хранятся прогнозы, проиндексированные квадрациклами. Преимущество использования квадроключей - это стратегия биннинга. На практике вариант использования диспетчера задач состоит в том, чтобы получить площадь застройки для многоугольника при создании нового проекта, что помогает руководителю проекта определить, какие приоритетные области должны быть отображены. В API уже есть функции для дополнения проекта диспетчера задач GeoJSON данными прогнозов, хранящимися в API аннотаций задач.

Относительно просто интегрировать новый предиктор и агрегатор. На данный момент мы интегрировали Looking Glass и Microsoft Building Footprints API.

Запуск моделей по запросу

ML Enabler упрощает сбор и систематизацию картографической информации на основе ИИ. В ближайшем будущем мы хотим улучшить конвейер, чтобы еще больше снизить планку применения инструментов машинного обучения для картографии. Хранение информации докеров о каждой модели позволяет нам создать систему управления заданиями для запуска контейнеров моделей в облаке и автоматического получения прогнозов для новых областей. Это позволит нам масштабировать модели по мере необходимости и обновлять карту с максимальной точностью. Мы хотим добавить функцию хранения геометрии, чтобы ML Enabler мог напрямую взаимодействовать с такими инструментами, как iD.

Мы надеемся, что ML Enabler принесет огромное количество моделей и знаний машинного обучения для улучшения карты. Если у вас есть вопросы или комментарии, напишите мне в Twitter!