Как теперь вам проще анонимизировать данные

Google только что анонсировала общедоступную предварительную версию дифференциальной конфиденциальности BigQuery со стандартными блоками SQL.

Вы можете использовать эти функции для анонимизации своих данных. Дифференциальная конфиденциальность включает четыре агрегатные функции дифференциальной конфиденциальности, которые можно использовать для анонимизации данных[1]:

  • AVG
  • COUNT,
  • SUM,
  • PERCENTILE_CONT

Дифференциальная конфиденциальность — это (математическая) основа для обеспечения конфиденциальности отдельных лиц в наборах данных. Это позволяет анализировать данные, не раскрывая конфиденциальную информацию о каком-либо человеке в наборе данных[2].

Чтобы глубже погрузиться в эту математическую тему, воспользуйтесь ссылками, которые я разместил ниже.

В будущем Google также объявил, что они хотят реализовать это в BigQuery Data Clean Rooms, что является функцией, которую Google также хочет интегрировать в BigQuery.



Это имеет смысл, поскольку Data Clean Rooms предназначены для обмена данными с третьими лицами. Следовательно, с помощью этой функции вы также можете обеспечить безопасный обмен данными.



Новость также вполне уместна, так как Google теперь вступит в партнерство с Tumult Labs, лидером в области дифференциальной конфиденциальности для компаний и государственных учреждений[4].

Источники и дополнительная литература

[1] Google, Примечания к выпуску BigQuery (2023 г.)

[2] Statice, Что такое дифференциальная конфиденциальность: определение, механизмы и примеры (2023)

[3] Vis2021, Поддержка принятия решений для обмена данными с использованием дифференциальной конфиденциальности (2023)

[4] Google, Что нового в Google Cloud (2023 г.)