Статьи по тематике data-privacy

Публикации по теме 'data-privacy'

Данные машинного обучения: действительно ли у вас есть права на их использование?

Организации, использующие системы машинного обучения, нуждаются в данных для обучения своих систем. Но откуда эти данные? И могут ли они попасть в беду, если у них нет прав на использование этих данных? Краткий ответ - да; они могут попасть в беду, если не будут осторожны. Несколько недавних случаев демонстрируют риски, связанные с использованием компаниями личной информации для обучения систем искусственного интеллекта якобы без разрешения. Во-первых, коллективный иск Burke v...

Дополнение NLP к машине для стирки данных

Этот пост является продолжением предыдущего поста Кэтрин Нельсон из серии Concur Labs Data Privacy , в котором объясняется ее подход к конфиденциальности данных - машина для стирки данных. Введение Когда этим летом я пришел в Concur Labs в качестве стажера в поисках проекта, я даже представить себе не мог, что настолько увлечен проблемой конфиденциальности данных. Тем не менее, когда я познакомился с машиной для очистки данных, инструментом обеспечения конфиденциальности,..

Вы можете быть идентифицированы по вашей истории просмотра Netflix

2 октября 2006 года Netflix объявил приз в 1 миллион долларов за улучшение алгоритма рекомендации фильмов. Netflix выпустил анонимный набор данных, содержащий рейтинги фильмов от 500 000 подписчиков. Netflix утверждает, что вся личная информация, позволяющая установить личность (PII), была удалена. Достаточно ли удаления PII для защиты конфиденциальности данных? Год спустя Арвинд Нараянан и Виталий Шматиков (Нараянан и Шматиков), два исследователя из Техасского университета в Остине,..

«Ломая барьеры в конфиденциальности данных: как федеративное обучение расширяет возможности безопасного машинного обучения»

Введение ИИ уже давно является модным словом в отрасли и имеет широкое применение во всех отраслях. Данные — это сырой ингредиент, на котором строится ИИ. В повседневной жизни, сознательно или неосознанно, мы производим петабайты данных. Данные, особенно информация, позволяющая установить личность, хотя и необходимы для предоставления персонализированных рекомендаций, улучшений и оптимизаций, — палка о двух концах. Данные могут помочь компаниям понять своих заинтересованных сторон и..

Введение в ИИ и аналитику с сохранением конфиденциальности

Данные важны, потому что они показывают, как люди думают или ведут себя. Независимо от того, анализируете ли вы бизнес-тенденции или тренируете модель искусственного интеллекта, чем больше и глубже данные, тем ценнее результаты. Но по мере увеличения возможностей для инноваций растут и риски конфиденциальности, связанные с более дорогостоящими нарушениями и более строгими правилами. Чтобы совместить инновации и защиту данных, возникла новая область: обучение с сохранением..

Признание именованных лиц для неструктурированных документов

Распознавание именованных сущностей (NER) в неструктурированном тексте имеет множество применений. Компании иногда обмениваются документами (например, контрактами) с личной информацией. Может случиться так, что личная информация, содержащаяся в этих документах, должна быть анонимной. Также может случиться так, что личная информация должна быть анонимной, прежде чем она будет доступна сотрудникам определенного уровня. Другой вариант использования - оценка действий, выполняемых объектами..

Конфиденциальность данных в машинном обучении: технический обзор

В базе данных различные точки данных, связанные с человеком, можно различить с точки зрения конфиденциальности, по классу информации , которую они содержат. Набор данных состоит из точек данных (определенных членов популяции) и функций (значений атрибутов, связанных с каждым человеком). В случае медицинских карт характеристиками могут быть имя - возраст - пол - государство - религия - болезнь. Первый столбец представляет собой личную информацию (PII), которая однозначно идентифицирует..