1. Требования к обезличиванию BigData Пермяков Руслан Анатольевич Руководитель офиса взаимодействия с федеральными проектами и программами развития АО Академпарк
10. Спасибо за внимание Пермяков Руслан Анатольевич +7(913)916 - 21 - 156 pra@yandex.ru
9. Требования 1. Реализация процесса гарантированного обезличивания с верификацией без участия человека. 2. Математически доказанная невозможность реидентификации. 3. Законодательная возможность обмениваться и продвать датасеты в обезличенной форме в стране и зарубежом без получения согласия третьих лиц.
6. Угрозы личности и обществу 1. Идентификация на основе поведнческой модели 2. Дискриминация на основе интрепритации данных 3. Восстановление составляющих тайну личности (медицинские данные, тайна усыновления и т.п.) на основе публичных данных. 4. Непредсказуемость последствий предоставления данных для личности в связи с равитием технологий анализа.
7. Разработанные методики позволяют получать оценку состояния здоровья не только в текущий момент времени, но и получать прогноз его состояния в будущем, в частности, трудового потенциала, рисков смерти и продолжительности жизни. Такие прогнозы важны не только для человека лично, но и для руководителей разных уровней, а также высоко востребованы в настоящее время страховыми компаниями, разрабатывающими персонализированные страховые продукты. Как решается сейчас
4. Обезличивание Обезличивание персональных данных – дейсвтия, в результате которых становиться невозможным без использования дополнительной информации определить принадлежность персональных данных конкретному субъекту. Деобезличивание – дейсвтия, в результате которых обезличенные данные принимают вид, позволяющий определить их принадлежность конкретному субъекту персональных данных. Деидентификация - это процесс, используемый для предотвращения раскрытия чьей - либо личности .
3. Приватность : Alan Westin в 1967 году определил приватность как: • Одиночество - физическое отделение от других • Интимность – «близкие и откровенные отношения между двумя или более лицами», которые могут возникнуть из уединения • Анонимность - свобода от идентификации и наблюдения в общественных местах • Скрытность - создание психологического барьера против нежелательного вторжения
5. Как решается сейчас С 1 июля 2020 года провести в субъекте Российской Федерации - городе федерального значения Москве эксперимент по установлению специального регулирования в целях создания необходимых условий для разработки и внедрения технологий искусственного интеллекта в субъекте Российской Федерации - городе федерального значения Москве, а также последующего возможного использования результатов применения искусственного интеллекта. часть 1 статьи 6 дополнить пунктом 9.1 следующего содержания: "9.1) обработка персональных данных, полученных в результате обезличивания персональных данны х, осуществляется в целях повышения эффективности государственного или муниципального управления, а также в иных целях, предусмотренных Федеральным законом "О проведении эксперимента по установлению специального регулирования в целях создания необходимых условий для разработки и внедрения технологий искусственного интеллекта в субъекте Российской Федерации - городе федерального значения Москве и внесении изменений в статьи 6 и 10 Федерального закона "О персональных данных", в порядке и на условиях, которые предусмотрены указанным Федеральным законом;"; статья 10 дополнить частью 2.1 следующего содержания: "2.1. Обработка персональных данных, касающихся состояния здоровья , полученных в результате обезличивания персональных данных , допускается в целях повышения эффективности государственного или муниципального управления, а также в иных целях, предусмотренных Федеральным законом "О проведении эксперимента по установлению специального регулирования в целях создания необходимых условий для разработки и внедрения технологий искусственного интеллекта в субъекте Российской Федерации - городе федерального значения Москве и внесении изменений в статьи 6 и 10 Федерального закона "О персональных данных", в порядке и на условиях, которые предусмотрены указанным Федеральным законом.".
2. Большие данные Объем Количество данных — важный фактор. Располагая ими в больших количествах, Вам потребуется обрабатывать большие объемы неструктурированных данных низкой плотности. Ценность таких данных не всегда известна. Это могут быть данные каналов Twitter, данные посещаемости веб - страниц, а также данные мобильных приложений, сетевой трафик, данные датчиков. В некоторые организации могут поступать десятки терабайт данных, в другие — сотни петабайт. Скорость Скорость в данном контексте — это скорость приема данных и, возможно, действий на их основе. Обычно высокоскоростные потоки данных поступают прямо в оперативную память, а не записываются на диск. Некоторые "умные" продукты, функционирующие на основе Интернета, работают в режиме реального или практически реального времени. Соответственно, такие данные требуют оценки и действий в реальном времени. Разнообразие Разнообразие означает, что доступные данные принадлежат к разным типам. Традиционные типы данных структурированы и могут быть сразу сохранены в реляционной базе данных. С появлением Big Data данные стали поступать в неструктурированном виде. Такие неструктурированные и полуструктурированные типы данных как текст, аудио и видео, требуют дополнительной обработки для определения их значения и поддержки метаданных. обозначение структурированных и неструктурированных данных огромных объёмов и значительного многообразия, эффективно обрабатываемых горизонтально масштабируемыми программными инструментами
8. Как это видит математик Идентификация на основе персональных данных: 풀 : 풇 푿 = Y, • ∀ 풙 ퟏ , 풙 ퟐ ∈ 푿 , таких , что 푓 풙 ퟏ = 푓 풙 ퟐ ⟹ 풙 ퟏ = 풙 ퟐ , где Х – мнодество данных идентифицирующих субъекта , Y – множество даных Обезличенные данные: 풀 : 풇 푿 = Y, ∃ 풙 ퟏ , 풙 ퟐ ∈ 푿 , такие, что 푓 풙 ퟏ = 푓 풙 ퟐ , 풙 ퟏ ≠ 풙 ퟐ , где Х – мнодество данных идентифицирующих субъекта, Y – множество даных