Стандарт разработан Ассоциацией участников рынка больших данных, внесён Техническим комитетом по стандартизации ТК 22 «Информационные технологии».
Текст проекта стандарта можно скачать по адресу https://www.normacs.info/project_files/13714 , а пояснительной записки к нему – по адресу https://www.normacs.info/project_files/13713 . Принять участие в обсуждении документа можно здесь: https://www.normacs.info/discussions/9548#9548 .
В аннотации на проект говорится:
«Цель разработки стандарта состоит в закреплении риск-ориентированного подхода к защите данных, формализованных моделей анонимизации, псевдонимизации и подходов к методам обезличивания данных. Стандарт позволит повысить управляемость задач обезличивания с использованием моделей оценки рисков, обеспечить совместимость данных и будет способствовать развитию рынка высоких технологий.
Ключевым принципом, положенным в основу стандарта, является достижение оптимального баланса между уровнем защиты конфиденциальности и сохранением полезности данных для решения прикладных задач. Этот принцип реализуется через применение количественных метрик оценки риска повторной идентификации (включая k-анонимность, l-разнообразие, t-близость) и метрик качества преобразованных данных (статистическая близость, сохранение корреляций, пригодность для аналитики, потеря информации).»
Во вводной части документа отмечается:
«Настоящий стандарт устанавливает требования к методам и технологиям псевдонимизации и обезличивания (де-идентификации) данных, используемым для минимизации рисков повторной идентификации при обработке, хранении, передаче и публикации данных.
Стандарт определяет:
- требования к методам псевдонимизации как обратимого преобразования данных;
- требования к методам обезличивания (де-идентификации) как необратимого преобразования данных;
- процедуры оценки эффективности методов на основе риск-ориентированного подхода;
- критерии выбора методов для различных сценариев обработки данных.
Положения настоящего стандарта распространяются на:
- информационные системы различных классов и назначений, включая платформы обработки больших данных (Big Data), озера данных (Data Lake), потоковые системы, а также системы искусственного интеллекта и машинного обучения, обрабатывающие персональные или иные конфиденциальные данные;
- обработку структурированных (базы данных, таблицы, реестры), полу-структурированных (XML, JSON, логи), неструктурированных (тексты, изображения, аудио, видео) и бинарных данных специализированных форматов.
Рекомендации настоящего стандарта могут быть использованы:
- организациями и учреждениями при подготовке, публикации или обмене открытыми и ограниченными наборами данных;
- участниками отраслей здравоохранения, финансов, телекоммуникаций и других сфер при обработке и распространении чувствительной информации;
- разработчиками и интеграторами информационных систем при проектировании механизмов преобразования и анонимизации данных;
- организациями, осуществляющими трансграничную передачу информации, а также работающими с персональными и иными данными, требующими специальных мер защиты.
Стандарт не распространяется на:
- методы генерации полностью синтетических данных, которые регулируются отдельной серией стандартов (ПНСТ 1.11.164–1.363, 1.11.164–1.361.25, 1.11.164–1.362.25);
- криптографические методы защиты информации, регулируемые ГОСТ Р 34.10, ГОСТ Р 34.11 и другими стандартами криптографической защиты;
- организационные меры защиты информации, не связанные с техническим преобразованием данных, регулируемые ГОСТ Р ИСО/МЭК 27002–2021, ГОСТ Р 59336-2021, ГОСТ Р 59347—2021 и другими стандартами.
Применение настоящего стандарта способствует:
- реализации требований законодательства Российской Федерации в области защиты персональных и иных конфиденциальных данных;
- совместимости с международными стандартами;
- объективной оценке уровня защиты данных и воспроизводимости результатов применения методов анонимизации.»
В документе разъясняется соответствующая терминология (п.5.1.1):
Анонимизация — процесс необратимого преобразования, при котором персональные данные изменяются таким образом, что субъект персональных данных не может быть идентифицирован ни прямо, ни косвенно, в том числе с использованием дополнительной информации, разумно доступной для анализа с использованием ограниченных ресурсов и за ограниченное время.
Обезличивание — процесс, при котором становится невозможным без использования дополнительной информации определить принадлежность персональных данных конкретному субъекту.
Псевдонимизация — один из видов обезличивания, представляющий собой замену идентифицирующей информации псевдонимом (ГОСТ Р 59407–2021). В результате такого преобразования персональные данные больше не могут быть отнесены к конкретному субъекту без использования дополнительной информации, которая хранится отдельно и подлежит специальным техническим и организационным мерам защиты.
Содержание документа следующее:
Предисловие
Введение
1. Область применения
2. Нормативные ссылки
3. Термины и определения
4. Сокращения
5. Обзор методологии анонимизации
6. Методы псевдонимизации
7. Методы Обезличивания
Приложение A (справочное): Модели обмена чувствительной информации и сопутствующие угрозы
Приложение Б (справочное): Оценка рисков анонимизации
Приложение В (справочное): Метрики качества и полезности для методов анонимизации
Источник: сайт NORMACS
https://www.normacs.info/projects/12308
Комментариев нет:
Отправить комментарий