четверг, 22 августа 2019 г.

Великобритания: Начато публичное обсуждение стандартов больших данных, часть 1


Поводом продолжить рассказ о работе над двумя новыми британскими стандартами (см. мой предыдущий пост здесь: https://rusrim.blogspot.com/2019/07/blog-post_87.html ) стало то, что 4 августа 2019 года Британский институт стандартов (BSI) выложил их проекты для публичного обсуждения, в котором может принять участие любой желающий – само собой, при условии регистрации на сайте. Обсуждение на сайте BSI продлится до 31 октября 2019 года.

Текст проекта стандарта BS 10102-1 «Большие данные – Часть 1: Руководство для организации, деловая деятельность которой опирается на данные» (Big data. Part 1: Guidance for data-driven organization) выложен для обсуждения на странице https://standardsdevelopment.bsigroup.com/projects/2019-00868


Текст аннотации остался прежним:
«Данная часть стандарта BS 10102 содержит рекомендации по получению отдачи от данных, включая выявление глубинных взаимосвязей, поддержку формирования обоснованных стратегий, укрепление репутации и улучшение исполнения законодательно-нормативных требований, повышение эффективности и производительности.

Для достижения этого результата, в документе даются рекомендации по эффективному, ответственному и устойчивому управлению данными с тем, чтобы обеспечить надлежащий доступ к наборам данных требуемого качества.

Данная часть стандарта BS 10102 адресована организациям, формирующим или разрабатывающим свои стратегии данных, а также для тех, кто стремится улучшить свою текущую практику использования и организации данных. Документ применим в государственных, частных и некоммерческих организациях любого размера.»
Однако дальше меня ждал сюрприз – оказывается, название стандарта вводит в заблуждение, и он посвящён отнюдь не исключительно большим данным, а управлению вообще любыми данными! В результате документ предстаёт совсем в ином свете. С одной стороны, он может использоваться более широко, а с другой – может сильно разочаровать тех, кто надеялся получить руководство именно по «большим данным».

Ниже приведен соответствующий фрагмент документа:
«Поскольку важность данных стала в большей мере осознаваться (и монетизироваться), а возможность совместно обрабатывать различные наборы данных стала преумножающим их ценность фактором, очевидной стала потребность более крупных организаций в надлежащим образом определенной архитектуры данных и обеспечении соответствия ей. Например, доступность поступающих в реальном времени на протяжении всего жизненного цикла данных об их функционировании превращает прежние продукты в более прибыльные сервисы. И, наоборот, растет понимание того, что слабое использование данных организацией приводит к неэффективности и принятию не лучших решений.

В число ключевых вопросов менеджмента данных в настоящее время входят:
  • стандарты данных;

  • стандарты метаданных;

  • происхождение данных (provenance);

  • актуальность данных (timeliness);

  • повторяемость (потенциальная доступность регулярно поступающих данных);

  • качество (включая точность, достоверность, непротиворечивость, полноту и уникальность);

  • потенциальная взаимосвязь с другими наборами данных;

  • миграция данных и управление мастер-данными;

  • меры управления доступом и обеспечения безопасности при хранении;

  • журналы аудита;

  • стратегическое управление (включая исполнение требований законодательства и договорных обязательств);

  • безопасность (включая кибербезопасность, противодействие сбору информации враждебными сторонами, защиту интеллектуальной собственности и коммерческой тайны);

  • установление целей обработки, ограничивающих обработку персональных данных; а также

  • курирование данных (включая ответственное хранение и обеспечение долговременной доступности).
Настоящий британский стандарт продвигает передовую практику, адресованную всем обрабатывающим и использующим данные организациям. В зависимости от особенностей условий деятельности или устройства организации, стандарт также охватывает данные, которые можно рассматривать как «большие данные». Таким образом, несмотря на то, что в тексте везде говорится о «данных» вообще, сюда входят и «большие данные».

Понятие «большие данные» и его трактовка продолжают эволюционировать. Для целей настоящего документа:
  • под «большими данными» могут пониматься отдельные, разрозненные либо интегрированные наборы данных:

  • «большие данные» отличаются объемом, разнообразием, наличием «шума», скоростью производства/поступления и/или изменчивостью; и потенциально требуют применения масштабируемых систем и технологий для их эффективного хранения, манипулирования, управления и анализа с целью получения от них отдачи.
В настоящем стандарте признается, что то, что является «большим» для одной организации, необязательно будет таковым для другой; и что технологии и условия деятельности могут часто меняться, поэтому любое точное определение, вероятно, потребует частого пересмотра.»
С моей точки зрения, представляет интерес раздел о принципах управления данными, которых предлагается семь:
1. Управление данными и их целостность

Следует знать содержание, происхождение, законность, точность, все применимые спецификации и ограничения использования (например, запрет на перепродажу), а также знать о распространении данных и связанных с ними метаданных.

Следует проверять и поддерживать целостность данных; устранять (или сводить до минимума) неточные данные из хранилища или из итоговых результатов.

Следует вести мониторинг систем больших данных, выявлять и реагировать на утечки данных.

2. Этичность, справедливость и прозрачность

Продемонстрируйте справедливость, прозрачность и этичность подходов, используемых при сборе, хранении, обработке и публикации данных.

Обеспечьте законность и этичность до осуществления сбора, обработки или распространения данных из любого источника (в число которых могут, например, входить локальные мониторы и датчики, процессы, сотрудники, государственные открытые источники данных).

3. Инвестиции и инновации

Для реализации на практике рекомендаций настоящего раздела следует адекватным образом поддерживать технологические, организационные и инновационные меры в качестве составной части стратегии обработки данных.

Следует генерировать доход на основе центров обработки данных и ноу-хау в отношении сбора и анализа данных посредством справедливого лицензирования.

Следует выявлять возможности, как связанные с технологиями, так и вытекающие из деловой деятельности.

4. Защита прав интеллектуальной собственности и чувствительной коммерческой информации

Следует обеспечить защиту чувствительной коммерческой информации и интеллектуальной собственности (включая патенты, авторские права, права на исполнение и образцы).

5. Уважение к личности

Продемонстрируйте соблюдение требований законодательства и хорошей практики, а также этичность обработки персональных данных, например, посредством проектирования полезных для физических лиц продуктов и услуг и надлежащего реагирования на поступающие от физических лиц запросы на доступ к данным и запросы на основании закона о свободе доступа к государственной информации.

6. Безопасность и неприкосновенность частной жизни

Сформулируйте и соблюдайте политики организации в отношении защиты неприкосновенности частной жизни, безопасности данных и информационной безопасности.

7. Вовлечение, распространение информации и обучение

Разработайте планы обучения и информирования, которые должны быть соответствующим образом адаптированы для различной аудитории, например, для детей, взрослых, бизнесменов, государственных служащих и представителей научного сообщества.
(Продолжение следует, см. https://rusrim.blogspot.com/2019/08/2_23.html )

Источник: Сайт Британского института стандартов
https://standardsdevelopment.bsigroup.com/projects/2019-00868
https://standardsdevelopment.bsigroup.com/projects/2019-00869

Комментариев нет:

Отправить комментарий