Поводом продолжить рассказ о работе над двумя новыми британскими стандартами (см. мой предыдущий пост здесь: https://rusrim.blogspot.com/2019/07/blog-post_87.html ) стало то, что 4 августа 2019 года Британский институт стандартов (BSI) выложил их проекты для публичного обсуждения, в котором может принять участие любой желающий – само собой, при условии регистрации на сайте. Обсуждение на сайте BSI продлится до 31 октября 2019 года.
Текст проекта стандарта BS 10102-1 «Большие данные – Часть 1: Руководство для организации, деловая деятельность которой опирается на данные» (Big data. Part 1: Guidance for data-driven organization) выложен для обсуждения на странице https://standardsdevelopment.bsigroup.com/projects/2019-00868
Текст аннотации остался прежним:
«Данная часть стандарта BS 10102 содержит рекомендации по получению отдачи от данных, включая выявление глубинных взаимосвязей, поддержку формирования обоснованных стратегий, укрепление репутации и улучшение исполнения законодательно-нормативных требований, повышение эффективности и производительности.Однако дальше меня ждал сюрприз – оказывается, название стандарта вводит в заблуждение, и он посвящён отнюдь не исключительно большим данным, а управлению вообще любыми данными! В результате документ предстаёт совсем в ином свете. С одной стороны, он может использоваться более широко, а с другой – может сильно разочаровать тех, кто надеялся получить руководство именно по «большим данным».
Для достижения этого результата, в документе даются рекомендации по эффективному, ответственному и устойчивому управлению данными с тем, чтобы обеспечить надлежащий доступ к наборам данных требуемого качества.
Данная часть стандарта BS 10102 адресована организациям, формирующим или разрабатывающим свои стратегии данных, а также для тех, кто стремится улучшить свою текущую практику использования и организации данных. Документ применим в государственных, частных и некоммерческих организациях любого размера.»
Ниже приведен соответствующий фрагмент документа:
«Поскольку важность данных стала в большей мере осознаваться (и монетизироваться), а возможность совместно обрабатывать различные наборы данных стала преумножающим их ценность фактором, очевидной стала потребность более крупных организаций в надлежащим образом определенной архитектуры данных и обеспечении соответствия ей. Например, доступность поступающих в реальном времени на протяжении всего жизненного цикла данных об их функционировании превращает прежние продукты в более прибыльные сервисы. И, наоборот, растет понимание того, что слабое использование данных организацией приводит к неэффективности и принятию не лучших решений.С моей точки зрения, представляет интерес раздел о принципах управления данными, которых предлагается семь:
В число ключевых вопросов менеджмента данных в настоящее время входят:
Настоящий британский стандарт продвигает передовую практику, адресованную всем обрабатывающим и использующим данные организациям. В зависимости от особенностей условий деятельности или устройства организации, стандарт также охватывает данные, которые можно рассматривать как «большие данные». Таким образом, несмотря на то, что в тексте везде говорится о «данных» вообще, сюда входят и «большие данные».
- стандарты данных;
- стандарты метаданных;
- происхождение данных (provenance);
- актуальность данных (timeliness);
- повторяемость (потенциальная доступность регулярно поступающих данных);
- качество (включая точность, достоверность, непротиворечивость, полноту и уникальность);
- потенциальная взаимосвязь с другими наборами данных;
- миграция данных и управление мастер-данными;
- меры управления доступом и обеспечения безопасности при хранении;
- журналы аудита;
- стратегическое управление (включая исполнение требований законодательства и договорных обязательств);
- безопасность (включая кибербезопасность, противодействие сбору информации враждебными сторонами, защиту интеллектуальной собственности и коммерческой тайны);
- установление целей обработки, ограничивающих обработку персональных данных; а также
- курирование данных (включая ответственное хранение и обеспечение долговременной доступности).
Понятие «большие данные» и его трактовка продолжают эволюционировать. Для целей настоящего документа:
В настоящем стандарте признается, что то, что является «большим» для одной организации, необязательно будет таковым для другой; и что технологии и условия деятельности могут часто меняться, поэтому любое точное определение, вероятно, потребует частого пересмотра.»
- под «большими данными» могут пониматься отдельные, разрозненные либо интегрированные наборы данных:
- «большие данные» отличаются объемом, разнообразием, наличием «шума», скоростью производства/поступления и/или изменчивостью; и потенциально требуют применения масштабируемых систем и технологий для их эффективного хранения, манипулирования, управления и анализа с целью получения от них отдачи.
1. Управление данными и их целостность(Продолжение следует, см. https://rusrim.blogspot.com/2019/08/2_23.html )
Следует знать содержание, происхождение, законность, точность, все применимые спецификации и ограничения использования (например, запрет на перепродажу), а также знать о распространении данных и связанных с ними метаданных.
Следует проверять и поддерживать целостность данных; устранять (или сводить до минимума) неточные данные из хранилища или из итоговых результатов.
Следует вести мониторинг систем больших данных, выявлять и реагировать на утечки данных.
2. Этичность, справедливость и прозрачность
Продемонстрируйте справедливость, прозрачность и этичность подходов, используемых при сборе, хранении, обработке и публикации данных.
Обеспечьте законность и этичность до осуществления сбора, обработки или распространения данных из любого источника (в число которых могут, например, входить локальные мониторы и датчики, процессы, сотрудники, государственные открытые источники данных).
3. Инвестиции и инновации
Для реализации на практике рекомендаций настоящего раздела следует адекватным образом поддерживать технологические, организационные и инновационные меры в качестве составной части стратегии обработки данных.
Следует генерировать доход на основе центров обработки данных и ноу-хау в отношении сбора и анализа данных посредством справедливого лицензирования.
Следует выявлять возможности, как связанные с технологиями, так и вытекающие из деловой деятельности.
4. Защита прав интеллектуальной собственности и чувствительной коммерческой информации
Следует обеспечить защиту чувствительной коммерческой информации и интеллектуальной собственности (включая патенты, авторские права, права на исполнение и образцы).
5. Уважение к личности
Продемонстрируйте соблюдение требований законодательства и хорошей практики, а также этичность обработки персональных данных, например, посредством проектирования полезных для физических лиц продуктов и услуг и надлежащего реагирования на поступающие от физических лиц запросы на доступ к данным и запросы на основании закона о свободе доступа к государственной информации.
6. Безопасность и неприкосновенность частной жизни
Сформулируйте и соблюдайте политики организации в отношении защиты неприкосновенности частной жизни, безопасности данных и информационной безопасности.
7. Вовлечение, распространение информации и обучение
Разработайте планы обучения и информирования, которые должны быть соответствующим образом адаптированы для различной аудитории, например, для детей, взрослых, бизнесменов, государственных служащих и представителей научного сообщества.
Источник: Сайт Британского института стандартов
https://standardsdevelopment.bsigroup.com/projects/2019-00868
https://standardsdevelopment.bsigroup.com/projects/2019-00869
Комментариев нет:
Отправить комментарий