пятница, 17 июля 2020 г.

Принципы TRUST для цифровых хранилищ


Данная статья большого коллектива авторов (19 человек!), в числе которых есть ряд известны специалистов, была опубликована 14 мая 2020 года в онлайн-журнале «Научные данные» (Scientific Data, ISSN 2052-4463, том 7, статья 144 (2020)), публикуемом издательством Шпрингер (Springer). В статье речь идёт о доверенных хранилищах научно-исследовательских данных.

Список авторов: Давэй Лин (Dawei Lin), Джонатан Крэбтри (Jonathan Crabtree), Ингрид Дилло (Ingrid Dillo), Роберт Даунс (Robert R. Downs), Рори Эдмундс (Rorie Edmunds), Дэвид Джаретта (David Giaretta), Мариса де Джусти (Marisa De Giusti), Эрве Льорс (Hervé L’Hours), Вим Хьюго (Wim Hugo), Рейна Дженкинс (Reyna Jenkyns), Варша Ходияр (Varsha Khodiyar), Мэриэн Мартони (Maryann E. Martone), Мустафа Мокран (Mustapha Mokrane), Вивек Наваль (Vivek Navale), Джонатан Петтерс (Jonathan Petters), Барбара Сирман (Barbara Sierman), Дина Соколова (Dina V. Sokolova), Мартина Штокхаузе (Martina Stockhause) и Джон Уэстбрук (John Westbrook).


Поскольку информационно-коммуникационные технологии стали в нашем обществе повсеместно распространёнными, мы все больше зависим как от цифровых данных, так и от хранилищ (репозиториев), которые обеспечивают доступ и делают возможным использование таких ресурсов. Хранилища должны завоевать доверие сообществ, которые они намерены обслуживать, и продемонстрировать свою надежность и способность надлежащим образом управлять хранимыми ими данными.

Вслед за проходившим в течение года публичным обсуждением и опираясь на сложившийся в профессиональном сообществе консенсус, несколько заинтересованных сторон, представляющих различные сегменты сообщества цифровых хранилищ, совместно разработали и одобрили набор руководящих принципов для демонстрации надежности цифрового хранилища.

Принципы TRUST (слово «доверие», в которое складываются первые буквы принципов – Transparency (прозрачность), Responsibility (ответственность), User focus (ориентация на пользователей), Sustainability (жизнестойкость) и Technology (технологии)) представляют собой общую основу, которая облегчает для всех заинтересованных сторон обсуждение и внедрение передового опыта в области обеспечения сохранности цифровых данных.

Мой комментарий: Честно говоря, я не слишком доверяю принципам, которые подбираются таким образом, чтобы «сложиться» в красивую аббревиатуру :)

Прозрачность

Все потенциальные пользователи, которым нужно подобрать наиболее подходящее хранилище для конкретного варианта использования, выиграют от возможности легко находить и получать доступ к информации о сфере охвата, целевом сообществе пользователей, политиках и возможностях хранилища данных. Прозрачность в этих вопросах даёт возможность больше узнать о хранилище и оценить его пригодность с точки зрения конкретных требований пользователей, включая вопросы депонирования данных, обеспечения их долговременной сохранности и поиска.

Чтобы соответствовать данному принципу, хранилища должны предоставить, как минимум, четкое описание своей миссии и сферы охвата хранилища. Кроме того, должны быть прозрачно освещены следующие вопросы:
  • Условия использования, как для хранилищ, так и для фондов данных (data holdings);

  • Минимальный сроки сохранения цифровых данных для фондов данных;

  • Сведения о всех соответствующих дополнительных функциональных возможностях или услугах, например, способность ответственно курировать «чувствительные» данные.
Чёткое информирование о политиках хранилищ и, в частности, об условиях их использования фондами данных, осведомляет пользователей обо всех ограничениях, которые могут ограничивать использование ими находящихся в хранилище данных. Аналогичным образом, возможность легко оценить, способно ли хранилище ответственным образом обрабатывать конфиденциальные данные, также будет влиять на их решение о том, использовать ли имеющиеся сервисы данных.

Ответственность

Доверенные хранилища (в оригинале игра слов: TRUSTworthy, помимо «заслуживающие доверия», также означает «соответствующие принципам TRUST» - Н.Х.) берут на себя ответственность за курирование хранимых ими данных и за обслуживание своего целевого сообщества пользователей. Ответственное отношение демонстрируется:
  • Соблюдением стандартов метаданных и курирования целевого сообщества, а также обеспечением курирования фондов данных, включающим, например, техническую валидацию, документацию, контроль качества, защиту аутентичности и долговременную живучесть.

  • Предоставление сервисов данных, например, портальных и машинных интерфейсов, скачивание данных или обработка данных на сервере.

  • Управление правами интеллектуальной собственности производителей данных, защита конфиденциальных информационных ресурсов, а также обеспечение безопасности системы и её контента.
Пользователи хранилища должны быть уверены в том, что депонентам данных предлагается предоставить все метаданные в соответствии с соответствующими нормами сообщества, поскольку это значительно повышает возможность обнаружения и полезность данных. Знание того, что хранилище проверяет целостность имеющихся данных и метаданных, даёт потенциальным пользователям уверенность в том, что фонды данных с большей вероятностью будут интероперабельны с другими соответствующими наборами данных. И депоненты, и пользователи должны быть уверены в том, что данные будут оставаться доступными с течением времени, и, следовательно, их можно будет цитировать и на них можно будет ссылаться в научных публикациях.

Ответственность может быть прояснена с помощью определённых правовых средств (право на долговременную сохранность), и может принимать форму добровольного соблюдения определённых норм (этических стандартов).

Ориентация на пользователей

Доверенное хранилище должно быть ориентировано на обслуживание целевого сообщества пользователей. У каждого сообщества пользователей вполне могут иметь свои ожидания в отношении им хранилища, отчасти в зависимости от зрелости сообщества в вопросах управления данными и обмена ими. Доверенное хранилище «встраивается» в практику работы с данными целевого сообщества пользователей, и может поэтому реагировать на меняющиеся требования сообщества. Мы трактуем понятие «сообщество пользователей» широко, поскольку сообщества могут включать пользователей, размещающих или получающих доступ к данным; тех, кто обращается к фондам данных программно; и косвенно заинтересованные стороны, такие как финансирующие организации, редакторы журналов, другие институциональные партнёры или граждане.

Использование и повторное использование научно-исследовательских данных является неотъемлемой частью научного процесса, и поэтому доверенные хранилища должны обеспечивать своему сообществу возможность находить, изучать и понимать свои фонды данных в плане их потенциального (повторного) использования. Хранилища должны поощрять пользователей к полному описанию данных во время депонирования, и облегчать обратную связь по всем проблемам, связанным с данными (таким, например, как качество или пригодность для использования), которые могут всплыть после того, как данные станут доступными.

Хранилища играют важнейшую роль в применении и обеспечении соблюдения норм и стандартов целевого сообщества пользователей, поскольку соответствие нормам и стандартам облегчает интероперабельность и повторное использование данных. Стандарты данных, соблюдение которых доверенные хранилища должны обеспечивать, включают схему метаданных, файловые форматы данных, контролируемые словари, онтологии и иную семантику, если таковая существуют в сообществе пользователей.

Доверенное хранилище может продемонстрировать приверженность этому принципу посредством:
  • Внедрения соответствующих метрик данных и предоставления их пользователям;

  • Предоставления (или содействия разработке) каталогов сообщества, облегчающих обнаружение данных;

  • Мониторинга и выявления эволюционирующих ожиданий сообщества и реагирования по мере необходимости с целью удовлетворения этих меняющихся потребностей.
Жизнестойкость

Обеспечение жизнестойкости доверенного хранилища необходимо для обеспечения текущим и будущим сообществам пользователей бесперебойного доступа к их ценным фондам данных. Непрерывный доступ к данным зависит от способности хранилища предоставлять услуги во времени, и реагировать на меняющиеся требования целевого сообщества пользователей посредством предоставления новых или усовершенствованных услуг.

Доверенное хранилище может продемонстрировать жизнестойкость своих фондов посредством:
  • Успешного планирования действий по смягчению рисков, обеспечению непрерывности деловой деятельности, восстановления после катастроф и преемственности;

  • Гарантированного финансирования, обеспечивающего непрерывное использование и сохранение желаемых свойств ресурсов данных, обеспечение сохранности и распространение которые было поручено хранилищу;

  • Обеспечения стратегического управления вопросами необходимой долговременной сохранности данных, с тем, чтобы ресурсы данных оставались обнаруживаемыми, доступными и пригодными для использования в будущем.
Технологии

Для поддержки безопасных, стабильных и надёжных услуг, хранилище опирается на взаимодействие людей, процессов и технологий. Его деятельность и функции поддерживаются программным обеспечением, аппаратурой и техническими сервисами. Совместно они предоставляют инструменты, поддерживающие реализацию принципов TRUST.

Доверенное хранилище может продемонстрировать пригодность своих технологических возможностей посредством:
  • Внедрения соответствующих и надлежащих стандартов, инструментов и технологий для управления данными и их курирования;

  • Наличия планов и реализованных механизмов для предотвращения, обнаружения и реагирования на угрозы информационной и физической безопасности.
Источник: сайт онлайн-журнала «Научные данные» (Scientific Data)
https://www.nature.com/articles/s41597-020-0486-7

Комментариев нет:

Отправка комментария