понедельник, 24 декабря 2018 г.

Разработка и реализация программы обеспечения долговременной сохранности в Британской геологической службе, часть 1


Данный пост специалиста по управлению научно-исследовательскими данными Британской геологической службы (British Geological Survey, https://www.bgs.ac.uk/ ) и обеспечению их долговременной сохранности Джааны Пинник (Jaana Pinnick – на фото) был опубликован 21 ноября 2018 года на блоге британской Коалиции по электронной сохранности (Digital Preservation Coalition, DPC) среди материалов, приуроченных к Международному дню электронной сохранности, который отмечался 29 ноября 2018 года (см. https://dpconline.org/blog/idpd ).

Развивать возможности Британской геологической службы (British Geological Survey, BGS) по обеспечению долговременной сохранности электронных материалов мы начали в 2016 году, изучив первоначальные требования и подготовив политику обеспечения сохранности, которая будет направлять дальнейшую работу. В этом посте рассказывается о том, чего нам удалось достичь к настоящему времени.

Предыстория

В соответствии с Законом о государственных документах (Public Records Act), Британская геологическая служба является авторизованным местом депозитарного хранения и обязуется обеспечить постоянное курирование определенных геолого-геофизических данных постоянного срока хранения, ответственным хранителем которых она является.

Принадлежащий службе Национальный центр геофизических научных данных (National Geoscience Data Centre, NGDC) делает большую часть своих данных свободно доступными на условиях «лицензии открытого правительства» (Open Government Licence). BGS также по закону обязана обеспечить управление некоторыми типами данных. Политика в отношении данных Британского органа по научным исследованиям и инновациям (UK Research and Innovation, UKRI, https://www.ukri.org/ - действующая с апреля 2018 года организация, в задачи которой входит координация финансирования научных исследований – Н.Х.) требует, чтобы данные, признанные имеющими долгосрочную ценность, были сохранены и оставались доступными для будущих исследований; при этом NGDC считает, что большая часть его геолого-геофизических данных должна храниться дольше, чем установленный этой политикой 10-летний срок.

Геолого-геофизические данные включают многочисленные типы данных, от геохимических, сейсмических, нефтегазовых и геофизических данных и до данных о породах, минералах, отложениях, почвах, загрязнении земель, природных ресурсах, эрозии и многом другом. Они включают геопространственные данные и данные геоинформационных систем (GIS), представленные в различных географических системах координат, а также векторные и растровые данные, хранящиеся в виде слоев и используемые в картографировании.

Наше целевое сообщество пользователей очень широко - от местных органов власти и органов центрального правительства до сфер промышленности, производства, строительства, транспорта, научных исследований, а также широкой общественности. Геофизические научные данные помогают создавать новые продукты и знания и давать ответы на насущные научные вопросы; они используется в процессе принятия решений и для построения моделей инфраструктуры и рисков, для инноваций и иного использования и обмена.

Чтобы справиться с управлением всем этим разнообразием, требуется использование стандартов и нормализация данных и метаданных. Наличие сервиса BGS поиска по метаданным означает, что данные, хранящиеся в NGDC, могут быть найдены через службу каталогов данных (Data Catalogue Service, https://csw-nerc.ceda.ac.uk/geonetwork/srv/eng/catalog.search;jsessionid=BCDEEFFC104776FB629EAD999B7BBA40#/home ) британского Научного совета по природной среде (Natural Environment Research Council, NERC), через платформу открытых данных правительства Великобритании Data.gov.uk ( https://data.gov.uk/ ) и через портал геофизических данных Еврокомиссии INSPIRE Geoportal ( http://inspire-geoportal.ec.europa.eu/ ).

За последние три года мы повысили долговременную живучесть и пригодность к использованию наших данных, внедрив в организации стиль мышления, учитывающий вопросы долговременной сохранности.

Проблемы обеспечения долговременной сохранности

Помимо обычных проблем долговременной сохранности, существуют и дополнительные, специфические для геофизических данных:
  • Сбор данных глубинного бурения, до глубин многих километров, обходится в десятки миллионов фунтов и слишком дорог, чтобы проводить его повторно. Ещё одним примером уникальных данных являются сейсмические данные, собираемые во время землетрясений.

  • Геофизические данные имеют долговременную ценность и поддерживают будущие исследования, поэтому экспертиза ценности является ключевым элементом при создании надежных и повторно используемых наборов данных.

  • Отсутствие в унаследованных данных условий их сбора или пространственной привязки означает невозможность их повторного использования, а также то, что сделанные на основе этих данных выводы не будут достоверными.

  • Восстановление данных с магнитных лент, которые широко использовались в ряде геофизических исследований, требует значительных ресурсов.

  • Новые способы сбора данных с использованием сенсорных сетей и сетей мониторинга приведут к потопу данных, значительно обостряя проблемы описания и хранения.
Но электронная сохранность зависит не только от инструментов и технологий, но также и от людей, делающих эту работу. Необходимо стратегическое мышление для того, чтобы обеспечить развитие и поддержание цифровых навыков и компетенций, покрывающих все аспекты жизненного цикла данных. Нам необходимо управлять переходом наших сотрудников с аналогового на цифровое мышление, а создание сервисов с использованием различных источников финансирования на основе объединенных требований заинтересованных сторон является отнюдь не простым прямолинейным процессом.

Всегда есть вариант ничего не делать и просто хранить данные. Это связано с риском того, что всё больше данных станут непригодными для использования, что приведет к потере способности быстро, полно и точно давать ответы на научные вопросы (а BGS полагается на эту способность при ведении своей основной деятельности), а также к потере репутации национальной архивной организации. В этом случае возможность использования уникальных наборов геолого-геофизических данных будет поставлена под угрозу, а потенциал для разработки новых научно-информационных продуктов может пострадать.

Прогресс к настоящему времени

Мы разработали онлайн-портал приёма данных на депозитарное хранение (Data Deposit Portal) с тем, чтобы стандартизировать прием электронных данных и метаданных, и мы рекомендуем передающим данные организациям использовать открытые и подходящие для долговременного хранения файловые форматы. Постоянное совершенствование процессов и автоматизация помогают смягчить последствия роста объемов данных, а применение DOI-идентификаторов для наборов данных обеспечивает стабильные ссылки на данные.

Наша политика электронной сохранности была опубликована и начала внедряться в 2017 году. Разработка политики может показаться пугающе сложным делом, однако в Интернете доступно много такого рода документов, на примере которых можно поучиться. Мы проанализировали политики ряда организаций государственного сектора, включая Британскую библиотеку, Национальные Архивы Великобритании, Парламентские Архивы Великобритании, - а также нескольких британских и европейских университетов и электронные библиотек.

Справочник по вопросам электронной сохранности (DPC Handbook, о нём см. https://rusrim.blogspot.com/2015/11/blog-post_12.html - Н.Х.), опубликованный британской Коалицией по электронной сохранности (Digital Preservation Coalition, DPC), включает прекрасные рекомендации по формированию стратегии и политики организации по обеспечению долговременной сохранности, и Коалиция также проводит тематические семинары для своих членов.

Мы хотели, чтобы наша политика была кратким высокоуровневым документом. Для начала мы определили сферу охвата и цели политики, и перечислили ту отдачу, которую даёт организации налаживание электронной сохранности. Затем мы обрисовали в общих чертах концепцию электронной сохранности, а также наши первоначальные требования и деловые потребности; определили роли и необходимые ресурсы. Чтобы ознакомить с основами руководителей из сфер деятельности, не связанных с ИТ (читай: ученых), мы описали в документе ряд ключевые понятий, связанных с обеспечением сохранности. Нашу политику мы опубликовали на веб-сайте NGDC, чтобы заверить сдающие организации в долговременной защищённости и безопасности их данных, и мы будем пересматривать эту политику каждые три года.

(Окончание следует, см. http://rusrim.blogspot.com/2018/12/2.html )

Джаана Пинник (Jaana Pinnick)

Источник: блог Коалиции по электронной сохранности
https://dpconline.org/blog/idpd/developing-a-digital-preservation-programme-at-bgs

Комментариев нет:

Отправить комментарий