суббота, 14 октября 2017 г.

Эталонная модель OAIS и распределенное обеспечение долговременной сохранности электронных материалов


Заметка сотрудника Библиотеки Стенфордского университета д-ра Дэвида Розенталя (David Rosenthal – на фото, см. также https://www.lockss.org/contact-us/dshr/ ) была опубликована на его блоге (DSHR's Blog) 4 октября 2017 года. Розенталь был одним из инициаторов проекта LOCKSS (от Lots of Copies Keep Stuff Safe - «Множество копий гарантирует сохранность»), осуществляемого Стенфордским университетом с целью создания системы с открытым кодом, позволяющей библиотекам собирать, сохранять и предоставлять читателям доступ к материалам, опубликованным в Интернете.

Мой комментарий: Как в другом своём посте ( http://blog.dshr.org/2014/07/trac-certification-of-clockss-archive.html ) поясняет Дэвид Розенталь, архив CLOCKSS (см. https://clockss.org/clockss/Home ), о котором дальше пойдёт речь - это «тёмный» (т.е. не обслуживающий исследователей) архив контента электронных журналов и книг, совместно управляемый издателями и библиотеками, реализованный с использованием технологии LOCKSS. Управление архивом по поручению некоммерческой организации  CLOCKSS осуществляет группа LOCKSS в Библиотеке Стэнфордского университета.

Руководство «Аудит и сертификация доверенных хранилищ: Критерии и контрольный список» (Trustworthy Repositories Audit and Certification: Criteria and Checklist, TRAC) было разработано американским Центром научно-исследовательских библиотек (Center for Research Libraries, CRL) в 2007 году, см. http://www.crl.edu/sites/default/files/d6/attachments/pages/trac_0.pdf , с участием и при финансовой поддержке Национальных Архивов США (NARA).

Одним из уроков аудита архива CLOCKSS на соответствие требованиям TRAC в  (см. пост на блоге DSHR's Blog http://blog.dshr.org/2014/08/trac-audit-lessons.html - аудит проводился в 2014 году, его итоги опубликованы здесь:  http://www.crl.edu/sites/default/files/reports/CLOCKSS_Report_2014.pdf  - Н.Х.) было выявленное несоответствие между эталонной моделью открытой архивной информационной системы OAIS (описана в стандарте ISO 14721:2012  - Н.Х.) и распределенным подходом к обеспечению электронной сохранности:
Архив CLOCKSS организован централизованно, однако реализован в виде распределенной системы.

Предпринимаются усилия по согласованию полностью централизованной модели OAIS с реалиями применения распределенных систем обеспечения электронной сохранности (здесь автор ссылается на статью Элд Зирау (Eld Zierau) и Мэтта Шульца (Matt Schultz) «Создание концептуальных рамок для применения модели OAIS к распределенному обеспечению электронной сохранности» (Creating a Framework for Applying OAIS to Distributed Digital Preservation), см. http://purl.pt/24107/1/iPres2013_PDF/Creating%20a%20Framework%20for%20Applying%20OAIS%20to%20Distributed%20Digital%20Preservation.pdfН.Х.) , например, в таких коллективных проектах, как MetaArchive ( https://metaarchive.org/ );  или как совместный проект датской Королевской и университетской библиотеки в Копенгагене ( http://www.kb.dk/en/ ) и библиотеки Университета Орхуса (University of Aarhus,  http://library.au.dk/en/ ).

Хотя организационно архив CLOCKSS является централизованным, серьезные электронные архивы такого рода требуют распределенной реализации, хотя бы для достижения географической избыточности (т.е. для надёжного обеспечения сохранности за счёт хранения нескольких копий в географически удаленных местах – Н.Х.). Модель OAIS не в состоянии принять во внимание распределенный подход даже на уровне реализации, не говоря уже об организационном уровне.
В 19-ю годовщину программы LOCKSS ( http://blog.dshr.org/2013/10/it-was-fifteen-years-ago-today.html ) уместно обратить внимание на 38-минутное видео, выложенную в прошлом месяце и посвященную данной проблеме, см. https://vimeo.com/233024801 (это аудиозапись доклада на английском языке, наложенная на презентацию доклада – Н.Х.). В ней Элд Зирау описывает модель «Внешний OAIS - Внутренний OAIS», которую она и Нэнси Макговерн (Nancy McGovern) разработали для устранения упомянутого неоответствия и опубликовали в трудах конференции iPRES 2014.



Авторы применяют модель OAIS иерархически, сначала к распределенной сети электронной сохранности в целом (внешний OAIS), а затем к каждому узлу этой сети (внутренний OAIS). Это может быть полезно для описания функций узлов сети в отличие от сети в целом, и для выявления единых точек отказа, возникающих в связи с использованием централизованных функций в сети в целом.

И раз уж я рекламирую видеосюжеты, то хочу также отметить превосходное видео, выложенное на сайте Arquivo.pt ( http://arquivo.pt/ ) для широкой аудитории о важности веб-архивации, на португальском, но с субтитрами на английском языке, см. https://www.youtube.com/watch?v=YVqFey7hVJc

Дэвид Розенталь (David Rosenthal)

Мой комментарий: Обратите внимание на то, что блокчейн, о котором сегодня только ленивый не слагает фантастические легенды, не единственный распределенный подход, который можно применять в управлении документами и информацией и в архивном деле. Вполне можно обойтись и без полукриминальных систем типа «Биткойн» :) И в любом случае нужно пересматривать прежние модели, ориентированные на централизованные системы.

Источник: DSHR's Blog
http://blog.dshr.org/2017/10/oais-distributed-digital-presevation.html

Комментариев нет:

Отправить комментарий