четверг, 13 ноября 2014 г.

Модели архивных информационных AIP-пакетов OAIS-систем: Нужны ли нам общие форматы для обмена AIP-пакетами?


Данная заметка Марека Меличара (Marek Melichar – на фото) была опубликована 29 октября 2014 года на блоге Digital Preservation CZ («Электронная сохранность в Чехии», http://digital-preservation-cz.blogspot.com )

Мой комментарий: В базовом международном стандарте электронной архивации ISO 14721:2012 «Системы передачи данных и информации о космическом пространстве. Открытая архивная информационная система. Эталонная модель» (Space data and information transfer systems - Open archival information system (OAIS) - Reference model, о нём см. также http://rusrim.blogspot.ru/2012/06/oais.html ), под «архивным информационным пакетом» (Archival Information Package, AIP) понимается формат хранения документов внутри архивной информационной системы.

За время работы в области обеспечения долговременной сохранности у меня была возможность «заглянуть под капот» нескольких систем, разработанных с целью соответствовать эталонной модели OAIS. В течение нескольких лет я познакомился с системами Rosetta, SDB (Safety Deposit Box, «Сейф» - решение фирмы Tessella, облачный вариант которого известен как Preservica – Н.Х.), RODA, ещё с одной системой, самостоятельно разработанной в Словакии, а также, менее детально, с ещё несколькими коробочными и доработанными под собственные нужды решениями. Включившись в проект LTP-Pilot (Pilotní projekt pro low-barrier přístup k ochraně digitálního obsahu  - «Пилотный проект по отработке "низкобарьерного" подхода к обеспечению сохранности электронного контента», http://www.muni.cz/ics/research/projects/28563  - Н.Х.) университета имени Масарика в Брно, я начал более внимательно изучать систему Archivematica, находящуюся в центре внимания данного проекта (а также ряда других проектов в Чехии - Archivematica вроде бы используется Национальными Архивами Чехии; Национальный киноархив и Библиотека Академии наук также присматриваются к этому решению).

Стандарт OAIS (ISO 14721) описывает функциональные элементы и информационную модель. По ряду причин я склонен считать, что для понимания OAIS-системы всегда очень полезно начать с информационной модели -  то есть разобраться с тем, как описанные в стандарте OAIS типы информации находят отражение в структуре архивного AIP-пакета, как может быть устроен сдаточный SIP-пакет (это формат, в котором документы и их метаданные передаются фондообразователем в электронный архив – Н.Х.) и как он преобразуется в AIP-пакет; что может быть сделано с AIP-пакетом впоследствии, когда он уже находится в хранилище. Модель AIP-пакета отражает философию разработчика OAIS-системы в отношении обеспечения долговременной сохранности, а также налагает ограничения на потенциальные функциональные возможности системы.

Глядя на N-ое решение с одними и теми же амбициями (быть соответствующей стандарту «OAIS-системой»), я понял, что между ними есть немало различий на уровне модели данных AIP-пакетов. Если за 10 лет существования стандарта OAIS мы наблюдаем такие различные подходы к его реализации, как модель на основе FOXML в системе RODA («Хранилище аутентичных электронных объектов», Repositório de Objectos Digitais Autênticos – Н.Х.); модель на основе Bagit в системе Archivematica; решения на основе METS (Metadata Encoding and Transmission Standard – стандарт кодирования и передачи метаданных – Н.Х.), а также не соответствующие METS простые одиночные контейнеры метаданных, как в Rosetta, SDB и некоторых других решениях, - не говоря уже о других подходах, таких как SPAR (система электронной архивации – Н.Х.) Национальной Библиотеки Франции, - то можно ли ожидать хоть какого-то уровня совместимости через 50 лет? Как мы собираемся мигрировать AIP-пакеты из одной системы в другую? Означает ли это, что мы станем сбрасывать использовавшиеся прежним хранилищем метаданные в «мешок» для метаданных, подтверждающих происхождение электронного объекта, и будем брать для создания новых AIP-пакетов лишь часть информации? Или же нам следует замахнуться на большее, стараясь перенести максимум информации о происхождении и контрольной информации их журналов аудита в новые системы?

Я всегда был довольно скептически относился к практической полезности абстрактных моделей, таких, как «Доверенный электронный объект» (Trustworthy Digital Object, TDO, http://archivists.metapress.com/content/g513766100731832). Но разве не стоит нам попытаться спроектировать некий «Единый формат для обмена AIP-пакетами» (“Common AIP Exchange Format”) или же разработать стандартный метод обмена AIP-пакетами, ускоряющий обмен AIP-пакетами между системами и позволяющий сохранить максимум информации? Я не знаю, был ли проект TIPR (Towards Interoperable Preservation Repositories, «На пути к созданию способных взаимодействовать электронных хранилищ»,  http://wiki.fcla.edu/TIPR/1 ) доведен до практической реализации, но использование «пакета для обмена между хранилищами» (Repository Exchange Package) может стать одним из способов решения проблемы. Однако этот проект, похоже, был ограничен географическими рамками и закончился в 2011 году, без каких-либо дальнейших попыток расширения сообщества пользователей.

Если попытаться оценить положение дел с электронными LTP-хранилищами (от Long-Term Preservation – «долговременная сохранность» - Н.Х.) через 50 лет, то можно ожидать, что к этому времени каждый AIP-пакет дважды пройдёт процесс миграции из одной системы в другую. Разве нам не следует иметь четкое общее представление о том, что должно быть сохранено в ходе таких миграций? И разве не следует всё это явным образом сформулировать в виде общепринятого стандарта?

Марек Меличар (Marek Melichar)

Источник: блог Digital Preservation CZ
http://digital-preservation-cz.blogspot.ru/2014/10/oais-systems-aip-modeling-do-we-need.html 

Комментариев нет:

Отправить комментарий