пятница, 13 июля 2018 г.

Новая эра сотрудничества в проведении исследований в области обеспечения долговременной сохранности электронных материалов


Заметка основателя и директора по технологиям компании Preservica Джона Тилбери (Jon Tilbury – на фото) была опубликована на блоге британской Коалиции по электронной сохранности (Digital Preservation Coalition, DPC) 29 июня 2018 года.

Вы, возможно, уже видели выпущенное на этой неделе объявление (см. https://preservica.com/resources/press-releases/arkivum-artefactual-the-open-preservation-foundation-and-preservica-collaborate-on-new-jisc-initiative-for-sharing-preservation-action-best-practice - для доступа может потребоваться анонимайзер – Н.Х.) о финансируемом британским Объединенным комитетом по информационным системам (Joint Information Systems Committee, JISC,  https://www.jisc.ac.uk/ ) совместном проекте, которые должен объединить усилия в области исследований компаний Arkivum ( https://arkivum.com/ ), Archivematica ( https://www.archivematica.org/en/ ), Preservica ( https://preservica.com/ ) и Фонда «Открытая сохранность» (Open Preservation Foundation, OPF,  http://openpreservation.org/ - ранее известный как фонд «Открытые планеты», Open Planets Foundation – Н.Х.), с тем, чтобы организовать обмен информацией об опыте обеспечения долговременной сохранности электронных данных.

Я, как член этой новой команды, буду рад поделиться своими мыслями о том, как всё это произошло и к чему это может привести. Данное событие может стать началом новой эры совместных исследований, проводимых всеми новаторами в области электронной сохранности, и в результате могут быть получены два очень важных результата – электронная сохранность может стать лучше, и обеспечивать её может стать проще.

Я проработал 20 лет в сфере электронной сохранности, и меня очень огорчает то, что многие «острова» передового опыта и практики изолированы друг от друга и сведения о них распространяются только через локальные группы, на конференциях и в определенных сообществах пользователей конкретных продуктов. Многие не известны за пределами разработавших их организаций и учреждений, несмотря на вложенные в них творческие усилия и детальные исследования. Это иронично, поскольку наше сообщество в основное неконкурентное и его члены с удовольствием учатся друг у друга – но у них нет для этого эффективного механизма. В ряде своих докладов на конференции Специальной тематической группы по вопросам обеспечения сохранности и архивации (Preservation and Archiving Special Interest Group, PASIG, http://sun-pasig.ning.com/ ) я настоятельно призывал к более тесному сотрудничеству между всеми игроками в этой области.

Именно такого рода проблемы призван решить недавно объявленный проект создания реестра мер по обеспечению долговременной сохранности (Preservation Actions Registry, PAR). Эта амбициозная инициатива финансируется Джоном Кэй (John Kaye) из JISC как часть проекта Общих услуг по работе с научно-исследовательскими данными (Research Data Shared Service, RDSS,  https://www.jisc.ac.uk/rd/projects/research-data-shared-service ) с целью дать пользователям системы наилучшие рекомендации о том, как им обеспечить долговременную сохранность тех научных данных, за сохранение которых они несут ответственность. Реестр позволит пользователям сосредоточить свои усилия на исследованиях, а не на вопросах электронной сохранности, будучи уверенными в том, что их контент будет доступен в будущем. Поскольку RDSS включает в себя как решение Preservica, так и решение Archivematica, необходимо, чтобы эти системы могли делиться друг с другом передовой практикой с тем, чтобы пользователи могли учиться у всех, а не только у тех, кто пользуется такой же системой.

Партнеры RDSS по обеспечению электронной сохранности, - Arkivum, Archivematica, а также наша компания Preservica, - очень позитивно отнеслись к данной инициативе. На самом деле в прошлом было сделано немало попыток реализовать подобную концепцию, главным образом, путем создания супер-реестров, в названии которых присутствовали слова «окончательный» или «глобальный». Однако на этот раз проект является более реалистичным и нацелен на конкретный вариант использования, и все партнеры быстро согласились его поддержать; а затем к этой инициативе присоединился Фонда «Открытая сохранность» (OPF), который будет представлять точку зрения более широкого сообщества и имеет возможность размещать в будущем любых общие реестры.

Команда проекта

Команда проекта в совокупности обладает колоссальным опытом, и её возглавляют следующие эксперты:
  • от Arkivum - Мэтью Аддис (Matthew Addis);

  • от Archivematica - Джастин Симпсон (Justin Simpson);

  • от OPF - Карл Уилсон (Carl Wilson);

  • от Preservica - Джек О'Салливан (Jack O’Sullivan);

  • от JISC – Пол Стоукс (Paul Stokes).
План заключается в том, что, как только будет готова демонстрирующая работоспособность подхода пилотная версия (Proof of Concept), протоколы и модель данных будут свободно доступны для всех пользователей по всему миру, и мы будем приветствовать присоединение к проекту многих новых участников.

Обмен знаниями в рамках RDSS

Как я уже сказал выше, первоначальная усилия будут направлены на удовлетворение потребностей британских вузов, участвующих в проекте JISC RDSS - Общих услуг по работе с научно-исследовательскими данными. Исследователи получат возможность получать актуальные рекомендации по обеспечению электронной сохранности и действовать в соответствии с ними, что повысит ценность RDSS для академического сообщества Великобритании.

Идея проекта заключается в совместной работе над механизмами обмена и распространения используемых в различных системах наилучших практик выполнения действий по обеспечению долговременной сохранности. Основное внимание при этом будет уделено протоколам обмена, общей модели данных и развертывании API-интерфейсов для чтения и подготовки рекомендаций. Под «действиями по обеспечению долговременной сохранности» (Preservation Actions) мы понимаем методы идентификации файловых форматов, извлечения свойств / метаданных из файлов, списки свойств / метаданных, которые можно извлечь (и что они означают), методы проверки файлов, миграции файлов из одного формата в другой и способы их отображения. Пользователи решений Preservica и Archivematica смогут делиться своими правилами и видеть, какие правила используют их коллеги - и применять их в своих системах.

В рамках данного проекта будет протестирована концепция такого обмена на основе общей модели данных и опубликованных API-интерфейсов. Эта часть работы завершится в конце июля, и ряд дальнейших работ запланирован на следующие несколько месяцев.

Обмен знаниями со всем сообществом

Подтверждение работоспособности концепции - это только начало. В ходе дальнейшей работы будут расширены и сделаны более продуктивными интерфейсами; это поощрит большее число пользователей присоединиться к этой инициативе. В их числе будут выполняющие научно-исследовательскую работу практики и отраслевые эксперты, имеющие детальные знания о конкретных типах контента - например, об аудиовизуальных материалах, PDF-документах или научно-технической и опытно-конструкторской документации. Любой, кого интересует передовой опыт, сможет одним щелчком мыши получить совет от ведущих специалистов мира.

Существует также возможность немедленной публикации наилучшей практики в действующих системах, что позволит пользователям, желающим «принять значения по умолчанию» доверять центральному органу, распространяющему готовую для широкого применения, проверенную передовую практику, без необходимости обновления систем. Эта возможность представляется мне наиболее интересной, поскольку она дает возможность пользователям с небольшим опытом в области электронных технологий эффективно использовать сложные, порой даже пугающе сложные технологии электронной сохранности.

Дополнительная информация

Более подробную информацию о проекте можно найти здесь: www.parcore.org (или https://parcore.readme.io/ ). Мы также представим совместный доклад и статью о проекте PAR на конференции iPres, которая пройдёт в этом году в Бостоне 24-27 сентября 2018 года. Полный текст статьи, которая называется «Обеспечение интеоперабельности в электронной сохранности посредством использования реестров мер по обеспечению долговременной сохранности» (Digital Preservation Interoperability through Preservation Actions Registries), доступен по адресу https://ndownloader.figshare.com/files/12127601 .

Совместная работа

С моей точки зрения, замечательно, что конкуренты могут работать вместе с тем, чтобы помочь создать механизмы для решения существующих проблем электронной сохранности. Эти проблемы не по силам одной отдельной компании, и в результате такого сотрудничества в выигрыше будут пользователи как решения Archivematica, так и решения Preservica. Я надеюсь, что в будущем мы будем вспоминать сегодняшние события как поворотный момент в обмене информацией об обеспечении электронной сохранности, способствовавший быстрому ускорению исследований, сокращению дублирования усилий и получению всеми, кто в этом нуждается, наилучших советов, как только те будут опубликованы.

Джон Тилбери (Jon Tilbury)

Источник: блог Коалиции по электронной сохранности (Digital Preservation Coalition, DPC)
https://dpconline.org/blog/a-new-era-in-collaboration-in-digital-preservation-research

Комментариев нет:

Отправить комментарий