понедельник, 6 августа 2012 г.

Электронная архивация во Франции: ad VITAM


Заметка Фредерика Брежье (Frédéric Brégier – на фото) была опубликована на блоге Национальных Архивов Франции 24 июля 2012 года. Фредерик Брежье с июня 2012 года возглавил проект создания электронного архива, осуществляемый Министерством культуры. Заголовок поста  «ad VITAM…» - игра слов: VITAM не только название новой системы, но и латинское слово «жизнь», поэтому заголовок можно перевести и как «К системе VITAM», и как «к жизни [вечной?]» :)

Национальные Архивы Франции начали  проект создания системы электронной архивации под названием VITAM. Его  цель – обеспечить выполнение архивной службой её миссии в отношении электронных данных, создаваемых государством и его органами. Консервативная оценка объёма таких данных - 7 тысяч терабайт в 2021 году.

Данный проект выполняется в тесном партнерстве с Министерством иностранных дел и Министерством обороны, которые занимаются аналогичными вопросами в своей сфере компетенции - это, соответственно, деятельность Дипломатических архивов (Archives diplomatiques) и Архивов министерства обороны (Archives de la Défense). В проекте, ввиду своего опыта, также принимает участие Министерство финансов, которое думает о дальнейшем развитии собственной системы «Arcade».

На первом этапе планируется  обеспечить архивацию материалов из программного приложения SOLON, используемого администрацией Премьер-министра, и передать электронные архивные документы, в настоящее время сохраняемые в системе Constance - это 15 терабайт в 2012 году [Проект Constance  («Постоянство», а также аббревиатура, расшифровываемая как «Conservation et stockage des Archives nouvelles constituées par l'électronique» - «Обеспечение сохранности новых архивных документов, созданных при помощи электронных средств») осуществлялся Национальными Архивами Франции с конца 1970-х годов. Его задачей было обеспечение долговременной сохранности статистических данных, дел, баз данных и офисных документов. Сейчас под этим названием известна служба Национальных Архивов, базирующаяся в Фонтенбло (Fontainebleau) и занимающаяся обеспечением сохранности электронных документов. Наиболее старые материалы относятся к началу 1960-х годов. См. также http://fr.wikipedia.org/wiki/Constance_%28archives_%C3%A9lectroniques%29Н.Х.]

Создаваемую систему предполагается запустить в эксплуатацию в конце 2014 года, при этом объём хранимых в ней данных будет составлять от 100 до 500 терабайт.

Говоря об электронной архивации, нужно сказать о двух областях и двух категориях специалистов, которые должны тесно сотрудничать между собой. Для каждой из этих областей кратко перечислим задачи, решаемые благодаря знаниям и навыкам представителей двух профессий.

1. Архивация

Помимо отбора данных, подлежащих постоянному хранению, следует также выделить ряд задач, связанных с выполнением архивистами своей основной миссии.
  • Обеспечение качества метаданных является ключевым вопросом в процессе архивации, как по причинам исторического характера, так и для обеспечения возможностей поиска документов.

    Перед архивистами стоит задача не только оценки информации, но и придания ей дополнительных свойств, таких как конфиденциальность, анонимность, формат и/или структура данных. Эти метаданные обеспечат возможность доступа к данным во времени.

    Качество создаваемых ИТ-специалистами поисковых средств будет зависеть от качества метаданных.

  • Обеспечение качества передаваемых на хранение данных также является ключевым вопросом с точки зрения обеспечения их долговременной сохранности. Формат данных будет в огромной степени влиять на их доступность во времени. ИТ-специалисты могут помочь архивистам в выборе форматов и в структуризации данных.

  • Для процессов передачи документов на хранение имеют значение вопросы обеспечения качества данных и метаданных, и, кроме того, приходится решать дополнительную задачу по достижению соглашения о сдаче данных между создающими их службами и службой электронной архивации.

    В этом соглашении должен быть оговорено содержание передаваемых на архивное хранение сдаточных информационных SIP-пакетов (автор использует терминологию стандарта OAIS, общепринятую в сфере электронной архивации – Н.Х.), объёмы и частота передачи, формат SIP-пакетов и метод передачи. Стандартизация формата и метода передачи является необходимым условием успешности проекта.
Начиная с этого момента, эстафета в плане реализации задач передается  ИТ-специалистам.

2. Информационные технологии

Помимо чисто технических аспектов программного или аппаратного характера, ИТ-специалистам приходится сталкиваться с двумя проблемами «масштабирования»:
  • Обеспечение сохранности данных и метаданных в таких объемах и в течение неопределенно долгого периода времени в настоящее время не является распространенной практикой.

    Большие объёмы предполагают использование надежных и эффективных решений. Что касается метаданных, то при таких объёмах невозможно станет использовать разработанные за последние тридцать лет традиционные инструменты - например, реляционные базы данных. Незаменимыми станут технологии «больших данных».

    Примеров использования такого рода технологий при работе с большими объёмами данных много: это Google, Amazon, Facebook, MTV Network (управление контентом), Национальные Архивы Великобритания, британский сайт gov.uk для взаимодействия с общественностью, исследовательский инструмент Sematext.

    Длительный срок хранения означает необходимость обеспечения высокого уровня безопасности и защищённости (в т.ч. репликацию), а также возможностей для масштабирования системы хранения. Исходя из принципа модифицируемости (см. ниже), данное требование распространяется на все платформы.

    Роль архивистов будет заключаться в консультировании ИТ-специалистов по вопросам функциональных требований. Примерами могут служить необходимость поддержки шифрования или сертификации ведомственных систем электронной архивации.

  • Модифицируемость (réversibilité) - это возможность с течением времени изменить всю или часть программной или аппаратной платформы, не ставя под сомнение возможность её дальнейшего использования (конечно, если платформа заменяется целиком, то какие уж тут сомнения :) – Н.Х.).

    В отличие от бумажных архивов, для которых существуют известные и опробованные на практике методы обеспечения сохранности, неясно, какими будут информационные технологии через 50 лет. Поэтому, даже не пытаясь предвидеть будущее, в концепцию платформы VITAM закладывается принцип модифицируемости каждой из её компонентов. Предусматривается интерфейс, дающий возможность заменять компоненты по мере развития информационных технологий. Конструкция платформы сознательно сделана модульной. Такой подход позволяет минимизировать риски, связанные с изменением технологий.

  • Автоматизация является важной задачей в области ИТ. Уже не существует крупных систем, в которых бы не предусматривалась автоматизация деловых процессов.

    В результате изменяется роль архивиста. До сих пор, по необходимости, архивисты выполняли роль хранителей и кураторов. В будущем архивисты будут заниматься фундаментальными процессами архивирования, в то время, как вопросы хранения и поиска будет решаться ИТ-специалистами.

    Далее, невозможно будет поштучно «вручную» проверить все сдаточные SIP-пакеты, прежде чем создавать на их основе архивные информационные AIP-пакеты, или все выдаваемые пользователям дистрибутивные информационные DIP-пакеты. Единственный случай, когда архивист сможет «вручную» вмешаться, это если в процессе проверки SIP-пакета будет выявлено какое-либо несоответствие. Процесс проверки будет автоматизирован.

    В то же время спецификация процессов проверки - задача архивиста, а не ИТ-специалиста, который не является специалистов по данному вопросу.

    Тесное сотрудничество между архивистами и ИТ-специалистами является ключом к успеху такого проекта, поскольку каждому из них при решении своих задач необходимы знания и навыки, которыми располагают представители другой профессии.
Фредерик Брежье (Frédéric Brégier),
Отдел информационных систем (sous-direction des systèmes d'information, SDSI)

Дополнение от 8 ноября 2013 года. Я позаимствовала из недавнего поста Фредерика Брежье на его блоге (см. http://archiverleternite.blogspot.fr/2013/10/un-peu-de-publicite.html ) картинку, показывающую основные элементы и основных участников проекта VITAM:


О проекте VITAM также можно прочитать в следующих постах: http://rusrim.blogspot.ru/2013/06/dlm.html  (27.06.2013), http://rusrim.blogspot.ru/2013/09/blog-post_576.html  (23.09.2013)

Источник: блог Национальных Архивов Франции
http://www.archivesnationalesfrance.blogspot.fr/2012/07/ad-vitam.html 
http://frederic.bregier.free.fr/res/Default/cvfrdricbrgier2012.pdf

2 комментария:

  1. Natasha,

    One of my collegue points me your blog. I'm pleased to see that you have looked at one of the project information page available. I just checked and it seems the link you refer (archivesnationalesfrance.blogspot) is no more active (I'm not in charge of this one).
    However you could have also a look at my current "personal" blog, which is a sort of journal of the preliminary studies around our VITAM project in France (interministerial project, which whishes to cover all electronic archives future platforms for french state agencies and ministeries). The project is at its very beginning steps...
    The blog is currently only in French, hoping you can either read it or translate it... : http://archiverleternite.blogspot.fr/

    Best regards,
    Frederic

    ОтветитьУдалить
  2. Dear Frederic,

    Thank you for the information and for the link to your blog. I’ve added it to my “watch list” :) I’ve also added to this post the picture from your invitation to VITAM seminar.

    With my best wishes,
    Natasha

    ОтветитьУдалить