Статья, подготовленная Мие Стаге (Mie Stage), была опубликована 5 марта 2016 года на сайте датского издания Ingeniøren («Инженер»).
Наш читатель Игон Йенсен (Egon Jensen) спрашивает: Как архивируются принятые государством решения – например, законы, - которые необходимо сохранить для потомков?
Ему отвечает Ян Дальстен Сёренсен (Jan Dalsten Sørensen), главный специалист Национальных Архивов Дании (Rigsarkivet), отвечающий за обеспечение долговременной сохранности и конверсию/миграцию электронных материалов:
На фото: В архивохранилищах Национальных Архивов хранится 450 погонных километров бумажных документов - (C) Национальные Архивы Дании
Государству всегда было необходимо документировать свои решения и права. Ключевые государственные документы хранятся в Национальных Архивах (Rigsarkivet), которые, в соответствии со своим названием, отвечают за обеспечение сохранности как письменного, так и электронного культурно-исторического наследия таким образом, чтобы будущие поколения могли получить к нему доступ.
Самые старые подлинные документы, хранящиеся в отделениях Национальных Архивов в Копенгагене (København), Оденсе (Odense), Виборге (Viborg) и Обенро (Åbenrå), относятся к середине 1100-х годов. На протяжении многих лет коллекция бумажных документов Национальных Архивов увеличивалась в объёмах, и сейчас это около 450 погонных километров документов.
Начиная с 1960-х годов постоянно увеличивались масштабы использования информационных технологий, и сегодня государственное управление в Дании почти на 100 процентов является электронным. Переход на электронные технологии привёл к колоссальному увеличению объемов информации, и задача Национальных Архивов - сохранить эту электронную информацию таким образом, чтобы её можно было прочитать, скажем, через 100 лет.
На фото: Данные необходимо преобразовывать в новые форматы, чтобы они оставались читаемыми даже тогда, когда «вымирают» старые носители информации - (C) Национальные Архивы Дании
Проблема с изначально созданными в электронном виде документами в том, что носители информации, на которых они хранятся, могут отказать, а необходимые для чтения носителей технологии могут морально устареть. Точно так же устаревают и форматы, в которых записывается электронная информация, и может быть утрачено знание о том, как данные следует интерпретировать, и об их контексте.
Когда Национальные Архивы сохраняют электронную информацию, она должна быть представлена в виде, обеспечивающем её повторное использование, и это требует сознательного выбора в плане методов, технологий и документации.
Национальные Архивы реализовали стратегию, нацеленную на то, чтобы созданные в электронной форме данные (в том числе электронные документы), имеющие историческую ценность, сохранялись таким образом, чтобы обеспечить получение от них полноценной отдачи, как сейчас, так и в будущем.
В соответствии с установленными Национальными Архивами правилами, все государственные органы уведомляют Национальные Архивы о своих ИТ-системах. Архивисты определяют, подлежит ли контент этих систем сохранению для будущих поколений. Если это так, то после определенного периода времени - как правило, через пять лет – данные передаются на хранение в Национальные Архивы.
На фото: Ещё один впечатляющий вид многоярусного хранилища. - (C) Национальные Архивы Дании
Данные передаются в виде так называемой архивной версии - копии данных, которые структурированы и документированы в соответствии с правилами Национальных Архивов, при этом данные и документы преобразованы в форматы, подходящие для долговременного хранения. Табличные данные из реляционных баз данных преобразуются в XML-файлы, в то время, как документы сохраняются в формате TIFF. В меньшей степени используются форматы JPEG 2000, MP3, MPEG-2 и MPEG-4, и GML – соответственно для аудио-, видео- и геоданных.
«Архивная версия» должна быть платформенно-независимой и самодокументированной, с тем, чтобы данные могли быть поняты и использованы без доступа к конкретной ИТ-системе, в которой они были изначально созданы.
Для обеспечения максимальной сохранности Национальные Архивы используют распределенную систему, в которой нескольких идентичных копий данных хранится на нескольких типах носителей, как оптических (Blu-Ray), так и магнитных (LTO-ленты), - в нескольких различных местах. Состояние коллекции постоянно контролируется, и данные по мере необходимости перемещаются на новые носители и на носители новых типов.
Национальные Архив постоянно ведут планирование действий по обеспечению долговременной сохранности, принимая, помимо прочего, решения о том, когда проводить конверсию данных в новые форматы. Поскольку используется очень небольшой набор стандартизованных форматов, пригодных для долговременной сохранности, необходимость в проведении конверсии в новые форматы возникает крайне редко, однако рано или поздно ныне используемые форматы окажутся под угрозой технологического устаревания и такую конверсию придётся выполнять.
Мы выполнили один крупный проект конверсии форматов и структуры, в рамках которого все данные, полученные до 2000 года, были преобразованы в современный формат для долговременного хранения. Конверсия охватывала только изначально-электронные данные (сотни погонных километров бумажных документов не сканировались).
Национальные Архивы принимают государственные электронные документы начиная с 1973 года – это данные из государственных ИТ-систем. Более старые электронные документы существовали во множестве форматов и структур. Это было связано с тем, что до конца 1990-х годов не были четко сформулированы стандарты для обеспечения долговременной сохранности электронных документов.
Проект выполнялся в течение 4-х лет – с 2005 по 2008 год - и включал в себя конверсию всех форматов и структур, которые не отвечали требованиям распоряжения Национальных Архивов № 342 от 11 марта 2004 года (Bekendtgørelse om arkiveringsversioner af bevaringsværdige data fra elektroniske arkivsystemer, BEK nr 342 af 11/03/2004, https://www.retsinformation.dk/forms/R0710.aspx?id=11924 ), которым был установлен действовавший на тот момент стандарт долговременного хранения.
На практике это означало, что все иерархические базы данных была переработаны в реляционные, что все тексты были преобразованы в кодировку ISO 8859-1 (Latin 1). Были распакованы все сжатые файлы, все поля переменной длины стандартизованы. Документация была отсканирована и структурирована в соответствии с требованиями, и были созданы метаданные т.е. машиночитаемая документация на данные.
Таким образом, старые данные были унифицированы с современными данными в плане форматов, структуры и документации. Трудозатраты на проект составили 30 человеко-лет.
Помимо этого проекта, мы ещё несколько раз проводили миграцию носителей информации. В «старые времена» (т.е. до 1998 года) мы получали и поддерживали данные на больших бобинах с магнитной лентой, а позднее – на оптических дисках CD-R и DVD. Сегодня, как уже отмечалось выше, мы используем в качестве носителей LTO-ленты и Blu-Ray-диски. Естественно, и в будущем виды носителей будут достаточно часто меняться.
Что касается конкретно законов, то следует также отметить, что все датские законы, циркуляры, уведомления и т.д. публикуются на сайте https://www.lovtidende.dk/ . Четыре раза в год проводится сбор размещенной на сайте информации для её архивирования в веб-архиве, в котором Королевская библиотека (Det Kongelige Bibliotek) и Национальная библиотека (Statsbiblioteket), согласно Закону об обязательном экземпляре, собирают и сохраняют материалы датского сегмента Интернета.
Публикацию подготовила Мие Стаге (Mie Stage)
Источник: сайт издания «Ingeniøren»
http://ing.dk/artikel/spoerg-scientariet-hvordan-arkiveres-statslige-beslutninger-eftertiden-182592