пятница, 5 августа 2011 г.

Обеспечение сохранности баз данных в Дании

Данный комментарий к заметке «Опыт сохранения баз данных» (см. её перевод на русский язык здесь: http://rusrim.blogspot.com/2011/07/blog-post_8070.html ) Ян Дальстен Сёренсен (Jan Dalsten Sørensen – на фото, ник Jan DS)  разместил на сайте проекта PLANETS 27 июля 2011 года.

Обеспечение долговременной сохранности баз данных было важной задачей для Национальных Архивов Дании начиная с 1973 года. Все 3600 архивных AIP-пакетов в нашей коллекции представляют собой файлы, экспортированные из баз данных. Контент как деловых систем, так и систем управления документами поступает на хранение в виде реляционных баз данных. Один AIP-пакет соответствует одному поступлению данных из одной базы данных.

У нас есть три основных вида поступлений в архив:

a)    Контент относится к определенному периоду времени. Например, данные (и, где это применимо, документы) из системы управления документами, где обычный период хранения до передачи в архив составляет 5 лет. Это также могут быть данные из  деловой системы, например, налоговых органов, от которых мы получаем одно поступление в год, после того, как завершается обработка налоговых деклараций за этот год.

Такого рода поступление включает в себя всю информацию за определенный период времени.

b)    Снимок, когда в архив передается контент базы данных на определенный момент времени. Снимки обычно делаются один раз в 5 лет, в течение всего периода эксплуатации системы. Поступление включает всю информацию, имевшуюся на соответствующий момент времени. Однако, если только не велось протоколирования истории базы данных, изменения, происходившие между моментами снятия снимков, могут и не сохраниться.

c)    Окончательная передача контента базы данных, как только соответствующее агентство уже больше её не обновляет.

По моим оценкам, мы сохраняем контент примерно 20-25% всех выявленных нами баз данных, используемых государственными органами. «Документность» контента не является основным критерием при принятии решения о постоянном хранении. Вместо этого, мы стараемся оценить, будет ли контент служить полезным источником информации для будущих историков и других исследователей.

Ныне используемый формат для хранения баз данных применяется с сентября 2010 года, и основана на модифицированной версии формата SIARD (материалы об этом формате см. http://rusrim.blogspot.com/search/label/SIARD - Н.Х.). Вместе с контентом базы данных в формате SIARD-XML (и, при необходимости, вместе со всеми документами, преобразованными в форматы для длительного хранения - TIFF, JPEG-2000, MP3, MPEG-2 или MPEG-4) поступление должно включать документацию, содержащую архивное описание (сведения о создателе документов и специфические метаданные, описывающие содержании сдаточного SIP-пакета) и сведения о контексте. Мы определили различные категории описывающей контекст документации, охватывающие как технические, так и административных документы, а также документы о процессе передачи и о тестировании.

Формат установлен распоряжением,  которое было переведено на английский язык. Оно доступно по адресу: http://www.sa.dk/media(3367,1033)/Executive_Order_on_Submission_Information_Packages.pdf 

Сведения об истории сохранения баз данных в Национальных Архивах Дании - уже слегка устаревшие - можно найти в трудах симпозиума по вопросам передачи, обеспечения сохранности электронных документов и доступа к ним, проведенного Национальными Архивами в 2008 году: http://www.sa.dk/media(3009,1033)/Symposium_about_the_Transfer%2C_Preservation_of_and_Access_to_Digital_Records.pdf

Ян Дальстен Сёренсен (Jan Dalsten Sørensen)

Другие публикации автора:

Комментариев нет:

Отправить комментарий