Данный комментарий к заметке «Опыт сохранения баз данных» (см. её перевод на русский язык здесь: http://rusrim.blogspot.com/2011/07/blog-post_8070.html ) Ян Дальстен Сёренсен (Jan Dalsten Sørensen – на фото, ник Jan DS) разместил на сайте проекта PLANETS 27 июля 2011 года.
Обеспечение долговременной сохранности баз данных было важной задачей для Национальных Архивов Дании начиная с 1973 года. Все 3600 архивных AIP-пакетов в нашей коллекции представляют собой файлы, экспортированные из баз данных. Контент как деловых систем, так и систем управления документами поступает на хранение в виде реляционных баз данных. Один AIP-пакет соответствует одному поступлению данных из одной базы данных.
У нас есть три основных вида поступлений в архив:
a) Контент относится к определенному периоду времени. Например, данные (и, где это применимо, документы) из системы управления документами, где обычный период хранения до передачи в архив составляет 5 лет. Это также могут быть данные из деловой системы, например, налоговых органов, от которых мы получаем одно поступление в год, после того, как завершается обработка налоговых деклараций за этот год.
Такого рода поступление включает в себя всю информацию за определенный период времени.
b) Снимок, когда в архив передается контент базы данных на определенный момент времени. Снимки обычно делаются один раз в 5 лет, в течение всего периода эксплуатации системы. Поступление включает всю информацию, имевшуюся на соответствующий момент времени. Однако, если только не велось протоколирования истории базы данных, изменения, происходившие между моментами снятия снимков, могут и не сохраниться.
c) Окончательная передача контента базы данных, как только соответствующее агентство уже больше её не обновляет.
По моим оценкам, мы сохраняем контент примерно 20-25% всех выявленных нами баз данных, используемых государственными органами. «Документность» контента не является основным критерием при принятии решения о постоянном хранении. Вместо этого, мы стараемся оценить, будет ли контент служить полезным источником информации для будущих историков и других исследователей.
Ныне используемый формат для хранения баз данных применяется с сентября 2010 года, и основана на модифицированной версии формата SIARD (материалы об этом формате см. http://rusrim.blogspot.com/search/label/SIARD - Н.Х.). Вместе с контентом базы данных в формате SIARD-XML (и, при необходимости, вместе со всеми документами, преобразованными в форматы для длительного хранения - TIFF, JPEG-2000, MP3, MPEG-2 или MPEG-4) поступление должно включать документацию, содержащую архивное описание (сведения о создателе документов и специфические метаданные, описывающие содержании сдаточного SIP-пакета) и сведения о контексте. Мы определили различные категории описывающей контекст документации, охватывающие как технические, так и административных документы, а также документы о процессе передачи и о тестировании.
Формат установлен распоряжением, которое было переведено на английский язык. Оно доступно по адресу: http://www.sa.dk/media(3367,1033)/Executive_Order_on_Submission_Information_Packages.pdf
Сведения об истории сохранения баз данных в Национальных Архивах Дании - уже слегка устаревшие - можно найти в трудах симпозиума по вопросам передачи, обеспечения сохранности электронных документов и доступа к ним, проведенного Национальными Архивами в 2008 году: http://www.sa.dk/media(3009,1033)/Symposium_about_the_Transfer%2C_Preservation_of_and_Access_to_Digital_Records.pdf
Ян Дальстен Сёренсен (Jan Dalsten Sørensen)
Другие публикации автора:
Обеспечение долговременной сохранности баз данных было важной задачей для Национальных Архивов Дании начиная с 1973 года. Все 3600 архивных AIP-пакетов в нашей коллекции представляют собой файлы, экспортированные из баз данных. Контент как деловых систем, так и систем управления документами поступает на хранение в виде реляционных баз данных. Один AIP-пакет соответствует одному поступлению данных из одной базы данных.
У нас есть три основных вида поступлений в архив:
a) Контент относится к определенному периоду времени. Например, данные (и, где это применимо, документы) из системы управления документами, где обычный период хранения до передачи в архив составляет 5 лет. Это также могут быть данные из деловой системы, например, налоговых органов, от которых мы получаем одно поступление в год, после того, как завершается обработка налоговых деклараций за этот год.
Такого рода поступление включает в себя всю информацию за определенный период времени.
b) Снимок, когда в архив передается контент базы данных на определенный момент времени. Снимки обычно делаются один раз в 5 лет, в течение всего периода эксплуатации системы. Поступление включает всю информацию, имевшуюся на соответствующий момент времени. Однако, если только не велось протоколирования истории базы данных, изменения, происходившие между моментами снятия снимков, могут и не сохраниться.
c) Окончательная передача контента базы данных, как только соответствующее агентство уже больше её не обновляет.
По моим оценкам, мы сохраняем контент примерно 20-25% всех выявленных нами баз данных, используемых государственными органами. «Документность» контента не является основным критерием при принятии решения о постоянном хранении. Вместо этого, мы стараемся оценить, будет ли контент служить полезным источником информации для будущих историков и других исследователей.
Ныне используемый формат для хранения баз данных применяется с сентября 2010 года, и основана на модифицированной версии формата SIARD (материалы об этом формате см. http://rusrim.blogspot.com/search/label/SIARD - Н.Х.). Вместе с контентом базы данных в формате SIARD-XML (и, при необходимости, вместе со всеми документами, преобразованными в форматы для длительного хранения - TIFF, JPEG-2000, MP3, MPEG-2 или MPEG-4) поступление должно включать документацию, содержащую архивное описание (сведения о создателе документов и специфические метаданные, описывающие содержании сдаточного SIP-пакета) и сведения о контексте. Мы определили различные категории описывающей контекст документации, охватывающие как технические, так и административных документы, а также документы о процессе передачи и о тестировании.
Формат установлен распоряжением, которое было переведено на английский язык. Оно доступно по адресу: http://www.sa.dk/media(3367,1033)/Executive_Order_on_Submission_Information_Packages.pdf
Сведения об истории сохранения баз данных в Национальных Архивах Дании - уже слегка устаревшие - можно найти в трудах симпозиума по вопросам передачи, обеспечения сохранности электронных документов и доступа к ним, проведенного Национальными Архивами в 2008 году: http://www.sa.dk/media(3009,1033)/Symposium_about_the_Transfer%2C_Preservation_of_and_Access_to_Digital_Records.pdf
Ян Дальстен Сёренсен (Jan Dalsten Sørensen)
Другие публикации автора:
- «Сдаточный информационный SIP-пакет по-датски», http://rusrim.blogspot.com/2010/05/eca-2010-viii.html
- «Датский опыт электронного архивного дела», http://rusrim.blogspot.com/2009/11/blog-post_25.html
- «Архивация электронных документов», http://rusrim.blogspot.com/2010/11/blog-post_21.html
- Migration of older digital records at the Danish National Archives, http://www.openplanetsfoundation.org/blogs/2011-06-28-migration-older-digital-records-danish-national-archives
Комментариев нет:
Отправить комментарий