пятница, 2 января 2015 г.

Конференция DLM-форума 2014 года в Лиссабоне: Финский опыт сохранения административных баз данных


Сотрудник Национальных Архивов Финляндии Микко Эрякаски (Mikko Eräkaski – на фото) в ноябре 2014 года выступил на конференции DLM-форума в Лиссабоне, Португалия, с докладом на тему «Практический опыт и проблемы обеспечения сохранности административных баз данных» (Practical experiences and challenges preserving administrative databases). Полный текст доклада выложен на сайте конференции (см. http://purl.pt/26107/1/DLM2014_PDF...pdf ), а ниже приведен перевод его отдельных фрагментов.

В последние годы Национальные Архивы Финляндии получили на хранение базы данных и реестры из различных государственных органов. Информация, содержащаяся в этих реестрах и базах данных, будет передана службе обеспечения долговременной сохранности Национальных Архивов с тем, чтобы обеспечить её аутентичность, целостность и пригодность к использованию во времени. В данной статье говорится о том, как информация может быть отделена от структур баз данных и перенесена в архивы. Ключевым аспектом обеспечения долговременной сохранности информации, содержащейся в базе данных, является исчерпывающе полная документация на извлеченные данные. Это делается на основе использования финского национального стандарта SÄHKE2 и разработанного норвежскими Национальными Архивами стандарта ADDML.

,,, Национальные Архивы Финляндии сталкиваются с серьезной проблемой, когда речь заходит о сохранении баз данных. В течение последних лет государственные органы вели сотни реестров и баз данных, но лишь немногие из них систематически поддерживаются с целью обеспечения их долговременной сохранности. Наш предшествующий опыт показал, что обеспечение сохранности баз данных - это не просто техническая задача. Учреждения и организации государственного сектора также обычно недооценивают научное значение своих баз данных, результатом чего является недостаточная осведомленность о проблемах обеспечения долговременной сохранности, о принципах экспертизы ценности и об обязанности Национальных Архивов проводить такую экспертизу.

... Основная стратегия Национальных Архивов предусматривает сохранение только данных, а не функциональных возможностей, правил обработки данных или алгоритмов. Данные извлекаются из системы управления базами данных (СУБД) и отделяются от структур базы данных. Данные хранятся в форматах XML или CSV, без сохранения каких-либо программно-зависимых свойств или бинарных (т.е. нетекстовых – Н.Х.) файлов. В рамках данного процесса все бинарные файлы должны быть извлечены из базы данных и преобразованы в подходящий формат.

Национальные Архивы не устанавливают строгих правил в отношении формы файлов данных. Вместо этого ключевые требования связаны с описанием базы данных и с обязательными элементами метаданных. Такое описание должно быть подготовлено на разных уровнях, с тем, чтобы полностью понимать извлеченные данные и контекст их создания и использования. Описание данных и их передача в Национальные Архивы осуществляются с помощью стандартизированных структур сдаточных информационных SIP-пакетов и метаданных. Дополнительная документация, касающаяся контекста, происхождения данных, системы управления базами данных (СУБД), моделей данных, правил обработки и рекомендаций по удобству использования, сохраняется также в формате PDF. Вопрос о том, какую документацию следует включать в SIP-пакет, пока что решается для каждого случая отдельно.

Структура SIP-пакета регламентируется национальным стандартом SÄHKE2 ( http://www.arkisto.fi/se/saehke2-maeaeraeys , о нём также см. http://rusrim.blogspot.ru/search/label/SAHKE2 - Н.Х.), описывающего информационную модель, разработанную для электронных систем управления документами (ERMS). Национальные Архивы разработали в рамках SÄHKE2 структуру SIP-пакетов с целью обеспечить передачу документов из различных электронных систем управления документами в свою службу обеспечения долговременной сохранности в единой структуре. SÄHKE2-структура также используется при передаче баз данных и данных реестров. Такой подход обеспечивает передачу всех материалов в Национальные Архивы, в единой структуре с однотипными метаданными.

SÄHKE2-метаданные используются для описания баз данных и данных реестров как на уровне коллекций, так и на уровне записей. SÄHKE-метаданных – это в основном  контекстные и административные метаданные, описывающие происхождения, функции, информационное содержание и возможные ограничения. SÄHKE-структура обеспечивает целостность и постоянство SIP-пакета, которые автоматически проверяются в процессе передачи на архивное хранение.

Стандарт ADDML используется для описания данных: таблиц, полей, переменных, кодов и их взаимосвязей. Это стандарт норвежской архивной службы для технических метаданных. ADDML (от Archival Data Description Markup Language – «Язык разметки для описания архивных данных») используется для описания наборов файлов данных, представляющих собой «плоские» файлы. ADDML описывает структуру «плоского» файла, подлежащего переносу из одной системы в другую. Стандарт ADDML является относительно гибким, его можно модифицировать с учетом местных требований и практики описания контента на различных уровнях. Это также позволяет каждому архиву определить свои собственные правила применения стандарта (подробнее об ADDML см. http://www.arkivverket.no/arkivverket/Arkivbevaring/Elektronisk-arkivmateriale/Standarder/ADDML ).

Микко Эрякаски (Mikko Eräkaski)

Источник: сайт конференции DLM-форума 2014 года в Лиссабоне
http://purl.pt/26107/1/DLM2014_PDF/17%20-%20Practical%20experiences%20and%20challenges%20preserving%20administrative%20databases.pdf
http://purl.pt/26107/1/

Комментариев нет:

Отправка комментария