понедельник, 24 мая 2010 г.

Тезисы ECA-2010, часть IV: Норвегия

Анне Метте Дёрум (Anne Mette Dørum - генеральный директор департамента экспертизы ценности и современного управления документами, на фото), Тронд Сиревог (Trond Sirevåg), Ханс Фредрик Берг (Hans Fredrik Berg) - Национальные Архивы Норвегии, «Норвежский стандарт Noark-5 – Новая модель долговременной сохранности делопроизводческих данных»

История Noark - норвежского стандарта по управлению документами – начинается с 1984 года, а использование систем, соответствующих требованиям Noark, является обязательным для норвежских государственных и муниципальных учреждений. С начала 1990-х годов в Национальные Архивы Норвегии начали поступать наборы документов из Noark-систем.

В докладе описывается опыт приема этих документов, а также пересмотренная и упрощенная модель обеспечения долговременной сохранности электронных документов, содержащаяся в новой 5-й редакции стандарта Noark (2008).

В предыдущих версиях Noark (1-й по 4-ю) был предусмотрен стандартизированный формат передачи, представлявший собой заданную табличную структуру. Задача заключалась в том, чтобы обеспечить хранилищам возможность импортировать полученные таблицы в реляционную СУБД для последующего хранения и распространения. Проблемы с противоречивыми данными в таблицах, передаваемых из Noark-3-систем, вынудили Национальные Архивы определить формат передачи очень детально (220 страниц; 95 таблиц, содержащих 885 столбцов; и множество правил проверки целостности), - очень близко к схеме базы данных, предусмотренной гораздо более сложным стандартом Noark-4 (1999 год).

Но и данные, передаваемые в формате Noark-4, часто оказывались несогласованными: нарушались правила ссылочной целостности, в таблицах встречались повторяющиеся значения главного ключа и т.д. Ошибки были фатальными, поскольку в результате импорта в данных в СУБД  база данных становилась несогласованной. Сложность модели передачи в целом стала серьёзной проблемой Noark-4. Настоятельная необходимость в разработке упрощенных структур передачи данных стала важным побудительным мотивом для создания спецификаций Noark-5.

При проектировании нового формата передачи в Noark-5 от сложных табличных структур отказались. Теперь задача восстановления структуры базы данных не ставится. Процесс передачи документов на постоянное хранение кардинально упростился - и стал значительно устойчивее. В Noark-5 передаваемые пакеты содержат лишь 8 «архивных единиц» (объектов метаданных). Обеспечивается долговременная сохранность только логической структуры самих документов. Выделение 8 архивных единиц в основном основывается на их положении в иерархической XML-структуре, а не на уникальных идентификаторах. Все условные коды, используемые в системах управления документами взамен определенной текстовой информации, раскодируются и заменяются самой этой текстовой информацией.

Внедрение в Noark-5 новой модели передачи, которая отделяет логический информационный контент от структуры базы данных, используемой в системе управления документами, - заставило поставить фундаментальный вопрос: что нам нужно сохранить? Данные, системы, или архивных документы? Как обеспечить, чтобы описания (метаданные) документов с достаточной точностью описывали контекст (систему), в которой документы были созданы, - чтобы избежать зависимости от продолжающегося существования (возможно, восстановленных) систем? Как обеспечить сохранение не только семантики документов, но и их целостности и аутентичности? В Noark 5 эта задача решается путем строгого режима создания и контроля контрольных сумм (значений хеш-функции).

Дополнительная информация:
http://www.bar.admin.ch/eca2010/...   (презентация доклада)

Комментариев нет:

Отправить комментарий