понедельник, 15 марта 2010 г.

Электронные документы в датских архивах

8 марта 2010 года Крис Пром (Chris Prom) на своём блоге «Электронные документы на практике – программное обеспечение и инструменты для архивистов» (Practical E-Records) опубликовал большую заметку о своем визите в Копенгаген и об общении с датскими архивистами. Ниже приведен перевод наиболее интересных, с моей точки зрения, фрагментов этого поста.

Датское архивное законодательство уникально тем, что государственные органы по закону обязаны сдавать электронные документы на архивное хранение в формате, установленном архивной службой.

Документы, независимо от их формата, преобразуются в формат TIFF и сдаются вместе с набором табличных и XML-файлов с метаданными, которые могут быть прочитаны разработанным Государственными Архивами Дании программным приложением для работы с базой данных. Все материалы, в том числе TIFF-файлы, текстовые файлы для поиска, а также табличные файлы/метаданные хранятся в одной папке, и сохраняются  в качестве «архивного информационного пакета» [в терминологии стандарта OAIS – Н.Х.], в хранилище, основанном на принципе избыточного хранения в автономных (offline) системах (сохраняются 2 набора DVD-дисков в различных местах, а также резервные магнитные ленты). Состояние всех носителей информации непрерывно контролируется, и они регулярно перезаписываются.

Государственные архивы выбрали TIFF в качестве формата для долговременного хранения, поскольку сочли, что он наиболее стабилен в долгосрочном плане, и для него вероятность изменений наименьшая. Закон обязывает государственные учреждения соблюдать это требование, и документы должны сдаваться в архивы в формате TIFF. Наличие такого требования обеспечило определенность, в результате чего возник рынок средств и услуг в области конверсии документов. Большинство государственных учреждений теперь понимают эти требования, и учитывают их при формировании своего бюджета.

Государственные Архивы Дании начинают развивать программную основу для принятия на хранение электронных «бумаг» от частных лиц, коммерческих компаний и ассоциаций. Эти файлы (за исключением аудио-, видео-, и других специальных форматов) также будут преобразованы в формат TIFF для постоянного хранения. Очевидно, что архивы не вправе требовать, чтобы частные лица сдавали свои материалы в данном формате, поэтому их конверсия будет проводиться архивами.

Чтобы помочь людям в сдаче их материалов на архивное хранение, разрабатываются четыре программных инструмента. Эти инструменты будут использоваться государственными архивами, а также будут предоставлены другим датским архивам, имеющим право принимать на хранение электронные документы. Разрабатываются инструменты для экспертизы ценности, для конверсии (преобразования) файлов, для проверки файлов и для доступа. Все программы пишутся в среде C # /. NET, так что они будут работать только с файлами, доступными в компьютерах с операционной системой Microsoft Windows.

Каждый TIFF-файл снабжается цифровым идентификатором, а также XML-файлом и рядом текстовых .tab-файлов, в которых содержатся структурированные метаданные и записано первоначальное имя файла.

Для каждого конвертируемого файла создается текстовой файл. Кроме того, из документов определенных типов (таких, как электронная почта) извлекается ряд метаданных, с тем, чтобы конечный пользователь мог искать по таким реквизитам, как «адресат», «тема» и «получатели копий». Далее, сохраняется информация о полном составе документов, как они существовали на жестком диске пользователя. Сохраняются .tab-файлы (и xml-«ключ», содержащий структурные метаданные, дающие возможность восстановить многостраничные документы или сложные объекты, такие, как сообщения электронной почты с присоединёнными файлами). По завершении всех преобразований, преобразованные файлы и их метаданные копируются в другое место для проверки.

Архивы предоставляют рабочие копии DVD-дисков, вместе с копией необходимого для доступа программного обеспечения, для использования либо в читальном зале, либо на домашнем компьютере пользователя.

Разработка всех этих инструментов будет завершена в мае или июне, после чего они будут распространяться среди датских учреждений и других заинтересованных лиц.

Крис Пром (Chris Prom)

Источник:
http://e-records.chrisprom.com/?p=898

2 комментария:

  1. Добрый день! Так и в нашем «королевстве» вроде как наступает «прозрение» -)) Вот ссылка на ЭРК законопроекта № 342098-5 http://asozd2.duma.gov.ru/main.nsf/%28Spravka%29?OpenAgent&RN=342098-5&02
    Стоит считаться в сам текст проекта:
    http://asozd2.duma.gov.ru/work/dz.nsf/ByID/211F3400BF995FA9C32576E40051FB63/$File/%D0%A2%D0%B5%D0%BA%D1%81%D1%82%20%D1%81%D0%BE%D0%BF%D1%80%D0%BE%D0%B2%D0%BE%D0%B6%D0%B4%D0%B0%D1%8E%D1%89%D0%B5%D0%B3%D0%BE%20%20%D0%A4%D0%97%20%D0%BE%D0%B1.doc?OpenElement
    Может это – начало оттепели? -))
    С уважением. С.В. Дроков

    ОтветитьУдалить
  2. Спасибо за информацию! Законопроект интересный, направление мыслей у авторов правильное – предлагаемые формулировки, правда, вызывают ряд возражений. Если будет время, постараюсь проанализировать этот документ поподробнее, а пока что «с ходу» в первой же статье законопроекта вижу следующие огрехи:

    - Хорошо, что в п.11 ст.2 Закона «Об информации…» предлагается вернуть в закон термин «документ». Плохо, что авторы законопроекта берут на себя смелость придумать очередное определение документа, не совпадающее ни с одним из предыдущих.

    - Хорошо, что в виде п.11-1 той же статьи Закона «Об информации…» предлагается ввести определение понятия «электронный документ», - однако жаль, что авторы не ограничились кратким определением из закона об ЭЦП, и начали писать развёрнутое объяснение, которое IMHO лишь вредит. Согласно этому мудрому определению, любой бумажный документ является электронным, - поскольку он существует «в виде, пригодном для восприятия человеком с использованием электронных вычислительных машин» (с помощью сканера, разве нет? сканер можно считать приводом для чтения бумажных документов :) ), «также для передачи по информационно телекоммуникационным сетям» (факс!).

    - Предлагаемое дополнение в ст.3 «трёхглавого» закона (принцип приоритета предоставления госуслуг в электронном виде) – IMHO ошибка. Приоритет должен отдаваться такому способу (способам) предоставления госуслуг, который в каждом конкретном случае оптимально учитывает интересы государства и граждан – а не какой-то конкретной технологии.

    - Ставить на одну доску электронный документ и электронное сообщение IMHO неправильно. Сообщение, с моей точки зрения, аналог невскрытого письма обычной почты, и может содержать что угодно – в том числе и документ(ы). Равнозначность отражена плохо – в ряде случаев необходимо (и в законе об ЭЦП это есть, ст.19 п.2), чтобы электронная подпись была равнозначна собственноручной подписи + печати.

    - В последнем пункте 1-й статьи законопроекта – что понимается под «официальностью» информации в государственных информационных системах? Если то, что эта информация принадлежит госоргану, и тот отвечает за её точность – тогда это можно было и не писать. Если же смысл в том, что электронная информация в государственных базах, регистрах и реестрах имеет преимущество перед аналогичной информацией на бумажных носителях (а у нас по законодательству многие такие реестры ведутся в бумажном и электронном виде) – тогда это спорное утверждение.

    Кроме того, представьте себе форум или блог на государственном портале. Его содержание входит в состав государственной информационной системы, или нет? Если входит, то, согласно предложению авторов законопроекта, госорган несёт ответственность за содержание сообщений на форуме!

    ОтветитьУдалить