суббота, 10 апреля 2010 г.

Инструментарий электронного архивиста: Программа SABA для подготовки сдаточного информационного пакета

Американец Крис Пром на своём блоге «Практичные электронные документы» продолжает описывать программные средства, которые электронный архивист может использовать в своей работе, от функциональных возможностей Windows и до специализированных разработок Национальных Архивов различных стран. Ниже приводится очень краткая выжимка из большой публикации, посвящённой датской программе SABA. Как я поняла, датчане для архивистов сделали программу, которая сильно напоминает по своему интерфейсу и принципам работы программы записи файлов на оптические диски (с добавлением возможности ввода описательной информации).

В последние дни я потратил немало времени на изучение разработанной датскими Государственными Архивами программы  SABA. Коротко подводя итоги, я считаю, программу действительно очень полезной, даже несмотря на интерфейс на датском языке.

По сути, создан инструмент, который может быть использован как архивистами, так и фондообразователями для проведения экспертизы и отбора файлов документов и создания копии отобранных файлов для передачи в архив, где с ними будут выполняться дополнительные работы по каталогизации и миграции /обеспечению долговременной сохранности.

При использовании программы, список типов файлов, которые могут быть скопированы для передачи в архив, ограничен наиболее часто встречающимися форматами, и расширить этот список мне не удалось. В интерфейсе файлы, которые SABA может скопировать, при отображении содержания жёсткого диска подкрашены по умолчанию зеленым цветом.


Когда всё готово к копированию отобранных файлов, нужно в интерфейсе выбрать нужную папку, а затем нажать кнопку “Start Kopiering”. Ни один из исходных файлов никоим образом не модифицируется, - они просто копируются в папку "SABA_Kopiering" на указанном диске.

По завершении процесса, можно просматривать файлы и  их метаданные. Вся информация хранится в нескольких поддиректориях:
  • DOKINFO: Содержит метаданные о копируемых файлах (оригинальные пути к ним и имена файлов);
  • GENINFO: введённая пользователем описательная информации, в виде двух файлов формата RTF;
  • DOKUMENTER: собственно файлы, сложенные все в одну папку и переименованные – создается имя из восьми цифр и сохраняется исходное расширение;
  • MAPPE.ARK: содержит уникальный код для каждой из папок/директорий:
    • первые восемь цифр: помер по порядку, в котором папка была обработана программой SABA;
    • вторые восемь цифр: уникальный идентификатор, присвоенный папке (на который в информации о каждом файле, содержащейся в  DOCUMENT.ARK);
  • DOKUMENT.ARK: содержит информацию о каждом файле.
Я так понимаю, что разрабатываемая сейчас отдельная программа для просмотра передаваемых в архив файлов будет показывать пользователям исходную структуру папок/каталогов.

Чем мне нравится эта программа:
  • Она уникальна тем, что предлагает способ отбора и копирования электронных документов для передачи в архив, не допуская внесения в исходные файлы каких-либо изменений или модификаций. Думаю, что такой инструмент очень нужен.

  • Программа позволяет создавать «сдаточные информационные пакеты» SIP [терминология стандарта OAIS – Н.Х.] для больших групп файлов, при этом  требуется минимальное количество данных, необходимых для подтверждения аутентичности и выполнения миграции документов и другой их обработки;

  • Интерфейс хорошо спроектирован, и им, как правило, несложно пользоваться, - достаточно лишь краткого объяснения;

  • SABA предлагает простой способ «сворачивания» структуры папок в одну директорию, сохраняя при этом информацию о первоначальной структуре в метаданных. После «уплощения» структуры гораздо проще выполнять миграцию файлов в другие форматы, обрабатывая разом файлы одного типа. Синтаксис файлов с метаданными легко понять, и будет сравнительно нетрудно написать дополнительные программные инструменты для обработки информации, содержащейся в файлах с метаданными, параллельно с выполнением операций миграции.

  • Списки файлов, исключенных из передаваемого в архив пакета, записываются, - иными словами, приложение автоматически документирует решения, принятые в ходе экспертизы ценности.
Крис Пром (Chris Prom)

Источник: блог "Practical E-Records"
http://e-records.chrisprom.com/?p=1035

6 комментариев:

  1. Наталья Александровна, добрый день! Да неужели Вы не видите кучу противоречий данного решения!! Где ж практическое использование хотя бы ISO 15489-1-2001 (российский аналог ГОСТ Р ИСО 15489-1-2007)? Это решение не для архивиста, а архиватора (именно «тупого» архиватора!), не имеющего абсолютно никакого специализированного образования (даже представления) в области требований систематизации документации о деятельности организации. Это – всего лишь начало для последующей доработки решения специалистами предметной области, знакомых хотя бы с Electronic Records: A workbook for archivists//ISA Study 16.
    «По сути, создан инструмент, который может быть использован как архивистами, так и фондообразователями для проведения экспертизы и отбора файлов документов и создания копии отобранных файлов для передачи в архив, где с ними будут выполняться дополнительные работы по каталогизации и миграции /обеспечению долговременной сохранности» - пишет автор.
    Да ничего подобного! Автор решения перекладывает титаническую работу по дальнейшей систематизации файлов в совокупности их метаданных на плечи архивистов государственных архивов. Эти специалисты обязаны будут в рамках General International Standard Archival. Description. Second Edition. Adopted by the Committee on Descriptive Standards. Stockholm, Sweden, 19-22 September 1999; ISAAR (CPF) International Standard Archival Authority Record for Corporate Bodies, Persons and Families. Second Edition, 2004; ISDF. International Standard for Describing Functions. First Edition. Developed by the Committee on Best Practices and Standards. Dresden, Germany, 2-4 May 2007; ISDIAH. International Standard for Describing Institutions with Archival Holdings. First edition. Developed by the Committee on Best Practices and Standards. London, United Kingdom, 10-11 March 2008 (российские не привожу) перелопачивать принятые файлы (с метаданными) в привязке их по нескольким «регулирующим средам». Это по всем то источникам комплектования!! Где ж автоматизация то?
    Безусловное достоинство авторского решения в соблюдении ISO 23081-1:2006 (российский аналог ГОСТ Р ИСО 23081-1-2009), который «позабыт и заброшен» в отечественных решениях. С уважением, С.В. Дроков

    ОтветитьУдалить
  2. Хочу поблагодарить Вас за внимание к этому вопросу – а то я уже отчаялась дождаться какой-либо реакции от архивистов!

    О практическом использовании ISO 15489-1-2001 (ГОСТ Р ИСО 15489-1-2007) речь идти не может, поскольку (загляните в текст что английской, что русской версий) этот стандарт не только не распространяется на область архивного дела, но и лишь в самых общих словах упоминает о процессе передачи документов на архивное хранение. Стандарт же ISO 23081-1:2006 (ГОСТ Р ИСО 23081-1-2009), действительно, имеет куда большее отношение к вопросу, поскольку в нем существенное место уделено метаданным, необходимым для обеспечения длительной сохранности целостных и аутентичных документов.

    В электронной архивации Библией является стандарт ISO 14721:2003 «Space data and information transfer systems - Open archival information system - Reference model» («Системы передачи данных и информации о космическом пространстве. Открытая архивная информационная система. Эталонная модель»), который ИСО продаёт за большие деньги, но который (вам понравится!) можно бесплатно скачать на сайте его настоящего разработчика: http://public.ccsds.org/publications/archive/650x0b1.pdf Программное обеспечение в первую очередь нацелено на то, чтобы послужить одним из инструментов, обеспечивающих выполнение требований именно этого стандарта.

    Жаль, что Вы не посмотрели оригинальную статью, по указанной в конце поста ссылке (я честно предупредила, что переведена только её часть). В полном тексте оцениваются и возможности программы по описанию передаваемых документов. Они, по мнению Криса Прома, скромные, но ненулевые. Многие метаданные сохраняются и передаются. Пром, замечу, не айтишник, а практикующий электронный архивист, и именно ему приходится в своей организации решать вопросы систематизации, архивного описания и т.д. Судя по его блогу, он уже перепробовал десяток-другой программных средств, и если о данной программе он отзывается положительно, то я склонна ему верить. Да и выбор ПО для архивистов, судя по всему, пока что очень невелик :)

    Кстати говоря, если уж зашла речь о стандартах архивного описания Международного Совета Архивов, то ISAD(G), действительно, «по теме» - он регламентирует описание документов. Остальные же стандарты относятся к описанию фондообразователя или хранителя, которое на каждый день переписывается – и острой необходимости поддерживать их в подобного рода программе нет.

    А автоматизация тоже бывает разная - можно автоматизировать создание НСА, можно заниматься автоматизацией ввода документов в архивную систему, можно автоматизировать планирование и проведение миграции. Это разные задачи, и вряд ли есть одна-единственная программа, способная решить их все :)

    ОтветитьУдалить
  3. Какая великая «вещь» Интернет -)) Сидишь на даче, кругом птички, трава (т.е. сорняк) «прет» с треском… -)) Наталья Александровна, вот «дело принципа» (не архивиста, а управленца, «взращенного» еще на забытой «советской закваски» организации управленческого труда в госучреждениях, включавшей в себя и управление архивами) не согласиться с тезисом о нераспространении ISO 15489-1-2001 (ГОСТ Р ИСО 15489-1-2007) на область архивного дела. -))
    Тем более с тем, что он (несмотря на прямое указание) не распространяется на госархивы. Если согласиться (а особенно с последним), то госархивы «во веки веков» будут «сидеть» в яме, ими же «вырытой». Потому как это означает безаппеляционное признание того, что госархивы НЕ организации, у них НЕТ внутренних «регулирующих сред», а основная задача – демонстрировать бумажки, т.е. «склад» в системе складской логистики, работающий «по вызову».
    Стандарт ISO 14721:2003 «Space data and information transfer systems - Open archival information system - Reference model» хорошо знаю. В связи с чем прошу «без брезгливости» вчитаться в следующий термин «Документ электронный – информационный объект, состоящий из двух частей: реквизитной, содержащей идентифицирующие атрибуты (имя, время и место создания, данные об авторе и т. д.) и электронную цифровую подпись; содержательной, включающей в себя текстовую, числовую и/или графическую информацию, которая обрабатывается в качестве единого целого.»
    Да, это «проклятый» Вами 18 марта ГОСТ Р 52292-2004 (вернее Приложение А). Ой, что сейчас будет! «Богиня Шива» повернет на меня «лик гнева» -)) Куда залечь то?.. Трава то еще не выросла!
    SABA по скрину, размещенному в Вашем сообщении, не отвечает на вопрос: предполагается ли формирование необходимых отчетных форм? Имею в виду описи, листы учета и т.п. Судя по всему такой «кнопки» нет. А как же с рекомендациями ГОСТ Р ИСО 23081-1-2009: «Все метаданные о документе формируют новый документ, а именно документ метаданных… Документ метаданных, равно как и сами метаданные, необходимо сохранять до тех пор, пока существует оригинал документа. В случае передачи документов хранителем или владельцем на последующее хранение или уничтожение некоторые метаданные могут понадобиться для подтверждения факта существования этих документов, управления ими и их местонахождения».
    Не могу согласиться с отсутствием необходимости в актуализации описаний фондообразователей (как известно, ими могут быть как организации, так и структурные подразделения, так и…). Особенно в современных темпах, когда была организация и нет ее, или слилась с передачей функционала.
    В любом случае, SABA интересна как «довесок» в решении, но нуждается в существенной доработке. По крайней мере, на российской почве. С уважением, С.В. Дроков

    ОтветитьУдалить
  4. …«дело принципа» … не согласиться с тезисом о нераспространении ISO 15489-1-2001 на область архивного дела. -))

    Цитирую: (из п.1. «Область применения») «Настоящий стандарт не распространяется на управление архивными документами, хранящимися в архивных учреждениях.». В оригинале: «This part of ISO 15489 … does not include the management of archival records within archival institutions.». Это не я придумала, это ИСО :)

    Если согласиться (а особенно с последним), то госархивы «во веки веков» будут «сидеть» в яме, ими же «вырытой». Потому как это означает безаппеляционное признание того, что госархивы НЕ организации, у них НЕТ внутренних «регулирующих сред», а основная задача – демонстрировать бумажки, т.е. «склад» в системе складской логистики, работающий «по вызову».

    Если госархив сам себя позиционирует как склад бумаги или музей, то ему мало что поможет выбраться из ямы – и уж точно не ISO 15489. За рубежом архивы стремятся «вписаться» в текущую государственную деятельность, с тем, чтобы стать необходимыми для высшего руководства, от которого зависит финасирование. Я с удовольствием читаю выступления руководителей американской архивной службы: как только в Белом Доме меняется направление ветра, они всё те же свои программы преподносят, как ярчайшее проявление и поддержку новой линии :)

    Стандарт ISO 14721:2003 «Space data and information transfer systems - Open archival information system - Reference model» хорошо знаю. В связи с чем прошу «без брезгливости» вчитаться в следующий термин…

    Преодолевая брезгливость, вчитываюсь. Замечаю, что упомянутое приложение А – справочное, в нём в кучу свалены определения из различных источников (в самом же стандарте для нормативной части придумано собственное, бредовое). И всё равно я так и не поняла, какая связь между знанием Вами OAIS – и этим определением из Рекомендаций по стандартизации Р 50.1.031-2001. Вы точно ничего не напутали? :)

    SABA … не отвечает на вопрос: предполагается ли формирование необходимых отчетных форм? Имею в виду описи, листы учета и т.п. Судя по всему такой «кнопки» нет.

    Если я правильно понимаю, SABA служит для подготовки сдаточного пакета, на стороне фондообразователя. Подготовка отчетных форм – это уже скорее функционал ПО самого архива (безусловно, очень нужный).

    А как же с рекомендациями ГОСТ Р ИСО 23081-1-2009…

    Исполняются (о качестве спорить не буду, для этого нужно с программой поработать самостоятельно) – метаданные собираются и включаются в сдаточный пакет.

    Не могу согласиться с отсутствием необходимости в актуализации описаний фондообразователей …

    Описание фондообразователя – задача архива, должна поддерживаться ПО архива, а не ПО формирования (многочисленных) сдаточных пакетов. IMHO, конечно.

    SABA интересна как «довесок» в решении, но нуждается в существенной доработке.

    Думаю, по этому пункту я с Вами согласна :)

    ОтветитьУдалить
  5. Да, решение более чем достойное, если повнимательнее ознакомиться с описанием. Меня поразила его сочетаемость с этим важным документом http://www.sa.dk/media(3000,1033)/Danish_Archives_Act.pdf
    Любопытно, датчане продают SABA? С уважением, С.В. Дроков

    ОтветитьУдалить
  6. За ссылку благодарю, у меня такого документа не было :) Что касается программы, то о ней, к сожалению, информации на сайте датских государственных архивов мне найти не удалось (SABA,наверное, пока ещё находится в процессе разработки) - но другие программы они дают скачивать, поэтому можно надеяться, что и эта программа впоследствии будет в свободном доступе.

    ОтветитьУдалить