четверг, 26 мая 2011 г.

Архивы Новой Зеландии: Исследования и открытые вопросы в области обеспечения долговременной сохранности электронных материалов – часть II

(Продолжение заметки Юэна Кокрена, начало см. http://rusrim.blogspot.com/2011/05/i.html )

Документирование программных приложений и сред

В настоящее время в некоторой степени мы развиваем наш инструмент/базу данных архивных описаний, и рассматриваем возможность документирования сведений об использованном для создания электронных объектов программном приложении / среде, для всех контролируемых нами электронных объектов. К сожалению, все эти поля будет непросто заполнить, поскольку заполнение, ввиду больших объёмов,  придётся делать в большинстве случаев автоматически - и инструментов, способных извлечь такие сведения, либо нет, либо они недостаточно хороши для решения данной задачи.

Для того, чтобы восполнить этот пробел и получить возможность документировать другие наши эксперименты (подробнее об этом ниже), мы экспериментировали с базой данных для документирования программных приложений /вычислительной среды, в которую предполагается включить сведения обо всех имеющихся у нас приложениях, об их взаимозависимости, включая различные параметры приложений, которые может быть полезно знать для целей обеспечения долговременной сохранности. Это, например, такие параметры, как форматы, в которых можно сохранять файлы, форматы, которые приложение способно читать, а также параметры импорта и экспорта.

Нечто подобное может быть полезно для многих целей, но в ходе этого экспериментирования мы уже многое узнали о сложности/объемности различных наборов кода, которые используются для открытия или сохранения файлов, захваченных в различных «стандартных форматах». Например, у 33 задокументированных к настоящему моменту приложений имеется 505 параметров сохранения, и 77 из них связаны с файлами с расширением .doc. Это подразумевает, что имеется столько же различных наборов кода, используемых для записи doc-файлов,  - что объясняет некоторые изменения, которые мы обнаруживаем, открывая впоследствии эти файлы в иной программной среде (т.е. внутренняя структура файлов может отличаться от той, которую ожидает отображающее файл приложение). То же самое можно сказать и о параметрах открытия и количестве различных наборов кода, используемых для открытия файлов одного и того же «формата».

Сейчас в сообществе специалистов по сохранности электронных материалов при документировании приложений/вычислительных сред в какой-то степени встает проблема типа «что было сначала - курица или яйцо?», поскольку для приложений/сред отсутствуют эквиваленты PUID (глобально-уникальных идентификаторов форматов в реестре файловых форматов PRONOM – Н.Х.) Это означает, что сложно создать инструменты для определения того, какое приложение/среда необходимы для отображения файла (или набора файлов), либо были использованы для их создания; и также отсутствует стандартного способа идентификации/документирования приложений/сред (насколько мне известно).

Создаваемая нами база данных в данный момент довольно примитивная и простая, но она помогает нам понять, что требуется в этой области. Было бы здорово, если бы фонд Open Planets Foundation разработал что-нибудь, что заполнило бы этот пробел. Если такой проект будет организован, то мы могли бы поделиться нашими требованиями.

(Окончание следует, см. http://rusrim.blogspot.com/2011/05/iii.html )

Юэн Кокрен (Euan Cochrane)

Источник: сайт фонда Open Planets Foundation
http://openplanetsfoundation.org/blogs/2011-05-18-digital-preservation-research-activities-and-open-questions-archives-new-zealand

Комментариев нет:

Отправить комментарий