вторник, 25 июня 2019 г.

Электронная архивация – дело, связанное с рисками


Заметка Дэвид Андедауна (David Underdown – на фото) была опубликована 3 июня 2019 года на блоге Национальных Архивов Великобритании. Перевод публикуется с сокращениями.

Дэвид Андедаун - старший электронный архивист в департаменте электронной архивации Национальных Архивов Великобритании. Получил образование в области ИТ-технологий, в Национальных Архивах работает с 2005 года. Имеет степень бакалавра по математике от Имперского колледжа в Лондоне.

Данная заметка публикуется в рамках Международной недели архивов ( https://www.ica.org/en/international-archives-week-2019 ), основной темой которой является «Проектирование Ваших архивов в 21-м веке».
Обеспечение долговременной сохранности электронного контента целиком и полностью связано с пониманием рисков и управлением ими. По сути дела это ничем не отличается от того, как мы управляем нашими более старыми физическими коллекциями.

Например, то, что хранилища Национальных Архивов располагаются в местечке Кью (Kew), связано со своим собственным риском: возможен разлив Темзы и наводнение! Однако здание Национальных Архивов имеет различные конструктивные особенности, предназначенные для того, чтобы уменьшить вероятность попадания паводковой воды внутрь и причинения ущерба коллекциям. Даже наши замечательные пруды отчасти созданы для того, чтобы помочь контролировать сток воды.


Цифровые риски

В то время, как для электронно-цифровых коллекций существует ряд физических рисков (таких, например, как повреждение жестких дисков и магнитных лент), большинство цифровых рисков труднее наглядно себе представить.

Для данных, хранящихся на магнитных носителях, существует крохотный риск того, что отдельные магнитные частицы, с помощью которых записываются данные, «перевернутся». В результате считываемое с носителя значение может измениться с единицы на ноль (или наоборот). Для некоторых файлов это может не иметь большого значения:
  • В простом текстовом файле в этом случае изменился бы один символ, внося тем самым небольшую ошибку;

  • В несжатых графических образах (tiff-файлы) мог изменился бы цвет одного пикселя.
Однако для других типов файлов, таких как zip или jpeg, подобное изменение может оказаться более существенным. Может даже так случиться, что файл вообще невозможно будет открыть.

Одной лишь уверенности в том, что файл удастся открыть, может быть недостаточно. Если этот файл не является в точности идентичным тому файлу, который мы первоначально приняли на хранение, можно ли считать его аутентичным документом? Будут ли доверять нам исследователи, если мы не сможем доказать аутентичность наших документов?

Мы можем защищаться от таких рисков, сохраняя несколько экземпляров файла. Мы также создаем для каждого файла контрольные суммы (сейчас это чаще сего хеши, которые имеют ряд дополнительных полезных свойств, и в первую очередь то, что хеш каждого документа уникален – Н.Х.), выполняющие роль цифровых «отпечатков пальцев», которые позволяют показать, что файл не изменился.

Понимание рисков

Мы очень хотим найти способ наглядно увидеть, как взаимодействуют все эти различные риски. В идеале такая картина также показала бы нам, какие риски наиболее велики - и это могут оказаться совсем не те риски, которые мы традиционно считаем важными. Или же мы могли бы увидеть, что защиту от ряда рисков можно обеспечить легко и дешево, и суммарная отдача от этого могла бы оказаться больше, чем смягчение одного большого риска.

Как нам кажется, такую возможность может нам дать байесовская динамическая сеть (Bayesian Dynamic network, https://en.wikipedia.org/wiki/Dynamic_Bayesian_network ). Для изучения возможностей этого подхода мы провели ряд внутренних работ по статистическому моделированию. В интересах дальнейшего продвижения в данном вопросе мы начали сотрудничать с экспертами из группы прикладной статистики и рисков Университета Уорика (University of Warwick, см. https://warwick.ac.uk/fac/sci/statistics/asru/ ). Мы стремимся к тому, чтобы в нашей работе был представлен широкий спектр точек зрения.

Если Вас интересует дополнительная информация об этой работе, посетите веб-сайт британской Коалиция по электронной сохранности (Digital Preservation Coalition, DPC) по адресу https://www.dpconline.org/blog/creating-an-evidence-base .

Дэвид Андедаун (David Underdown)

Источник: блог Национальных Архивов Великобритании
https://blog.nationalarchives.gov.uk/digital-archiving-is-a-risky-business/

Комментариев нет:

Отправить комментарий