вторник, 3 ноября 2015 г.

Дэвид Розенталь: Снова о «раке предстательной железы» электронной сохранности


Заметка известного американского специалиста, сотрудника Библиотеки Стенфордского университета д-ра Дэвида Розенталя (David Rosenthal – на фото) была опубликована на его блоге (DSHR's Blog) 16 сентября 2015 года. Она привлекла меня своей нетрадиционной точкой зрения на проблему устаревания форматов.

Опубликованный более 8 лет тому назад третий по счёту пост на моём блоге назывался «Устаревание форматов: «рак предстательной железы» электронной сохранности» (Format Obsolescence: the Prostate Cancer of Preservation, http://blog.dshr.org/2007/05/format-obsolescence-prostate-cancer-of.html ). В нём я утверждал, что случаи устаревания широко используемых форматов, таких, как распространенные в Интернете форматы, будут редкими. Даже если это когда-либо произойдёт, это будет очень медленный процесс, оставляющий достаточно времени для того, чтобы системы обеспечения долговременной сохранности на него отреагировали.

В этой связи направление большой части выделяемых на обеспечение долговременной сохранности ресурсов на то, чтобы одержимо собирать метаданные с целью облегчения проводимой в конце концов миграции формата, является экономически неоправданным по трем причинам. Во-первых, отдача от расходов со временем меняется, и те же затраты на более позднем отрезке времени позволят сохранить больше контента. Во-вторых, формат, возможно, никогда не устареет, поэтому деньги на подготовку к миграции могут быть потрачены впустую. В-третьих, если формат когда-либо действительно морально устареет, доступные для работы с ним технологии будут на момент устаревания более совершенными, чем на момент его появления.

Теперь, по прошествии ряда лет, можно поставить вопрос о том, насколько хорошо эти предсказания оправдались в свете последующих событий.

Исследование, проведенное Мэттом Холденом (Matt Holden) во французском Национальном аудиовизуальном институте (Institut national de l'audiovisuel, INA) в 2012 году, показало, что подавляющее большинство аудиовизуального контента даже 15-летней давности легко отображается современными инструментами ( http://blog.dshr.org/2012/10/formats-through-time.html ). Аудиовизуальная форматы, использовавшиеся на заре Интернета, являются одними из наиболее уязвимых к устареванию. Так, прототип Interject ( http://www.webarchive.org.uk/interject/ ) на веб-сайте Британского интернет-архива (UK Web Archive)  утверждает, что следующие форматы устарели и требуют миграции:
  • image/x-bitmap и  image/x-pixmap – оба отображаются в моей стандартной Linux-среде через Image Viewer;

  • x-world/x-vrml версий 1 и 2 - не отображаются в моей стандартной Linux-среде, но для них имеются инструменты миграции;.

  • программное обеспечение ZX Spectrum - не подходит для миграции.
Эти примеры подтверждают прогноз о том, что архивы будут содержать очень немного контента в форматах, подверженных моральному устареванию.

На рис: художественная инсталляция, показанная в среде эмуляции.

Прогноз о том, что технологии доступа к сохраненному контенту будут со временем улучшаться, подтверждается недавними событиями. Два с половиной года назад группа исследователей из Фрайбургского университета (Freiburg University) представили свою концепцию эмуляции bwFLA, которая, подобно проектам Olive университета Карнеги-Меллона (Carnegie Mellon University, CMU) и Internet Archive, способна обеспечить читателю среду эмуляции, встроенную в обычную веб-страницу. Примером этого является инсталляция 2000 года Яна Роберта Легте (из базы данных современного искусства Rhizome, http://rhizome.org/artbase/ ) «Без названия [полосы прокрутки]» (запуск эмуляции: http://hdl.handle.net/11270/5a23663e-67da-43ba-9a35-83ab89bb5bed ). Для отображения первоначального намерения художника, нужно посмотреть инсталляцию, используя браузер Internet Explorer того времени, что делается с помощью bwFLA.

Все чаще в современном программном обеспечении полосы прокрутки не показываются постоянно, а всплывают при необходимости. Просмотр инсталляции с использованием, например, Safari под OS X озадачивает, потому что полосы прокрутки не видны (см. рис).

Прогноз о том, что если широко используемый формат и устареет, что это будет происходить очень медленно, в настоящее время подтверждается, но не по ожидаемой причине и не как демонстрация необходимости миграции форматов. Формат Adobe Flash был очень широко распространенным веб-форматом. Он не устарел в том смысле, что его больше не нет возможности отображать. Он устаревает в том смысле, что браузеры, следуя примеру Стива Джобса, оказываются его поддерживать, считая  слишком опасным с учетом современной обстановки интернет-угроз:
  • Пять лет назад, 28,9% сайтов использовали Flash тем или иным образом - по данным Матиаса Гельбмана (Matthias Gelbmann), управляющего директора фирмы W3Techs, занимающейся метриками веб-технологий. По состоянию на август 2015 года, использование Flash снизилось до 10,3%.

  • Однако крупным веб-сайтам предстоит более долгий путь. Flash всё ещё используется на 15,6% сайтов из топ-1000, отмечает Гельбман. Сейчас ситуация стала обратной той, что имела место несколько лет назад, когда Flash применялся на 22,2% крупнейших сайтов и на 25,6% общего числа сайтов.
Если браузеры не будут поддерживать Flash из-за того, что с ним связаны неприемлемые риски для базовой системы, то значительная часть сохраненных к настоящему времени сайтов станет непригодной для использования. Правдой является то, что некоторые из сохраненных Flash-объектов представляют собой вредоносные программы, поэтому просто предложить пользователю разрешить использование Flash в его браузере - не очень хорошая идея. Однако если веб-архивы будут эмулировать браузер с поддержкой Flash (удаленно или локально), то риск будет значительно меньше.

Даже если эмуляция падёт жертвой вредоносной программы, базовая система будет подвержена гораздо меньшему риску. Если цель вредоносной программы - использовать скомпрометированную систему как часть ботнета, то короткий жизненный цикл эмуляции сделает её неэффективной. Людей следует предупредить о том, что не следует вводить конфиденциальную информацию, которая может быть перехвачена вредоносной программой, однако маловероятно, что многие пользователи будут передавать пароли или другие учетные данные через историческую эмуляцию. И, поскольку вредоносная программа была сохранена до того, как была создана эмулирующая система, то авторы вредоносной программы не смогут обновить её таким образом, чтобы нацелить на сам  эмулятор, а не систему, которая эмулируется.

Итак, в какой же мере сбылись мои прогнозы?
  • Очевидно, что устаревание широко используемых веб-форматов случается редко. Flash является единственным таким примером за 20 лет, и это не тот вид устаревания, что имели в виду сторонники превентивной миграции;

  • Очевидно, что даже если устаревание широко используемых веб-форматов имеет место, то это очень медленный процесс. Для Flash процесс устаревания идёт уже половину десятилетия и до сих пор ещё не завершился;

  • Технология доступа к сохранённому контенту значительно улучшилась. Мне не известно ни одного решения на основе миграции для безопасного доступа к сохраненному Flash-контенту. Весьма вероятно, что гипотетический метод миграции Flash-объектов также приведёт к миграции вредоносного кода, тем самым извращая основания для проведения миграции.
Три из трех, не так уж плохо!

Дэвид Розенталь (David Rosenthal)

Мой комментарий: При всём уважении к многоопытному коллеге, я считаю бессмысленным спорить о том, что нужно в домашнем хозяйстве – молоток или отвертка (или, ближе к теме поста, миграция или эмуляция). Нужно и то, и другое – у каждого инструмента есть своя ниша, свои сильные стороны и ограничения.

Источник: DSHR's Blog
http://blog.dshr.org/2015/09/the-prostate-cancer-of-preservation-re.html

Комментариев нет:

Отправить комментарий