понедельник, 18 декабря 2023 г.

Размышления о круглом столе «Политики, риски и стратегии: Дискуссия о файловых форматах» на конференции iPres 2023

Данный пост Тэрин Эллис (Taryn Ellis – на фото) был опубликован 9 ноября 2023 года на сайте британской Коалиции по электронной сохранности (Digital Preservation Coalition, DPC).

Об авторе: Тэрин Эллис (Taryn Ellis) - технический аналитик по вопросам электронной сохранности Государственной библиотеки штата Южная Австралия, являющейся членом объединения 10 ведущих библиотек Австралии и Новой Зеландии – «Национальных библиотек и библиотек штатов Австралии» (National and State Libraries of Australia, NSLA,
https://www.nsla.org.au/ ).

О конференции iPres 2023:
19-я Международная конференция по обеспечению долговременной сохранности электронных объектов iPres 2023 (
https://ipres2023.us/ ), прошла с 19 по 23 сентября 2023 года в Университете Иллинойса в Урбана-Шампейн (США). Программа конференции выложена здесь: https://ipres2023.us/program/ . Труды конференции доступны по адресу https://www.ideals.illinois.edu/items/128305 .

Будучи относительным новичком в области электронной сохранности (так многому мне ещё нужно научиться, так многое предстоит сделать!), я очень хотела посетить на конференции iPRES 2023 круглый стол «Существуют ли неприемлемые файловые форматы? - Политики, риски и стратегии: Дискуссия о файловых форматах» (Do Unacceptable Formats Exist? - Policies, Risks and Strategies: A File Format Debate), который вёл Сэм Аллоинг (Sam Alloing) из Национальной библиотеки Нидерландов (KBNL).

Для многих из нас, специалистов в области обеспечения электронной сохранности, политика в отношении файловых форматов, когда мы приходим на работу в организацию, это:

  • один из документов, которые нам выдаются, возможно, с оговоркой о том, что его необходимо обновить; или

  • нечто, что, как ожидается, мы сами должны разработать, потому иметь такой документ - это хорошая практика.

Такая политика может включать указания и рекомендации относительно того, какого рода материалы организация должна принимать и/или когда и как принятый материал должен быть обработан с целью обеспечения его долговременной сохранности. Данный круглый стол дал возможность более детально изучить цель такого подхода к управлению коллекциями и побудил нас рассмотреть альтернативные формулировки и модели, которые можно было бы использовать.

Предысторию этой дискуссии можно найти в посте Пола Уитли (Paul Wheatley), опубликованном 30 ноября 2022 года на блоге Коалиции DPC ( https://www.dpconline.org/blog/file-format-recommendations ), в котором он размышляет о новом ресурсе Фонда «Открытая сохранность» (Open Preservation Foundation, OPF) «Международное сравнение рекомендуемых файловых форматов» (International Comparison of Recommended File Formats, https://openpreservation.org/resources/member-groups/international-comparison-of-recommended-file-formats/ - о нём см. также пост на моём блоге: http://rusrim.blogspot.com/2022/05/opf.html - Н.Х.), сводящим воедино сведения о «допустимых и предпочтительных файловых форматах», полученные от ряда учреждений.

Работа круглого стола началась с того, что каждый его участник представил краткое описание того, как его организация формулирует политику в отношении файловых форматов, а также контекста, в котором используются такие оценки. Из шести представленных на круглом столе организаций три имели политику, устанавливающую рекомендуемые файловые форматы, две – не имели (уделяя больше внимания стратегиям и планам действий), а ещё одна рассказала об уровнях обеспечения сохранности, поддерживаемых в настоящее время для каждого формата. Ни одна из организаций не отказывала в приёме материалов из-за неподходящего формата. По ходу дискуссии всплыл ряд интересных тем – больше, чем можно описать в кратком посте на блоге – поэтому, пожалуйста, посмотрите видеозапись круглого стола, выложенную по адресу https://mediaspace.illinois.edu/media/t/1_ug02resm/320674362 (продолжительность 1 час 30 минут, собственно круглый стол начинается на отметке 37 минут – Н.Х.).

Одной из этих тем был выбор формулировок и способы определения форматов как «приемлемых», а также влияние, которое это может оказать на наши коллекции. Некоторые их участников дискуссии отметили, что концепцию «приемлемых» файловых форматов можно интерпретировать как признание того, что некоторые форматы не следует принимать на хранение или собирать; что всегда необходима миграция «неприемлемых» форматов; или же что «приемлемые» форматы не требуют проведения дальнейшего анализа.

Подобные интерпретации могут быть вредны по ряду причин. Запрещая какой-либо формат, организация может не приобрести ключевые элементы набора данных или коллекции. Источники комплектования могут в этом случае не предлагать некоторые материалы или даже пойти на изменение расширений файлов, чтобы те соответствовали «допустимым» форматам (тем самым увеличивая рабочую нагрузку на и без того перегруженных и страдающих от нехватки ресурсов специалистов по обеспечению сохранности!).

Нет никаких гарантий что конверсия/миграция файлов будет простым и надёжным процессом. Перекладывая бремя этой работы на создателей документов или на источники комплектования, мы рискуем получить поврежденные или неполные файлы – или же вообще не получить материалы. Если конверсия/миграция является обязательной согласно политике, то соответствующие затраты на оплату труда и хранение (если оригинал также сохраняется) могут фактически воспрепятствовать выполнению более значимой работы -  а при больших масштабах возможно воздействие на окружающую среду, что мы не можем себе позволить. Кроме того, как напомнили нам эксперты, проведение конверсии/миграции – сложное дело, возможна потеря данных, а ведь все мы можем ошибаться.

Кроме того, рискованно действовать на основе предположения, что порядок управления файлом может определяться одним только форматом, вместо использования более гибкого подхода, учитывающего специфические свойства файла. Например, можно упустить из виду проблемные особенности «допустимого» формата; также создатель документов может проигнорировать более надёжные или отказоустойчивые альтернативные варианты файловых форматов.

Хотя каждая организация будет использовать политику в отношении файловых форматов по-разному - как руководство для источников комплектования, как средство отслеживания своих собственных ресурсов и возможностей, как стратегию выдерживания последовательного внутреннего подхода к проблемам обеспечения долговременной сохранности, как способ обмена с трудом добытыми знаниями с другие ведомствами – стоит рассмотреть альтернативные способы информирования об этих намерениях, особенно в ситуациях, когда плохое информирование может привести к ограничениям и к снижению качества коллекций.

Национальная библиотека Нидерландов (KBNL) разработала подход, способный помочь избежать ряда описанных выше ловушек. Вместо того, чтобы ранжировать файловые форматы, KNBL описывает уровни обеспечения сохранности, которые они в настоящее время могут обеспечить, основываясь на имеющихся у учреждения знаниях о конкретном формате. Существует три уровня знаний:

  • Уровень 1 означает, что есть возможность лишь хранить файлы данного формата, что означает обеспечение сохранности составляющего файл потока бит и его постоянной целостности.

  • Форматы уровня 2 – это те форматы, которые можно идентифицировать в системе PRONOM и присвоить им соответствующий идентификатор PUID ( https://www.nationalarchives.gov.uk/PRONOM/Default.aspx ).

  • Форматы уровня 3 считаются «известными», т.е. хорошо понятными. Будет проведена валидация файлов в таких форматах, и из них будут извлечены технические метаданные.

Рассказывая об этой системе, Сэм объяснил, что цель его учреждения заключается в том, чтобы однажды достичь такого положения дел, когда все его активы будут считаться представленными в форматах уровня 3. Однако имея в своей коллекции более 1000 расширений файлов, они понимают, что для этого предстоит проделать огромную работу!

Подобная прозрачность является признанием того факта, что создатели культурных артефактов всегда будут использовать доступные им инструменты. Она также служит сигналом более широкому сообществу о том, что мы осознаём, что как хранители культурного наследия, несмотря на многочисленные проблемы, обязаны продолжать внедрять инновации и адаптироваться.

Тэрин Эллис (Taryn Ellis)

Источник: сайт британской Коалиции по электронной сохранности (DPC)
https://www.dpconline.org/blog/cdf-ipres23-taryn-ellis

Комментариев нет:

Отправить комментарий