Данный пост эксперта в области управления электронными документами, эксперта ИСО от США Энди Поттера (Andy Potter - на фото) был опубликован 3 ноября 2025 года в социальной сети Substack
Когда Питер Уайет (Peter Wyatt) выходит на трибуну, можно ожидать мастер-класс, характеризующийся как точностью, так и перспективой. На конференции iPRES 2025 в Веллингтоне Питер Уайет, директор по технологиям Ассоциации PDF и ключевой разработчик стандартов международной организации по стандартизации (ИСО) для формата переносимых документов (Portable Document Format, PDF), провёл насыщенный и увлекательный обучающий семинар, который приоткрыл завесу тайны над тем, как на самом деле «работает» формат PDF/A.
В начале этого года мне не удалось попасть на доклад Питера на проходившей в Берлине конференции «Дни PDF в Европе» (PDF Days Europe 2025, https://pdfa.org/event/pdf-days-europe-2025/ ), поэтому я был рад увидеть его имя в программе конференции в Веллингтоне. На этот раз я твёрдо решил не пропускать его выступление, которое представляло собой не просто обсуждение файловых форматов; в докладе был сделан чёткий разбор того, как пересекаются практика обеспечения долговременной сохранности электронных материалов (электронная сохранность), разработка программного обеспечения и международные стандарты.
Говорит архитектор
Уайет начал с того, что развеял завесу загадочности вокруг своей профессии. Он — австралийский инженер, технический редактор международного стандарта ISO 32000 (PDF 2.0) и контактное лицо, участвующее практически во всех международных дискуссиях об эволюции формата PDF. «Я тот человек, что пишет спецификации формата», - сообщил он. Однако его доклад был не о текущем состоянии стандарта, а о его разъяснении - помогая специалистам по электронной сохранности, архивистам и библиотекарям понять живую экосистему, поддерживающую 30-летнего возраста формат, который по-прежнему играет ключевую роль в сохранении мировой документальной памяти.
Он ясно сформулировал свою миссию: привести практику обеспечения электронной сохранности в соответствие с реальностью существующих стандартов. Использование формата PDF/A не является некоей мистической «печатью» архивной чистоты. Данный формат представляет собой ряд прагматических ограничений, наложенных на сложный и эволюционирующий «полный» файловый формат PDF. Посыл Уайета был ясен: невозможно сохранить то, чего не понимаешь.
От «цифровой бумаги» к платформе обеспечения сохранности
Первый тезис Уайета был обманчиво прост. PDF - это не файл, а контейнер. Это объектно-ориентированная структура с произвольным доступом, инкапсулирующая текст, изображения, векторную графику, метаданные и даже исполняемую логику. В начале своего существования PDF выступал в роли «цифровой бумаги» - окончательной формы для готовых к печати документов. Формат PDF 2025 года, пояснил Уайет, уже больше похож на самоописываемую цифровую экосистему. Он может содержать 3D-модели, мультимедийные объекты, встроенные метаданные в форматах XML или JSON, слои доступности, а также несколько представлений контента в одном файле.
Вот почему так важна буква «А» в аббревиатуре PDF/A (от слова «архивный»). Она укрощает хаос, ограничивая использование функциональных возможностей, которые могут нарушить воспроизводимость или же сделать контент зависимым от внешнего программного обеспечения. Речь идёт о фиксации визуального представления, а не смысла, политики или аутентичности. «Формат PDF/A определяет визуальное представление статической страницы, и это, по сути дела, всё», - напомнил Уайат аудитории. «Всё остальное - политика управления документами, структура метаданных, долговременная доступность доступ - определяется Вами».
Отправка «на покой» устаревшей редакции стандарта
Самое провокационное замечание Уайета касалось формата PDF/A-1, опубликованного в 2005 году, который отказывается исчезать. Уайет отметил, что некоторые архивные и государственные политики по-прежнему требуют его использования, и назвал эту практику «индикатором устаревшего программного обеспечения, а не хорошей политики». PDF/A-1 запрещает прозрачность, тени и использование формата изображений JPEG 2000, которые уже два десятилетия являются стандартными элементами цифрового контента. Преобразование современных документов в этот формат, по его словам, «отупляет контент и искажает его аутентичность».
Мой комментарий: Знаете ли Вы страну, в которой архивное агентство и многие государственные ведомства по-прежнему настаивают именно на использовании PDF/A-1? :)
Его призыв был недвусмысленным: Перестаньте считать соответствие стандарту PDF/A-1 признаком добродетели. Используйте архивный формат PDF/A-4 (регламентированный стандартом ISO 19005-4:2020), основанный на формате PDF 2.0, который объединяет в себе доступность, поддержку встроенных файлов и боле богатые модели метаданных. Если же Ваша система по-прежнему настаивает на PDF/A-1, сказал он, «то Вы не обеспечиваете отражение контента в том виде, в котором сегодня создаётся».
(Окончание следует, см. http://rusrim.blogspot.com/2026/01/pdfa-2.html )
Эндрю Поттер (Andrew Potter)
Источник: сайт Substack
https://metaarchivist.substack.com/p/inside-the-black-box-of-pdfa



Комментариев нет:
Отправить комментарий