пятница, 30 марта 2018 г.

Файловые форматы: Долговременное архивное хранение с использованием формата PDF/A


Данная заметка Дика Вейсингера (Dick Weisinger – на фото) была опубликована 19 марта 2018 года на блоге компании Formtek.

Разработанный компанией Adobe файловый формат PDF почти повсеместно используется при обмене документами фиксированного формата. В 2005 году компания Adobe сделала формат PDF общедоступным в качестве открытого стандарта, и теперь он находится под контролем соответствующего технического комитета Международной организации по стандартизации (ИСО).

PDF/A (где литера «A» означает «для долговременного архивного хранения») является стандартизированным ИСО файловым форматом для постоянного хранения документов в неизменном виде. Технологии быстро меняются, а файловые форматы столь же быстро устаревают и перестают поддерживаться. PDF/A разрабатывался как стандартный открытый формат, который позволяет просматривать документы в их первоначальном виде в течение длительного времени в будущем.

История развития стандарта PDF/A выглядит следующим образом:
  • PDF/A-1 [2005 год] - на основе базового формата PDF 1.4;

  • PDF/A-2 [2011 год] – добавлена поддержка сжатия JPEG 2000, прозрачных слоев, встраивание шрифтов OpenType и электронные цифровые подписи;

  • PDF/A-3 [2012 год] – вводит возможность встраивания в документ PDF/A электронных объектов в произвольных файловых форматах (таких, как XML, CSV), электронных таблиц и САПР-файлов;

  • PDF/A-4 [должен быть опубликован в 2018 году] – обновления формата, приводящие его в соответствие с новым базовым форматом PDF 2.0.
Однако в отчете (речь идёт об отчёте «Преимущества и риски использования файлового формата PDF/A-3 архивными учреждениями» (The Benefits and Risks of the PDF/A-3 File Format for Archival Institutions), см. http://www.digitalpreservation.gov/documents/NDSA_PDF_A3_report_final022014.pdf ; см. мой пост о нём здесь https://rusrim.blogspot.ru/2014/03/pdfa-3.html - Н.Х.), выпущенном американским «Национальным альянсом попечения об электронных материалах» (National Digital Stewardship Alliance, NDSA, http://ndsa.org/ ) была дана весьма критическая оценка полезности формата PDF/A-3.

«Возможность включения в файлы формата PDF/A-3 встроенных электронных объектов произвольного формата создает для учреждений памяти существенные риски и проблемы. Файл формата PDF/A-3 может содержать внутри себя файл любого иного типа, и всё, что стандарт говорит в связи с этим по вопросу обеспечения долговременной сохранности, это то,  что соответствующая стандарту PDF/A-3 программа чтения не обязана отображать встроенные файлы, а должна лишь поддерживать возможность их извлечения. Стандарт молчит о том, следует ли считать встроенный контент существенным для полного понимания или использования первичного документа, чьё внешнее представление сохраняется. В результате использование файлов формата PDF/A-3 без дополнительных правил или соглашений может привести к тому, что архивное учреждение примет на хранение встроенный контент в формате, который оно не ожидало, с которым неспособно работать, и чья связь с основным документом может быть неясной».

Дик Вейсингер (Dick Weisinger)

Мой комментарий: На данный момент формат PDF/A-3 слабо востребован, однако потенциально он может оказаться очень полезным, причём скорее в оперативной и среднесрочной деловой деятельности организаций, чем в архивной работе. На сегодня известны следующие перспективные варианты его применения:
  • Создание счетов-фактур и других деловых документов, которые помимо представления сведений в виде человеко-читаемого документа также содержат ту же информацию в виде, удобном для автоматизированной обработке (скажем, в виде XML-файла, спрятанного в PDF/A-3-файле в виде встроенного объекта);

  • Экспорт из почтовой системы и последующее хранение сообщений электронной почты вместе с прикрепленными файлами произвольного формата.
Хочу также обратить внимание читателей на то, что как базовый формат PDF, так и его «архивный» вариант PDF/A непрерывно развиваются, поэтому у меня вызывает улыбку нормотворчество ряда ведомств, которые до сих пор знают лишь о существовании довольно бедного по своим возможностям PDF/A-1.

Источник: блог компании Formtek
http://formtek.com/blog/file-formats-long-term-archival-with-pdf-a/ 

Комментариев нет:

Отправить комментарий