понедельник, 9 сентября 2019 г.

Как правильно архивировать электронную почту в виде PDF-файлов, часть 1


Данная заметка исполнительного директора Ассоциации PDF (PDF Association) Даффа Джонсона (Duff Johnson – на фото) была опубликована 12 июля 2019 года на сайте специализированного австралийского издания IDM (Information and Data Manager - «Специалист по управлению информацией и данными», https://www.idm.net.au/ ).

В сотрудничестве с Национальными Архивами США (NARA), Библиотекой Конгресса и другими партнёрами, Ассоциация PDF примет участие в финансируемом Фондом Эндрю Меллона проекте по выявлению основных характеристик и оптимальных функциональных требований к сообщениям электронной почты и необходимой сопутствующей информации, сохраняемым в архиве на основе технологии PDF. Целью проекта, который продлится свыше шести месяцев, является публикация технической «белой книги» (аналитического отчёта), определяющего, каким образом сообщения электронной почты и их идентифицированные основные характеристики и функциональные возможности должны быть преобразованы в PDF-контейнеры, которые можно будет рассматривать - в контексте захваченной информации – как доказуемо аутентичную и полную документацию электронной переписки.

В числе результатов проекта будут опубликованный отчет и приложения, определяющие существенные характеристики электронной почты, необходимые для удовлетворения потребностей сообщества, занимающего архивацией электронной почты. Кроме того, в отчете будут описаны варианты использования программного обеспечения, преобразующего сообщения электронной почты в PDF-файлы, вместе с рекомендациями, которые поставщики смогут использовать для встраивания подобных функциональных возможностей для архивирования в почтовые клиенты или инструменты, разрабатываемыми третьими сторонами.

В 2016–2018 годах Фонд Эндрю Меллона (Andrew W. Mellon Foundation) и британская Коалиция по электронной сохранности (Digital Preservation Coalition, DPC) оказали поддержку Целевой группе по техническим подходам к созданию и ведению архивов электронной почты (Task Force on Technical Approaches for Email Archives), которая выпустила отчет CLIR 175 о своих выводах под названием «Будущее архивов электронной почты – Отчет Целевой группы по техническим подходам к созданию и ведению архивов электронной почты» (The Future of Email Archives - A Report from the Task Force on Technical Approaches for Email Archives) (The Future of Email Archives,  https://www.clir.org/wp-content/uploads/sites/6/2018/08/CLIR-pub175.pdf - об этом отчете см. также https://rusrim.blogspot.com/2018/10/saacosanagara-2018-201.html - Н.Х.).

Этот отчет, опубликованный в августе 2018 года Советом по библиотечным и информационным ресурсам (CLIR, Council on Library and Information Resources, http://www.clir.org/ ), содержит подробный анализ технических проблем, связанных с обеспечение долговременной сохранности электронной почты, и предлагает заинтересованному сообществу рабочую повестку дня по улучшению и доработке технической концепции архивирования электронной почты, включая разработку интероперабельных инструментальных наборов инструментов с целью закрытия существующих пробелов.

Одним из выявленных пробелов - и целью многих других проектов архивирования электронной почты - является определение формата или форматов, подходящих для долговременного сохранения электронной почты. Одним из сильных претендентов на эту роль, как отмечается в отчете Целевой группы, является формат PDF, а именно, его подмножество PDF/A.

Электронная почта как архивные документы

Традиционно применявшийся подход «распечатай и подшей в дело» (print and file) к архивированию электронной почты весьма трудоёмок и обременителен. В результате накопления практического опыта и развития направления электронной сохранности, традиционный метод теперь признан деструктивным, приводящим к потере контекстуальной информации, такой как метаданные; к изменению внешнего вида электронных сообщений и их восприятия пользователем (look and feel), а также к разрыву взаимосвязей сообщений с присоединёнными файлами.

Как это подтвердила утверждённая правительством США Директива по управлению государственными документами OMB/NARA М-12-18 (Managing Government Records Directive, https://www.archives.gov/files/records-mgmt/m-12-18.pdf , о ней см. также пост http://rusrim.blogspot.ru/2012/08/i_27.html . Недавно её заменил новый меморандум OMB/NARA M-19-21 «Переход к электронным документам» (Transition To Electronic Records), см. https://www.whitehouse.gov/wp-content/uploads/2019/06/M-19-21.pdf , а также мой пост https://rusrim.blogspot.com/2019/07/blog-post_8.html  – Н.Х.), потребовавшая, чтобы к концу 2016 года федеральные органы исполнительной власти обеспечили хранение документированной электронной почты в доступном электронном формате, -  и как давно уже признали сообщества специалистов в области управления документам и архивного дела, - подход «распечатай и подшей в дело» более не является приемлемым для управления документами в электронной почте.

В качестве поддержки реализации Директивы и в интересах исполнения своей миссии по укреплению непрерывной целостности электронных документов в масштабах всего федерального правительства, Национальные Архивы выпустили официальное руководство (см. https://www.archives.gov/records-mgmt/policy/transfer-guidance-tables.html#email2 ) для федеральных органов исполнительной власти, установившее форматы файлов, которые они могут использовать при передаче электронных документов на постоянное архивное хранение. Хотя это руководство адресовано федеральным органам, на практике оно широко применяется более широким сообществом специалистов в области управления документами и архивного дела.

Мой комментарий: В упомянутых рекомендациях Национальных Архивов формат PDF не упоминается ни как предпочтительный, ни как допустимый.

Поддержание электронной почты в архивных целях с использованием часто незнакомых и / или проприетарных форматов является тяжёлой задачей, поэтому многие организации выбирают безопасный и предсказуемый формат PDF, в немалой степени из-за его близости привычному подходу «распечатай и подшей в дело». С уходом в прошлое метода «распечатай и подшей в дело», экспорт сообщений электронной почты из их «родных» приложений в виде PDF-файлов является одним из потенциальных вариантов их сохранения, в рамках которого документы остаются в знакомом формате, и файлами в таком формате можно управлять в системах управления электронными документами. Кроме того, некоторые устаревшие почтовые системы и системы, поддерживающие шифрование электронной почты, имеют функциональные возможности для экспорта сообщений только в виде PDF-файлов. По этим причинам, а также благодаря другим полезным возможностям формата, «сохранение в формате PDF» остается очень привлекательным вариантом для многих организаций и архивов.

(Окончание следует)

Дафф Джонсон (Duff Johnson)

Источник: сайт издания IDM (Information and Data Manager)
https://www.idm.net.au/article/0012551-how-can-email-be-correctly-archived-pdf

Комментариев нет:

Отправить комментарий