вторник, 10 сентября 2019 г.

Как правильно архивировать электронную почту в виде PDF-файлов, часть 2


(Окончание, начало см. http://rusrim.blogspot.com/2019/09/pdf-1.html )

Проблемы

Поскольку формат PDF спроектирован для воспроизведения внешнего вида бумажных документов, то некоторые из тех же проблем, с которыми приходится сталкиваться при преобразовании сообщений электронной почты в бумажные форматы, наблюдаются и при преобразованиях в PDF. Работа по данному гранту стремится положить начало решению этих проблем.

По иронии судьбы, именно гибкость PDF создаёт сложности при обеспечении долговременной сохранности сообщений электронной почты. В отсутствие поддерживаемого отраслью профиля формата PDF для целей архивирования электронной почты, просто существует слишком много способов хранить и связывать друг с другом различные компоненты электронных сообщений в документах формата PDF. Более того, отсутствие такого профиля тормозит разработку приложений для конечного пользователя, поддерживающих взаимодействие с заархивированной подобным образом электронной почтой.

По словам ведущего исследователя Криса Прома (Chris Prom), существующие инструменты сильно различаются в том, как они обрабатывают имеющие значения с точки зрения архивации свойства электронной почты; и ни один из них не делает это таким образом, который можно было бы считать в полно мере «архивным». Известны следующие проблемы, связанные с преобразованные в PDF-файлы сообщениями электронной почты:
  • Может отсутствовать возможность различить такие компоненты электронного письма, как заголовки, тело сообщения и вложения;

  • Поля адресов могут заполняться не единообразно - либо адресом, либо псевдонимом;

  • Могут не показываться получатели BCC-копий;

  • Может не обеспечиваться согласованная обработка присоединённых файлов;

  • Не сохраняются цепочки сообщений, если только текст не цитируется или не вкладывается в одно сообщение, которое затем «распечатывается» в файл PDF. Первоначальный контекст ответа легко может быть потерян;

  • Псевдонимы часто используются в списках рассылки, но они не всегда «привязаны» к проверенному адресу электронной почты;

  • По содержанию PDF-файлов не видно, было ли письмо прочитано;

  • Пользовательские системы классификации (например, папки или теги) могут не воспроизводиться или не документироваться;

  • Контент, на который указывают гиперссылки, может отображаться некорректно и не включаться в PDF-файл.
Возможности

Несмотря на все эти проблемы, несоответствия и сложности, формат PDF является очень жизнеспособным вариантом для архивирования электронной почты, поскольку:
  • PDF широко распространён и знаком,

  • Многие почтовые клиенты изначально поддерживают экспорт в PDF;

  • Многие хранилища уже имеют функциональные возможности для обеспечения долговременной сохранности PDF-файлов, поэтому электронная почта, захваченная в виде PDF-файлов, будет легче интегрироваться с существующими системами, чем другие форматы, специфические для сообщений электронной почты.

  • PDF имеет богатые возможности для работы с метаданными;

  • PDF поддерживает богатые семантические функциональные возможности для обеспечения доступности и повторного использования контента;

  • PDF включает широко реализованную модель для вложений;

  • Конфиденциальная информация может быть легко и надежно удалена из PDF-файла; имеются даже функции, специально предназначенные для поддержки рабочих процессов цензурирования;

  • У формата имеется хорошо себя зарекомендовавший «архивный» вариант (PDF/A);

  • PDF - это открытая, стандартизированная Международной организацией по стандартизации (ИСО) технология, поддерживаемая широкой экосистемой разработчиков.
Профиль PDF для архивирования электронной почты

PDF может стать мощным решением для архивирования электронной почты, но создание необходимого профиля PDF для удовлетворения архивных требований потребует значительных усилий. Настоящий проект, финансируемый Фондом Эндрю Меллона, собирает группу специалистов для написания и публикации отчета, детализирующего специфические свойства электронной почты, имеющие ключевое значение для архивирования в контексте PDF, - а также вариантов использования для преобразования архивных электронных писем в формат PDF и рекомендаций для сообщества поставщиков относительно разработки профиля (в ходе запланированной второй фазы проекта).

Проект возглавляет Кристофер Пром (Christopher Prom), профессор и декан по цифровым стратегиям Университета Иллинойса в Урбана-Шампейн. Проектная группа включает разнообразных экспертов, представляющих государственные органы, науку и отрасль, в том числе представителей Ассоциации PDF.

Ожидаемые результаты

Цель проекта - предоставить строительные блоки для интероперабельных технических решений для архивирования электронной почты. Используя практичный подход к определению архивных потребностей, создатели систем могут затем использовать их в качестве функциональных требований, на основе которых будут разрабатываться согласованные решения для работы с электронной почтой от различных поставщиков и для различных платформ.

Основным результатом проекта станет технический аналитический отчёт, определяющий основные характеристики электронной почты, в качестве основе для проведения преобразований сообщений в формат PDF. Дополнительным результатом станет прямое взаимодействие между сообществами специалистов по работе с электронной почтой и по использованию формата PDF. Посредством создания рабочих групп и установления формальных связей между поставщиками PDF-решений и членами сообщества специалистов по работе с электронной почтой в академической и государственной сферах будет решаться задача, заключающаяся в том, чтобы удовлетворить реальные потребности в расширенных возможностях архивировании электронной почты, одновременно с упрощением применяемых способов, чтобы помочь пользователям быстрее и проще найти свой путь к наилучшей практике управления документами.

Проделанная в рамках данного проекта работа поможет в выполнении планируемого последующего проекта, в ходе котором эксперты по PDF и электронной почте совместно разработают:
  • Профиль PDF, предназначенный для архивирования электронной почты (Archival PDF profile for email  - «Архивный профиль PDF для электронной почты»);

  • Руководство по хорошей практике создания PDF-файлов на основе профиля;

  • Методические рекомендации в качестве дополнения к названным выше результатам.
Дафф Джонсон (Duff Johnson)

Источник: сайт издания IDM (Information and Data Manager)
https://www.idm.net.au/article/0012551-how-can-email-be-correctly-archived-pdf

Комментариев нет:

Отправить комментарий