вторник, 3 июня 2025 г.

Какую роль играет формат EPUB/A в обеспечения долговременной сохранности электронных материалов, часть 2

(Окончание, начало см. http://rusrim.blogspot.com/2025/06/epuba-1.html )

Является ли формат EPUB/A новым аналогом PDF/A?

Нет, это не так - важное различие заключается в том, что форматы PDF/A и EPUB/A служат разным целям.

  • Формат PDF/A - это формат для фиксированного представления контента (layout). Вы получаете то, что видите. Этот формат отлично подходит для юридических документов, инженерных чертежей, подписанных контрактов - для всех ситуаций, когда важны разметка страницы и расположение контента.

  • Формат EPUB/A, с другой стороны, создан для контента, представление которого может меняться (reflowable content) - например, для электронных книг, доступных для лиц со специфическими потребностями отчетов и для цифровых публикаций, которые могут адаптироваться к различным размерам экрана и различным устройствам.

Таким образом, если нужно сохранить официальную версию государственной формы, используйте PDF/A. Если же нужно сохранить электронную книгу, находящуюся в открытом доступе, или изначально размещённый в интернете отчёт, опубликованный в формате EPUB, то формат EPUB/A предлагает более удобный путь вперед, не «упрощая» при этом файл EPUB в формат PDF.

Каковы требования при создании файлов формата EPUB/A?

Не вдаваясь слишком глубоко в технические тонкости, перечислю основные моменты:

  • Отсутствие внешних зависимостей – Все элементы (изображения, тексты, шрифты) должно содержаться внутри файла EPUB. Ссылки на внешний веб-контент не допускаются.

  • Отсутствие встроенных исполняемых скриптов (сценариев) и шифрования — Не должно быть ничего интерактивного или заблокированного. Это позволяет избежать в будущем проблем с неработающими функциональными возможностями или с недоступным контентом.

  • Использование кодировки UTF-8 - Это затейливый способ сказать «используйте самую распространённую и стабильную кодировку символов».

  • Структурированные метаданные - Файл должен включать базовые метаданные, такие как автор, название, дата публикации, права и идентификаторы (такие, например, как ISBN или DOI).

  • Поощряется поддержка доступности для лиц с особыми потребностями - Стандарт опирается на стандарт ISO/IEC 23761 в плане поддерживающих доступность метаданных, который согласован с Рекомендациям концерна W3C по доступности веб-контента (WCAG).

Опять же, всё это делается ради того, чтобы сохраненный сегодня файл формата EPUB можно было прочитать и понять следующим поколениям, даже если изменится ландшафт программного обеспечения.

Как быть с PDF-коллекциями (PDF Collections)?

Мой комментарий: Переносимая PDF-коллекция (или просто «коллекция») - это специальный PDF-файл контейнерного типа, в который упакованы несколько встроенных файлов.

Если Вы работаете с состоящими из нескольких частей документами или с цифровыми объектами, которые упакованы вместе - например, это может быть отчет плюс приложения и электронные таблицы - Вы, возможно, уже знакомы с PDF-коллекциями. Они предусмотрены в стандарте формата PDF 2.0 (ISO 32000), и такая возможность позволяет объединять взаимосвязанные документы в один файл, сохраняя связи между ними.

В EPUB также есть элемент, называемый коллекцией (collection), однако он используется редко, а EPUB/A пока его не поддерживает. Это значит, что PDF-коллекции по-прежнему являются лучшим вариантом, если вы архивируете составные документы, которые должны оставаться взаимосвязанными.

Как форматы EPUB/A и PDF/A сочетаются друг с другом?

Вместо того чтобы выбирать между ними, я рассматриваю EPUB/A и PDF/A как взаимодополняющие инструменты. Смотреть на это можно следующим образом:


Главное заключается в том, чтобы выбор формата соответствовал контенту и варианту использования.

Почему формат EPUB/A важен для специалистов по управлению документами и архивистов

Формат EPUB/A - не панацея, и к тому же его разработка пока ещё не завершена, однако он признаёт реальность того, что немало ценного контента, особенно в сфере образования, научных исследований и открытого правительства, публикуется в формате EPUB. До сих пор у нас не было надёжного способа сохранять этот контент в формате EPUB, без преобразования его в PDF или какой-либо иной формат.

По мере развития этого стандарта я вижу, что EPUB/A предлагает следующее:

  • Более структурированный и прозрачный способ обеспечения долговременной сохранности изначально-цифровых публикаций,

  • Удобный для обеспечения долговременной сохранности формат, поддерживающий доступность для лиц с особыми потребностями;

  • Возможность для архивов, библиотек и репозиториев сохранять целостность изначально выложенных в интернете публикаций.

Данный формат подходит не для всех документов, однако он заполняет важный пробел в нашем наборе инструментов для обеспечения долговременной сохранности в рамках «подходящего» варианта использования.

Заключительные мысли

Формат EPUB/A - многообещающая разработка, но это только начало. На данный момент разработка находится на стадии «проекта комитета ИСО/МЭК» (CD), и работа продолжается. Еще слишком рано ожидать полной поддержки этого инструмента или вносить большие изменения в политики. Однако за этим форматом стоит последить.

Каково мой заключение? Формат EPUB/A меняет далеко не всё, но он даёт нам возможность делать разумный выбор инструментов по обеспечению долговременной сохранности в условиях всё более изменчивой, поддерживающей доступность для лиц с особыми потребностями и ориентированной на веб-публикацию среды.

Нам по-прежнему нужен формат PDF/A. Нам по-прежнему нужны качественные метаданные. Нам по-прежнему следует критически думать о типах контента и потребностях пользователей. В то же время формат EPUB/A помогает нам делать всё это, имея ещё один стандарта в нашем распоряжении.

Эндрю Поттер (Andrew Potter)

Источник: сайт Substack
https://substack.com/inbox/post/161691699

Комментариев нет:

Отправить комментарий