пятница, 17 июля 2015 г.

Файловый формат TIFF/A


Заметка профессионального разработчика программного обеспечения Гэри МакГэфа (Gary McGath - на фото) была опубликована 3 июля 2015 года на его блоге «Сумасшедшая наука о файловых форматах» (Mad File Format Science), который посвящён «файловым форматам, проверке структуры файлов, программному обеспечению для архивации и прочим странным вещам».

Файловый формат TIFF существует и используется уже в течение долгого времени. Его последняя официальная спецификация, TIFF 6.0, датируется 1992 годом (см. https://partners.adobe.com/public/developer/en/tiff/TIFF6.pdf ). В течение этих 23 лет формат, однако, не оставался неизменным. Его разработчик компания – фирма Adobe выпустила несколько «технических бюллетеней» (technical notes, о них см. https://fileformats.wordpress.com/2012/09/18/conformity/ ), описывающие важные изменения и содержащих разъяснения. Разработчики программного обеспечения единодушно проигнорировали требование о том, чтобы смещения значений (value offsets) должны располагаться на границе слова, поскольку для современных компьютеров это бессмысленное ограничение. Формат допускает частные теги, и многие организации ввели такие новые теги. Некоторые из них получили широкое распространение, такие, как тег TIFFTAG_ICCPROFILE, который удовлетворяет потребность в привязке профилей цвета ICC к изображениям. Многие приложения используют набор тегов EXIF  для определения метаданных, которые также не являются частью «стандарта».

Другими словами, формат TIFF сегодня представляет собой свод множества неписанных правил.

Как правило, не так уж сложно справляться с этим хаосом и создавать файлы, с которыми смогут работать все современные популярные приложения. С другой стороны, очень легко создать совершенно легальный TIFF-файл, который только Ваше собственное специализированное приложение будет обрабатывать так, как Вы хотели. Людям, которые архивируют файлы, нужна уверенность в их жизнеспособности. Предположения, которые популярны сегодня, могут измениться в течение одного-двух десятилетий. Вариации в соглашениях об использовании метаданных могут вызвать проблемы.

Ограниченное подмножество формата PDF, называемое PDF/A, определяет правила, помогающие обеспечить долговременную читаемость PDF-файлов, которые следуют этим правилам. Группа архивистов из научно-исследовательских учреждений начала работу над инициативой сделать то же самое с форматом TIFF, назвав будущий продукт по аналогии TIFF/A (см. http://tiff-a.org/ ). Эту инициативу поддерживает европейский проект PREFORMA (см http://www.preforma-project.eu/ ).

Пока что данная инициатива все ещё находится в стадии поиска поддержки. Как сообщает сайт этого проекта, с 1 сентября 2015 года начнутся обсуждения, а 1 марта 2016 года – целевая дата для представления проекта в Международную организацию по стандартизации (ИСО). Технические вопросы обсуждаются в «белой книге» (см. http://tiff-a.org/TIFF-A%20white%20paper.pdf ), написанной Питером Форнаро (Peter Fornaro) и Лукасом Розенталером (Lukas Rosenthaler) из Базельского университета. Это, очевидно, лишь первый «выстрел» по данному вопросу. В одном из мест авторы утверждают, что «очевидно, что TIFF-расширения [т.е. сё, что не относится к базовому TIFF] не должны использоваться в файлах, которые предполагается сохранять в течение длительного времени», однако затем они допускают использование тега ICC профиля (более того, объявляют его обязательным для цветных изображений) и EXIF-тега, а также тега IPTC для метаданных, хотя и не рекомендуют им пользоваться.

«Белая книга» не решает проблемы выравнивания на границе слова. По этому вопросу TIFF/A-консорциуму следует занять четкую позицию; либо он должен отказаться от этого требования, либо подтвердить его. Если консорциум будет настаивать на строгом соблюдении спецификаций, то очень многие файлы окажутся несоответствующими.

С TIFF/A, по сравнению с PDF/A, связаны иные проблемы. С одной стороны, TIFF значительно более простой формат, чем PDF (поверьте мне, я написал программы проверки структуры - валидаторы для обоих форматов). С другой стороны, PDF является стандартом ИСО, который ещё не пережил два десятилетия энтропии. Я желаю всяческих успехов коллегам, вовлеченным в проект TIFF/A.

Гэри МакГэф (Gary McGath)

Источник: блог «Mad File Format Science»
https://fileformats.wordpress.com/2015/07/03/tiffa/ 

Комментариев нет:

Отправить комментарий