Данная заметка Кейт Мюррей (Kate Murray), Маркуса Напье (Marcus Nappier) и Лиз Холдзком (Liz Holdzkom) из отдела сервисов и управления цифровыми коллекциями Библиотеки Конгресса США была опубликована 16 июня 2022 года в блоге «Сигнал» (The Signal) на сайте Библиотеки Конгресса США.
Мы обращаемся ко всем фанатам файловых форматы … и к тем компьютерным фанатам, которые – пока! – не являются фанатами файловых форматов! Закончилось ожидание новостей о файловых форматах, и мы можем сейчас поделиться несколькими интересными новостями, касающимися новых дополнений на подсайте Библиотеки Конгресса США «Жизнестойкость цифровых форматов» (Sustainability of Digital Formats, https://www.loc.gov/preservation/digital/formats/index.html?loclr=blogsig ) и поглощении подсайта «Стеллажи» (Stacks, https://stacks.loc.gov/?loclr=blogsig )!
Добро пожаловать на страницы второго поста серии «Увлекательный мир файловых форматов» (Fun with File Formats, первый пост см. здесь: https://blogs.loc.gov/thesignal/2021/12/fun-with-file-formats/?loclr=blogsig ).
Новые категории контента
Мы очень рады объявить о новых дополнениях на подсайте «Жизнестойкость цифровых форматов» ( https://www.loc.gov/preservation/digital/formats/index.html?loclr=blogsig ), являющимся из ведущих ресурсов в мире для получения углублённой технической информации о цифровых файловых форматах. Со времени нашего последнего обновления мы добавили три новые категории контента, с тем, чтобы отразить расширяющиеся потребности сообщества как в Библиотеке Конгресса США, так и за её пределами.
Рисунок 1. Категории контента на подсайте «Жизнестойкость цифровых форматов»; выделены три новые категории!
Новые категории контента следующие:
- «Электронная почта и электронный секретарь / менеджер личной информации» (Email and Personal Information Manager, PIM), https://www.loc.gov/preservation/digital/formats/fdd/email_fdd.shtml?loclr=blogsig
- «Проектирование и 3D-модели» (Design and 3D), https://www.loc.gov/preservation/digital/formats/content/design3D.shtml?loclr=blogsig , и
- «Сжатие и архивация файлов» (Aggregate), https://www.loc.gov/preservation/digital/formats/content/aggregate.shtml?loclr=blogsig .
Категория форматов электронной почты и электронных секретарей / менеджеров личной информации (Email and Personal Information Manager, PIM), которая также включает форматы календарей и обмена мгновенными сообщениями, в течение последних нескольких лет всё шире используется в Библиотеке. Эти форматы поддерживают функциональные возможности для обмена мгновенными сообщениями, для управления списками контактов, встреч и другими личными данными, которые обычно объединяются в рамках пакетов программного обеспечения. Библиотека изучает свои рабочие процессы для обработки и архивирования растущего числа коллекций сообщений электронной почты. В числе форматов электронной почты и PIM можно назвать:
- Формат электронной почты (Electronic Mail Format, EML), https://www.loc.gov/preservation/digital/formats/fdd/fdd000388.shtml?loclr=blogsig
- Формат электронного календаря и расписания iCalendar (iCal), https://www.loc.gov/preservation/digital/formats/fdd/fdd000394.shtml?loclr=blogsig
- Формат интернет-сообщений (Internet Message Format, IMF), https://www.loc.gov/preservation/digital/formats/fdd/fdd000393.shtml?loclr=blogsig
- Элемент Microsoft Outlook (Microsoft Outlook Item, MSG), https://www.loc.gov/preservation/digital/formats/fdd/fdd000379.shtml?loclr=blogsig
- И многие другие! https://www.loc.gov/preservation/digital/formats/fdd/email_fdd.shtml
Категория «Проектирование и 3D-модели» включает в себя форматы для двух- и трёхмерного автоматизированного проектирования (computer-aided design, CAD) и автоматизированного производства (computer-aided manufacturing, CAM), форматы застроенной человеком среды, схем, архитектурных чертежей, фотограмметрического сканирования, данных облака точек и многого другого!
Вместе с новой категорией контента появляются новые факторы качества и жизнестойкости (Quality and Sustainability factors, https://www.loc.gov/preservation/digital/formats/content/design3D_quality.shtml?loclr=blogsig ). О том, как эти факторы играют роль одного из столпов нашей работы с файловыми форматами, мы кратко рассказывали в нашем предыдущем посте https://blogs.loc.gov/thesignal/2021/12/fun-with-file-formats/?loclr=blogsig .
Факторы качества и функциональности для форматов проектирования и 3D-моделей основаны на результатах анализа проведенного в 2008 году Национальным центром суперкомпьютерных приложений (National Center for Supercomputing Applications, NCSA), см. https://www.archives.gov/files/applied-research/ncsa/8-an-overview-of-3d-data-content-file-formats-and-viewers.pdf .
Существует четыре ключевых аспекта 3D-модели - геометрия, внешнее представление, сцена и анимация, которые служат основой наших факторов качества и функциональности. Геометрия 3D-модели описывает форму модели посредством, помимо прочего, облаков точек, наборов линий или сеток. Внешнее представление включает в себя цвета, текстуры и типы материалов. Сцена модели определяет положение источников света, камеры и других объектов относительно 3D-модели, а анимация - то, как движется 3D-модель!
В числе популярных форматов проектирования и 3D-моделей можно назвать:
- STEP , https://www.loc.gov/preservation/digital/formats/fdd/fdd000448.shtml
- Семейство файлов Adobe Photoshop, https://www.loc.gov/preservation/digital/formats/fdd/fdd000523.shtml?loclr=blogsig
- STL (STereoLithography), https://www.loc.gov/preservation/digital/formats/fdd/fdd000504.shtml?loclr=blogsig
- X3D, https://www.loc.gov/preservation/digital/formats/fdd/fdd000490.shtml?loclr=blogsig ; и
- DXF, https://www.loc.gov/preservation/digital/formats/fdd/fdd000446.shtml?loclr=blogsig .
Категория форматов сжатия и архивации файлов (Aggregate – букв. «агрегированный контент»; оно стало использоваться вместо термина «файлы-архивы», чтобы избежать путаницы с понятиями архивного дела – Н.Х.) охватывает подмножество простых форматов групповой упаковки (bundling), которые используются для объединения множества файлов данных в один файл для упрощения переноса и хранения, с возможностью, в дополнение к другим функциональным возможностям, сжатия данных для экономии места хранения.
Форматы данной категории, такие как:
- ZIP ( https://www.loc.gov/preservation/digital/formats/fdd/fdd000354.shtml?loclr=blogsig ),
- RAR ( https://www.loc.gov/preservation/digital/formats/fdd/fdd000450.shtml?loclr=blogsig ),
- tar ( https://www.loc.gov/preservation/digital/formats/fdd/fdd000531.shtml?loclr=blogsig ) и
- новый формат 7z ( https://www.loc.gov/preservation/digital/formats/fdd/fdd000539.shtml?loclr=blogsig ),
в вычислительной технике и во многих спецификациях стандартов проходят под названием «архивные файлы» (archive files). Сайт Библиотеки, в координации с другими усилиями в рамках сообщества специалистов по электронной сохранности, использует термин «агрегация» (aggregate) вместо «архив» (archive), ввиду того, что последний термин более широко используется сообществом за пределами определений таких форматов.
Рисунок 2. Факторы качества и функциональности для категории «Сжатие и архивация файлов» (Aggregate content – букв. «Агрегированный контент»).
Существует три фактора качества и функциональности файловых форматов, используемых для сжатия и архивации файлов: сжатие, поддержка обнаружения ошибок и функциональные возможности, выходящие за рамки обычного отображения. Одной из основных особенностей таких файловых форматов является сжатие, которое позволяет упаковывать вместе набор из нескольких файлов данных. Файловые форматы данной категории поддерживают множество алгоритмов, степеней и методов сжатия. Поддержка обнаружения ошибок - это способность данных файловых файлов включать контрольные суммы, хеш-значения или иные инструменты контроля целостности для минимизации потери данных.
(Окончание следует, см. http://rusrim.blogspot.com/2022/07/2.html )
Кейт Мюррей (Kate Murray), Маркус Напье (Marcus Nappier) и Лиз Холдзком (Liz Holdzkom)
Источник: блог «Сигнал» (The Signal) на сайте Библиотеки Конгресса США
https://blogs.loc.gov/thesignal/2022/06/return-to-the-fascinating-world-of-file-formats/
Комментариев нет:
Отправить комментарий