четверг, 4 августа 2011 г.

Обеспечение сохранности цифровых видеоматериалов: Идентификация контейнеров и кодеков

Заметка стажера Смитсоновского института (США, см. http://ru.wikipedia.org/wiki/Смитсоновский_институт ) Киллиана Эскобедо (Killian Escobedo) была размещена на блоге «The Bigger Picture», располагающемся на сайте института, 26 июля 2011 года. В переводе не приводятся образцы мигрированных видеозаписей.

Помимо оцифровываемой в настоящее время богатой коллекции аналоговых видеоматериалов, Архивы Смитсоновского института (Smithsonian Institution Archives, SIA) принимают на хранение от подразделений института большое количество изначально электронных видеоматериалов, записанных на разнообразных жестких дисках, CD и DVD-дисках, и выложенных на веб-сайтах. Точно так же, как для обеспечения сохранности аналоговых видеозаписей, прежде чем они деградируют на соответствующих носителях, применяется оцифровка, - электронные материалы следует мигрировать с оптических носителей до того, как отказ оборудования или деградации подобных устройств приведет к недоступности контента. Как и другие электронные документы  в Архивах института, цифровые видеофайлы, отобранные на  архивное хранение, включаются в workflow-процессы электронной сохранности, чтобы обеспечить возможность их воспроизведения для будущих поколений.

Программа MediaInfo выявляет видео- и аудиопотоки в AVI-файле и идентифицирует видеокодек как Indeo 4. Программное приложение способно определить и другие атрибуты, включая частоту кадров 10 кадров в секунду. Это почти что скорость показа слайд-презентаций!

В Смитсоновском институте обеспечение долговечности цифровых видеозаписей начинается с инвентаризации коллекции видеофайлов и сбора технической информации о них (кодек, разрешение, частота кадров и т.д.), с тем, чтобы идентифицировать их форматы. Этот процесс обеспечивает возможность выявления материалов, подверженных риску морального устаревания, а также помогает определить приоритеты работ по обеспечению сохранности. Наконец, поскольку на хранение уже приняты тысячи цифровых видеозаписей, и их число, вполне вероятно, будет в ближайшие годы экспоненциально нарастать, понимание состава архивных коллекций является ключевым фактором при определении приоритетов, выработке наилучшей практики управления и стратегии обеспечения долговременной сохранности цифровых видеоматериалов.

Проигрыватель VLC Media Player не умеет воспроизводить видеозаписи, требующие видеокодека Indeo 4. VLC вежливо сообщает пользователю об ошибке и выдает четырехсимвольный идентификатор кодека, с тем, чтобы пользователь мог попытаться подобрать другую программу, способную воспроизвести видеофайл.

В цифровых видеофайлах видео- и аудиопотоки упаковываются в контейнер (оболочку), которая обычно определяется по расширению видеофайла, которое по этой причине архивистам важно отслеживать. И из-за большого размера несжатого видео, потоки часто сжимаются до более приемлемых размеров с использованием программы сжатия/распаковки, называемой «кодеком». Программы для проигрывания аудиовидеофайлов, такие, как Windows Media, RealPlayer, QuickTime  и VLC, определяют тип кодека и используют соответствующую программу для декодирования видео- и аудиопотоков перед их воспроизведением. Некоторые типы кодеков обеспечивают сжатие без потерь, т.е. математически обратимое, и в процессе сжатия потери данных нет. Другие методы сжимают информацию с потерей данных, и являются эффективными средствами для создания высококачественных копий фонда пользования. Однако из-за того, что любая потеря данных отягощает совесть архивиста, применяемые для долговременного хранения видеоформаты либо используют сжатие без потерь, либо вообще обходятся без сжатия.

В ходе моей стажировки в Архивах, я проводил инвентаризацию различных видеофайлов, документируя для каждого файла типы контейнера и кодека. Всего было обработано десять тысяч видеофайлов, использующих более 20 различных типов контейнеров, 50 типов видеокодеков и 25 типов аудиокодеков. Все файлы были протестированы на воспроизводимость в проигрывателях Windows Media, RealPlayer, QuickTime (Mac и Windows) и VLC. Выяснилось, что около 20 процентов всех видеофайлов не воспроизводятся в этих четырех проигрывателях. На удивление, ряд относительно более современных типов кодеков чаще вызывал проблемы при воспроизведении, чем более старые, малоизвестные кодеки, которые, по-видимому, более основательно поддерживаются потребительскими проигрывателями. Естественно, что файл, который воспроизводится только в одном медиаплеере, подвержен большему риску устаревания формата и программного обеспечения.

Я использовал различные программные приложения для анализа и идентификации видео- и аудиопотоков и соответствующих кодеков, однако у каждого такого приложения оказалась собственная терминология и список атрибутов видеофайлов и потоков в них. В отношении кодеков использовались разнообразные термины, такие, как «формат», «имя формата», «профиль формата», «имя программы сжатия»,  «кодек», и «идентификатор кодека». Для выдерживания согласованной схемы идентификации кодеков и преодоления расхождений между различными инструментами идентификации, очень полезными оказались такие ресурсы, как Википедия и MultimediaWiki.

Автоматизация сбора всех этих технических метаданные имеет решающее значение для приёма на архивное хранение цифровых видеоматериалов, тем более, что эти данные  служат ключевым инструментом при управлении и обеспечении доступа к видеоматериалам, и при принятии решений, относящихся к обеспечению их долговременной сохранности в Архивах.

Киллиан Эскобедо (Killian Escobedo)

Источник: блог «The Bigger Picture» на сайте Смитсоновского института
http://blog.photography.si.edu/2011/07/26/digital-video-preservation/?utm_source=feedburner&utm_medium=feed&utm_campaign=Feed:+si/vrZU+%28The+Bigger+Picture%29

Комментариев нет:

Отправить комментарий