вторник, 1 ноября 2016 г.

Наиболее яркие моменты конференции iPRES 2016, часть 2


(Окончание, начало см. http://rusrim.blogspot.ru/2016/10/ipres-2016-1.html )

Фото: мы со Стивом выступаем с нашим докладом (автор: @shirapeltzman )

Утром во вторник 4 октября вместе со Стивом Макки (Steve Mackey) из компании Arkivum мы выступили на сессии «Обеспечение сохранности научно-исследовательских данных» (Research Data Preservation)  -  очень приятно, что данной теме была посвящена целая сессия. Я рассказала о наших усилиях, в рамках проекта «Закрытия брешей в электронной сохранности»., по установлению связи хранилищ с системой Archivematica (Archivematica обеспечивает создание архивных информационных AIP-пакетов – Н.Х.), сосредоточив внимание, в частности, на «длинном хвосте» файловых форматов, используемых для хранения научных данных, и необходимости решения этого вопроса совместными усилиями всего сообщества.

Мой комментарий: В отношении научных данных, термин «длинный хвост» (long tail) применяется к многочисленным, но сравнительно небольшим по объёму наборам данных, которые часто «живут» на обычных персональных компьютерах, и, соответственно, не охватываются дисциплиной и мерами по обеспечению сохранности, которые имеются в крупных хранилищах. Относительно файловых форматов, тот же термин ссылается на многочисленные редкие, устаревшие и проприетарные форматы, в каждом из которых хранится сравнительно небольшое число файлов.

Замечательно было получить возможность выступить в переполненном зале, следствием чего стал ряд очень полезных дискуссий во время обеденного перерыва и на вечернем приёме для участников конференции.

Для меня одной из наиболее интересных на конференции стала сессия, посвященная инструментам и методам приема электронных материалов на хранение (ingest). На подобных мероприятиях меня всегда больше привлекают сессии, на которых основное внимание уделяется практическим инструментам и опыту работы из первых рук, а не теоретические доклады, так что это был очевидный выбор.

Сначала выступил Бруно Феррейра (Bruno Ferreira, компания KEEP SOLUTIONS, Португалия) об инструментальном наборе для обеспечения долговременной сохранности баз данных (Database Preservation Toolkit, подробнее об этом позже). После него был доклад «Изучение на разных уровнях электронного наследия Фридриха Киттлера: Инструменты в арсенал будущего архивиста», с которым выступили Юрген Энге (Jurgen Enge) и Хайнц Вернер Крамски (Heinz Werner Kramski) из Университета искусств и дизайна в Базеле.

Крайне любопытно было видеть, как они решали задачу обеспечения сохранности объёмного, разнородного и сложного электронно-цифрового наследия, преодолевая возникающие перед ними проблемы и препятствия. Выступающие также подчеркнули, что оборудование само по себе является важным свидетельством в своей физической форме, показывая, например, насколько часто Фридрих Киттлер использовал кнопку перезагрузки на своем ПК!

Фото: Делегаты конференции отдыхают на террасе.

Следующие два доклада были посвящены обеспечению сохранности электронной почты - у меня пока небольшой опыт в этой области, но я уверена, что в будущем мне предстоит этим заняться. Клаус Йенсен (Claus Jensen) из Королевской библиотеки Дании представил решение для приема на хранение электронной почты. Этот подход показался мне очень практичным, и было видно, что проектная группа хорошо продумала свои требования и усвоила уроки, полученные при испытаниях первоначального прототипа, прежде чем приступать ко второй итерации. Буду с интересом следить за этим проектом и с удовольствием прочитаю подробности в опубликованном докладе.

Затем выступил Брент Вест (Brent West) из университета штата Иллинойс с интересным интерактивным докладом об обработке сохраняемой по методу Capstone электронной почты с помощью предсказательного кодирования (Processing Capstone Email using Predictive Coding). Разговор был сфокусирован на проблемах принятия решений в рамках экспертизы ценности и оценки конфиденциальности сообщений электронной почты; а также о том, как может помочь поддерживаемый технологиями процесс анализа (technology assisted review), позволяющий программному обеспечению обучаться на примере уже принятых человеком решений с тем, чтобы впоследствии уменьшить объём ручного труда и сделать его более целенаправленным. Опять же, у меня было ощущение, что в будущем такого рода опыт может оказаться для меня очень полезным, если мне придётся столкнулся с задачей сохранения больших объёмов электронной почты.

Фото: Очень дорогой джин с тоником!

Организованная консорциумом BitCurator ( http://www.bitcurator.net/ ) во вторник вечеринка BitCurator Mixer предоставила хорошую возможность пообщаться с другими пользователями программного обеспечения BitCurator (применяется, в частности, для целей электронной судебной экспертизы – Н.Х.). Признаюсь, я пока не ещё не стала настоящим пользователем этого решения, но, получив теперь на свой рабочий стол новый компьютер для приема электронных материалов на хранение, его установка, освоение и тестирование – теперь для меня лишь вопрос времени. Здорово было поговорить с опытными пользователями и получить ряд советов относительно установки решения и поиска примеров рабочих процессов. Однако большего всего в моей памяти застряла цена на джин-тоник в том баре!

В среду во второй половине дня я приняла участие в семинаре под названием OSS4PRES 2.0: «Наведение мостов и заполнения пробелов» (Building Bridges and Filling Gaps) - по существу, продолжение семинара на тему «Использование инструментов с открытым кодом для выполнения требований  к электронной сохранности» (Using Open-Source Tools to Fulfill Digital Preservation Requirements), о котором я рассказывала в своём посте о прошлогодней конференции iPRES ( https://digital-archiving.blogspot.co.uk/2015/11/ipres-workshop-report-using-open-source.html ).

Это был один из тех семинаров, где от нас требовалось реально поработать (что всегда вызывает шок после обеда!). Участники разделились на три группы, каждая из которых обсуждала свою тему. Одна группа анализировала пробелы в составе инструментария с открытым исходным кодом, используемого для обеспечения электронной сохранности, которые нам следовало бы заполнить (либо путем расширения возможностей существующих инструментов, либо путем создания новых).

Вторая группа работала над проектом рекомендаций для поставщиков инструментов с открытым исходным кодом. Та группа, в которую попала я, обдумывала создание сообществом платформы для обмена рабочими процессами в области электронной сохранности. Мне кажется, что все это может вылиться создание действительно ценного ресурса для специалистов-практиков, которые хотят видеть, как их коллеги применяют эти инструменты.

К концу дня все группы сформулировали много идей и план действий. Работу по данным направлениям предполагается продолжить вне рамок семинара. Замечательно поучаствовать в семинаре, который не просто является «говорильней», но способен вывести на конкретные результаты.

Фото: Мой ноутбук напряжённо трудится на семинаре по обеспечению сохранности баз данных

В четверг утром 6 октября я присутствовала еще одно очень полезном практическом семинаре под названием «Стандарты и инструменты для обеспечения сохранности реляционных баз данных» (Relational Database Preservation Standards and Tools) . Участникам было предложено опробовать пакет SIARD Suite and Database Preservation Toolkit на своих ноутбуках. Ценность и отдача от этого семинара были ясны, и действительно возникло понимание того, как мы могли бы использовать эти инструменты для создания на основе реляционных баз данных их версий для целей долговременной сохранности.

Инструменты, поддерживающие работу с целым рядом широко используемых систем управления реляционными базами данных, позволяют экспортировать данные в формат SIARD 2. Этот формат по сути дела представляет собой zip-файл, содержащий соответствующую информацию в формате XML. Он удобнее, чем формат CSV (при  помощи которого я сохраняла базы данных в прошлом), поскольку содержит как сами данные, так и информацию об их структуре, и позволяет добавлять метаданные о том, как данные извлекались, Это возможности кажутся особенно полезными для создания «снимков» активно функционирующих баз данных для сохранения в рамках регулярно выполняемого цикла. Я определенно вижу для себя возможности для использования этих инструментов в будущем.

Фото: За рамками мероприятия пересеклись iPRES 2016 и «Швейцарская игрушка 2016» (Swisse Toy 2016 )

В конце сессии прошла полезная дискуссия о том, как эти инструменты будут на самом деле вписываться в более широкий рабочий процесс обеспечения сохранности; и можно ли будет интегрировать их в системы обеспечения долговременной сохранности (такие, как, например, Archivematica) и сконфигурировать как автоматический путь миграции для баз данных, созданных в Microsoft Access. Ответ на этот вопрос был утвердительным, но последующее обсуждение заставило предположить, что это, возможно, будет не лучший подход. Разработчики инструментов не считают полную автоматизацию наилучшим подходом. Как правило, нужен человеческий глаз для принятия решения о том, какие части базы данных должны быть сохранены, чтобы соответственно адаптировать процесс экспорта в формат SIARD 2.

В последний вечер конференции было замечательно поучаствовать в швейцарской ежегодной ярмарке игрушек, которое проходила на той же  площадке, что и конференция. Это была отличная возможность закупить подарки для семьи перед возвращением в Великобританию.

Дженни Митчем (Jenny Mitcham)

Источник: блог «Digital Archiving at the University of York»
http://digital-archiving.blogspot.ru/2016/10/some-highlights-from-ipres-2016.html

Комментариев нет:

Отправить комментарий