вторник, 27 сентября 2016 г.

Отбор и экспертиза ценности документов в модели OAIS


Данная заметка Эдварда (Эда) Пинсента (Ed Pinsent) была опубликована 7 сентября 2016 года на блоге DART Blog.

Для справки: Эдвард Пинсент (на фото) – электронный архивист, работающий в Вычислительном центре Университета Лондона (University of London Computer Centre, ULCC) с 2004 года.  У него есть опыт работы в качестве традиционного архивиста и специалиста по управлению документами в Генеральном Синоде англиканской церкви, Национальных Архивах Великобритании и в других организациях, он был членом правления британской Коалиции по электронной сохранности (Digital Preservation Coalition, DPC). В настоящее время Эдвард Пинсент является одним из преподавателей в программе подготовки специалистов по обеспечению долговременной сохранности электронных материалов (Digital Preservation Training Programme, DPTP). Он входит в состав группы специалистов ULCC, которая предлагает консультационные услуги в области электронной сохранности, и имеет опыт в вопросах веб-архивирования, управления хранилищами, проектов по метаданным, миграции, оцифровки, разработки политик и управления проектами.

Модель OAIS (от «Open archival information system» - «Открытая архивная информационная система», подробнее о ней см. http://rusrim.blogspot.ru/2016/08/oais.html ) - это доминирующая сейчас концепция организации электронного архива, закрепленная в международном стандарте ISO 14721. Подборку материалов по OAIS на моем блоге см. здесь: http://rusrim.blogspot.ru/search/label/OAIS - Н.Х.

Вдогонку к недавнему подкасту (короткой аудиозаписи, https://soundcloud.com/ulcc/ep5-freeoais ) о нашем бесплатном онлайн-курсе по OAIS («Руководство для начинающих по эталонной модели OAIS», о нем см. http://dart.blogs.ulcc.ac.uk/2015/12/09/free-oais-beginners-course-update/ ), я хочу предложить Вашему вниманию ряд дополнительных соображений по поводу модели OAIS. Мы знаем, что сейчас проходит обсуждение модели, организованное британской Коалицией по электронной сохранности (DPC), см. http://wiki.dpconline.org/index.php?title=Category:Blog , и предлагаемую ниже скептическую точку зрения можно считать ещё одним вкладом в этот процесс.


Данный набор графических образов автор использовал в своей статье в качестве иллюстрации. Последняя схема показывает структуру модели OAIS функционирования электронного архива – Н.Х.

Недавно я участвовал в работе конференции Ассоциации специалистов Великобритании и Ирландии в области управления документами и архивного дела (Archives and Records Association, ARA, о конференции см. http://www.archives.org.uk/ara-in-action/the-ara-conference.html ). 31 августа 2016 года на секции по электронной сохранности мы прослушали три очень полезных доклада, с которыми выступили Мэтью Эддис (Matthew Addis) из компании Arkivum, Сара Хиггинс и Салли Макиннес из Уэльса, и Майк Куинн из фирмы Preservica. Там я задал вопрос по модели OAIS, которая был спровоцирован другим вопросом, заданным одним их присутствующих в аудитории коллег-архивистов. Я спросил о навыках отбора и экспертизы ценности документов – есть ли им место в модели OAIS? Меня беспокоит то, что они в эту модель не вписываются, и что данная модель склонна давать чрезмерно упрощенное представление, в соответствии с которым сдаточный информационный пакет (Submission Information Package, SIP) поступает в «идеальном состоянии», полностью подготовленный к приему на архивное хранение, так что можно сразу приступать к формирования архивного информационного пакета (Archival Information Package, AIP). Любой архивист или специалист по управлению документами, которому когда-либо приходилось обрабатывать партию документов, передаваемых на ответственное или на постоянное архивное хранение, скажет Вам, что в реальной жизни так не бывает. В результате модель OAIS отторгает архивиста.

Я знаю тех в нашем сообществе, кто выступает за более «сильную» стадию подготовки документов к передаче на хранение (pre-ingest) в рамках модели OAIS. Некоторые её называют «длинным хвостом», предшествующим собственно процессу ввода материалов в архивную систему (ingest). Полагаю, что сейчас как раз проводится работа по формализации этого процесса в рамках стандарта – см. «Спецификации взаимодействия фондообразователя и архива» (Producer-Archive Interface Specification - это свободно доступный «близнец» международного стандарта ISO 20104:2015 Space data and information transfer systems - Producer-Archive Interface Specification (PAIS), http://www.iso.org/iso/home/store/catalogue_tc/catalogue_detail.htm?csnumber=67056  – Н.Х.)  Я также в курсе постов на вики-ресурсе DPC для обсуждения OAIS ( http://wiki.dpconline.org/index.php?title=Pre-ingest ), в которых высказаны предложения о том, как эти элементы ввести в модель и даже в некоторой степени автоматизировать.

Но это не совсем то, что меня беспокоит. Давайте вернемся к основам того, что мы понимаем под отбором и экспертизой ценности. Я считаю, что это очень сильные навыки архивистов, которые могут иметь огромную ценность в сфере электронной сохранности.

Серии документов

Когда я, будучи архивистом Генерального Синода, работал с бумажными документами и архивными материалами, мы часто проводили отбор и экспертизу ценности документов на основе серий.
Для справки: Серия – группа похожих документов, которые упорядочены в соответствии с системой хранения документов, и которые взаимосвязаны друг с другом в результате того, что они создаются/поступают и используются в рамках одного и того же вида деятельности. (Глоссарий общества американских архивистов, см. http://www2.archivists.org/glossary/terms/s/series ).

Мой комментарий: Если сопоставлять с нашей традицией, то серия близка к группе документов, соответствующих конкретной статье в номенклатуре дел организации, с той разницей, что серия не прерывается при начале очередного года, при изменениях организационной структуры и т.д., что на практике всё чаще оказывается более удобным подходом. Если Вы принимаете решение сохранять индекс по номенклатуре неизменным как при ежегодном переутверждении номенклатуры, так и в случае передачи документов в другое подразделение, Вы фактически используете серии документов.
Для меня это означало, что мы могли оценить ценность контента в рамках контекста, в основе которого лежали другие документы, которые, как мы знали, создавались, или же другие серии архивных документов, которые мы уже отобрали и приняли на архивное хранение. На таком подходе основывалась стратегия формирования коллекции – серии отбирались в контексте их происхождения. Например, создателем документов мог быть Совет по социальной ответственности (Board for Social Responsibility, BSR); а серией – «Протоколы». Мы всегда принимали бы на хранение партии документов этой серии, поскольку они заслуживали доверие как точная документация деятельности Совета. Но если бы тот же BSR сохранял у себя копии протоколов и документов другого Совета (например, Центрального совета по финансовым вопросам), то мы могли не принять эту серию на архивное хранение на том основании, что BSR всего лишь получал «копии для сведения».

Описанный процесс - это вторая натура любого профессионала в области архивного дела или управления документами. Понимание контекста, происхождения, серий документов: всё это помогает нам определить потенциальную ценность контента. И действительно, модель серий является основой для всего архивного упорядочивания и краеугольным камнем нашей профессии. Она чрезвычайно эффективна, и избавляет от необходимости изучать каждый отдельный документ.

Экспертиза ценности в рамках модели OAIS

Мне интересно, каким образом серии можно отразить в модели OAIS. Мне часто кажется, что эта модель в большей степени отдает предпочтение отдельным электронным объектам, чем сериям документов. Иначе говоря, сдаточный SIP-пакет не является идеальным объектом для проведения экспертизы. Здесь Вы могли бы сказать мне: «Вот 100 взаимосвязанных SIP-пакетов, это и есть Ваша серия». Или: «Мы помещаем все PDF-файлы с нашими протоколами в этот один SIP-пакет». Но я все равно буду беспокоиться. Посредством базовой операции по вводу SIP-пакета в архивную систему мы начинаем процесс, в котором все последующие действия по обеспечению сохранности начинают вращаться вокруг отдельного электронного объекта - контрольные суммы, идентификация файлового формата, извлечение технических метаданных, метаданные для обеспечения долговременной сохранности. И, конечно же, силён соблазн автоматизировать эти операции по формированию архивного AIP-пакета, что привело нас к созданию сценариев, которые полностью сфокусированы на какой-то одной характеристике – чаще всего на формате файла.

Где во всем этом место сериям? Это трудно определить. Может быть, серии будут восстановлены или реконструированы во время каталогизации. Тем не менее, нетрудно понять, почему архивисты могут почувствовать себя отодвинутыми в сторону таким взглядом на то, что представляет собой электронная сохранность. Целостностью и контекстной осмысленностью коллекции пренебрегают в пользу этой точки зрения, основное внимание уделяющей элементарным электронным объектам. Модель OAIS, если её реализовывать «дословно», может вообще обойти серии в пользу конвейерного рабочего процесса, который просто обрабатывает один электронный объект за другим.

Я считаю, что нам нужно вновь открыть для себя значение отбора и экспертизы ценности.  Я призываю всех архивистов выйти вперед и заново подтвердить их важность в условиях электронно-цифровой среды.

Тем временем, я хочу задать ряд вопросов: Может ли кто-нибудь показать мне способ по-настоящему включить отбор и экспертизу ценности в поток рабочих процессов в модели OAIS? Дает ли модель возможность подумать об «информационном пакете серии» (Series Information Package) или чём-то подобном? Не преувеличиваю ли я предпочтительное внимание модели OAIS к отдельным электронным объектам?

Эд Пинсент (Ed Pinsent)


Источник: блог DART Blog
http://dart.blogs.ulcc.ac.uk/2016/09/07/selection-appraisal-oais-model/ 

1 комментарий: