понедельник, 17 января 2022 г.

Концепция электронного документа с точки зрения проекта InterPARES

Данная статья Лючианы Дюранти (Luciana Duranti) была выложена в декабре 2021 года на сайте журнала Arbido – швейцарского профессионального обозрения, издаваемого для архивистов, документоведов и библиотекарей. Статья вошла в состав 4 номера за 2021 год, посвященного общей теме «Что такое документ?» (Le document, c'est quoi?)


Об авторе: Лючиана Дюранти (Luciana Duranti) - теоретик архивного дела и профессор архивоведения и дипломатики кафедры архивно-библиотечных и информационных исследований Университета Британской Колумбии в Ванкувере, Канада. Она - известный эксперт в области дипломатики и электронных документов, с 1998 года является директором научно-исследовательского проекта по электронным документам InterPARES (от International Research on Permanent Authentic Records in Electronic Systems – «Международные исследования аутентичных документов постоянного срока хранения в электронных системах», сокращение также можно прочитать и как латинское выражение «inter pares» - «среди равных», что намекает на равноправные отношения между участниками проекта).

InterPARES (1998-2026) - это коллективный международный научно-исследовательский проект, финансируемый Канадским советом по исследованиям в области общественных и гуманитарных наук (Social Sciences and Humanities Research Council, SSHRC), цель которого - обеспечить долговременную сохранность аутентичных электронных документов вне зависимости от используемых технологий и их смены.

Когда проект InterPARES ещё начинался, стало ясно, что исследователям, пришедшим из разных дисциплин и культурных контекстов, необходимо согласовать основные понятия. Ключевым понятием проекта являлось понятие «электронного документа» (digital record). Мы решили сохранить классическое архивное определение: документ (record) - это информационный объект (document), созданный или полученный физическим или юридическим лицом в ходе его деятельности в качестве инструмента или побочного продукта этой деятельности, который в дальнейшем сохраняется для действий или в качестве справочной информации таким лицом или его законным правопреемником. Поскольку документы формируют инфраструктуру, посредством которой поддерживаются и осознаются убеждения и ценности, а также поддерживаются общественные институты, нам нужно были определить характерные свойства документов в электронно-цифровой среде.

Изначально-электронные документы одновременно уязвимы (их легко уничтожить, потерять, исказить, подделать, и они легко могут стать недоступными) и живучи (они остаются навсегда, если их не уничтожить целенаправленно). Их контент, структура и форма больше уже не являются неразрывно связанными. Они формируются из объектов, хранящихся в системе, в которой они располагаются, и большинство из них также имеют документальное воплощение (manifestation), которое позволяет им быть понятными для людей.

«Сохранённый документ» образован из цифровых компонентов, используемых при его воспроизведении, содержащих данные, которые должны быть обработаны с целью отобразить документ (данные контента и данные формы), и правил обработки данных, включая те, что допускают вариации (данные о составе).

«Материализованный документ» (manifested record) - это визуализация или создание экземпляра (instantiation) документа в форме, подходящей для представления человеку или системе. Иногда не существует соответствующего сохранённого документа, но он воссоздается из защищённых от изменений данных контента, когда действие пользователя связывает их с конкретными данными формы и данными композиции (например, документ, сформированный на основе реляционной базы данных).

Всякий раз, когда мы закрываем воплощение (материализацию) электронного документа, мы её уничтожаем; а когда мы открываем её снова, мы создаём копию. Обеспечить сохранность собственно электронных документов невозможно, мы можем лишь сохранить способность воспроизводить или воссоздавать их.

Мы знаем, что все документы должны иметь фиксированную форму и стабильное содержание (контент). Что это значит в электронно-цифровой среде? InterPARES полагает, что объект имеет фиксированную форму, если его двоичный контент хранится таким образом, что то сообщение, которое он передаёт, может быть отображено в том же документальном представлении (documentary presentation), которую оно имело на экране в момент первого сохранения (даже если его цифровое представление изменяется, скажем, с формата Word на формат .pdf).

Объект имеет фиксированную форму также и в том случае, если один и тот же контент может быть представлен на экране несколькими различными способами из ограниченного числа возможных вариантов: у нас может быть другое документальное представление того же самого сохранённого документа, имеющего стабильное содержание и фиксированную форму (примером может служить просмотр статистических данных в виде круговой диаграммы, гистограммы или таблицы).

Объект имеет стабильный контент, если данные неизменны и не могут быть изменены, что означает, что они не могут быть перезаписаны, изменены, удалены или дополнены.

InterPARES также ввёл понятие «ограниченной вариативность» (bounded variability), которая имеет место тогда, когда изменения в документальном представлении определенного стабильного контента ограничены и контролируются фиксированными правилами, так что один и тот же запрос, алгоритм или взаимодействие всегда выдают один и тот же результат. Ограниченная вариативность также присутствует в случае, когда используются различные представления (views) разных подмножеств контента, из-за намерений автора или из-за использования разных операционных систем и приложений.

Электронные документы бывают двух типов: статические и интерактивные. Статические документы не позволяют изменять свой материализуемый контент или форму, помимо открытия, закрытия и навигации (примерами служат сообщения электронной почты, отчеты, звукозаписи, видеозаписи, снимки веб-страниц). Интерактивные документы представляют переменный контент и/или форму, а правила, регламентирующие контент и форму представления, могут быть как фиксированными, так и переменными.

Интерактивные объекты могут быть динамическими или нединамическими. Мы имеем дело с нединамическими объектами, когда правила, регламентирующие представление контента и форму, не меняются, а представляемый контент всякий раз, выбирается из фиксированного хранилища данных (например, интерактивные веб-страницы, онлайн-каталоги или описи, а также документы, поддерживающие выступления): это документы. С динамическими объектами мы сталкиваемся, когда правила, регламентирующие представление контента и форму, могут варьироваться: это либо информационные системы, либо потенциальные документы.

Потенциальные документы (potential records) находятся
  • в системах, в которых вариации связаны с часто изменяющимися данными, поскольку архитектура этих систем допускает обновления, замены или изменения (например, реестр студентов);

  • в системах, которые позволяют собирать данные от пользователей или о взаимодействиях или действиях пользователей (например, портал самообслуживания преподавателей); или

  • в системах, которые используют введенные пользователями данные для определения последующего представления (например, земельный кадастр).
Они также присутствуют в системах, в которых вариация связана с данными, получаемыми из нескольких внешних источников в разное время и не хранящимися в самой системе (примером может служить геоинформационная система, ГИС).

В настоящее время такие системы не являются документными, но должны быть преобразованы в документные системы, если наборы данных, которые они производят и хранят, выполняют функции документов, если пользователи полагаются на них в своих действиях и нуждаются в их поддержании.

В рамках InterPARES был проведен ряд тематических исследований в области искусства, науки и государственного управления, направленных на обеспечение того, чтобы такие системы создавали и хранили документы.

Вопросы аутентичности электронных документов и возможности её проверки во времени, независимо от того, где документы хранятся, рассматривались на всех четырёх завершённых этапах проекта InterPARES [1]. На пятом этапе, начатом в апреле 2021 года, основное внимание сосредоточено на разработке опирающихся на архивные концепции инструментов искусственного интеллекта, с целью создания, поддержания, использования, отбора, интеллектуального контроля, обеспечения долговременной сохранности и доступности заслуживающих доверия электронных документов [2]. В связи с этим образом большая работа проводится в плане формирования нашей терминологической базы данных [3]. Кто знает, как будет трактоваться понятие «документ» лет через пять?

Ссылки:

[1] См., например: http://www.interpares.org/book/interpares_book_k_app02.pdf . Что касается документов, хранящихся в облачной среде, см. https://interparestrust.org/

[2] См. https://interparestrustai.org/

[3] См. https://interparestrustai.org/terminology .

Лючиана Дюранти (Luciana Duranti)

Источник: сайт журнала Arbido
https://arbido.ch/fr/edition-article/2021/das-dokument/concept-of-digital-record-interpares

Комментариев нет:

Отправить комментарий