четверг, 27 мая 2021 г.

Описание электронных документов

Данная заметка архивиста и консультанта Марго Ноут (Margot Note – на фото) была опубликована была опубликована 26 апреля 2021 года на сайте компании Lucidea.

Один из самых наболевших вопросов, который постоянно поднимается с момента появления электронных документов - это вопрос о том, применимы ли в их отношении традиционные архивные принципы.

Одни утверждали, что это именно так, и что архивистам следует рассматривать электронные документы просто как ещё один формат документов, вроде карт, фотографий или аудиовизуальных материалов [естественно, речь идёт об унаследованных картах, фотографиях и аудиовизуальных материалах; в настоящее время их создание в неэлектронной форме уже практически сошло на нет – Н.Х.]. Другие считают, что характерная природа того, как электронные документы создаются и управляются, означает, что архивистам нужен новый набор правил, практик и процедур для их описания.

Одной из проблем, связанных с электронными документами, является возможность внесения изменений в содержащуюся в них информацию [по правде говоря, то же самое можно было делать и с традиционными документами – но в случае электронных документов изменения вносить во многих случаях проще, быстрее, это можно делать в больших масштабах; и выявить изменения сложнее, если не принимаются специальные меры – Н.Х.]. В случае аналоговых материалов легче определить, были ли внесены изменения, и проверить конкретные версии. Сделать это же самое с электронными материалами сложно, если вообще возможно [очень даже возможно; для этого используются контрольные суммы, хеши, многочисленные копии, реестры, а также усиленные электронные подписи, печати и отметки времени – Н.Х.]. Аутентичность и надёжность играют ключевую роль при проведении архивной экспертизы ценности, результаты которой транслируются в порядок доступа. Электронные документы также зависят от оборудования и программного обеспечения, и существуют проблемы ввиду «хрупкости» носителей, на которых они записаны.

Существует острая необходимость в описании электронных документов ввиду машинозависимости данных и сложности электронных систем. Основной мотивацией для описания является отсутствие внутренней упорядоченности. Также существует потребность во включении в описание сведений о жизненном цикле, с тем, чтобы установить характер документов, время их создания и аутентичность данных.

Проблемы описания

С точки зрения традиционного описания, с электронными документами связан ряд проблем. Первой проблемой является время составления описания. Большинство архивов создаёт описания и формирует соответствующий научно-справочный аппарат уже после того, как архивисты приняли на хранение и упорядочили документы. Стадиями жизненного цикла документов являются создание, распространение и использование, хранение и обслуживание, отслеживание сроков хранения и уничтожение/передача, а также долговременное архивное хранение. Архивисты, как правило, привлекаются в самом конце жизненного цикла. Электронные документы требуют более раннего вовлечения архивистов; задержка с этим часто приводит к безвозвратной утрате ключевой по важности информации.

Еще одна проблема связана с тем, кто является ответственным хранителем документов, имеющих непреходящую ценность. Архивисты склонны описывать те документы, что находятся в их распоряжении. Для электронных документов существуют различные модели: кастодиальные (документы находятся под полным контролем архива – Н.Х.) и некастодиальные (также «пост-кастодиальные»; документы физически хранятся вне архива, и архив имеет над ними только определенный интеллектуальный контроль – Н.Х.). Архивы могут описывать документы, которые планируется в последующем передать в какой-то момент на архивное хранение, или же документы, которые могут оставаться в создавшем их органе или учреждении. Важным решением, которое следует принять архивистам, скорее является решение о том, что должно быть захвачено, а не что [сами архивы должны] хранить.

Традиционное описание основное внимание обращает на физические особенности. Архивисты склонны описывать физические единицы хранения, такие как короба, папки и тома, создавая список контейнеров для документов, который обычно является частью научно-справочного аппарата – такого списка для электронных документов нет (Не совсем так! Если электронные документы хранятся не в информационной системе, а на обособленных носителях – то учёт носителей остаётся столь же актуальным, как и в бумажной среде – Н.Х.). Электронные данные хранятся случайным образом [правильнее, думаю, было бы сказать, что при хранении в информационных системах у документов может не быть стабильного, четко определенного физического местоположения – Н.Х.], поэтому структура [массива документов] и контент не связаны друг с другом.

Также существует смещение акцентов при описании. Описание электронных документов имеет тенденцию делать акцент на системном уровне, а не на серии документов [серия примерно соответствует в нашей традиции переходящей позиции в номенклатуре дел – Н.Х.]. Однако произошёл также сдвиг в соотношении внимания, уделяемого происхождению (provenance) и содержанию (контенту). Существует сильная тенденция обращать основное внимание на происхождение: речь идёт о свидетельствах того, откуда документы поступили из делопроизводства, и, часто, о доказательствах аутентичности. Меньше внимания уделяется контенту.

Метаданные и описание

Архивистам необходимо иметь достаточные данные для того, чтобы знать о существовании документа и иметь возможность его идентифицировать, локализовать и определить условия, при которых исследователи смогут его использовать. Когда документ найден, пользователю требуется информация, достаточная для доступа к документу, для извлечения информации и понимания контекста её создания. Пользователю требуется информация для того, чтобы [корректно – Н.Х.] интерпретировать контент. Иногда эта информация может быть абстрактного характера, предполагающего наличие определенного уровня знаний - или же основываться на кодах. Описание должно содержать информацию, нужную для проверки аутентичности и поддержки документов. Информация о документе, захваченная в момент его создания в системе, полезна, но она может не включать сведения о происхождении, или же контекст, достаточный с архивной точки зрения.

В профессиональной литературе основное внимание уделяется роли метаданных в описании электронных документов. Некоторые считают, что все архивные описания - это метаданные [исходя из популярных определений термина «метаданные», так оно и есть, поскольку описания представляют собой «данные о данных». Правда, есть определения, согласно которым метаданные должны представлять собой структурированные данные – Н.Х.]. Но исключает ли наличие и доступность метаданных необходимость в чём-либо, напоминающем традиционное архивное описание? Такое описание на уровне отдельных объектов необходимо для включения электронных материалов в онлайн-ресурсы, но это приводит к проблеме сосуществования описаний уровня объекта и уровня агрегации (массива) документов - область, которая становится чрезвычайно сложной при работе с электронными документами.

Мой комментарий: Мне не очень понятно, в чём здесь, собственно, проблема. Что для электронных, что для бумажных документов всегда существовали метаданные разных уровней – начиная от метаданных всего архивного фонда в целом и заканчивая метаданными отдельно хранящейся части документа. Всегда существовали метаданные, отражающие как физическую, так и логическую структуризацию документов. Всегда существовал механизм наследования объектами нижележащего уровня метаданных вышележащего уровня – этот механизм в электронных информационных системах обычно автоматизирован. Какова бы ни была конкретная функциональная возможность работы с документами (например, поиск), она всегда поддерживалась и поддерживается специфическими метаданными. Как мне кажется, именно в хорошо спроектированных информационных системах разбираться с этим непростых «хозяйством» метаданных стало проще :)

Говоря о противопоставлении традиционного словесного описания структурированному набору метаданных, хочу отметить следующее. Словесное описание в подавляющем большинстве случаев может автоматически формироваться на основе структурированных метаданных; кроме того, дополнительная информация, если таковая есть в словесном описании может быть выделена и добавлена в состав структурированных метаданных (в том числе в них может быть включено словесное описание целиком!).Наконец, с развитием инструментов искусственного интеллекта будет всё сильнее стираться грань между описаниями на естественном языке и структурированными метаданными, поскольку компьютеры смогут с высокой точностью преобразовывать одни в другие.


Электронные документы обладают уникальными характеристиками, такими, как потребность во вспомогательной документации для описания их контента; а также удобство редактирования, копирования, стирания и переформатирования. Простота манипуляций (с учётом проблемы отслеживания этих изменений) является обоюдоострым оружием. Описание электронных документов со временем будет меняться, что повлияет на традиционные методы описания, используемые для аналоговых материалов.

Мой комментарий: Описания всех документов, аналоговых и электронных, сейчас хранятся в одних и тех же информационных системах в электронном виде – исключениями являются лишь отсталые архивы не очень развитых в цифровом отношении стран. Соответствующие системы стремятся единообразно поддерживать описания документов всех форм и форматов, на различных уровнях – что соответствует и реальным практическим потребностям. Вследствие этого волей-неволей практика архивного описания уже приводится «к единому знаменателю» :)

Марго Ноут (Margot Note)

Источник: сайт компании Lucidea
https://lucidea.com/blog/description-of-electronic-records/ 

Комментариев нет:

Отправить комментарий