понедельник, 31 мая 2021 г.

Эндрю Ворланд: Проблема идентификации изначально-электронных документов, часть 1

Данная заметка опытного австралийского специалиста с почти 40-летним профессиональным стажем и консультанта по вопросам управления документами Эндрю Ворланда (Andrew Warland – на фото) была опубликована 28 марта 2021 года на его блоге «Документы о мире» (Records about the world).

В опубликованном 30 января 2021 года отчёте по итогам проверки выполняемых функций и эффективности деятельности Национальных Архивов Австралии (см. https://www.ag.gov.au/rights-and-protections/publications/tune-review , также известном, как «Отчёт комиссии Тьюна» - Tune Review) отмечаются «стремительно возникающие и постоянно эволюционирующие проблемы электронно-цифрового мира».

В отчёте говорится, что «определение понятия «документ» (record) должно соответствовать текущим международным стандартам, быть более непосредственно применимым в отношении цифровых технологий и более недвусмысленно предусматривать и поддерживать прямой захват тех документов, для которых велик риск уничтожения, таких, как электронные письма, текстовые или онлайн-сообщения».

В данном документе также привлекается внимание к трудностям, связанным со вводом электронных документов в соответствующие архивные системы «с использованием интенсивных ручных операций (из-за отсутствия интеоперабельности между системами)», и предлагается новая модель, основанная на «непрерывной автоматизированной экспертизе ценности электронных документов [органа исполнительной власти центрального правительства], для реализации которой может потребоваться комбинация искусственного интеллекта и усилий опытных архивистов».

В отчёте подчеркнуты проблемы идентификации / выявления и управления изначально-электронными документами, а также потребность в более эффективных решениях.

В данном посте рассматриваются проблемы точной идентификации (выявления) изначально-электронных документов с целью управления ими.

Выявление и защита документов

Документы обычно являются свидетельствами / доказательствами того, что произошло - действия, деятельности или процесса, решения или текущего состояния (включая фото- и видеодокументы). Они могут иметь быть связаны с описательными метаданными (в том числе и в обязательном порядке), используемыми для описания контекста документов и для установления сроков их хранения.

Мой комментарий: Интересно, что коллеги регулярно забывают о том, что многие наиболее ответственные документы являются не просто свидетельствами и/или побочными продуктами деловой деятельности, - а инструментами этой деловой деятельности!

Как и для любых других типов доказательств, следует защищать аутентичность, целостность и надежность документов в течение всего срока их хранения.

В бумажном мире этот результат достигался посредством хранения физических документов (включая распечатанные версии изначально-электронных документов) в бумажных делах или в физических хранилищах.

В течение последних двадцати или около лет подобный же результат достигался для (некоторых) электронных документов посредством (осуществляемого в основном вручную) копирования их с сетевого диска или из системы электронной почты (или через соединительный интерфейс) в специализированную систему управления электронными документами (electronic records management, ERM), с последующей «блокировкой» их в этой системе с целью предотвращения несанкционированного изменения или удаления. В состав большинства ERM-систем (ERMS – к такому классу систем, в частности, относятся наши СЭД – Н.Х.) входили база данных для метаданных и взаимосвязанное с ней сетевое файловое хранилище для электронных объектов.


На рис. показано, что система управления электронными документами и контентом (EDRMS) получает документы из почтовой системы и с сетевых дисков – Н.Х.

Основная проблема этой централизованной модели хранения заключается в том, что как бы хороша она ни была в плане защиты экземпляров хранящихся в ней документов – однако оригинальные версии этих документов, наряду со всеми прочими документами, которые либо не удалось выявить, либо невозможно было скопировать в ERMS-систему, остаются там, где они были созданы или захвачены.

В то же время документы, хранившиеся «внутри» ERMS-системы, фактически хранились в сетевой системе хранения файлов на сервере, которая (a) был доступна ИТ-специалистам, и (b) почти всегда имела резервные копии. Таким образом, существовало ещё больше копий.

Проблемы изначально-электронных документов

Имеется ряд ключевых проблем, связанных с изначально-электронными документами:

  • Последовательная и точная идентификация (или «декларирование» - речь идёт о признании электронного объекта подлежащим сохранению «полноценным» документом; в нашей практике для этой цели обычно служит процесс регистрации – Н.Х.) всех документах вне зависимости от их вида и формата, созданных или сохранённых во всех возможных местах. Слишком долго основное внимание уделялось электронной почте и всему, что может быть сохранено на сетевом диске, при этом обязанность идентифицировать документ возлагалась на конечных пользователей.

  • Обеспечение аутентичности, надежности и целостности во времени. Для документов, хранящихся в ERMS-системе, это обычно делается посредством блокирования возможности их редактирования (в том числе в результате процесса «декларирования»), и предотвращения их удаления. Однако почти во всех случаях исходную версию документа (в почтовой системе или на сетевом диске) по-прежнему можно модифицировать. Прочие документы, которые не были идентифицированы и/или сохранены в ERMS, могут быть удалены.

  • Обеспечение доступности изначально-электронных документов до тех пор, пока в них сохраняется потребность.

Вручную (или даже автоматически) невозможно последовательно и точно идентифицировать каждый изначально-электронный документ, который организация создаёт или захватывает, с тем, чтобы обеспечить аутентичность, надёжность, целостность и доступность этих документов с течением времени. Лишь небольшой процент изначально-электронных документов копируется в ERMS-системы.

Документы скрываются в личных почтовых ящиках, на личных дисках и в решениях, поддерживаемых третьими сторонами (использование которых часто неавторизованно). Документы могут существовать в различных формах и форматах; иногда они создаются или хранятся в «частных» системах или на платформах социальных сетей. Документы могут быть представлены в виде текстов, мгновенных сообщений, постов и цепочек сообщений в социальных сетях. Это могут быть рисунки, графические изображения, голосовые или видеозаписи.

Даже если документ идентифицирован, не всегда возможно сохранить его в ERMS-системе. Текстовые или мгновенные сообщения на мобильных устройствах - это пример, проблемы, существующей, по крайней мере, уже два десятилетия. В качестве более свежих примеров можно назвать сообщения в чате, реакции (смайлики, комментарии) и записи онлайн-совещаний.

И даже если бы в ERMS-системах удалось сохранять больший процент изначально-электронных документов, - исходные их версии практически всегда останутся там, где они были созданы или захвачены.

Нужен иной подход.

(Окончание следует, см. http://rusrim.blogspot.com/2021/06/2.html )

Эндрю Ворланд (Andrew Warland)

Источник: блог Эндрю Ворланда
https://andrewwarland.wordpress.com/2021/03/28/the-challenge-of-identifying-born-digital-records/

Комментариев нет:

Отправить комментарий