четверг, 18 декабря 2025 г.

Евросоюз: Начато публичное обсуждение стандарта prEN 18286 «Система менеджмента качества для целей регулирования Закона ЕС об искусственном интеллекте»

Как сообщили сайты европейского органа по стандартизации CEN и национальных органов по стандартизации стран-членов Евросоюза и Европейской экономической зоны, с 31 октября 2025 года началось публичное обсуждение проекта стандарта prEN 18286 «Искусственный интеллект - Система менеджмента качества для целей регулирования Закона ЕС об искусственном интеллекте» (Artificial intelligence - Quality management system for EU AI Act regulatory purposes) объёмом 57 страниц.

Данный проект выполняется в рамках программы разработки целого пакета европейских стандартов в области ИИ, которые должны выполнять функции подзаконных нормативных актов, поддерживающих реализацию на практике положений недавно принято европейского Закона об ИИ. Над стандартом работает технический комитет CEN/CENELEC JTC 21 «Искусственный интеллект» (Artificial Intelligence).

С текстом проекта можно познакомиться на греческом сайте https://standardsdevelopment.elot.gr/drafts/11184 . Есть возможность до 23 декабря 2025 года индивидуально принять участие в публичном обсуждении данного стандарта на сайте Британского института стандартов (BSI) по адресу https://standardsdevelopment.bsigroup.com/projects/2025-01916 (при условии регистрации на сайте).


Страница публичного обсуждения проекта BS EN 18286 на сайте BSI

Стандарт EN 18286 первым из числа европейских стандартов, разрабатываемых в поддержку Закона Евросоюза об искусственном интеллекте, вышел на стадию публичного обсуждения.


Адам Смит (Adam Leon Smith) в своём посте в социальной сети LinkedIn (см. 
https://www.linkedin.com/posts/adamleonsmith_as-of-a-few-hours-ago-pren-18286-𝐀𝐫𝐭-activity-7389606051693686785-LfqD/ )  отметил следующее:
 
«Этот европейский стандарт самостоятельно разработан техническим комитетом по стандартизации CEN/CENELEC JTC 21 «Искусственный интеллект», отвечающим за поддержку внедрения Закона Евросоюза об искусственном интеллекте. Он обогнал prEN проект ISO/IEC DIS 24970 «Искусственный интеллект – Протоколирование в ИИ-системах» (Artificial intelligence - AI system logging), по которому был достигнут консенсус, но голосование начнётся только через несколько недель.

Данная система менеджмента качества призвана обеспечить презумпцию соответствия требованиям статьи 17 Закона об искусственном интеллекте. Под «качеством» здесь понимается соответствие всем требованиям Закона, представляющего собой регламент безопасности продукции.»

Во вводной части стандарта отмечается:

«В настоящем документе установлены требования к системе менеджмента качества, соответствующей применимым законодательно-нормативным требованиям на протяжении всего жизненного цикла системы ИИ. Эти требования применяются к широкому спектру систем ИИ и включают в себя явные требования по устранению возможных рисков для здоровья, безопасности и фундаментальных прав.

Настоящий документ предназначен для использования поставщиками систем ИИ, вне зависимости от размера, характера или местоположения. Однако требования и рекомендации, изложенные в настоящем документе, специально разработаны для поддержки поставщиков, работающих в Европейском Союзе, а также для поставщиков, располагающихся за пределами Европейского Союза, но действующих на рынке Европейского Союза или планирующих выйти на этот рынок.

Система менеджмента качества в настоящем документе описана таким образом, чтобы при её внедрении можно было принять во внимание размер поставщика, одновременно обеспечивая требуемую степень строгости и уровень защиты, предусмотренные действующими законодательно-нормативными требованиями.

… В настоящем документе установлены требования и даны рекомендации по формированию, внедрению, поддержанию и совершенствованию системы менеджмента качества для организаций, поставляющих системы ИИ.

Настоящий документ предназначен для помощи организациям в соблюдении применимых законодательно-нормативных требований.»

Содержание стандарта следующее:

Европейское предисловие
Введение
1. Область применения
2. Нормативные ссылки
3. Термины и определения
4. Система менеджмента качества
5. Ответственность и обязанности руководства
6. Планирование
7. Поддержка
8. Реализация продукции
9. Эксплуатация и контроль/управление
10. Оценка эффективности
Библиография

Источники: сайт BSI / сайт LinkedIn
https://standardsdevelopment.bsigroup.com/projects/2025-01916 
https://www.linkedin.com/posts/adamleonsmith_as-of-a-few-hours-ago-pren-18286-𝐀𝐫𝐭-activity-7389606051693686785-LfqD/   


среда, 17 декабря 2025 г.

Почему традиционные модели управления документами терпят неудачу в цифровую эпоху

Данный пост Стивена Кларка (Stephen Clarke – на фото слева) и Дэвид Робинсон (David Robinson – на фото справа) был опубликован 25 сентября 2025 года на сайте ассоциации AIIM.

Мой комментарий: Стиль данного поста необычен, и сильно напоминает слегка отредактированную выдачу ИИ-чатботов. Но даже если и так, мы же не будем на этом основании отвергать разумные мысли, не так ли?
:) 

Процессы создания и захвата документов требуют переосмысления

Эволюция теории управления документами

Со времени 1980-х годов процессы создания и захвата документов претерпели значительную концептуальную эволюцию, однако профессиональная практика не всегда поспевает за развитием теории. Фундаментальные модели, такие как модели жизненного цикла документов и континуума документов, предлагают базовые концептуальные рамки для понимания управления информацией от создания до окончательного уничтожения или передачи на постоянное архивное хранение.

Спорные постулаты традиционных моделей

Эти модели, однако, в значительной степени основаны на предположении, что сотрудники изначально создают документы целенаправленно и структурированным образом, и последовательным образом осуществляют их захват в указанные официальные системы. На практике это предположение часто оказывается не вполне соответствующим действительности.

Реальность поведения современных организаций 

Реальность повседневного поведения организаций показывает нам, что многие документы, имеющие доказательную или деловую ценность, либо вообще не создаются (когда, например, критически важные решения принимаются неформально и не документируются «далее лекционной доски»), либо, если даже они создаются, не захватываются способом, обеспечивающим их долговременную доступность и возможность повторного использования (примером могут служить распечатки на термопринтере – позабытая сегодня технология, отличавшаяся тем, что документы очень быстро становились практически нечитаемыми – Н.Х.).

Проблема неэффективной реализации

Проблемы, связанные с неадекватными правилами именовании, с наличием минимального количества метаданных и/или с недостаточным сохранением сведений о контексте, приводят к тому, что даже тогда, когда документы попадают в «официальные» системы, их по-прежнему бывает сложно найти и интерпретировать. Этот разрыв между теорией и практикой высвечивает фундаментальную проблему для нашей профессии: без заново сделанного акцента на условия и поведение, лежащие в основе создания и захвата документов (особенно в условиях всё более децентрализованной и цифровой рабочей среды), ценность даже самых развитых теоретических моделей рискует быть подорванной вследствие их неэффективного внедрения на практике.

Разрыв между теорией бумажного документооборота и цифровой практикой

Переход от физических документов к электронно-цифровым


Мы наблюдали изменения в практике работы прямо на своих рабочих местах, по мере того, как процессы создания и захвата документов трансформировались, переходя из бумажной парадигмы, в рамках которой документы были осязаемым физическим артефактом, в сложную цифровую среду, в которой документы являются изменчивыми, распределёнными и часто недолговечными.

Целенаправленная природа бумажных систем

В бумажном мире ведение документации было более осознанным и наблюдаемым процессом; документы физически размещались в дела, официально регистрировались и контролировались в рамках структурированных систем. В рамках цифровой практики, однако, эти границы стали размываться, и каждый владелец персонального компьютера стал по факту своим собственным (обычно необученным) специалистов по управлению документами.

«Встроенный» характер создания электронных документов

Создание документов теперь встроено в повседневные деловые процессы и приложения, в электронную почту, сообщения в чатах, в коллективно создаваемые документы и в транзакционные системы, что делает различие между ценными и малоценными документами менее заметным. Становится сложнее управлять этими документами без целенаправленного вмешательства.

Выявление ограниченности традиционных подходов

Подобный сдвиг потребовал переосмысления традиционных концепций управления документами и выявил ограничения, связанные с необходимостью полагаться на сотрудников в том, что те будут осознанно и последовательно создавать и захватывать документы в официальные системы.

Эволюция от моделей жизненного цикла к моделям континуума документов


Во второй половине 20-го века в практике управления документами доминировала модель жизненного цикла документов, разработанная в 1940-х годах Филиппом Кулиджем Бруксом (Philip Coolidge Brooks). В рамках этой модели деятельность по управлению документами представляла собой линейную последовательность этапов: от создания, активного использования, полуактивного хранения и до передачи на постоянное хранение в архивы либо уничтожения.

Неадекватность линейных моделей в цифровых средах


Хотя модель жизненного цикла и является подходящей для физических документов, она оказывается всё более неадекватной в цифровых средах, где документы постоянно используются повторно, пересматриваются, перепрофилируются и остаются активными в различных деловых контекстах и системах.

Мой комментарий: Модель жизненного цикла хорошо работала в основном для организационно-распорядительной и бухгалтерской документации, и никогда не была подходящей, например, для научно-технической документации. Вид носителя имеет вторичное значение для применимости моделей такого рода.

Модель континуума документов как решение

В качестве реакции на эту проблему была разработана модель континуума документов (records continuum model) в качестве более динамичной и интегрированной концептуальной основы. К моделям такого типа пришли различные теоретики и эксперты в области управления документами и архивного дела, однако в качестве основы современной теории управления документами обычно считается модель Фрэнка Апворда (Frank Upward).

Мой комментарий: Модель континуума широко известна, но … в очень узких кругах, и в основном в университетах стран Австралазии. На практике она фактически не применяется. Даже там, где невозможно строить системы управления документами на основе модели жизненного цикла, их разработчики практически всегда опираются на практические правила и руководства, а не на модель континуума документов. Иными словами, модель жизненного цикла в ряде случаев не работает, однако модель континуума так и не смогла занять до сих пор пустующее место альтернативной модели.

Понимание множественных состояний документов

Теория континуума признает, что документы могут существовать одновременно в нескольких состояниях, будучи одновременно как текущими (активно используемыми), так и архивными, как деловыми документами, так и доказательствами - в зависимости от их использования и интерпретации во времени и пространстве. Однако эта модель также предполагает, что документы осознанно создаются и управляются с самого начала.

Постоянный разрыв теории и реальности

Разрыв между теорией и реальностью в деятельности организаций остаётся постоянной проблемой. Как подход на основе модели жизненного цикла, так и подход на основе модели континуума основаны на фундаментальном предположении о том, что документы будут захватываться в момент создания (или близко к нему) в установленную контролируемую среду.

Почему сотрудники не пользуются официальными документными системами

Сотрудники часто избегают пользоваться официальными документными системами из-за того, что это кажется сложным, из-за нехватки времени или вследствие неосведомленности. Документы производятся, но «застревают» на персональных компьютерах, на общих дисках или в средствах оперативного обмена информацией. Практические особенности современной рабочей среды и опора на децентрализованную коллективную работу в цифровой среде приводят к тому, что часто не осуществляется осознанное выявление документов, не говоря уже о последовательном и согласованном управлении ими.

В следующем посте: Теперь, когда мы понимаем, почему традиционные модели терпят неудачу, в нашей следующем посте мы подробно рассмотрим практические проблемы, с которыми сталкивается современное управление информацией - от хаоса метаданных до ловушек автоматизации, которая обещает эффективность, но приводит в результате к фрагментации.

Этот пост входит в серию из пяти постов Стивена Кларка (Stephen Clarke, https://www.linkedin.com/in/steffclarke/ )  и Дэвида Робинсона (David Robinson,  https://www.linkedin.com/in/david-robinson-a89382165/ ). Данная серия постов основана на статье «Готовы к будущему? Управление информацией нуждается в пересмотре» (Future Ready? Information Management Needs a Makeover), которая впервые была опубликована в майском 2025 года выпуске 41-го тома ежеквартального журнала iQ Ассоциации специалистов Австралазии по управлению документами и информацией (Records and Information Management Professionals Australasia, RIMPA, http://rimpa.com.au/ ).

Стивен Кларк (Stephen Clarke) и Дэвид Робинсон (David Robinson)

Источник: сайт AIIM
https://info.aiim.org/aiim-blog/why-traditional-records-management-models-are-failing-in-the-digital-age  

Евросоюз: Готовится Исполнительный регламент Еврокомиссии, касающийся квалифицированных услуг электронного архивирования (2)

(Окончание, начало см. http://rusrim.blogspot.com/2025/12/1_01624974031.html )

Архивирование и безопасность криптографических средств 

Положения об обеспечении безопасности криптографических средств являются очень детальными и представляют собой, пожалуй, самый «технический» и строгий аспект нового регламента. Установленные требования весьма жёсткие:

  • Когда поставщики доверенных услуг электронного архивирования (EATSP-поставщики) подписывают объекты и документы усиленной электронной подписью, то, с целью защиты ключа подписания (закрытого ключа), этот ключ должен храниться и использоваться исключительно внутри устройств, сертифицированных в соответствии с одной из следующих схем:

    • Стандарт Common Criteria (ISO/IEC 15408) с сертификацией уровня EAL4 или выше;

    • Европейская схема EUCC (основанная на Common Criteria) с сертификацией уровня EAL4 или выше;

    • Американский стандарт FIPS 140-3 «Требования безопасности для криптографических модулей» (Security Requirements for Cryptographic Modules, см. https://csrc.nist.gov/pubs/fips/140-3/final ), уровень 3 (временно, до 31 декабря 2030 г.).

  • EATSP-поставщики должны постоянно контролировать надежность используемых криптографических алгоритмов. Если, согласно оценке рисков, алгоритм перестает быть адекватным, то поставщик обязан обновить свои политики хранения или создать новые профили для управления пакетами для хранения информации (архивными информационными AIP-пакетами согласно терминологии OAIS).

Ключевым ориентиром являются согласованные криптографические механизмы, одобренные Европейской группой сертификации по кибербезопасности (European Cybersecurity Certification Group) и опубликованные Европейским агентством по кибербезопасности ENISA (European Network and Information Security Agency) – это документ «Согласованные криптографические механизмы» (Agreed Cryptographic Mechanisms, ACM, см. https://certification.enisa.europa.eu/document/download/a845662b-aee0-484e-9191-890c4cfa7aaa_en?filename=ECCG%20Agreed%20Cryptographic%20Mechanisms%20version%202.pdf ).

Как установить происхождение подлежащих архивированию данных

Требование об установлении происхождения подлежащих архивированию содержится в самом определении понятия «электронное архивирование». Если используются электронные подписи или электронные печати, то они должны быть квалифицированными, обеспечивая тем самым максимальный уровень надежности. В других случаях EATSP-поставщик определяет критерии, используемые для исполнения этого требования. 

Регламент требует проведения регулярных проверок безопасности сетевой инфраструктуры:

  • сканирование на уязвимости - не реже одного раза в квартал;

  • тесты на проникновение - не реже одного раза в год;

  • настройка межсетевого экрана - он должен блокировать все протоколы и попытки доступа, не являющиеся необходимыми для работы сервиса.

Различные компоненты системы перед взаимодействием должны взаимно аутентифицировать друг друга с использованием криптографических методов.

Должна быть обеспечена надёжность времени событий архивирования. Если используются отметки времени, то должны использоваться квалифицированные подтверждения, выданные доверенными поставщиками в соответствии со стандартом ETSI EN 319 421 «Электронные подписи и инфраструктуры доверия - Требования политики и требования по безопасности к поставщикам услуг доверия, выдающим электронные отметки времени» (Electronic Signatures and Trust Infrastructures (ESI); Policy and Security Requirements for Trust Service Providers issuing Time-Stamps).

EATSP-поставщики должны внедрить системы отслеживания и протоколирования событий, соответствующие стандарту ETSI EN 319 401 «Электронные подписи и инфраструктуры доверия: Общие требования к политике поставщиков доверенных услуг» (Electronic Signatures and Trust Infrastructures (ESI); General Policy Requirements for Trust Service Providers) - как для критических, так и для некритических событий. Это обеспечивает возможность восстановления последовательности событий и проверки соответствия требованиям оперативной деятельности с течением времени, в том числе с учётом требований европейской директивы NIS2 (это Директива №2022/2555 Европейского парламента и Совета от 14 декабря 2022 года о мерах по обеспечению высокого общего уровня кибербезопасности во всем Евросоюзе - Н.Х.).

Часто упускаемым из виду, но очень важным элементом является план прекращения оказания услуг. Регламент требует от EATSP-поставщиков подготовки подробного плана, соответствующего требованиям подзаконных нормативных (имплементационных) актов, упомянутых в пункте 5 статьи 24 закона eIDAS. Тем самым обеспечивается, что даже в случае прекращения оказания услуг поставщиком хранимые данные могут быть безопасно переданы и сохранят свою целостность.

Последствия Исполнительного регламента

Данный Исполнительный регламент представляет собой всеобъемлющую и строгую концептуальную структуру, устанавливающую высокие стандарты безопасности и надежности для квалифицированных услуг электронного архивирования. Европейский подход отдаёт предпочтение сертификации на соответствие признанным международным стандартам, особенно выделяя «Общие критерии» и европейские схемы сертификации.

Исполнение всех этих требований требует от поставщиков услуг значительных инвестиций в сертифицированную инфраструктуру, квалифицированный персонал и в процессы непрерывного мониторинга. Такой уровень строгости, однако, необходим для обеспечения безопасного и надежного хранения электронных документов в течение длительного времени, с сохранением их доказательной силы и поддержания соответствия законодательно-нормативным требованиям.

Когда новый Регламент вступит в силу?


Документ будет опубликован в Официальном журнале Европейского Союза (Official Journal of the European Union) после перевода на национальные языки, и вступит в силу через 20 дней после публикации.

Данное обстоятельство должно послужить поводом для обновления разработанного итальянским агентством «Электронная Италия» (L'Agenzia per l'Italia Digitale, AgID) «Руководство по созданию, управлению и обеспечению сохранности электронных документов» (Linee Guida sulla formazione, gestione e conservazione dei documenti informatici, см. https://www.agid.gov.it/sites/agid/files/2024-05/linee_guida_sul_documento_informatico.pdf ). Обновления должны учесть новые требования по кибербезопасности, предписываемые Директивой NIS2, согласованные с законом eIDAS, а также новые эксплуатационные требования, которые должны быть обновлены в приложениях к Руководству. Необходимо также обновить требования к поставщикам квалифицированных услуг доверия, в частности, требование к минимальному акционерному капиталу в размере 5 миллионов евро для подачи заявки на аккредитацию любого доверенного сервиса.

Запланированные обновления итальянского «Кодекса электронного правительства» (Codice dell’Amministrazione Digitale) также будут способствовать гармонизации норм Евросоюза и национального законодательства.

Джованни Манка (Giovanni Manca)

Источник: Онлайн-издание Agenda Digitale EU
https://www.agendadigitale.eu/documenti/archiviazione-elettronica-qualificata-europea-cosa-sapere-sul-regolamento-di-esecuzione/ 

вторник, 16 декабря 2025 г.

От фондов к данным: Переосмысление архивной экспертизы ценности на основе формального анализа, часть 2

(Окончание, начало см. http://rusrim.blogspot.com/2025/12/1_01767617145.html )

Цифровая трансформация и проблемы экспертизы ценности

Распространение и хрупкость электронных документов

Цифровые технологии кардинально увеличили объемы документов, и одновременно проявилась хрупкость этих документов ввиду быстрого морального устаревания технологий. В материалах международного проекта InterPARES подчеркивается, что аутентичность (свойство соответствия документа заявленным в нём характеристикам) и целостность (полнота и неизменность документа) зависят от идентичности документа (его создателя, даты, адресата, классификационного кода и т.д.) и от контекста его создания. Цифровые документы могут потерять доказательную ценность, если их метаданные неполны или же если имеющееся аппаратное и программное обеспечение неспособно их прочитать. 

По мнению Иствуда (Eastwood), технологическое устаревание и хрупкость носителей информации означают, что архивисты не могут откладывать проведение экспертизы ценности; они должны оценивать аутентичность, идентичность и возможность обеспечения долговременной сохранности документов в то время, пока те всё ещё находятся в активных системах. Иствуд далее отмечает, что цифровые объекты должны иметь достаточную идентифицирующую информацию и контекст с тем, чтобы решение об их уничтожении либо передаче на архивное хранение могло быть принято на ранней стадии. Таким образом, экспертиза ценности превращается из проводимого на конечной стадии процесса в упреждающее вмешательство в течение активного периода существования документов.

Одновременное принятие решений по отбору на хранение и по мерам по обеспечению сохранности

В рекомендации «Приобретение и экспертиза ценности» (Acquisition and Appraisal, https://www.dpconline.org/handbook/organisational-activities/acquisition-and-appraisal ) британской Коалиции по электронной сохранности (Digital Preservation Coalition, DPC – речь идёт о главе в «Справочнике по вопросам электронной сохранности» (Digital Preservation Handbook), https://www.dpconline.org/handbook , мой пост о котором см. здесь: http://rusrim.blogspot.com/2015/11/blog-post_12.html - Н.Х.) объясняется, что в цифровой среде решения о создании и отборе документов имеют немедленные последствия для деятельности по обеспечению долговременной сохранности, поскольку доступ к цифровым ресурсам может быть быстро утрачен. 

В отличие от коллекций печатных изданий, где решения по отбору и по обеспечению сохранности могут приниматься с промежутком в десятилетия, в случае цифровых коллекций такие решения необходимо принимать одновременно, поскольку в отсутствие непрерывного управления ими электронные документы могут стать недоступными или быть испорчены. В «Руководстве» подчёркивается, что точная документация и контекстные метаданные имеют решающее значение; без адекватной документации сохранение цифрового объекта может оказаться малоцелесообразным, даже если его технически возможно сохранить. В «Руководстве» рекомендуется разрабатывать политики, обеспечивающие баланс между ценностью изначально-электронных объектов и затратами на их долгосрочное сохранение и управление правами. Организациям следует выявлять высокоценные электронные объекты и устанавливать им соответствующие сроки хранения, одновременно прилагая ограниченные усилия для обеспечения долговременной сохранности менее ценных материалов

Актуальность принципов обеспечения долговременной сохранности в цифровом мире

В разделе 6.4 «Актуальность обеспечения долговременной сохранности в цифровом мире» (The Relevance of Preservation in a Digital World, см. https://www.nedcc.org/free-resources/preservation-leaflets/6.-reformatting/6.4-the-relevance-of-preservation-in-a-digital-world – раздел в брошюре 6 «Изменение формата» (Reformatting)) Северо-восточного центра консервации документов (North East Document Conservation Center, NEDCC, штат Массачусетс, США) утверждается, что такие принципы обеспечения долговременной сохранности, как принципы долговечности, выбора, качества, целостности и доступности, остаются крайне важными, но должны быть переосмыслены в цифровом контексте.

Сканирование бумажных документов в электронные форматы не исключает необходимости в ответственной работе по обеспечению долговременной сохранности. Напротив, учреждения должны строго придерживаться стратегий смягчения рисков, поскольку риск утраты высок, а бюджеты ограничены. 

В брошюре отмечается, что цели обеспечения сохранности расширились: цифровые технологии используются для защиты оригиналов посредством создания суррогатов для доступа; для представления оригиналов с помощью систем высокого разрешения, захватывающих полную информацию; и для выхода за рамки возможностей оригиналов посредством выявления деталей, невидимых в физическом объекте. 

Эффективное управление деятельностью по обеспечению электронной сохранности требует выделения ресурсов и признания того, что суждения о ценности, электронных объектов. В брошюре утверждается, что лидерство в области обеспечения электронной сохранности должно быть общей задачей для исполнителей целого ряда ролей; при этом архивисты должны определить, какие аспекты цифровых технологий они могут контролировать, а какие нет. Фундаментальные концепции долговечности, выбора, качества, целостности и доступа продолжают направлять выбор приоритетов.

Цифровая трансформация государственных органов и обязательные требования политик

Современная государственная политика подчёркивает неотложность цифровой трансформации. Так, директор по управлению документами (Chief Records Officer, CRO) Национальных Архивов США в своём посте на блоге в 2024 году отметил, что совместные меморандумы M-19-21 и M-23-07 Административно-бюджетного управления администрации США (Office of Management and Budget, OMB) и Национальных Архивов США предписывают федеральным органам исполнительной власти США управлять документами в электронном виде и устанавливают 30 июня 2024 года как крайний срок для государственных органов, к которому они должны перейти на ведение своих документов в электроном виде в максимально возможном объёме. 

В полностью электронном правительстве документы создаются, используются и хранятся в электронном виде, а те из них, что подлежат постоянному архивному хранению, передаются в Национальные Архивы США в электронном виде. В посте содержится предупреждение о том, что распечатывание электронных документов с целью подписания собственноручными «мокрыми» подписями и/или с целью их использования в унаследованных бумажных рабочих процессах – это неэффективный подход, который создаёт риски потери информации; федеральные органы исполнительной власти должны перейти на полностью электронно-цифровые рабочие процессы и провести конверсию аналоговых документов до истечения крайнего срока. Это нормативное требование является наглядным примером того, как сегодня политики диктуют необходимость создания документов в электронном виде и требует проведения архивной экспертизы ценности с тем, чтобы решать проблемы с цифровыми форматами и метаданными прямо «в источнике».

Разработка жизнеспособных программ обеспечения электронной сохранности

В более раннем посте на блоге Национальных Архивов подробно рассказывалось о том, как архивное ведомство разработало программу обеспечения электронной сохранности, обеспечивающую доступность электронных документов «для всех и навсегда». 

В 2018 году Национальные Архивы внедрили облачную систему ERA 2.0, которая модернизирует обработку, хранение и обеспечение долговременной сохранности изначально-электронных и оцифрованных документов. Национальные Архивы создало Группу по электронной сохранности (Digital Preservation Group), в которую вошли представители подразделений, занимающихся ответственным хранением документов, ИТ-службы, юридической службы и службы обеспечения доступа, с целью разработки политик, анализа пробелов и публикации стратегии обеспечения электронной сохранности. 

Стратегия, которая затем была обновлена в 2022 году, включает оценку рисков, определение форматов файлов и публикацию концепции электронной сохранности в виде связанных открытых данных. Постоянно идущая экспертиза ценности и межведомственное сотрудничество крайне важны, поскольку обеспечение электронной сохранности - это командная работа, сочетающая в себе технологии и человеческий опыт. Данный пример демонстрирует, что для жизнеспособного обеспечения электронной сохранности необходимы координация усилий подразделений и служб организации, политик, обучения и инфраструктуры - всех факторов, влияющих на решения в ходе экспертизы ценности в цифровую эпоху.

Электронная экспертиза ценности на практике: Практический опыт

Примеры из реальной практики иллюстрируют, как электронная экспертиза ценности адаптируется к реальным условиям. В описании практики муниципального колледжа, подготовленном Джефом Хатом (Geof Huth) для Общества американских архивистов (Society of American Archivists, SAA), рассказывается, как архивист проводил отбор на сохранение и на уничтожение подверженных риску электронных документов, вёл мониторинг социальных сетей с целью сбора мнений студентов, анализировал съёмные носители и общие диски, проводил сканирование и захват веб-сайтов и учетных записей электронной почты, загружал материалы для управления курсами обучения и планировал передачу материалов на архивное хранение, - несмотря на отсутствие системы управления цифровыми активами. 

Архивист игнорировал устаревшие правила, отдавал приоритет подверженным риску изначально-электронным материалам и контенту в социальных сетях и налаживал отношения с заинтересованными сторонами с целью способствования непрерывного идущему процессу передачи материалов на архивное хранение. Этот пример подчеркивает необходимость использования при экспертизе ценности гибких критериев и стратегий отбора, а также необходимость сотрудничества при проведении электронной экспертизы ценности.

Новые и нарождающиеся тенденции: Экспертиза ценности в контексте ИИ и больших данных

Архивные документы как данные и устаревание традиционной экспертизы ценности

Искусственный интеллект трансформирует архивные рабочие процессы. В проведенном в 2021 году исследовании, изучавшем применение ИИ в архивном деле, отмечалось, что цифровая трансформация превращает архивные документы в данные, и что «ручные» экспертиза ценности, отбор и просмотр становятся нежизнеспособными. Авторы отмечали, что по мере оцифровки архивных коллекций и накопления изначально-электронных документов архивистам приходится полагаться на компьютерных агентов и оказываемую ими помощь в проведении экспертизы ценности и отбора. 

В исследовании подчеркивалось, что традиционные методы экспертизы ценности устаревают и что требуются новые человеко-машинные инструменты и методы анализа архивных материалов как данных. Внедрение ИИ оказывает давление на такие архивные концепции, как происхождение, аутентичность и первоначальный порядок, провоцируя дискуссии об их актуальности. Интеграция системной функциональной лингвистики и теории графов способна обогатить анализ происхождения и помочь архивистам ориентироваться в сложных цифровых взаимосвязях. Также утверждается, что архивисты должны стать «хозяевами данных», уделяя особое внимание повествованию и контексту, в то время, как алгоритмы возьмут на себя выполнение многих рутинных задач. Для этого требуются создание новых профессиональных групп и междисциплинарное образование, сочетающего архивную науку с ИТ-компетенциями.

Инструменты и принципы проведения экспертизы ценности с помощью машины

В том же исследовании анализировались эксперименты в области использования машинного обучения и обработки естественного языка в интересах проведения экспертизы ценности. Эксперименты Веллино (Vellino) с подборками электронных писем показали, что автоматические классификаторы могут воспроизводить решения экспертов при выявлении электронных писем, имеющих либо не имеющих ценность. 

По мнению Ли (Lee), цифровая криминалистика, обработка естественного языка и машинное обучение способны обеспечить более эффективную поддержку экспертизы ценности, поэтому требуются дальнейшие исследования в этой области. 

Хатчинсон (Hutchinson) анализировал такие инструменты, как ePADD, BitCurator NLP и ArchExtract, выявляя принципы проектирования - удобство использования, интероперабельность, гибкость, итеративность и настраиваемость - для интеграции инструментов обработки естественного языка в архивные рабочие процессы. 

Шабу (Shabou) сообщил о прототипе, который сочетает в себе нисходящий концептуальный подход проведения экспертизы ценности с восходящим интеллектуальным анализом данных и распознаванием именованных сущностей для идентификации и извлечения корпоративных данных для своевременного их удаления либо передачи на архивное хранение. 

Эти эксперименты демонстрируют, что ИИ способен помочь в отборе важных электронных документов, в отборе неструктурированных данных и в автоматизации экспертизы на предмет конфиденциальности, - хотя для этого требуются высококачественные обучающие данные, экспертные знания в предметной области и итеративный процесс разработки.

Управление чувствительной информацией и извлечение метаданных

Обработка чувствительной (конфиденциальной) информации является весьма актуальной проблемой. В упомянутом исследовании отмечалось, что федеральные органы стремятся избегать преждевременного раскрытия информации, одновременно исполняя запросы на основании закона о свободе доступа к государственной информации. Такие инструменты, как ePADD, используются для проверки электронной почты на наличие конфиденциального контента. Исследователи подчеркивали, что степень конфиденциальности зависит от контекста, и призывали использовать анализ контекста для принятия взвешенных решений.

Автоматическая классификация и машинное обучение могут помочь в проведении отбора на хранение и на уничтожение, но при этом архивисты должны осуществлять надзор и обеспечить справедливость принимаемых решений. ИИ также играет роль в извлечении метаданных: такие инструменты, как Transkribus, выполняют распознавание рукописного и печатного текста в оцифрованных материалах, делая возможными индексацию по содержанию и поиск по сущностям. ИИ, способствуя извлечение контента, даёт архивам возможность дополнять традиционное упорядочивание на основе происхождении возможностью доступа по сущностям и темам.

(Остальное — в платном доступе)

Эндрю Поттер (Andrew Potter)

Источник: сайт Substack
https://metaarchivist.substack.com/p/from-fonds-to-data