среда, 13 мая 2026 г.

Архивы готовятся к внедрению ИИ – но медленно, слишком медленно

Данный пост эксперта в области управления электронными документами, эксперта ИСО от США Энди Поттера (Andy Potter - на фото) был опубликован 28 марта 2026 года в социальной сети Substack.

Хорошая новость заключается в том, что архивное сообщество вышло за рамки расплывчатых разговоров об искусственном интеллекте (ИИ). Начинают обретать форму концепции, а рабочие группы не просто предлагается создавать - они активно работают. Финансирование начинает поступать в масштабах, позволяющих предположить, что учреждения и организации понимают, что речь идёт не о мимолетном увлечении технологией, а фундаментальном сдвиге.

Менее приятная новость - в том, что темпы освоения таковы, словно их задаёт человек, неспешно едущий на зеленый свет, в то время как во всех направлениях движение становится всё более и более интенсивным. Прогресс есть, но неспешный, и уж точно не такой, чтобы соответствовать текущей ситуации.

Поэтому стоит ненадолго взять паузу и посмотреть, что действительно изменилось, а что - нет.

Профессия, похоже, наконец организуется - по крайней мере, «на бумаге»

Общество американских архивистов (Society of American Archivists, SAA) в протоколе февральского заседания своего Совета ( https://www2.archivists.org/news/2026/saa-council-february-meeting-highlights ) без лишнего шума отметило, что рассмотрело проект технического задания на создания новой целевой группы, в центре внимания которой будет вопрос ИИ в архивах, и в марте 2026 года будет объявлен специальный конкурс на замещение руководящих должностей в этой целевой группе на период 2026–2027 годов. Известно, что Общество американских архивистов действует осторожно – поэтому создание постоянно действующей целевой группы является важным признаком того, на что профессиональное сообщество использует в этом вопросе свои институциональные ресурсы.

Между тем, в последнем выпуске журнала «Американский архивист» (American Archivist, https://www2.archivists.org/news/2026/read-the-fallwinter-2025-issue-of-american-archivist ) было опубликовано исследование, в рамках которого оценивались 33 программных инструмента с целью выяснить, как искусственный интеллект может повысить доступность и удобство поиска в специальных коллекциях. Анализ 33 инструментов в рецензируемом журнале - это солидная практическая работа, в которой действительно нуждается наша область: не просто размышления о потенциале ИИ, а честные оценки того, что действительно работает в реальных архивных коллекциях.

Мой комментарий: Речь идёт о статье Сони Яко (Sonia Yaco), Бала Десингху (Bala Desinghu), Клэр Уорвик (Claire Warwick) и Ричарда Андерсона (Richard Anderson) «Чем ИИ может быть полезен для специальных коллекций» (What Can AI Do for Special Collections?), опубликованной онлайн 2 января 2026 года в томе 88, вып.2 журнала «Американский архивист», стр. 441-473, см. https://doi.org/10.17723/2327-9702-88.2.441 

Руководство по обеспечению готовности к ИИ проекта FLAME – солидный документ, и теперь кому-то следует им реально воспользоваться

Недавно заметным событием стала публикация Ассоциацией архивистов и специалистов по управлению документами Великобритании и Ирландии (Archives and Records Association UK and Ireland, ARA) «Руководства по обеспечению готовности к ИИ для архивистов» (AI Preparedness Guidelines for Archivists, см. https://www.openaire.eu/ai-in-archives-why-preparation-and-governance-matter ), что сигнализируют о сдвиге от общего интереса к ИИ к более практическому мышлению, ориентированному на оперативную деятельность. 

Мой комментарий: Данный 6-страничный документ был подготовлен проф. Джованни Колавицца (Giovanni Colavizza, университеты Копенгагена и Болоньи) и проф. Лиз Жайян (Lise Jaillant, университет Лафборо, Великобритания) в рамках проекта FLAME (сокращение от AI For Libraries, Archives and Museums – «ИИ для библиотек, архивов и музеев»), финансируемого ARA. Он был опубликован в феврале 2026 года, см. https://www.archives.org.uk/s/AI-Preparedness-Guidelines_February_2026.pdf 

Эти рекомендации являются реакцией на возрастающее давление, вынуждающее внедрять ИИ в архивной среде без адекватной опоры на архивные принципы, качество данных и этику. Руководство стремится увязать воедино готовность данных, архивную теорию и ответственное использование ИИ в рамках работоспособной концептуальной структуры.

Поставленный диагноз точен, и «Руководство» являются ценным вкладом. Но именно здесь снова появляется знакомый пробел. Концепция не будет работать на практике, если у учреждений нет персонала, финансирования и нормативно-правовой основы для её реализации. У большинства учреждений и организаций ничего этого нет. Проблема обработки накопившихся данных не решается посредством её более чёткого описания или же более точного согласования с готовностью к использованию ИИ. Проблема решается посредством наращивания способностей / потенциала, что остаётся реальным препятствием.

«Холодные данные» привлекают всё больше внимание - и архивам следует обратить на это внимание

Есть один часто упускаемый аспект: мир корпоративных хранилищ данных начинает осознавать нечто такое, что архивисты знали всегда – «старые» данные имеют ценность. Даже давно неиспользуемые архивные «холодные» данные могут содержать ценные знания, выявляемые при их обработке моделью ИИ. Коммерческий сектор внезапно стал проявлять большой интерес к обеспечению машинного доступа к историческим данным, что как создаёт возможности для учреждений культурного наследия, так и оказывает на них давление. Возможности заключаются в том, что становится больше инструментов, растёт интерес со стороны поставщиков и увеличиваются инвестиции в инфраструктуру. Что касается давления: если организации и предприятия найдут способ разблокировать свои «холодные» данные раньше архивов, то есть риск, что вопрос обеспечения доступности к архивным материалам будет выглядеть как решённая проблема, которой никто [в архивной отрасли – Н.Х.] своевременно не уделил должного внимания.

Ситуация с «Интернет-архивом» продолжает ухудшаться

Ситуация вокруг «Интернет-архива» (Internet Archive) продолжает обостряться (см. https://www.eff.org/deeplinks/2026/03/blocking-internet-archive-wont-stop-ai-it-will-erase-webs-historical-record ). Ведущие издательства сейчас активно блокируют поисковые роботы «Интернет-архива» из-за споров об авторских правах, связанных с обучающими данными для ИИ, и эти действия уже наносят реальный ущерб усилиям по обеспечению долговременной сохранности информации. Заархивированные веб-страницы нередко являются единственным надёжным документированным источником информации о том, как изначально появлялись публикации. Издательства регулярно редактируют, изменяют или удаляют статьи, что делает «Интернет-архив» единственным источником для отслеживания этих изменений.

Во всей этой ситуации особенно возмущает то, что такие организации, как «Интернет-архив», не создают коммерческие системы ИИ - это некоммерческие организации, занимающиеся обеспечением долговременной сохранности информации. Их наказывают за то, что они полезны исследователям, которые используют ту же самую инфраструктуру, что и недовольные издатели. Хотя издательства имеют право защищать свой контент, делать это посредством разрушения исторической документированной информации неправильно.

Эту цифру должен помнить каждый руководитель

Аналитическая фирма Gartner прогнозирует (см. https://www.gartner.com/en/newsroom/press-releases/2025-02-26-lack-of-ai-ready-data-puts-ai-projects-at-risk ) что к 2026 году 60% проектов в области ИИ потерпят неудачу из-за нехватки готовых к обработке с помощью ИИ данных. Большинство учреждений спешат с экспериментами в области ИИ, не проведя работы с метаданными, не выявив пробелов и не заложив необходимую основу, - и им придётся многое объяснять своим советам директоров примерно через восемнадцать месяцев. То, что правы были архивисты, советовавшие «сначала привести свои коллекции в порядок», будет доказано самым болезненным образом.

Неудобная правда, которую никто не хочет сказать вслух

Главная проблема с готовностью архивов к использованию ИИ заключается не столько в технологиях, сколько в кадрах и финансировании, что часто маскируется под технологическую проблему. Рекомендации проекта FLAME превосходны, создание целевой группы Обществом американских архивистов (SAA) – хороший знак, а исследования, опубликованные в журнале «Американский архивист» – именно то, что нужно. Однако многим организациям по-прежнему недостаёт формальных (документированных и утверждённых – Н.Х.) процессов управления документами (см. https://www.infrrd.ai/blog/document-archiving-solutions-in-2026 ). Для устранения этой проблемы необходимы инвестиции в сотрудников, которые выполняют соответствующую работу. Пока спонсоры, администраторы и разработчики политик не начнут связывать проблему готовности к использованию ИИ с продолжающимся недофинансированием усилий по описанию и обработке документов, мы будем продолжать разработку рекомендаций, которые так и останутся неэффективными.

Подробнее об этом я поговорю в одном из следующих своих постов. Дайте мне знать, если я что-либо упускаю – особенно если Вы работаете над этими проблемами внутри учреждения или организации.

Эндрю Поттер (Andrew Potter)

Источник: сайт Substack
https://metaarchivist.substack.com/p/the-archives-are-getting-ai-ready 

Комментариев нет:

Отправить комментарий