вторник, 10 марта 2026 г.

Итоги 2025 года в сфере управления документами и предсказания на 2026 год, часть 2

(Продолжение, начало см. http://rusrim.blogspot.com/2026/03/2025-2026-1.html )

Прогнозы на 2026 год


Предсказывать будущее - довольно глупое занятие, и всё же мы пытаемся это делать, и мы верим в эти прогнозы. Финансовые аналитики и биржевые брокеры зарабатывают миллионы на «предсказании будущего», и мы охотно отдаём им свои деньги. Даже после краха «дот-комов» и схлопывания ипотечного «пузыря» мы, кажется, всё ещё одержимы ролью гадалок.

Я тоже этим грешен. Вся моя статистическая подготовка не мешает мне сидеть с моими тётушками, разглядывать кофейную гущу в своей чашке и спрашивать: «Тётушка, что ты видишь в моём будущем?». Ну а когда тётушек нет рядом, я задаю вопросы ChatGPT.

Прогнозы всегда одни и те же: разлука, новая любовь, более высокооплачиваемая работа. Забавно, но изредка они сбываются. Даже сломанные часы, и те показывают правильное время дважды в день.

Но я не могу просто посмотреть на кофейную гущу и дать прогноз для целого направления деятельности. Мне нужно опереться на какие-то исследования, например, на аналитику обожающих ИИ консультантов из компании Deloitte.

Итак, положение дел в нашей области следующее: Дела идут плохо, очень плохо.

Результаты исследования, проведенного в 2021 году ассоциацией специалистов по управлению контентом AIIM и представленные в публикации «Состояние интеллектуального управления информацией» (State of Intelligent Information Management), показывает, что в среднем уровень стратегического управления информацией в организациях оценивается на «тройку с минусом» (1,64 по 4-балльной шкале). Ассоциация специалистов по управлению документами ARMA сообщает о сокращении программ стратегического управления информацией. Количество организаций, в которых отсутствуют программы стратегического управления информацией, выросло с 45,6% до 46,7% в 2023 году.

Мой комментарий: Подобное увеличение процента – в пределах статистических погрешностей (не говоря уже о том, что данным, получаемым по итогам опросов специалистов отрасли, часто вообще нельзя доверять ввиду некорректности используемых методик сбора и обработки данных). Кроме того, отсутствие официальной программы «стратегического управления информацией» в организации ещё не означает, что управление информацией осуществляется плохо …

Здесь мой страх перед ИИ резко возрастает - когда он отнимет у меня работу? Затем следует двойной удар.

Недавно стали «вирусными» итоги исследования Microsoft и LinkedIn (см. https://www.microsoft.com/en-us/research/publication/working-with-ai-measuring-the-occupational-implications-of-generative-ai/ , см. также пост на блоге http://rusrim.blogspot.com/2025/12/blog-post_03.html - Н.Х.) о 40 профессиях, которые будут заменены ИИ. В этом перечне историки занимают 2-е место, архивисты - 31-е, а все специалисты с дипломом в области библиотечного дела - 40-е.

Мой комментарий: Качество данного «исследования» и достоверность полученных результатов вызвали очень много вопросов у специалистов. Реакция общественности оказалась настолько негативной, что Microsoft удалил со своего сайта часть новостей на эту тему.

Но есть «свет в конце тоннеля».

Согласно материалам американского IT-издания «Информация» (The Information), в Кремниевой долине сейчас наблюдается «архивная лихорадка» - сотрудники тщательно документируют и сохраняют свою работу и результаты исследований. Цель заключается в том, чтобы научить ИИ более эффективно помогать в выполнении задач и принимать решения так, как если бы это делали сами эти специалисты.

Похоже, технологические компании не уверены в полезности архивистов и специалистов по управлению документами, но появились две научных публикации, которые окончательно развеивают такие сомнения.

Компания Anthropic (создатель ИИ-модели Claude) опубликовала пугающее исследование, привлекающее внимание к необходимости надлежащего управления документами ( https://www.anthropic.com/research/agentic-misalignment ).

В этом исследовании показано, что все 16 ведущих моделей ИИ, от Gemini до GPT, шантажировали компании и, в случае угрозы для себя, разглашали корпоративные секреты, доходя вплоть до убийства представителей руководства компаний. Проблема, получившая название «Несогласованность агентов» (Agentic Misalignment), не была решена даже с использованием прямых инструкций системе и использования инженерии подсказок (prompt engineering).

По данным Anthropic, важной частью решения данной проблемы является управление документами. Вы не ослышались - одна из крупнейших компаний, занимающихся ИИ, только что заявила о необходимости более эффективного управления документами!

По их собственным словам, следует «тщательно анализировать информацию и системы, к которым может получить доступ модель».

Исследование, представленное на конференции ICLR 2026 и озаглавленное «Для атак отравления на большие языковые LLM-модели требуется практически одно и то же количество отравленных образцов» (Poisoning Attacks on LLMs Require a Near-constant Number of Poison Samples), также подтверждает необходимость управления документами. Авторы обнаружили, что 250 «отравленных» документов достаточно, чтобы полностью уничтожить ИИ и превратить его в патологического лжеца.

250 документов - это не так уж много, примерно 0,00016% от общего объёма набора обучающих данных. И для того, чтобы отравить более крупную модель, не требуется большего числа таких документов. Все, что нужно, - это 250 документов, независимо от масштабов, набора данных и интеллектуальности ИИ.

Всего 250 документов, чтобы «править ими всеми» (отсылка на кольцо Саурона во «Властелине колец» - Н.Х.), 250 документов, чтобы отравить их всех; 250 документов, чтобы сделать их расистами и в темноте сковать их.

Очевидно, у ИИ есть проблема. И, очевидно, мы [специалисты по управлению документами – Н.Х.] можем здесь помочь. Вопрос в том, как нам это сделать.

Если мы пойдем по пути «Мусорные данные на входе, мусорный ИИ — на выходе», то мы обречены. Цена использования ИИ снижается вдвое каждые 9 месяцев, а его возможности удваиваются каждые 7 месяцев. По консервативным прогнозам, через 5 лет развертывание LLM-систем с охватом всех наших данных будет обходиться дешевле, чем оплата услуг любого отдельного поставщика в сфере управления документами. В этот момент мы столкнемся с более серьёзной проблемой.

Мой комментарий: Специалисты по анализу и статистической обработке давно уже знают, что использовать высококачественные данные всегда эффективней, чем использовать большие объёмы данных сомнительного качества (также известные как «большие данные» и «мусорные данные»). К обработке последних имеет смысл обращаться только тогда, когда получение высококачественных «малых» данных невозможно или обходится чрезмерно дорого. Поэтому лично я считаю, что «мусорными данными» лучше по возможности не пользоваться – до добра это не доведёт.

В чём будет ценность управления документами, если ИИ способен управлять всем жизненным циклом всех наших документов? И, пожалуйста, не уклоняйтесь от этого вопроса и не отмахивайтесь от него, отвечая старыми добрыми словами «мы можем управлять процессами и осуществлять надзор над ИИ». ИИ, пусть он даже порой может быть несовершенным и глупым, - всё равно гениален. Мы, по сравнению с этими инструментами, всего лишь дети. Вы же не доверите ребенку присматривать за взрослым, правда?

Эта проблема характерна не только для управления документами. Сфера юриспруденции сталкивается с такой же проблемой, - но, по сравнению с нами, они умеют блокировать вред их профессии, который могли бы нанести новые технологии. Всё, что для этого требуется – это принять новый закон, гласящий: «Все результаты работы ИИ в отношении судебных дел должны контролироваться адвокатом»; и у этого сообщества есть возможность для того, чтобы протащить такой закон.

Не поймите меня неправильно: я ни в коем случае не являюсь фанатом ИИ, и я не верю в то, что в ближайшее время появится «сверх-интеллект», чем бы он ни являлся. Люди — гении; мы креативны, видим общую картину и помним события десятилетней давности. Мы сопереживаем, сочувствуем и заботимся друг о друге. В этом отношении по сравнению с нами, ИИ - тоже ещё ребенок.

Тем не менее, данный вопрос требует глубокого осмысления. Ввиду этого нам нужно представить себе наихудший сценарий, представить себя маленькими детьми, несущими ответственность за сверх-интеллект.

Мы можем попытаться «скорректировать курс». Узнайте больше об ИИ, уделите больше внимания проблемам интероперабельности и объяснимости, с которыми он сталкивается. Уделяйте 15 минут в день чтению исследований по ИИ, чтобы вместо повторения мантры «Мусорные данные на входе, мусорный ИИ — на выходе» спрашивать друг у друга: «А Вы читали публикацию об отравлении системы ИИ?»

Независимо от выбранного пути, нам предстоят перемены, и единственный способ разобраться во всём - это серьёзно отнестись к вопросу, собраться вместе и обсудить его. Мы с Энди Поттером (Andy Potter) начали движение по этому пути с двух статей: с моей статьи «Отрасль управления документами убьёт не ИИ, а специалисты отрасли» AI won't kill records, Records Managers Will, https://www.linkedin.com/pulse/ai-wont-kill-records-managers-kaan-volkan-r716c/ ) и ответной публикации Поттера «ИИ не уничтожит потребность в специалистах по управлению документами, но приведёт к кардинальному изменению их должностных обязанностей» (AI Will Not Kill Records Managers, But It Will Kill the Old Job Description, https://metaarchivist.substack.com/p/ai-will-not-kill-records-managers ). 

Но нам двоим нужна дополнительная помощь. Два человека не могут сами изменить всю отрасль. Может быть, Вам тоже пора взять в руки перо и начать писать статьи?

(Окончание следует)

Каан Волькан (Kaan Volkan)

Источник: сайт LinkedIn
https://www.linkedin.com/pulse/2025-records-recap-kaan-volkan-g2fec/  

Комментариев нет:

Отправить комментарий