вторник, 10 марта 2026 г.

Итоги 2025 года в сфере управления документами и предсказания на 2026 год, часть 2

(Продолжение, начало см. http://rusrim.blogspot.com/2026/03/2025-2026-1.html )

Прогнозы на 2026 год


Предсказывать будущее - довольно глупое занятие, и всё же мы пытаемся это делать, и мы верим в эти прогнозы. Финансовые аналитики и биржевые брокеры зарабатывают миллионы на «предсказании будущего», и мы охотно отдаём им свои деньги. Даже после краха «дот-комов» и схлопывания ипотечного «пузыря» мы, кажется, всё ещё одержимы ролью гадалок.

Я тоже этим грешен. Вся моя статистическая подготовка не мешает мне сидеть с моими тётушками, разглядывать кофейную гущу в своей чашке и спрашивать: «Тётушка, что ты видишь в моём будущем?». Ну а когда тётушек нет рядом, я задаю вопросы ChatGPT.

Прогнозы всегда одни и те же: разлука, новая любовь, более высокооплачиваемая работа. Забавно, но изредка они сбываются. Даже сломанные часы, и те показывают правильное время дважды в день.

Но я не могу просто посмотреть на кофейную гущу и дать прогноз для целого направления деятельности. Мне нужно опереться на какие-то исследования, например, на аналитику обожающих ИИ консультантов из компании Deloitte.

Итак, положение дел в нашей области следующее: Дела идут плохо, очень плохо.

Результаты исследования, проведенного в 2021 году ассоциацией специалистов по управлению контентом AIIM и представленные в публикации «Состояние интеллектуального управления информацией» (State of Intelligent Information Management), показывает, что в среднем уровень стратегического управления информацией в организациях оценивается на «тройку с минусом» (1,64 по 4-балльной шкале). Ассоциация специалистов по управлению документами ARMA сообщает о сокращении программ стратегического управления информацией. Количество организаций, в которых отсутствуют программы стратегического управления информацией, выросло с 45,6% до 46,7% в 2023 году.

Мой комментарий: Подобное увеличение процента – в пределах статистических погрешностей (не говоря уже о том, что данным, получаемым по итогам опросов специалистов отрасли, часто вообще нельзя доверять ввиду некорректности используемых методик сбора и обработки данных). Кроме того, отсутствие официальной программы «стратегического управления информацией» в организации ещё не означает, что управление информацией осуществляется плохо …

Здесь мой страх перед ИИ резко возрастает - когда он отнимет у меня работу? Затем следует двойной удар.

Недавно стали «вирусными» итоги исследования Microsoft и LinkedIn (см. https://www.microsoft.com/en-us/research/publication/working-with-ai-measuring-the-occupational-implications-of-generative-ai/ , см. также пост на блоге http://rusrim.blogspot.com/2025/12/blog-post_03.html - Н.Х.) о 40 профессиях, которые будут заменены ИИ. В этом перечне историки занимают 2-е место, архивисты - 31-е, а все специалисты с дипломом в области библиотечного дела - 40-е.

Мой комментарий: Качество данного «исследования» и достоверность полученных результатов вызвали очень много вопросов у специалистов. Реакция общественности оказалась настолько негативной, что Microsoft удалил со своего сайта часть новостей на эту тему.

Но есть «свет в конце тоннеля».

Согласно материалам американского IT-издания «Информация» (The Information), в Кремниевой долине сейчас наблюдается «архивная лихорадка» - сотрудники тщательно документируют и сохраняют свою работу и результаты исследований. Цель заключается в том, чтобы научить ИИ более эффективно помогать в выполнении задач и принимать решения так, как если бы это делали сами эти специалисты.

Похоже, технологические компании не уверены в полезности архивистов и специалистов по управлению документами, но появились две научных публикации, которые окончательно развеивают такие сомнения.

Компания Anthropic (создатель ИИ-модели Claude) опубликовала пугающее исследование, привлекающее внимание к необходимости надлежащего управления документами ( https://www.anthropic.com/research/agentic-misalignment ).

В этом исследовании показано, что все 16 ведущих моделей ИИ, от Gemini до GPT, шантажировали компании и, в случае угрозы для себя, разглашали корпоративные секреты, доходя вплоть до убийства представителей руководства компаний. Проблема, получившая название «Несогласованность агентов» (Agentic Misalignment), не была решена даже с использованием прямых инструкций системе и использования инженерии подсказок (prompt engineering).

По данным Anthropic, важной частью решения данной проблемы является управление документами. Вы не ослышались - одна из крупнейших компаний, занимающихся ИИ, только что заявила о необходимости более эффективного управления документами!

По их собственным словам, следует «тщательно анализировать информацию и системы, к которым может получить доступ модель».

Исследование, представленное на конференции ICLR 2026 и озаглавленное «Для атак отравления на большие языковые LLM-модели требуется практически одно и то же количество отравленных образцов» (Poisoning Attacks on LLMs Require a Near-constant Number of Poison Samples), также подтверждает необходимость управления документами. Авторы обнаружили, что 250 «отравленных» документов достаточно, чтобы полностью уничтожить ИИ и превратить его в патологического лжеца.

250 документов - это не так уж много, примерно 0,00016% от общего объёма набора обучающих данных. И для того, чтобы отравить более крупную модель, не требуется большего числа таких документов. Все, что нужно, - это 250 документов, независимо от масштабов, набора данных и интеллектуальности ИИ.

Всего 250 документов, чтобы «править ими всеми» (отсылка на кольцо Саурона во «Властелине колец» - Н.Х.), 250 документов, чтобы отравить их всех; 250 документов, чтобы сделать их расистами и в темноте сковать их.

Очевидно, у ИИ есть проблема. И, очевидно, мы [специалисты по управлению документами – Н.Х.] можем здесь помочь. Вопрос в том, как нам это сделать.

Если мы пойдем по пути «Мусорные данные на входе, мусорный ИИ — на выходе», то мы обречены. Цена использования ИИ снижается вдвое каждые 9 месяцев, а его возможности удваиваются каждые 7 месяцев. По консервативным прогнозам, через 5 лет развертывание LLM-систем с охватом всех наших данных будет обходиться дешевле, чем оплата услуг любого отдельного поставщика в сфере управления документами. В этот момент мы столкнемся с более серьёзной проблемой.

Мой комментарий: Специалисты по анализу и статистической обработке давно уже знают, что использовать высококачественные данные всегда эффективней, чем использовать большие объёмы данных сомнительного качества (также известные как «большие данные» и «мусорные данные»). К обработке последних имеет смысл обращаться только тогда, когда получение высококачественных «малых» данных невозможно или обходится чрезмерно дорого. Поэтому лично я считаю, что «мусорными данными» лучше по возможности не пользоваться – до добра это не доведёт.

В чём будет ценность управления документами, если ИИ способен управлять всем жизненным циклом всех наших документов? И, пожалуйста, не уклоняйтесь от этого вопроса и не отмахивайтесь от него, отвечая старыми добрыми словами «мы можем управлять процессами и осуществлять надзор над ИИ». ИИ, пусть он даже порой может быть несовершенным и глупым, - всё равно гениален. Мы, по сравнению с этими инструментами, всего лишь дети. Вы же не доверите ребенку присматривать за взрослым, правда?

Эта проблема характерна не только для управления документами. Сфера юриспруденции сталкивается с такой же проблемой, - но, по сравнению с нами, они умеют блокировать вред их профессии, который могли бы нанести новые технологии. Всё, что для этого требуется – это принять новый закон, гласящий: «Все результаты работы ИИ в отношении судебных дел должны контролироваться адвокатом»; и у этого сообщества есть возможность для того, чтобы протащить такой закон.

Не поймите меня неправильно: я ни в коем случае не являюсь фанатом ИИ, и я не верю в то, что в ближайшее время появится «сверх-интеллект», чем бы он ни являлся. Люди — гении; мы креативны, видим общую картину и помним события десятилетней давности. Мы сопереживаем, сочувствуем и заботимся друг о друге. В этом отношении по сравнению с нами, ИИ - тоже ещё ребенок.

Тем не менее, данный вопрос требует глубокого осмысления. Ввиду этого нам нужно представить себе наихудший сценарий, представить себя маленькими детьми, несущими ответственность за сверх-интеллект.

Мы можем попытаться «скорректировать курс». Узнайте больше об ИИ, уделите больше внимания проблемам интероперабельности и объяснимости, с которыми он сталкивается. Уделяйте 15 минут в день чтению исследований по ИИ, чтобы вместо повторения мантры «Мусорные данные на входе, мусорный ИИ — на выходе» спрашивать друг у друга: «А Вы читали публикацию об отравлении системы ИИ?»

Независимо от выбранного пути, нам предстоят перемены, и единственный способ разобраться во всём - это серьёзно отнестись к вопросу, собраться вместе и обсудить его. Мы с Энди Поттером (Andy Potter) начали движение по этому пути с двух статей: с моей статьи «Отрасль управления документами убьёт не ИИ, а специалисты отрасли» AI won't kill records, Records Managers Will, https://www.linkedin.com/pulse/ai-wont-kill-records-managers-kaan-volkan-r716c/ ) и ответной публикации Поттера «ИИ не уничтожит потребность в специалистах по управлению документами, но приведёт к кардинальному изменению их должностных обязанностей» (AI Will Not Kill Records Managers, But It Will Kill the Old Job Description, https://metaarchivist.substack.com/p/ai-will-not-kill-records-managers ). 

Но нам двоим нужна дополнительная помощь. Два человека не могут сами изменить всю отрасль. Может быть, Вам тоже пора взять в руки перо и начать писать статьи?

(Окончание следует)

Каан Волькан (Kaan Volkan)

Источник: сайт LinkedIn
https://www.linkedin.com/pulse/2025-records-recap-kaan-volkan-g2fec/  

Определен порядок представления в ФНС сведений, внесенных в Единую федеральную государственную информационную систему о землях сельскохозяйственного назначения

Федеральная налоговая служба (ФНС) приказом от 12 января 2026 г. №ЕД-1-21/1@ утвердила «Порядок представления в налоговый орган сведений, внесенных в Единую федеральную государственную информационную систему  (ЕФГИС) о землях сельскохозяйственного назначения и землях, используемых или предоставленных для ведения сельского хозяйства в составе земель иных категорий, о фактическом использовании для сельскохозяйственного производства земельного участка, принадлежащего организации или физическому лицу на праве собственности, праве постоянного (бессрочного) пользования или праве пожизненного наследуемого владения, отнесенного к землям сельскохозяйственного назначения или к землям в составе зон сельскохозяйственного использования в населенных пунктах (за исключением земельных участков, указанных в абзацах четвертом и пятом подпункта 1 пункта 1 статьи 394 Налогового кодекса Российской Федерации), в электронной форме».

Приказ вступит в силу с 1 января 2027 года.

Представление сведений осуществляется с использованием единой системы межведомственного электронного взаимодействия (СМЭВ) (п.2) оператором ЕФГИС в Федеральную налоговую службу, а также по запросу налогового органа, содержащему кадастровый номер земельного участка, о котором запрашиваются сведения (п.3).

В случае технической невозможности представления сведений с использованием единой системы межведомственного электронного взаимодействия они могут представляться по электронной почте или на электронных носителях по выбору оператора ЕФГИС (п.4).

При представлении сведений на электронных носителях сформированные файлы со сведениями передаются в виде архивного файла, содержащегося на электронном носителе (п.5).

Передача (доставка) электронного носителя осуществляется с сопроводительным письмом оператора ЕФГИС. При этом электронные носители сведений помещаются в упаковку, исключающую возможность их повреждения или извлечения информации из нее без нарушения целостности упаковки.

Мой комментарий: Для ФНС снижаются трудозатраты на истребование информации и проведение контрольных мероприятий. Налоговая база будет корректироваться на основе данных из авторитетного источника (ЕФГИС).

Порядок предусматривает резервные каналы связи на случай «технической невозможности». Оператор ЕФГИС может в таком случае отправить данные по электронной почте или на физическом носителе. Это разумная подстраховка, чтобы процесс не останавливался из-за сбоев в СМЭВ. Фраза «по выбору оператора» оставляет оператору свободу действий во нештатной ситуации.

Требование упаковывать электронные носители так, чтобы исключить «извлечение информации без нарушения целостности упаковки», является мерой физической безопасности. Это защищает данные от перехвата или подмены на этапе курьерской доставки (что особенно актуально при передаче флеш-накопителей или дисков). 

Источник: Консультант Плюс 
https://www.consultant.ru/cons/cgi/online.cgi?req=doc;base=LAW;n=526448


понедельник, 9 марта 2026 г.

Итоги 2025 года в сфере управления документами и предсказания на 2026 год, часть 1

Данная заметка Каана Волькана (Kaan Volkan – на фото) – независимого консультанта, активно сотрудничающего с ассоциациями ARMA и RIMPA – была опубликована 8 января 2026 года в социальной сети LinkedIn.

Итоги 2025 года и худшая ошибка десятилетия, связанная с документами

«Мусорные данные на входе, мусорный ИИ — на выходе» - запоминающаяся фраза, не правда ли? Её легко понять и легко запомнить.

Это высказывание легко может уничтожить нас. Наша одержимость одной этой фразой разрушила больше карьер, чем DOGE, проблемы экономики и COVID вместе взятые.

Мой комментарий: Здесь упомянут Департамент эффективности правительства (Department of Government Efficiency, DOGE) -  временный федеральный орган, созданный в рамках Службы DOGE (ранее известной как Служба цифровых технологий США), и подчинявшийся Исполнительному офису президента США (Executive Office of the President, EOP). Действовал с января по ноябрь 2025 года.

С данной фразой связаны три проблемы.

Во-первых, она некорректна.

Чат-бот ChatGPT был создан на основе данных интернета (по сути, мусорных данных). Хуже того, вообще все данные - мусорные. Вся работа специалиста по ИИ заключается в том, чтобы сотворить чудо и магическим образом сделать мусорные данные пригодными для использования и надёжными. Есть люди, что всю свою карьеру посвящают поиску обходных путей при решении этой проблемы. Если Вы хотите убедиться, насколько ложна фраза «Мусорные данные на входе, мусорный ИИ — на выходе», прочитайте вот эту статью: https://www.linkedin.com/pulse/6-biggest-lies-records-management-part-2-kaan-volkan-jbwfe/ .

Мой комментарий: Экспериментировать с моделями ИИ можно с использованием каких угодно данных. Однако модель, обученная на некачественных данных, будет выдавать некачественные результаты. И, конечно же, в каждом конкретном случае понятие качества данных может трактоваться по-своему! Не случайно ИИ-сообщество разрабатывает стандарты качества данных, используемых для обучения моделей ИИ :)


Во-вторых, мы совершенно некомпетентны в плане определения того, что такое «хорошие» данные, особенно для ИИ.

Хорошие данные - это не просто «данные из источника истины». Существует множество метрик для оценки их качества. Как они влияют на собственные множители и собственные векторы? Что они делают с числами с плавающей запятой? Как они изменяют узлы нейронной сети? Как они изменяют веса матрицы и векторов, особенно на 2-м, 3-м, 4-м... n-м этапе операций? Каково соотношение точности и вычислительной эффективности?

Мой комментарий: Эти слова автора – с моей точки зрения, просто «замыливание» довольно простого вопроса. Как сказано в стандартах ИСО, качественные данные – это данные, соответствующие деловым требованиям и потребностям в конкретной ситуации. Всё остальное – от лукавого :) Деловые требования могут быть очень разными – в некоторых ситуациях, например, могут быть нужны неполные и неточные данные.

ИИ - это математика. Хорошие данные - это математика. Эти термины идут из математики. Люди, работающие над ИИ, это прикладные математики (старый термин для информатики). Мы к их числу не относимся.

Мой комментарий: С моей точки зрения, чтобы оценить, является ли «хорошим» автомобиль или стиральная машина, не нужно быть ни инженером, ни слесарем-сборщиком, ни пилотом «Формулы 1». Достаточно быть домохозяйкой с минимальным опытом :) Точно так же, чтобы оценить качество данных, достаточно взглянуть, можно ли с использованием этих данных решить поставленные деловые задачи или нет.

В-третьих, это выглядит по-детски.

Для простоты рассуждений, давайте представим себе преувеличенно смешной сценарий.

Подросток стучит в дверь Вашего офиса. Он говорит вам, что документ - это «любые данные, созданные или полученные, и затем сохраняемые в ходе повседневной деловой деятельности, которые фиксируют «действие, состояние или событие»; которые служат доказательством транзакций, подтверждением исполнения законодательно-нормативных требований и свидетельством операций; часто используются в качестве надежных доказательств при решении юридических вопросов, поскольку они имеют ключевое значение для принятия повседневных решений и обеспечения прозрачности».

Затем он спрашивает: «Теперь Вы видите, что я знаю, что такое «документ». За смешную цену в 2 миллиона долларов в год я буду управлять Вашими указаниями по срокам хранения документов и Вашими документальными фондами. Не волнуйтесь, я занимаюсь программированием уже 16 лет».

Доверили бы Вы свои документы такому человеку?

В этот момент Вы задаётесь вопросом, сколько времени потребовалось этому подростку, чтобы зазубрить первое, что следует знать о документах – две минуты? Он выглядит слегка заторможенным – значит, скорее, 5 минут.

Знает ли он что-нибудь кроме определения понятия «документ»?

Именно такое неуважение мы проявляем к нашим коллегам из ИИ, когда говорим им: «Мусорные данные на входе, мусорный ИИ — на выходе. Я управляю документами, источником достоверной информации, уже 16 лет, так что Вы должны меня слушать».

Мой комментарий: По-детски звучит как раз подобная аргументация. Специалист в области ИИ может ничего не понимать в той деловой деятельности (и связанных с нею данных), где разработанный ИИ предполагается применять – особенно если речь идёт об универсальных моделях. Человек может умело собирать компьютеры, но при этом быть полным профаном в вопросах их эффективного использования в конкретной деловой деятельности – и это нормально. Правильный подход – взаимное уважение и сотрудничество специалистов различных профессий.

Однако не всё так плохо. Мы можем во многом помочь ИИ-специалистам, а именно, в вопросах интероперабельности и объяснимости. За этими замысловатыми терминами скрываются довольно простые вещи:

Интероперабельность: Допустим, мы развернули этот ИИ на хранилище файлов с данными о продажах. Будет ли этот ИИ работать на хранилище файлов с данными о маркетинге?

Как это выяснить? Вы развертываете ИИ, а затем проводите аудит.

Объяснимость: Каким образом ИИ пришёл к такому решению?

Вы проводите ещё один аудит.

Угадайте, кто является профессионалом в проведении таких аудитов? Мы [специалисты по управлению документами – Н.Х.].

Мой комментарий: Автор, мягко говоря, не совсем прав – проведением подобного тестирования (его не совсем правильно называть аудитом) занимаются чаще всего, специалисты по соответствующему направлению деловой деятельности совместно с ИТ-специалистами, а специалистов по управлению документами к этой работе могут вообще не привлекать.

Так что давайте сосредоточим внимание на тех вещах, где мы можем оказать наибольшее воздействие, вместо того чтобы раздражать наших друзей из ИИ.

(Продолжение следует, см. http://rusrim.blogspot.com/2026/03/2025-2026-2.html )

Каан Волькан (Kaan Volkan)

Источник: сайт LinkedIn
https://www.linkedin.com/pulse/2025-records-recap-kaan-volkan-g2fec/ 

Положение о национальной цифровой транспортно-логистической платформе Российской Федерации «ГосЛог»

Правительство Российской Федерации постановлением от 14 февраля 2026 года №139 утвердило «Положение о национальной цифровой транспортно-логистической платформе Российской Федерации «ГосЛог»». Постановление вступило в силу с 1 марта 2026 года. 

Содержание Положения:

  • Общие положения;

  • Цели, задачи, функции и принципы платформы;

  • Структура платформы;

  • Состав участников информационного взаимодействия;

  • Состав сведений, размещаемых на платформе;

  • Порядок, сроки и способы обмена информацией между участниками информационного взаимодействия;

  • Требования к программно-техническим средствам платформы, требования к защите информации, содержащейся на платформе.

Платформа создается в целях информационного обеспечения процессов управления транспортно-логистическим комплексом посредством формирования единого пространства для взаимодействия государственных органов, юридических лиц и индивидуальных предпринимателей, предоставляющих транспортные услуги, физических лиц, юридических лиц и индивидуальных предпринимателей, являющихся пользователями транспортных услуг, обеспечивающего повышение надежности, эффективности, скорости и безопасности внутренних и международных грузовых перевозок всеми видами транспорта и конкурентоспособности транспортных услуг российских организаций на мировом рынке (п.3).

Платформа функционирует на основе единых стандартов информационного взаимодействия, программных, технических средств и информационных технологий, обеспечивающих автоматизированный сбор, обработку, хранение, предоставление, размещение и использование информации о транспортной системе Российской Федерации, в том числе в целях реализации принципа «одного окна».

Платформа обеспечивает выполнение следующих задач (п.4):

  • Сбор и обработка статистической и аналитической информации о транспортно-логистическом комплексе;

  • Поддержка принятия решений о развитии транспортной инфраструктуры на основе транспортно-экономического баланса Российской Федерации;

  • Обеспечение предоставления доступа к информации, содержащейся на платформе, участникам информационного взаимодействия;

  • Организация и обеспечение защищенного информационного взаимодействия участников информационного взаимодействия.

Платформа включает в себя 14 подсистем (п.7), в том числе подсистему «Придание юридической значимости», обеспечивающую юридическую значимость документов и сведений, содержащихся на платформе, с использованием функционала проверки электронной подписи, в том числе при информационном обмене с информационными системами».

Доступ к информации осуществляется с использованием «Единой системы идентификации и аутентификации» (п.15).

Информационное взаимодействие платформы с федеральными государственными информационными системами осуществляется с использованием единой системы межведомственного электронного взаимодействия в соответствии с законодательством РФ (п.16).

Информационное взаимодействие платформы с информационными системами и информационными ресурсами пользователей платформы осуществляется в автоматизированном режиме с использованием программно-технических средств в соответствии с соглашениями об информационном взаимодействии, заключенными оператором платформы с указанными лицами (п.17).

Программные и технические средства платформы должны располагаться на территории РФ (п.21):

Мой комментарий: Документ описывает «что» будет сделано, но почти не описывает «как». Ключевые аспекты (порядок, сроки, форматы, соглашения) отданы «на откуп оператору и будущим соглашениям сторон. Это создает довольно большую неопределенность для потенциальных участников на этапе подготовки к внедрению.

Источник: Консультант Плюс
https://www.consultant.ru/cons/cgi/online.cgi?req=doc;base=LAW;n=526912