четверг, 2 июля 2026 г.

Лючиана Дюранти: От традиционных архивных знаний к компьютерному зрению и обработке естественного языка, часть 1

В мае 2026 года на сайте научных публикаций Academia.edu была выложена в свободном доступе новая статья ведущего мирового специалиста в области современной дипломатики и архивной науки, почетного профессора архивоведения Университета Британской Колумбии (Канада), научного руководителя международного проекта InterPARES (1999–2026) Лючианы Дюранти (Luciana Duranti) под названием «От традиционных архивных знаний к компьютерному зрению и обработке естественного языка. Чем больше всё меняется…» (From Traditional Archival Knowledge to Computer Vision and Natural Language Processing. The More Things Change … ), см. https://www.academia.edu/167046444/From_Traditional_Archival_Knowledge_to_Computer_Vision_and_Natural_Language_Processing  

Статья объёмом 7 страниц была опубликована 20 апреля 2026 года в журнале Norsk Arkivforum («Норвежский архивный форум») издательства Scandinavian University Press, том 32 (2026), номер 1, стр. 3–9, см. https://doi.org/10.18261/NAF.32.1.2 

В аннотации на статью отмечается:

«В данной статье представлены некоторые результаты 5-го этапа «Я доверяю ИИ» (I Trust AI) исследовательского проекта InterPARES. На примере двух тематических исследований, приведших к разработке ИИ-инструментов для создания метаданных (одно касалось текстовых документов, а второе – аудиодокументов), и на основе исследования общего плана, посвященного архивной подотчётности при использовании ИИ для выполнения архивных задач и, в частности, обеспечению долговременной сохранности материалов, созданных с помощью ИИ, -  в статье показано, как традиционные знания архивиста остаются необходимой основой для обеспечения долговременной сохранности и аутентификации электронно-цифровых документов, в особенности концепция документа и методологии палеографии и дипломатики.»

 
Лючиана Дюранти выступает с докладом на архивном семинаре в Норвегии в апреле 2025 года. Статья подготовлена на основе этого доклада

Ниже приведен перевод первых страниц статьи, где автор даёт краткую сводку современных представлений дипломатики и архивной науки:

«Говоря об электронном архивировании и об обеспечении долговременной сохранности электронных материалов, всегда следует начинать с вопроса о том, что именно нужно сохранить. В архивах мы сохраняем документы - то есть информационные объекты, созданные или полученные физическим или юридическим лицом (представляющим собой совокупность или последовательность физических лиц) в ходе его деятельности и сохраняемые для дальнейших действий или для использования в качестве справочного материала. Это традиционное определение архивной науки само по себе не очень полезно для деятельности по обеспечению долговременной сохранности в условиях современной цифровой среды, особенно когда архивисты сталкиваются со случаями использования искусственного интеллекта (ИИ) для создания документов или управления ими.

Если архивная наука основное внимание уделяет совокупностям (агрегациям) документов, то в мире ИИ нам необходимо сосредоточить внимание на отдельных документах, и, в частности, на их форме, чтобы не только понять представленные в документах факты или действия - и, следовательно, объект усилий по сохранению, - но и оценить степень, в которой они заслуживают доверие.

В архивной дипломатике понятие «документальной формы» (documentary form) определяется как правила представления (как физического, так и интеллектуального), которые формализуют те свойства документа, которые отличны от темы документа и от лиц и мест, о которых документ рассказывает. Форма документа раскрывает его функцию – а именно, то, каким образом документ взаимосвязан с действием. Существует шесть возможных типов взаимосвязей между документом и действием:

1) документ может быть средством (инструментом) выполнения действия - как, например, в случае договора: это диспозитивный (правоустанавливающий, распорядительный – Н.Х.) документ (dispositive record);

2) документ может быть создан для подтверждения того, что имело место действие, совершенное в устной форме - как в случае сертификата: это документальное доказательство (probative record);

3) документ может быть создан для использования в ходе деятельности в качестве источника информации – как, например, в случае конспектов лекций: это вспомогательный документ (supporting record);

4) Документ может создаваться исключительно по усмотрению его автора как средство передачи информации – как, например, в случае большинства электронных писем, служебных записок и некоторых веб-сайтов: это повествовательный документ (narrative record);

5) Документ может содержать указания о том, каким образом внешние по отношению к самому этому документу действия должны быть представлены - как в случае музыкальных партитур, сценариев, правил, руководств по процедурам или инструкций по заполнению форм: это инструктивный документ (instructive record); и

6) Документ может поддерживать работоспособность артефактов (например, программные патчи), выполнение деловых транзакций (например, взаимодействуя с  деловыми приложениями), проведение экспериментов (например, рабочий процесс, созданный и используемый для проведения эксперимента, по отношению к которому он является инструментом, побочным продуктом или остаточным продуктом) или анализ данных наблюдений (например, программное обеспечение для перевода): это поддерживающий документ (enabling record).

Если первые пять типов документов можно просмотреть на экране компьютера, то поддерживающие документы существуют только в виде сохраненной кодированной информации. Это различие в типах документов имеет ключевое значение для понимания того, что именно следует сохранять (в частности, с точки зрения составляющих документ элементов) и каким образом.

Примечание: Если первые четыре типа документов признаются современной дипломатикой (Duranti, 1998), то последние два типа были идентифицированы в 2006 году в рамках исследовательского проекта InterPARES 2 (Duranti & Thibodeau, 2006).»

(Окончание следует)

Лючиана Дюранти (Luciana Duranti)

Источник: сайт Academia.edu
https://www.academia.edu/167046444/From_Traditional_Archival_Knowledge_to_Computer_Vision_and_Natural_Language_Processing  
https://www.aksess-tidsskrift.no/aktuelt/arkivarforeningen/interpares/kunstig-intelligens/245720 

Банк России установил порядок направления налоговым органом оператору платформы цифрового рубля в электронной форме отдельных документов налогового органа

Банк России указанием от 12 января 2026 года №7273-У установил:

  • Порядок направления налоговым органом оператору платформы цифрового рубля в электронной форме решения налогового органа о приостановлении операций по счету цифрового рубля налогоплательщика-организации или решения об отмене приостановления операций по счету цифрового рубля налогоплательщика-организации;

  • Порядок направления оператором платформы цифрового рубля в налоговый орган в электронной форме сообщения, содержащего сведения об остатках цифровых рублей на счете цифрового рубля, операции по которому приостановлены;

  • Порядок определения даты и времени получения оператором платформы цифрового рубля решения о приостановлении операций налогоплательщика-организации по счету цифрового рубля в электронной форме.

Указание вступит в силу с 1 июля 2026 года.

Налоговый орган должен направить оператору платформы цифрового рубля (оператор платформы) в электронной форме решение о приостановлении операций по счету цифрового рубля налогоплательщика-организации (решение о приостановлении операций) или решение об отмене приостановления операций по счету цифрового рубля налогоплательщика-организации (документы налогового органа) с использованием единой системы межведомственного электронного взаимодействия, правила функционирования которой установлены Положением о единой системе межведомственного электронного взаимодействия (СМЭВ), через ФНС России (п.1).

После получения от налогового органа решения о приостановлении операций оператор платформы направляет в электронной форме с использованием СМЭВ в налоговый орган сообщение, содержащее сведения об остатках цифровых рублей на счете, операции по которому приостановлены (сообщение оператора платформы) (п.2).

Документы налогового органа и сообщение оператора платформы направляются с использованием СМЭВ в составе пакета электронных документов, подписанного усиленной квалифицированной электронной подписью (УКЭП) (п.5).

Проверка подлинности УКЭП ФНС России и оператора платформы проводится в СМЭВ в соответствии с пунктами 55 - 57 Технических требований к взаимодействию информационных систем в единой системе межведомственного электронного взаимодействия, утвержденных приказом Минкомсвязи России от 23 июня 2015 года №21 (п.6).
 
Оператор платформы должен в отношении поступивших документов налогового органа провести проверку форматов документов на соответствие форматам (далее - проверка документов налогового органа) (п.7).

По результатам проверки оператор направляет в налоговый орган с использованием СМЭВ уведомление о принятии или непринятии документов.

Налоговый орган должен в отношении поступившего сообщения оператора платформы провести проверку формата указанного сообщения на соответствие формату (п.8).

По результатам проверки сообщения налоговый орган направляет оператору с использованием СМЭВ уведомление о принятии или непринятии сообщения.

Датой и временем получения оператором решения о приостановлении операций считаются дата и время завершения оператором проверки решения о приостановлении операций на соответствие форматам документов налогового органа (п.9).

Мой комментарий: Пункт 9 Указания устанавливает, что датой и временем получения оператором решения о приостановлении операций считаются дата и время завершения им проверки решения на соответствие форматам.

Это создает парадоксальную ситуацию:

  • Юридически решение считается полученным только после его успешной проверки оператором;

  • До этого момента оператор формально не считается уведомленным, и блокировка не наступает;

  • Однако технически документ уже поступил в систему оператора и находится в обработке!

За то время, пока система проверяет формат (пусть даже в пределах одного рабочего дня), налогоплательщик может инициировать расходные операции, которые формально не будут заблокированы, так как решение еще не «получено» в трактовке Указания.

Источник: Консультант Плюс
https://www.consultant.ru/cons/cgi/online.cgi?req=doc;base=LAW;n=537272


среда, 1 июля 2026 г.

Неудачи в обеспечении долговременной сохранности документов происходят не из-за отсутствия технологий, а из-за недостатков в архитектуре

Данный пост колумбийского специалиста Джона Александра Гонсалеса Флореса (Jhon Alexander González Flórez, или Jhon A. Gonzalez F. – на фото), сотрудника управления проектов электронного документооборота в компании Grupo IB Consulting SAS, был опубликован 29 апреля 2026 года в социальной сети LinkedIn.

Более 30 лет тому назад (если точнее, то в 1990 году – Н.Х.) Пол Конвей (Paul Conway) высказал мысль, которую и сегодня некомфортно принять: Обеспечение сохранности архивных материалов не является технической проблемой; это проблема выделения ресурсов, институционального потенциала и принятия решений.

Мой комментарий: Те, кто, начиная с 1960-х годов, на практике занимался архивацией электронных материалов, всегда знали об этом. Более того, практика давно уже показала, что электронные архивы можно поддерживать в условиях любой технологической инфраструктуры, было бы желание, – а недостаточные возможности технологий можно компенсировать за счёт организационных мер и трудозатрат.

И все же, сегодня, в 2026 году, мы все еще пытаемся решить эту задачу с помощью программного обеспечения.

Мой комментарий: Если это возможно при разумных затратах, то почему бы и нет? Лень – двигатель прогресса! :)

Опубликованная в журнале Общества американских архивистов (Society of American Archivists) «Американский архивист» (American Archivist, том 53, № 2, специальный выпуск, посвященный проблеме обеспечения долговременной сохранности, весна 1990 г., стр. 204-222) статья Пола Конвея (Paul Conway) «Практика обеспечения долговременной сохранности архивных материалов в общенациональном контексте» (Archival Preservation Practice in a Nationwide Context), доступная по адресу https://american-archivist.kglmeridian.com/view/journals/aarc/53/2/article-p204.xml (прямая ссылка на PDF-файл: https://american-archivist.kglmeridian.com/downloadpdf/view/journals/aarc/53/2/article-p204.pdf ) была не об облачных технологиях, не об API-интерфейсах или искусственном интеллекте. Она была о чём-то более структурном: о неспособности организаций понять, что усилия по обеспечению сохранности информации, по сути, определяют её ценность во времени.

Мой комментарий:
Пол Конвей (Paul Conway, род. 7 сентября 1953 года – на фото) – известный американский архивист, см.
https://en.wikipedia.org/wiki/Paul_Conway_(archivist) . Его научно-исследовательская и педагогическая деятельность в основном была посвящена задаче обеспечения долговременной сохранности электронно-цифровых ресурсов и носителей. На протяжении своей карьеры он опубликовал множество работ по вопросам обеспечения сохранности библиотечного наследия, по проблемам консервации и вопросам обучения персонала библиотек и архивов.

В упомянутой статье Конвей предложил следующее определение понятия «обеспечение сохранности архивных материалов»:

«Обеспечение сохранности архивных материалов (archival preservation) -  это приобретение, организация и распределение ресурсов (кадровых, материальных, финансовых) для обеспечения адекватной защиты исторической информации, имеющей непреходящую ценность, чтобы к ней могли получить доступ нынешнее и будущие поколения.

Деятельность по обеспечению сохранности архивных материалов включает в себя планирование и внедрение политик, процедур и процессов, которые в совокупности предотвращают дальнейшее ухудшение состояния и/или восстанавливают пригодность для использования отдельных групп материалов.

Управление обеспечением сохранности архивных материалов, чтобы быть максимально эффективным, требует, чтобы планирование предшествовало внедрению, и чтобы профилактические меры имели приоритет над мерами по восстановлению.»

Именно здесь и возникает первое противоречие:

  • инвестиции делаются в инструменты, но не в модели,

  • проводится оцифровка, но доказательства не структурируются,

  • документы хранятся, но не осуществляется управление их жизненным циклом.

И тогда происходит неизбежное: усилия по обеспечению сохранности становятся ретроспективными, дорогостоящими и фрагментированными.

Конвей подошёл к решению этой проблемы, исходя из положения, которое сегодня должно быть «на столе» любого руководящего комитета: «Обеспечение сохранности архивных материалов - это, прежде всего, расстановка приоритетов: предпочтение отдается предотвращению проблем до их возникновения, а не их исправлению ситуации после возникновения проблем».

Именно здесь дискуссия становится ещё более интересной, поскольку в электронно-цифровом мире «предотвращение» уже не связано с контролем температуры и влажности (хотя при хранении съёмных носителей эта задача по-прежнему очень важна – Н.Х.). Речь идет о правильном проектировании:

  • событий, которые генерируют свидетельства и доказательства,

  • моделей данных, которые используются для их структурирования, и

  • архитектуры, которая обеспечивает их жизнеспособность во времени.

Иными словами, усилия по обеспечению долговременной сохранности начинаются еще до того, как документ вообще появляется на свет.

Еще одной неброской, но крайне важной концепцией в статье Конвея является понятие «нагрузки на персонал» (intensity of care) - это соотношение между объемом документов и фактическими возможностями для управления ими.

Не все наши организации сталкиваются с одними и теми же проблемами, однако многие применяют одни и те же решения, - и именно здесь появляются ошибки структурного характера:

  • чрезмерно мощные системы управления документами внедряются там, где они не нужны,

  • или, что ещё хуже, организации с большими объёмами документов не имеют реальных возможностей для управления ими.

Последствия этого носят не технологический, а институциональный характер, потому что, когда обеспечение сохранности документов не интегрировано в архитектуру, оно становится «дополнительной услугой» - и когда это происходит, оно перестаёт быть жизнеспособным.

Сегодня нам, как никогда прежде, необходимо возобновить этот разговор на другом уровне: говорить нужно не об инструментах, не о функциональных возможностях, а о том, каким образом организации создают, структурируют и поддерживают доказательства в сложных электронно-цифровых средах.

Именно этот вопрос был в числе ключевых областей моих исследований в последние годы: понимание того, что управление документами больше не может быть изолированным компонентом; оно должно стать архитектурным «ядром», которое связывает процессы, данные и решения, см. https://www.amazon.com/dp/B0GY4MP848

Мой комментарий: Автор дает ссылку на свою книгу, опубликованную в апреле 2026 года: Джон Александр Гонсалес Флорес (Jhon Alexander González Flórez) «Зависимые и независимые архитектуры систем управления документами: Как проектировать системы, способные пережить институциональные изменения » (Arquitecturas Acopladas y Desacopladas en Gestión Documental: Cómo diseñar sistemas que sobrevivan al cambio institucional - на испанском языке), см. также пост на блоге  https://rusrim.blogspot.com/2026/05/blog-post_20.html 

Это не новый вопрос, но он всё ещё остаётся нерешенным.
И, возможно, в этом и заключается истинная ценность обращения к публикациям прошлых лет: не для того, чтобы цитировать их… а чтобы признать, что проблема изначально никогда не была чисто технической. Проблемы была - и остается -  структурной.

Так будем ли мы проектировать в интересах обеспечения долговременной сохранности… или же будем просто ждать, чтобы уже потом решать уже возникшие проблемы?

Джон Гонсалес (Jhon Alexander González Flórez)

Источник: LinkedIn
https://www.linkedin.com/pulse/la-preservaci%C3%B3n-documental-falla-por-falta-de-jhon-a-gonzalez-f--2ynze/ 

Внедрение российских ИИ-сервисов в работу всех структурных подразделений Аппарата Правительства России

Я уже рассказывала на блоге о том, что в Аппарате Правительства РФ запущен эксперимент по применению ИИ, см. https://rusrim.blogspot.com/2026/04/blog-post_08.html

16 июня на сайте Правительства РФ была размещена новость о том, что тестирование российских ИИ-сервисов на площадке Аппарата Правительства России успешно завершено. По итогам пилотного проекта принято решение о целесообразности внедрения российских ИИ-сервисов в работу всех его структурных подразделений. Реализация проекта осуществляется под кураторством Заместителя Председателя Правительства – Руководителя Аппарата Правительства Дмитрия Григоренко.

Российские решения тестировались в восьми подразделениях Аппарата Правительства на протяжении полугода. ИИ, в частности, помогал:

  • формировать краткие справки; 

  • сравнивать версии документов;

  • составлять протоколы совещаний. 

В новости отмечается, что алгоритмы также были задействованы в решении рутинных задач. При этом во всех сценариях ИИ применялся в качестве технического ассистента, а финальное решение оставалось за ответственным сотрудником.

Для защищённой работы с ИИ-сервисами была выстроена особая двухконтурная архитектура с размещением серверов на территории Дома Правительства. В изолированном служебном контуре велась работа с внутренними данными, в интернет-контуре – с открытыми источниками. Участникам пилотного проекта также была доступна база типовых сценариев применения ИИ и более 150 заранее заготовленных промптов.

В числе решений, успешно прошедших тестирование, – продукты «Сбера» и «Яндекса», включая «ГигаЧат», «Нейроюриста» и «Алису AI». Более 80% участников пилотного проекта сообщили об активном использовании перечисленных решений.

«Ключевая цель в том, чтобы освободить специалистов от рутинных операций, например от подготовки справок, чтобы они могли сосредоточиться на сутевых вопросах. Важно понимать: искусственный интеллект не пишет законопроекты и не принимает государственные решения. Он не заменяет человека и не конкурирует с ним. ИИ - это лишь инструмент и помощник госслужащего», – отметил Дмитрий Григоренко.

Мой комментарий: Переход от эксперимента к решению о тиражировании на все структуры Правительства говорит о том, что проект признан успешным.

Принципиально важным итогом пилотного проекта стало не столько само внедрение нейросетей, сколько чёткое позиционирование ИИ как «младшего помощника». 

Отмечу, что техническая архитектура изначально учитывала специфику работы с конфиденциальными данными. Для защищённого функционирования ИИ-сервисов была выстроена двухконтурная система:

  • Изолированный служебный контур - использовался исключительно для работы с внутренними данными Правительства;

  • Интернет-контур - применялся для обращения к открытым источникам информации.

Это решение закрывает главную «болевую точку» внедрения облачных генеративных моделей в госорганах - угрозу утечки государственной тайны и конфиденциальной информации. Особого внимания заслуживает тот факт, что серверы были физически размещены на территории Дома Правительства. 

Источник: сайт Правительства РФ
http://government.ru/news/59040/