четверг, 2 июля 2026 г.

Лючиана Дюранти: От традиционных архивных знаний к компьютерному зрению и обработке естественного языка, часть 1

В мае 2026 года на сайте научных публикаций Academia.edu была выложена в свободном доступе новая статья ведущего мирового специалиста в области современной дипломатики и архивной науки, почетного профессора архивоведения Университета Британской Колумбии (Канада), научного руководителя международного проекта InterPARES (1999–2026) Лючианы Дюранти (Luciana Duranti) под названием «От традиционных архивных знаний к компьютерному зрению и обработке естественного языка. Чем больше всё меняется…» (From Traditional Archival Knowledge to Computer Vision and Natural Language Processing. The More Things Change … ), см. https://www.academia.edu/167046444/From_Traditional_Archival_Knowledge_to_Computer_Vision_and_Natural_Language_Processing  

Статья объёмом 7 страниц была опубликована 20 апреля 2026 года в журнале Norsk Arkivforum («Норвежский архивный форум») издательства Scandinavian University Press, том 32 (2026), номер 1, стр. 3–9, см. https://doi.org/10.18261/NAF.32.1.2 

В аннотации на статью отмечается:

«В данной статье представлены некоторые результаты 5-го этапа «Я доверяю ИИ» (I Trust AI) исследовательского проекта InterPARES. На примере двух тематических исследований, приведших к разработке ИИ-инструментов для создания метаданных (одно касалось текстовых документов, а второе – аудиодокументов), и на основе исследования общего плана, посвященного архивной подотчётности при использовании ИИ для выполнения архивных задач и, в частности, обеспечению долговременной сохранности материалов, созданных с помощью ИИ, -  в статье показано, как традиционные знания архивиста остаются необходимой основой для обеспечения долговременной сохранности и аутентификации электронно-цифровых документов, в особенности концепция документа и методологии палеографии и дипломатики.»

 
Лючиана Дюранти выступает с докладом на архивном семинаре в Норвегии в апреле 2025 года. Статья подготовлена на основе этого доклада

Ниже приведен перевод первых страниц статьи, где автор даёт краткую сводку современных представлений дипломатики и архивной науки:

«Говоря об электронном архивировании и об обеспечении долговременной сохранности электронных материалов, всегда следует начинать с вопроса о том, что именно нужно сохранить. В архивах мы сохраняем документы - то есть информационные объекты, созданные или полученные физическим или юридическим лицом (представляющим собой совокупность или последовательность физических лиц) в ходе его деятельности и сохраняемые для дальнейших действий или для использования в качестве справочного материала. Это традиционное определение архивной науки само по себе не очень полезно для деятельности по обеспечению долговременной сохранности в условиях современной цифровой среды, особенно когда архивисты сталкиваются со случаями использования искусственного интеллекта (ИИ) для создания документов или управления ими.

Если архивная наука основное внимание уделяет совокупностям (агрегациям) документов, то в мире ИИ нам необходимо сосредоточить внимание на отдельных документах, и, в частности, на их форме, чтобы не только понять представленные в документах факты или действия - и, следовательно, объект усилий по сохранению, - но и оценить степень, в которой они заслуживают доверие.

В архивной дипломатике понятие «документальной формы» (documentary form) определяется как правила представления (как физического, так и интеллектуального), которые формализуют те свойства документа, которые отличны от темы документа и от лиц и мест, о которых документ рассказывает. Форма документа раскрывает его функцию – а именно, то, каким образом документ взаимосвязан с действием. Существует шесть возможных типов взаимосвязей между документом и действием:

1) документ может быть средством (инструментом) выполнения действия - как, например, в случае договора: это диспозитивный (правоустанавливающий, распорядительный – Н.Х.) документ (dispositive record);

2) документ может быть создан для подтверждения того, что имело место действие, совершенное в устной форме - как в случае сертификата: это документальное доказательство (probative record);

3) документ может быть создан для использования в ходе деятельности в качестве источника информации – как, например, в случае конспектов лекций: это вспомогательный документ (supporting record);

4) Документ может создаваться исключительно по усмотрению его автора как средство передачи информации – как, например, в случае большинства электронных писем, служебных записок и некоторых веб-сайтов: это повествовательный документ (narrative record);

5) Документ может содержать указания о том, каким образом внешние по отношению к самому этому документу действия должны быть представлены - как в случае музыкальных партитур, сценариев, правил, руководств по процедурам или инструкций по заполнению форм: это инструктивный документ (instructive record); и

6) Документ может поддерживать работоспособность артефактов (например, программные патчи), выполнение деловых транзакций (например, взаимодействуя с  деловыми приложениями), проведение экспериментов (например, рабочий процесс, созданный и используемый для проведения эксперимента, по отношению к которому он является инструментом, побочным продуктом или остаточным продуктом) или анализ данных наблюдений (например, программное обеспечение для перевода): это поддерживающий документ (enabling record).

Если первые пять типов документов можно просмотреть на экране компьютера, то поддерживающие документы существуют только в виде сохраненной кодированной информации. Это различие в типах документов имеет ключевое значение для понимания того, что именно следует сохранять (в частности, с точки зрения составляющих документ элементов) и каким образом.

Примечание: Если первые четыре типа документов признаются современной дипломатикой (Duranti, 1998), то последние два типа были идентифицированы в 2006 году в рамках исследовательского проекта InterPARES 2 (Duranti & Thibodeau, 2006).»

(Окончание следует)

Лючиана Дюранти (Luciana Duranti)

Источник: сайт Academia.edu
https://www.academia.edu/167046444/From_Traditional_Archival_Knowledge_to_Computer_Vision_and_Natural_Language_Processing  
https://www.aksess-tidsskrift.no/aktuelt/arkivarforeningen/interpares/kunstig-intelligens/245720 

Комментариев нет:

Отправить комментарий