среда, 4 сентября 2024 г.

Анализ применения методов искусственного интеллекта в рабочих процессах обеспечения долговременной сохранности электронных материалов, часть 2

(Окончание, начало см. http://rusrim.blogspot.com/2024/09/1.html )

В статье «После цифровой революции: Работа с электронными письмами и изначально электронными документами в литературных и издательских архивах» (After the Digital Revolution: Working With Emails and Born-digital Records in Literary and Publishers’ Archives, Archives & Manuscripts, 47(3), 285–304, 2019, https://doi.org/10.1080/01576895.2019.1640555 ) Лиз Жайян (Lise Jaillant) делает аналогичные выводы, когда обсуждает «тёмные» цифровые архивы, которые изначально создавались как общедоступные, но стали недоступными ввиду чувствительного характера их документов.

Что касается доступа, Жайян советует сотрудничать с донорами, рекомендуя подход открытых данных и более совершенные инструменты для интеллектуального анализа текста, а также улучшение подготовки аспирантов в вопросах курирования цифровых материалов и ИИ.

Вовлечение доноров вписывается в подход радикальной эмпатии: это не только сотрудничество и выстраивание отношений с архивистами и создателями/субъектами документов, но и возможность для донора самостоятельно определять баланс между защитой персональных данных и риском. Жайян также выступает за вовлечение исследователей во взаимодействие с архивистами вместо того, чтобы ждать, пока архивисты не обработают документы и сделают их доступными. Для этого нужно, чтобы исследователи придерживались соответствующего кодекса этики и понимали контекст исследования.

В статье «Разблокировка цифровых архивов: Междисциплинарные перспективы ИИ и изначально-цифровых данных» (Unlocking Digital Archives: Cross‐disciplinary Perspectives on AI and Born-digital Data, AI & Soc 37, 823–835, 2022, https://doi.org/10.1007/s00146-021-01367-x  ) Лиз Жайян (Lise Jaillant) и Анналина Капуто (Annalina Caputo) продолжают изучать вопрос о том, как архивные учреждения предпочитают закрытость архивов, а не доступность, из-за парадигмы избегания какого-либо риска и желания предотвратить юридические проблемы.

Такой подход ограничения доступа к архивам, особенно на основе аргументации о защите прав, непросто согласовать с концепцией радикальной эмпатии, поскольку он потенциально заглушает голоса угнетенных и маргинализованных сообществ, которые могут присутствовать в архивных документах. Этот подход потенциально ограничивает как силу таких «голосов», так и возможности пользователей архивов, и может негативно повлиять на более широкое сообщество.

Авторы статьи выступают за работу человека вместе с ИИ-инструментами, поскольку «осуществляемый человеком надзор не заменяется его алгоритмическим аналогом, а усиливается благодаря ему… Проведение анализа конфиденциальности с использованием цифровых инструментов полезно как в плане скорости, так и объёмов обрабатываемых документов». Жайян и Капуто подчеркивают, что «архивистам не обязательно быть экспертами в технических аспектах ИИ… но им необходимо активно участвовать в этом процессе анализа архивных документов с использованием ИИ-инструментов». Авторы призывают к тщательному изучению инструментов ИИ и машинного обучения, поскольку точные способы создания и функционирования этих инструментов и их соответствующих алгоритмов обычно неочевидны.

Результаты анализа, проведенного Жайян и Капуто, плавно стыкуются с результатами анализ, проделанного Стефани Декер (Stephanie Decker) и её коллегами в работе «Найти свет в темных архивах: Использование ИИ для установления связи контекста и контента в электронной почте» (Finding Light in Dark Archives: Using AI to Connect Context and Content in Email, I & Soc 37, 859–872, 2022, https://doi.org/10.1007/s00146-021-01369-9 ). Ключевым моментом является работа вместе с машинами людей, помогающих понять  контекст, особенно в случае сложных архивов электронной почты, которые представляются особенно проблемными из-за их внутренне присущего им риска раскрытия персональных данных, сетевой природы, той легкости, с которой может быть потерян контекст информации, и объёма данных.

Деккер и др. дают всестороннее техническое описание того, как методы ИИ могут применяться к архивам электронной почты, помогая в поиске, контекстуализации и, в конечном счете, в обеспечении доступности, - но отмечают, что успех их применения зависит от того, каким именно образом архивные документы были представлены в машиночитаемом виде.

Лассер и Уайт также подчеркивают важность использовать специфичных для предметной области знаний ИИ-инструментов, особенно тех, что предназначены для архивов, поскольку инструменты могут быть менее эффективными, если он не смогут должным образом контекстуализировать анализируемые данные или помочь в их обработке.

Деккер и др. подчеркивают необходимость того, чтобы исследователи помогали обеспечивать доступ к документам, и чтобы междисциплинарное сотрудничество улучшало доступ или способствовало получению значимого доступа. Это еще одна причина, по которой так важно междисциплинарное сотрудничество между архивистами и ИИ-специалистами.

Уже по материалам, приведенным в одной только данной статье, можно увидеть, что ученые, которые интересуются этим пересечением ИИ и архивного дела, являются представителями различный областей знаний: так, Капуто – ИТ-специалист, Деккер изучает вопросы деловой деятельности, Жайян – «цифровой гуманитарий», Лассер - цифровой архивист, а Уайт - библиотекарь цифровых активов. Учитывая междисциплинарный характер области ИИ, можно ожидать большего сотрудничества экспертов, представляющих такие дисциплины, как история, антропология, лингвистика, деловая деятельность, информатика, архивное дело и т. д.

Недавние научные исследования показывают, как методы искусственного интеллекта могут применяться в рабочих процессах обеспечения долговременной сохранности цифровых материалов (электронной сохранности), и дают представление об этичном управлении документами при использовании новых и нарождающихся технологий.

Жайян и Капуто удачно резюмируют, как выглядит подход радикальный эмпатии к использованию ИИ-инструментов в архивах: это «концепция стратегического управления ИИ, основанная на хорошо проработанном языке и процедурах согласия, реализации власти, обеспечения инклюзивности, прозрачности… на междисциплинарном сотрудничестве [и] пристальном внимании к этическим принципам». Благодаря целенаправленному и терпеливому управлению и надзору, внедрение методов искусственного интеллекта в рабочие процессы электронной сохранности может помочь архивистам наладить ответственные взаимосвязи с создателями, субъектами и пользователями документов, а также с более широкими сообществами.

Джилл Сэдлер (Jill K. Sadler)

Источник: сайт Ассоциации канадских архивистов
https://www.archivists.ca/Blog/13358000

Комментариев нет:

Отправить комментарий