среда, 24 марта 2021 г.

Искусственный интеллект и архивы: Текущие проблемы и перспективы для архивов электронных и изначально-электронных материалов

Статья д-ра Айрини Гоударули (Eirini Goudarouli – на фото), была опубликована на блоге Национальных Архивов Великобритании 19 февраля 2021 года.

Сеть «Архивы Великобритании и Республики Ирландии и искусственный интеллект» (The Archives in the UK/Republic of Ireland & AI, AURA), финансируемая британским Советом по исследованиям в области искусства и гуманитарных дисциплин» (Arts and Humanities Research Council, AHRC, https://ahrc.ukri.org/ ) и Ирландским научно-исследовательским советом (Irish Research Council), намеревается обсудить вопрос о том, как использовать искусственный интеллект (artificial intelligence, AI) для раскрытия потенциала архивов культурно-исторического наследия, а также изучить проблемы, связанные с доступом. Своё внимание сеть концентрирует на трёх основных темах, которые будут обсуждаться в ходе трёх семинаров:

  • «Открытые данные и неприкосновенность частной жизни» (Open Data versus Privacy);

  • «Искусственный интеллект и архивы: Текущие проблемы и перспективы для архивов изначально-электронных материалов» (AI and Archives: Current Challenges and Prospects of Born-digital archives); и

  • «Искусственный интеллект и архивы: Что дальше?» (AI and Archives: What comes next?).

В январе 2021 года Национальные Архивы Великобритании и Британская библиотека объединили усилия для проведения второго семинара, в ходе которого рассматривались текущие проблемы и перспективы архивов изначально-электронных материалов. Первый день семинара, 28 января 2021 года, был организован Национальными Архивами, а второй, на следующий день - Британской библиотекой (подробнее о втором дне читайте здесь https://blogs.bl.uk/digital-scholarship/2021/02/aura-research-network-second-workshop-write-up.html ). Оба дня семинара прошли в дистанционном режиме.

Первый день семинара начался с двух докладов. Руководитель отдела цифровых услуг Национальных Архивов Кэтрин Эллиотт (Catherine Elliott) представила работу своей группы по «Преобразованию способов онлайн-взаимодействия наших пользователей с архивом» (Transforming how our users engage with the archive online), в рамках которой исследуется, что мы могли бы создать, если бы взялись за переделку нашего веб-сайт в рамках нашей новой стратегии «Архивы для всех» (Archives for Everyone, см. http://www.nationalarchives.gov.uk/about/our-role/plans-policies-performance-and-projects/our-plans/archives-for-everyone/ ; более подробную информацию можно найти здесь:  https://alpha.nationalarchives.gov.uk/ ).

Сотрудники Национальных Архивов Великобритании инженер-исследователь по программному обеспечению Бернард Огден (Bernard Ogden) и Лора Ангелова (Lora Angelova), руководитель отдела консервации, а также изучения и развития аудитории, совместно представили свою работу в проекте «Глубокие открытия» (Deep Discoveries, https://tanc-ahrc.github.io/DeepDiscoveries/index.html ), который является основополагающим в рамках финансируемой AHRC программы «На пути к объёдинённой Национальной Коллекции» (Towards a National Collection, https://ahrc.ukri.org/research/fundedthemesandprogrammes/tanc-opening-uk-heritage-to-the-world/ ). В их докладе, озаглавленном «На пути к использованию компьютерного зрения для поиска и выявления материалов из нашей национальной коллекции» (Towards computer vision search and discovery of our national collection), были рассмотрены проблемы и перспективы доступа к коллекциям графических образов.

После своих выступлений докладчики предложили два вопроса, два вызова, которые участники мероприятия могли бы обсудить в небольших комнатах для блиц-дискуссий. В ходе утренней сессии были поставлены следующие вопросы:

  • Каким образом мы могли бы использовать дизайн услуг и данные, чтобы поощрить предоставление пользователям первоисточники «умными помощниками»? (вопрос Кэтрин);

  • Как должны выглядеть пользовательские интерфейсы для поиска / выявления материалов визуальных коллекций в электронных архивах (или в визуальных архивах)? (вопрос Лоры и Бернарда).

Участники разделились на четыре подгруппы, отправившиеся в различные комнаты для обсуждения предложенных вопросов с использованием «Ментиметра» (Mentimeter, https://www.mentimeter.com/ ) - инструмента для интерактивных презентаций и дискуссий.

Среди ответов на первый блок вопросов были такие комментарии, как «Умные помощники предназначены для персонализации, они могут предоставлять первоисточники с использованием модели Пандоры» и «Связанные данные представляются полезным решением, которое легко реализовать».


Некоторые ответы на первую группу вопросов

В рамках дневной сессии состоялись ещё два доклада. Профессор цифровых гуманитарных наук Университета Глазго Лорна Хьюз (Lorna Hughes) говорила об этических соображениях при связывании и поиске созданного сообществом контента, сосредоточив внимание на вопросах, касающихся авторского права, метаданных и работы с объёмными данными.

«Электронный куратор» европейских и американских коллекций Британской библиотеки Нора МакГрегор (Nora McGregor) рассказала об «Эволюции программы цифрового образования Британской библиотеки для обучения персонала», рассказав о пути, пройденном Британской библиотеки от HTML до вопросов этики в связи с искусственным интеллектом.

После дневной сессии участникам было предложено ещё два вопроса для изучения на блиц-дискуссиях:

  • Кто запомнен в архиве? Каким образом при использовании и анализе материалов электронных архивов мы можем видеть и уважать людей и их личности, отражённые в данных? (предложен Лорной).

  • В какой степени учреждения культурного наследия должны нести ответственность за смягчение этических рисков при применении технологий искусственного интеллекта к материалам своих цифровых коллекций сотрудниками и/или исследователями? (предложен Норой).

Среди ответов на второй блок вопросов был такой комментарий, как «Принимая материалы на хранение, поощряйте творческое сообщество и всегда используйте этическое согласие, чтобы люди точно знали, что может случиться с их материалами / данными».


Некоторые ответы на вторую группу вопросов

Каждую из блиц-дискуссий координировал эксперт из Национальных Архивов. Этими экспертами были:

  • руководитель отдела архивных исследований Дженни Банн (Jenny Bunn),

  • старший научный сотрудник по цифровым технологиям Марк Белл (Mark Bell),

  • руководитель отдела изучения новых технологий Джон Мур (John Moore), и

  • аспирант Университетского колледжа Лондона и Национальных Архивов Леонтьен Талбум (Leontien Talboom), которого финансирует Лондонское партнёрство в области искусства и гуманитарных наук (London Arts and Humanities partnership, LAHP).

В конце семинара руководитель отдела исследований Национальных Архивов Пип Уиллкокс (Pip Willcox) провела круглый стол с участием докладчиков, координаторов блиц-дискуссий и участников семинара.

Кстати, среди ответов на первый блок вопросов был такой комментарий, как «Я считаю, что визуальный поиск является наиболее эффективным способом, при условии достаточной ясности и прозрачности того, как алгоритмический процесс отбирает представляемые изображения».


Ещё примеры ответов на первую группу вопросов

Интерактивные сессии, организованные в рамках семинара, позволили провести плодотворные беседы между участниками, докладчиками, проектной группой и организаторами семинара. В ходе бесед были рассмотрены текущие проблемы и перспективы электронных и изначально-электронных архивов с фокусом на вопросы доступа, этику, нарождающиеся форматы и искусственный интеллект, - с привлечением экспертов из ряда дисциплин, включающих архивную науку, информатику и науку о данных, гуманитарные науки, а также экспертов и специалистов-практиков из учреждений культурного наследия.

Мероприятие собрало широкий круг участников со всего мира и из различных организаций, библиотек, университетов и учреждений, расположенных в Европе, Африке, США и Великобритании, которые представили различные точки зрения на вопросы доступа как с инфраструктурной, так и с пользовательской точек зрения.

В ходе дискуссии также были подчеркнуты этические последствия использования искусственного интеллекта и передовых вычислительных подходов в архивной практике и архивных исследованиях, - на основе опыта участников, полученного в различных исследовательских контекстах и частях мира.

На заключительном семинаре сети AURA будут обсуждены последующие действия сети. Семинар будет проведен Эдинбургским университетом 16 марта 2021 года. Для получения дополнительной информации, пожалуйста, следите за веб-страницей мероприятия: https://www.aura-network.net/events/artificial-intelligence-and-archives-what-comes-next/

Мы благодарим сотрудников Национальных Архивов - руководителя отдела академических партнерств Рэйчел Смилли (Rachel Smillie) и Лиз Фултон (Liz Fulton), ответственную за академическое информационное взаимодействие и воздействие, за их помощь в организации семинаров. Благодарим сотрудников Технологического института Уотерфорда - преподавателя компьютерных наук Патрика Макинерни (Patrick McInerney) и старшего научного и международного консультанта Ларри Стэплтона (Larry Stapleton) за ведение утренних и дневных сессий.

Айрини Гоударули (Eirini Goudarouli)

Источник: блог Национальных Архивов Великобритании
https://blog.nationalarchives.gov.uk/ai-and-archives-current-challenges-and-prospects-of-digital-and-born-digital-archives/

Комментариев нет:

Отправить комментарий