четверг, 11 июня 2020 г.

Вебинар Антеи Селес: Искусственный интеллект в архивном деле


Данная заметка известного румынского архивиста Богдана-Флорина Поповичи (Bogdan-Florin Popovici, на фото) была опубликована на его блоге 9 июня 2020 года.

«Что такое искусственный интеллект? Стандартного определения пока нет» - Д-р Селес не стала «воевать» с терминологией, и подошла к теме как практик, опираясь на свой личный опыт работы в этой области в Национальных Архивах Великобритании – Н.Х.

В то время, как сегодня днём у нас в Румынии шла дискуссия о создании бумажного реестра для отслеживания электронных документов… -  вечером я участвовал в интересном вебинаре по искусственному интеллекту (ИИ) в архивном деле, на котором выступила генеральный секретарь Международного совета архивов (МСА) д-р Антея Селес (Anthea Seles).

Её выступление состояло из 3 разделов:

На слайде выделены три направления применения ИИ, представляющие интерес для архивистов – воздействие на деятельность в сфере государственного управления, использование в архивных процессах и обеспечение доступности и читаемости документов для исследователей – Н.Х.

1) ИИ в деятельгосударственном управлении: какова роль алгоритмов, как они влияют на принятие решений и, следовательно, на то, как эти решения будут восприниматься в исторической перспективе. Когда я думаю о том, что в Румынии мы только учимся использовать электронные документы в государственных органах, и нам с трудом даётся осознание того, что электронная почта - это не устройство, как факс, а вполне полноценные документы; и когда я вижу, какие возникают проблемы в Великобритании или США, мне кажется, что эта тема для нас столь же актуальна, как полёт на Марс.

(Что мне действительно не понравилось - как государственному служащему, а не как гражданину - так это несколько активистский подход г-жи Селес. Конечно, в её должности, большого босса негосударственной организации, она может себе это позволить; но среди аудитории было немало представителей национальных архивных служб, который не могут, поскольку являются наёмными работниками, позволить себе роскошь привлекать политиков к ответственности, - как это им рекомендует Кодекс этики архивиста МСА, который, если Вы будете следовать его букве, оставит Вас во многих странах без работы. Полагаю, что на уровне руководства МСА такой, несколько подрывной в политическом плане, подход вполне допустим …).

Мой комментарий: Текст на русском языке Международного этического кодекса архивистов, принятого на Конгрессе МСА в Пекине в 1996 году, доступен здесь: https://www.ica.org/sites/default/files/ICA_1996-09-06_code%20of%20ethics_RU.pdf  - но замечу, что этот документ довольно-таки умеренный, а вот современный подход МСА к вопросам этики куда опаснее. См. Также мой пост http://rusrim.blogspot.com/2011/08/blog-post_3884.html . А в целом я согласна с румынским коллегой; и во многом причиной тому является то, что МСА меньше всего думает об архивах как об инструменте непосредственной поддержки основной деловой деятельности и защиты интересов организации-владельца.

2) ИИ в процессах архивной обработки. В докладе было рассказано о ряде крупномасштабных «кейсов», связанных с количеством дублирующейся электронной информации в системах создателей документов (что объясняет успех Sharepoint…).

Слайд «Влияние практики управления информацией». На данном слайде рассказывается о том, что существующая в ряде органов и организаций практика управления информацией приводит к появлению «электронных помоек», провести экспертизу ценности которых вручную, ввиду их объёмов, нереально – что существенно подпитывает к интерес к инструментам на основе ИИ – Н.Х.

(См. также отчёт Национальных Архивов Великобритании об ограниченности возможностей интеллектуальной обработки данных и электронного раскрытия, https://www.nationalarchives.gov.uk/documents/digital-landscape-in-government-2014-15.pdf ).

Слайд «Влияние практики управления информацией на экспертизу ценности и отбор на архивное хранение» - Н.Х.

(См. также отчёт Национальных Архивов Великобритании о роли человека в процессах, https://www.nationalarchives.gov.uk/documents/technology-assisted-review-to-born-digital-records-transfer.pdf ).

Слайд «Искусственны интеллект и машинное обучение в управлении документами и архивном деле». Показано, что хорошо умеет делать машина, а что – человек (и видно, что полностью заменить человека машина пока не может). - Н.Х.

(Темы проводимых Национальными Архивами Великобритании исследований – см. ссылки выше – показались мне замечательно интересными. Я даже не пытаюсь сравнивать их с результатами архивных исследований в нашей стране ...).

3) ИИ как инструмент исследований. Проблема не столько  в том, чтобы внедрить ИИ, сколько в том, какое влияние он может оказать… Также прозвучали очень «капиталистические» комментарии о финансовой эксплуатации цифровых авторских прав.

Слайд «Искусственный интеллект и машинное обучение в исследованиях». Здесь, кстати говоря, Антея Селес весьма критически оценила практику передачи оцифровки архивных фондов на откуп частным организациям. Как оказалось, совсем бесплатного сыра по-прежнему не бывает :) - Н.Х.

И, наконец, выводы:

Выводы оказались большой группой вопросов, на которые нужно дать ответ :) – Н.Х.

Несколько полезных ссылок:

На сайте Национальных Архивов Великобритании:
Л.Дизендрюк (L. Diesendruck), Р.Купер (R. Kooper), Л.Марини (L. Marini) и К.Макгенри (K. McHenry) «Использование Lucene для индексирования и поиска по оцифрованным материалам всеобщей переписи населения США 1940 года» (Using Lucene to Index and Search the Digitized 1940 US Census), Concurrency and Computation: Practice and Experience, 2014.

К.Макгенри (K. McHenry), Л.Марини (L. Marini), М.Кеджривал (M. Kejriwal), Р.Купер (R. Kooper) и П.Баджси (P. Bajcsy) «На пути к свободному, с возможностью поиска доступу к информации, содержащейся в терабайтах графических образов переписных листов» (Towards Free and Searchable Access to Information within Terabytes of Census Images), в: Society of Photo-Optical Instrumentation Engineers (SPIE) Newsroom, 2011, http://spie.org/x57241.xml

Л.Дизендрюк (L. Diesendruck), Л.Марини (L. Marini), Р.Купер (R. Kooper), М.Кеджривал (M. Kejriwal) и К.Макгенри (K. McHenry) «Концепция доступа к рукописной информации в больших коллекциях оцифрованных бумажных документов» (A Framework to Access Handwritten Information within Large Digitized Paper Collections), в: IEEE eScience, Chicago, IL, 2012.

Богдан-Флорин Поповичи (Bogdan-Florin Popovici)

Мой комментарий: Соглашаясь с критическими «шпильками» Богдана-Флорина, не могу в то же время не отметить, что вебинар, который я тоже смотрела в прямом эфире, был интересным, эмоциональным, содержательным и динамичным (и он совсем не был похож на невыразительное ток-шоу об электронной сохранности, которое МСА провел на следующий день).

Признаюсь, я увидела Антею Селес в новом свете – уже не как международного бюрократа, который является заложником своей должности и должен демонстрировать политическую корректность по поводу и без повода, а как увлечённого своей работой исследователя и практика, не боящегося честно сказать о нерешённых проблемах и трудностях.

Не уверена, что все участники вебинара смогли в полной мере это оценить, но Селес по ходу своего доклада поделилась труднодоступной фактической информацией и об усилиях британских государственных органов по внедрению новых технологий, и о «кухне» проводимых Национальными Архивами Великобритании исследований в сфере ИИ.

Источник: блог Богдана-Флорина Поповичи
https://bogdanpopovici2008.wordpress.com/2020/06/09/anthea-seles-inteligenta-artificiala-ai-in-arhivistica/

Комментариев нет:

Отправить комментарий