понедельник, 28 мая 2018 г.

Погружение в вычислительную архивную науку


Статья Джейн Келли (Jane Kelly – на фото), ассистентки по историческим и специальным коллекциям библиотеки Гарвардской школы права, была опубликована на блоге «Bloggers!» секции электронных документов Общества американских архивистов (SAA) 8 мая 2018 года.

В декабре 2017 года в Бостон пришла конференция по большим данным (см.  http://cci.drexel.edu/bigdata/bigdata2017/ ) Международной ассоциации специалистов по электротехнике и радиоэлектронике IEEE (от Institute of Electrical and Electronics Engineers – «Институт инженеров по электротехнике и радиоэлектронике» - Н.Х.), а вместе с ней и второй ежегодный семинар по вычислительной архивной науке (computational archival science, CAS – см. http://dcicblog.umd.edu/cas/ieee_big_data_2017_cas-workshop/ ) !

Участники семинара проявили щедрость и пришли поделиться результатами своей работы с местным архивно-библиотечным сообществом в ходе однодневной публичной неформальной конференции (unconference), которая прошла в Гарвардской школе права. После ряда выступлений библиотекарей Гарварда, в которых был затронут вопрос об использовании вычислительных методов для изучения архивных коллекций, конференция-которая-не-совсем-конференция продолжилась в форме блиц-докладов участников семинара по вычислительной архивной науке и дискуссий по поводу того, что в будущем представителям архивно-библиотечного сообщества нужно научиться взаимодействовать с вычислительной архивной наукой.

Итак, что же такое «вычислительная архивная наука»? Сами ученые этого направления определяют данный термин так:
«Междисциплинарная область, связанная с применением вычислительных методов и ресурсов для крупномасштабной обработки документов и архивных материалов, для их анализа, хранения, обеспечения долговременной сохранности и доступности, с целью повышения эффективности, производительности и точности при поддержке таких видов деятельности, как экспертиза ценности, упорядочение и описание, принятие решений по вопросам обеспечения сохранности и доступа, а также включения в научный оборот и проведения исследований архивных материалов».
Молниеносные блиц-выступления по кругу участников семинара по вычислительной архивной науке (и они действительно произвели впечатление, как дюжина 90-секундных ударов молнии, честное слово!) варьировались по своей тематике от курирования оцифрованных документов с использованием вычислительных методов и до блокчейна и тематического моделирования для изначально-электронных коллекций.

Мой комментарий: среди выступавших был ряд весьма известных специалистов, таких как Джейсон Бэрон (Jason R. Baron), Крис Пром (Chris Prom) и Викрория Лемьё (Vicki Lemieux).

После голосования было проведено два раунда больших групповых дискуссий с целью более глубокого анализа поднятых в блиц-выступлениях вопросов. В ходе этих дискуссий рассматривалась обработка текстов на естественных языках; применение вычислительных методов для курирования архивных материалов, относящихся к культурному наследию; технология блокчейна и применение вычислительных методов для создания научно-справочного аппарата. Слайды к блиц-докладам и комментарии сообщества можно найти на веб-сайте мероприятия (CAS Unconference, https://projects.iq.harvard.edu/hlcas2017 ).

Что мы узнали? (Какие вопросы у нас есть сейчас?)

Помимо того, что мы кое-что узнали о конкретных проектах, в которых вычислительные методы применяются для изучения архивных материалов, мы также обсудили ряд проблем, с которыми могут столкнуться архивисты, когда они захотят включиться в такую работу. Было задано больше вопросов, чем получено ответов, но даже сама по себе постановка вопросов может помочь нам в создании прочной основы для будущих исследований.

Во-первых - и для некоторых из нас этот момент был, пожалуй, наиболее важным – нам необходимо познакомиться с вычислительными методами. Есть ли у нас специфические технические знания для того, чтобы понять, что на самом деле означают слова о желании использовать тематическое моделирование для описания электронных документов? Если же нет, то как нам расширить свои знания и навыки, опираясь на поддержку сообщества? Подходят ли наши электронные документы для применения вычислительных процессов? Как всё это может изменить наш подход к концептуализации и проведению экспертизы ценности, обработку и доступ к электронным документам?

Многие разговоры неоднократно возвращались к вопросам предвзятости, неприкосновенности частной жизни и к этическим проблемам. Как наша предубеждённость оказывает влияние на те инструменты, которые мы создаём и используем? Какие знания и навыки нам следует развивать с тем, чтобы распознавать и устранять предвзятости и предубеждения, заложенные в технологии?

Облако ключевых слов конференции, подготовленное её со-организатором Сейлин Бойд (Ceilyn Boyd)

Что нам нужно?

Задача неформальной конференции заключалась в том, чтобы предоставить площадку, позволяющую вовлечь больше голосов в дискуссию о применении вычислительных методов в архивах и, более конкретно, познакомить друг с другом тех, кто в настоящее время уже занимается вычислительной архивной наукой, со специалистами-практиками библиотечного и архивного дела. В конце дня мы вместе работали над составлением списка тем, которые, по нашему мнению, многим из нас следовало бы изучить, чтобы включиться во взаимодействие с вычислительной архивной наукой.

В число необходимых вещей входят списки методологий и существующих инструментов, канонические данные и/или открытые наборы данных, применяемые для тестирования таких инструментов, крепкое профессиональное сообщество, проведение анализ текущих/существующих проектов и многое другое. Создание профессионального сообщества и освоение знаний и навыков людьми, не имеющими хороших навыков программирования, были признаны особенно важным и очень сложными.

Чтобы больше узнать о вычислительной архивной науке как научном направлении, так и о конкретных проектах, обязательно познакомьтесь со слайдами к докладам и с комментариями сообщества, см. https://projects.iq.harvard.edu/hlcas2017/slides-notes !

Если Вы заинтересованы во взаимодействии с сообществом специалистов в области вычислительной архивной науки, присоединяйтесь к Google-группе CAS по адресу: computational-archival-science@googlegroups.com !

Неформальная конференция по вычислительной архивной науке в Гарварде была спланирована и организована Сейлин Бойд (Ceilyn Boyd), Джейн Келли (Jane Kelly) и Джессикой Фаррелл (Jessica Farrell) из библиотеки Гарвардского университета, при помощи Ричарда Марчиано (Richard Marciano) и Билла Андервуда (Bill Underwood) из Инновационного центра электронного курирования (Digital Curation Innovation Center, DCIC) факультета информационных наук (iSchool) Университета штата Мэриленд. Огромное спасибо всем организаторам, докладчикам и участникам!

Джейн Келли (Jane Kelly)

Источник: блог «Bloggers!»
https://saaers.wordpress.com/2018/05/08/diving-into-computational-archival-science/

Комментариев нет:

Отправить комментарий