среда, 20 февраля 2019 г.

США: Рассказ о 3-м семинаре по вычислительной архивной науке, проведено в рамках инициативы IEEE Big Data 2018


Данная статья Ричарда Марчиано (Richard Marciano), Виктории Лемьё (Victoria Lemieux) и Марка Хеджеса (Mark Hedges) была опубликована на блоге «Bloggers!» секции электронных документов Общества американских архивистов (SAA) 22 января 2019 года.

Мой комментарий: Как я уже рассказывала (см. https://rusrim.blogspot.com/2019/01/1.html ), в рамках мероприятий инициативы Международной ассоциации специалистов по электротехнике и радиоэлектронике IEEE «Будущие направления развития больших данных» (Future Directions Big Data Initiative, см. https://bigdata.ieee.org/about ) 12 декабря 2018 года с городе Сиэтле, США, прошёл 3-й семинар по вычислительной архивной науке (Computational Archival Science, CAS). Сопредседателями семинара были такие известные специалисты, как д-р Марк Хеджес (Mark Hedges, Королевский колледж Лондона), профессор Виктория Лемьё (Victoria Lemieux, университет Британской Колумбии, Канада) и профессор Ричард Марчиано (Richard Marciano, университет штата Мэриленд, США) – авторы настоящей статьи.

Ричард Марчиано, Виктория Лемьё и Марк Хеджес

Введение

Третий семинар по вычислительной архивной науке (Computational Archival Science, CAS) был проведен 12 декабря 2018 года в Сиэтле вслед за двумя предыдущими семинарами по данной теме, которые прошли в 2016 году в Вашингтоне (см. http://dcicblog.umd.edu/cas/ieee_big_data_2016_cas-workshop/ ) и в 2017 году в Бостоне (см. http://dcicblog.umd.edu/cas/ieee_big_data_2017_cas-workshop/ ). Он также опирался на итоги трёх предыдущих семинаров по «Большим гуманитарным данным» (Big Humanities Data), организованных теми сопредседателями в рамках конференции 2013–2015 годов, и особенно на итоги симпозиума, состоявшегося в апреле 2016 года в Университете Мэриленда (см. http://dcicblog.umd.edu/cas/dcickcl-invited-cas-symposium-apr-2016/ ).  Текущее рабочее определение вычислительной архивной науки следующее:
«Междисциплинарная область, объединяющая вычислительные и архивные теории, методы и ресурсы как для обеспечения создания и сохранения надёжных и аутентичных документов / архивных материалов, так и решения задач крупномасштабной обработки документов и архивных материалов, их анализа, хранения, обеспечения доступности с целью повышения эффективности, производительности и точности, поддерживая такие виды деятельности, как управление документами, экспертиза ценности, упорядочение и описание, принятие решений по вопросам обеспечения долговременной сохранности и доступа, а также включения в научный оборот и проведения исследований архивных материалов». [1]
Семинар включал пять сессий и тринадцати докладов с участием международных специалистов из США, Канады, Германии, Нидерландов, Великобритании, Болгарии, Южной Африки и Португалии. Подробная информация (фотографии, рефераты, слайды и тексты докладов) доступна по адресу: http://dcicblog.umd.edu/cas/ieee-big-data-2018-3rd-cas-workshop/ .

Основное внимание в пленарном докладе, которым выступил заместитель директора базирующейся в Сиэтле общественной организации Densho (см. http://densho.org/ ) Джефф Фро (Geoff Froh) , было уделено использованию электронных архивов для сохранения истории американских граждан японской национальности, интернированных во время Второй мировой войны.

Джефф Фро выступает с пленарным докладом «Возвращение нашей истории: Использование электронных архивов для сохранения истории американских граждан японской национальности, интернированных во время Второй мировой войны» (Reclaiming our Story: Using Digital Archives to Preserve the History of WWII Japanese American Incarceration).

В ходе данного семинара изучалось объединение (и его последствия) связанных с большими данными нарождающихся методов и технологий с архивной практикой и с новыми формами анализа и проведением исторических, социальных, научных и культурных исследований архивных материалов. Цель заключалась в том, чтобы выявить и оценить текущие тенденции, требования и потенциал в этих областях; обсудить новые вопросы, которые могут в связи с ними возникнуть, и помочь определить потенциальные направления исследований в рамках развития вычислительной архивной науки в ближайшие годы.

В то же время мы рассмотрели вопросы и озабоченности, возникающие у ученых относительно интерпретации «больших данных» и целей их использования, уделив особое внимание анализу проблем перехода количества данных в качество (под которым понимается смысл, знания и отдача); отслеживанию происхождения данных и аналитических результатов на сложных платформах «больших данных» и в экосистемах производства знаний; а также решению проблем, связанных с защитой неприкосновенности частной жизни и персональных данных.

Сессии:

1. Вычислительное мышление и вычислительная архивная наука

  • Уильям Андервуд (William Underwood), Дэвид Вайнтроп (David Weintrop), Майкл Курц (Michael Kurtz) и Ричард Марчиано (Richard Marciano) – университет штата Мэриленд, США «Внедрение вычислительного мышления в архивное образование» (Introducing Computational Thinking into Archival Science Education);

  • Ричард Марчиано (Richard Marciano) и др. «Автоматизация детектирования персональных данных в документах лагерей для интернированных американцев японского происхождения в период Второй мировой войны» (Automating the Detection of Personally Identifiable Information (PII) in Japanese-American WWII Incarceration Camp Records);

  • Кеннет Тибодё (Kenneth Thibodeau, в прошлом один из наиболее заметных специалистов Национальных Архивов США; теперь, после выхода на пенсию – независимый исследователь) «Вычислительная архивная практика: На пути к теории архивной инженерии» (Computational Archival Practice: Towards a Theory for Archival Engineering);

  • Натаниэль Пейн (Nathaniel Payne, университет Британской Колумбии, Канада) «Размешать котёл: Переосмысление вычислительной архивной науки для области больших данных» (Stirring The Cauldron: Redefining Computational Archival Science (CAS) for The Big Data Domain).
2. Использование машинного обучения в деятельности архивов
  • Тим Хатчинсон (Tim Hutchinson, библиотека университета Саскачевана, Канада) «Защита в архивах неприкосновенности частной жизни: Машинное обучение с учителем и изначально-электронные документы» (Protecting Privacy in the Archives: Supervised Machine Learning and Born-Digital Records);

  • Кристофер Ли (Christopher Lee, университет Северной Каролины, США) «Экспертиза ценности и отбор архивных материалов с использованием компьютерных технологий» (Computer-Assisted Appraisal and Selection of Archival Materials).
3. Метаданные и корпоративная архитектура 
  • Петер Киральет (Péter Királyet) и др. «Измерение полноты как метрика качества метаданных в европейской электронной библиотеке Europeana» (Measuring Completeness as Metadata Quality Metric in Europeana);

  • Майк Брайнт (Mike Bryant) и др. «Синхронизация «по месту» иерархических архивных описаний» (In-place Synchronisation of Hierarchical Archival Descriptions);
4. Менеджмент данных
  • Жоао Кардозо (João Cardoso) и др. «Определение сферы охвата единой модели данных для машинно-исполняемых планов менеджмента данных» (Framing the scope of the common data model for machine-actionable Data Management Plans);

  • Тайлер Смит (Tyler Smith, компания Adventium Labs,  США) «Лакмусовая бумажка для блокчейна» (The Blockchain Litmus Test).
5. Архивы социальных и культурных учреждений
  • Райан Кокс (Ryan Cox), Сохан Шах (Sohan Shah) и др. «Пример обеспечения прозрачности при использовании больших данных в сфере культуры: Проект о последствиях рабства» (A Case Study in Creating Transparency in Using Cultural Big Data: The Legacy of Slavery Project)

  • Мари Вигэм (Mari Wigham) и др. «Использование инструментария Jupyter Notebooks (создаёт документы, включающие также исполняемый код, который может использоваться, например, для статистического анализа. См. также https://en.wikipedia.org/wiki/Project_Jupyter и https://jupyter-notebook.readthedocs.io/en/stable/examples/Notebook/What%20is%20the%20Jupyter%20Notebook.html – Н.Х.) для создания более информативных архивных интерфейсов» (Jupyter Notebooks for Generous Archive Interfaces
Дальнейшие шаги

Новости будут по-прежнему размещаться на веб-сайт портала «Вычислительная компьютерная наука (см. http://dcicblog.umd.edu/cas ) и Google-группе, к которой вы можете присоединиться по адресу computational-archival-science@googlegroups.com .

Несколько взаимосвязанных мероприятий запланировано на апрель 2019 года:
  • Полуторадневный семинар на тему «Разработка вычислительной концепции для библиотечного и архивного образования» (Developing a Computational Framework for Library and Archival Education) состоится 3- 4 апреля 2019 года в рамках мероприятия iConference 2019 (подробности см. https://iconference2019.umd.edu/external-events-and-excursions/ ); и

  • Сессия докладов по инновационным вопросам (Blue Sky) на тему «Создание международной вычислительной сети для библиотекарей и архивистов» (Establishing an International Computational Network for Librarians and Archivists, см.: https://www.conftool.com/iConference2019/index.php?page=browseSessions&form_session=356 ).
Наконец, мы планируем провести 4-й семинар по вычислительной архивной науке в декабре 2019 года на Международной конференции IEEE по большим данным (IEEE BigData 2019) в Лос-Анджелесе, штат Калифорния. Следите за новостями и ждите приглашения подавать заявки на участие в этом семинаре, где мы будем рады видеть членов Общества американских архивистов!

Литература:

[1] R.Marciano, V.Lemieux, M.Hedges, M.Esteva, W.Underwood, M.Kurtz and M.Conrad, “Archival records and training in the Age of Big Data”, https://dcicblog.umd.edu/cas/wp-content/uploads/sites/13/2016/05/Marciano_Kurtz_et-al-Archival-Records-and-Training-in-the-Age-of-Big-Data-final-1.pdf . In J.Percell , L.C.Sarin, P.T.Jaeger, J.C.Bertot (Eds.), Re-Envisioning the MLS: Perspectives on the Future of Library and Information Science Education (Advances in Librarianship, Volume 44B, pp.179-199). Emerald Publishing Limited. May 17, 2018.

Ричард Марчиано (Richard Marciano), Виктория Лемьё (Victoria Lemieux) и Марк Хеджес (Mark Hedges)

Источник: блог «Bloggers!»
https://saaers.wordpress.com/2019/01/22/ieee-big-data-2018-3rd-computational-archival-science-cas-workshop-recap/

Комментариев нет:

Отправка комментария