воскресенье, 15 мая 2011 г.

США: Конференция MARAC Spring 2011: Новые инструменты для решения проблем, связанных с электронными документами – часть II

(Окончание статьи Бонни Ведл, начало см. http://rusrim.blogspot.com/2011/05/marac-spring-2011-i.html )

Мне трудно в полной мере оценить третий доклад – Марии Эстевы (Maria Esteva) из Техасского центра перспективных вычислительных методов (Texas Advanced Computing Center, TACC) и её коллег, изучающих возможности для использования в архивном деле технологий визуализации (о работе TACC в этом направлении см. также http://rusrim.blogspot.com/2011/04/blog-post_03.html - Н.Х.). Не удивительно, что её выступление включало множество иллюстраций и мультимедийных материалов. Если вы хотите получить представление о том, как выглядят эти материалы - что я очень рекомендую – то часть их них выложена на сайте TACC и приведена в майском выпуске журнала Discover. Группа также изложила свои выводы в статье, опубликованной в Международном журнале по управлению электронными материалами (The International Journal of Digital Curation, iss.1, vol.6, 2011), http://www.ijdc.net/index.php/ijdc/article/viewFile/162/230 .

Средства визуализации могут быть использованы для отображения, сравнения и сопоставления различных типов данных. Эстева и её коллеги надеются, что визуализация, - которую зачастую легче воспринимать, чем длинные тексты или данные статистического анализа, - в конечном итоге поможет принимать решения, касающиеся архивной обработки, облегчит анализ больших объёмов электронных документов, включающих многочисленные типы документов и сложные электронные объекты, а также будет способствовать расширению доступа к большим, сложным комплексам электронных документов.

Используя предоставленный Национальными Архивами США тестовый стенд (testbed) для работы с электронными документами, Эстева и ее коллеги применяют ряд автоматизированных методов для выявления группировки дел и объектов данных, происходящих из одного источника, и извлекают информацию об их контенте и организации, а затем помещают собранные данные в реляционную базу данных. Потом применяется целый ряд современных методов (data mining, алгоритмы группировки - alignment algorithms, средства обработки текстов на естественном языке, анализ распределения данных и др.) для сравнения, противопоставления и выявления интеллектуальных взаимосвязей между документами. При этом они используют средства визуализации для графического представления результатов анализа: круговые диаграммы, сетевые графы и древовидные схемы.

Эстева рассказала о двух практических примерах использования визуализации, выполненных в ходе исследований на тестовом стенде. В первом из них демонстрировалось, каким образом визуализация может помочь архивистам обрабатывать электронные документы, выделяя не являющиеся изначально очевидными интеллектуальный контент и взаимоотношения, оценивая потребность в выполнении действий по обеспечению сохранности и выявляя других важные характеристики документов. Второй пример показал, как визуализация может помочь пользователям идентифицировать те коллекции документов, которые лучше всего соответствуют их научным потребностям. Исследователи, ищущие материалы, которые содержат специфический интеллектуальный контент, происходят из определенного источника, были созданы в определенное время, имеют определенные характерные признаки (в том числе в сочетании), могут визуально оценить, какие коллекции для них наиболее перспективны.

Может быть, это свойственно возрасту (не говоря уже о моей любви к письменному слову), но на данный момент я сомневаюсь в том, что исследователи, ищущие документы с определенными характеристиками или наборами таких характеристик, предпочтут анализировать древовидные схемы. Меня, однако, интригует технологии визуализации, и я полагаю, что в скором времени мы осознаем, что она может помочь нам выявить материалы, требующие особых мер по обеспечению их сохранности; или же подпадающие под конкретные запросы, поданные в соответствии с законодательство о свободе доступа к государственной информации; или же в которых проявляются определенные тренды и типовые особенности (patterns), - которые в противном случае могли бы остаться незамеченными. Кроме того, я считаю, что исследователи будут использовать технологии визуализации в качестве аналитического инструмента. Например, многие исследователи, вероятно, будут использовать графы взаимоотношений для того, чтобы выделить модели взаимодействия, присущие большим наборам сообщений электронной почты.

Бонни Ведл (Bonnie Weddle)

Источник: блог l'Archivista
http://larchivista.blogspot.com/2011/05/marac-spring-2011-new-tools-to-address.html?utm_source=feedburner&utm_medium=feed&utm_campaign=Feed%3A+ArchivesBlogs+%28ArchivesBlogs%29

Комментариев нет:

Отправить комментарий