четверг, 24 марта 2016 г.

Великобритания: Коалиция по электронной сохранности опубликовала отчет по методам сохранения материалов из социальных сетей


Заметка Криса Эриксона (Chris Erickson – на фото) из университета им. Брайама Янга (Brigham Young University) была опубликована 24 февраля 2016 года на блоге «Долговременная сохранность имеет значение» (Digital Preservation Matters, http://preservationmatters.blogspot.com/ ).

16 февраля 2016 года компания Charles Beagrie Ltd и британская Коалиция по электронной сохранности (Digital Preservation Coalition, DPC)  опубликовали очередной отчет из популярной серии «Обозрение технологий» (Technology Watch) «Обеспечение долговременной сохранности материалов социальных сетей» (Preserving Social Media), подготовленный Сарой Дей Томсон (Sara Day Thomson).  Документ объёмом 47 страниц доступен по адресу http://dx.doi.org/10.7207/twr16-01 . Соответствующий пресс-релиз выложен здесь: http://blog.beagrie.com/2016/02/16/new-technology-watch-report-preserving-social-media/  .

В данном отчете рассматриваются взаимосвязанные вопросы сохранения материалов социальных сетей. Учреждениям, собирающим материалы такого рода, требуются новые подходы и методы. В докладе рассматривается «обеспечение долговременной сохранности и доступности материалов социальных сетей.  Представлены практические решения для сбора и управления данными, порожденными при взаимодействии пользователей на таких сетевых веб-платформах, как Facebook или Twitter». Блоги в публикации не рассматриваются. «Хелен Хокс-Ю (Helen Hockx-Yu) определяет социальные сети как: «групповое название, данное интернет-приложениям или мобильным приложениям, которые дают возможность пользователям формировать онлайн-сети и сообщества».

Если материалы «интернета первого поколения» (Web 1.0) можно собирать с помощью поисковых роботов-«сборщиков», таких, как Heretrix, то контент социального интернета (Web 2.0) - например, материалы платформ социальных сетей - эффективнее архивировать с использованием соответствующих API-интерфейсов прикладного программирования. Часто такая работа является расширением деятельности учреждения по архивации интернета. При архивации контента важны прозрачность и открытость. API-интерфейсы позволяют разработчикам получать первичные данные, контент и метаданные непосредственно с платформы, «упакованные» вместе в таких форматах, как JSON или XML.

Решение задачи обеспечения долговременного доступа к материалам социальных сетей сталкивается с рядом проблем, связанных с обработкой пользовательского контента, непрерывностью доступа к данным социальных сетей, защитой неприкосновенности частной жизни / персональных данных, потенциальными нарушениями авторских прав и наличием возможностей поддерживать взаимосвязанный, интерактивный характер большинства социальных платформ. Существует также «проблема сохранения во времени смысла социальных сетей - это означает, что нужно позаботиться о сохранении архивом достаточного объёма метаданных, обеспечивающих адекватный контекст». Существуют также услуги третьих сторон и услуги самоархивации.

Контент социальных сетей подвержен потенциальному риску утраты. В отчете цитируются результаты одного исследования, в котором изучалась «продолжительность жизни ресурсов, выложенных в социальных сетях, и было установлено, что «спустя год после публикации утрачивается примерно 11% выложенных материалов, а затем потери продолжаются со скоростью 0,02% в день»».

Мой комментарий: Это означает, что за 13 лет контент социальной сети полностью теряется.

Вот ещё несколько цитат:
  • В целом, при захвате и сохранении данных социальных сетей требуется адекватная контекстуальная информация.

  • Сбор данных, метаданных и документации может не обеспечить сохранение достаточно полной контекстуальной информации для того, чтобы передать характер взаимодействия пользователей с этими платформами и технологиями.

  • Если, однако, рассматривать картину в целом, то сохранение материалов социальных сетей наилучшим образом может быть обеспечено крупным централизованным поставщиком услуг или несколькими такими поставщиками, а не путем связывания друг с другом более мелких наборов данных и коллекций различных учреждений.
Крис Эриксон (Chris Erickson)

Источник: блог Digital Preservation Matters / сайт компании Charles Beagrie Limited
http://preservationmatters.blogspot.ru/2016/02/preserving-social-media.html
http://blog.beagrie.com/2016/02/16/new-technology-watch-report-preserving-social-media/

Комментариев нет:

Отправить комментарий