пятница, 13 декабря 2013 г.

Новости Международной организации по стандартизации: Опубликован Технический отчет ИСО по вопросам статистики и качества в веб-архивации


Несколько лет назад я сообщала о начале работы над этим документом, см. http://rusrim.blogspot.ru/2009/11/46.html . 4 декабря 2013 года из новостийной рассылки NISO (National Information Standards Organization - Национальная организации по информационным стандартам, представляющая США в соответствующем техническом комитете ИСО – Н.Х.) я узнала о том, что Технический отчет ISO/TR 14873:2013 «Информация и документация - вопросы статистики и качества в веб-архивации» (Information and documentation – Statistics and quality issues for web archiving, http://www.iso.org/iso/home/store/catalogue_tc/catalogue_detail.htm?csnumber=55211 ) объёмом 54 страницы опубликован.

Как сообщается в рассылке и на сайте ИСО, в техническом отчете определены статистические показатели, термины и критерии качества для целей веб-архивации. Документ учитывает потребности и практику широкого круга организаций и учреждений, таких, как библиотеки, архивы, музеи, научно-исследовательские центры и фонды культурно-исторического наследия.

Технический отчет ISO/TR 14873:2013 предназначен для профессионалов, непосредственно занимающихся веб-архивацией. Он также будет полезен для финансирующих проекты веб-архивации организаций и учреждений, и для внешних заинтересованных сторон. Используемая терминология стремится отразить широкий круг интересов и опыта потенциальной аудитории, балансируя между интересами компьютерных наук, менеджмента и библиотечного дела.

Основное внимание в Техническом отчете уделено принципах и методам веб-архивации, и он не охватывает альтернативные способы захвата интернет-ресурсов.

Информация о Техническом отчете на «Платформе для онлайн-просмотра» (OBP)

Более подробную информацию о документе дает недавно заработавшая «Платформы для онлайн-просмотра материалов по стандартам ИСО» (Online Browsing Platform, OBP), где доступны тексты предисловия, введения и частично терминологического раздела, см. https://www.iso.org/obp/ui/#iso:std:iso:tr:14873:ed-1:v1:en  .

Во введении в документ отмечается:
«Данный технический отчет был разработан в ответ на мировой спрос на руководства по управлению веб-архивацией и по оценке соответствующей деятельности и продуктов.

Под веб-архивацией понимается деятельность по отбору, захвату, хранению, обеспечению долговременной сохранности и управлению доступом к «снимкам» (snapshots) интернет-ресурсов. Такая деятельность началась в конце 1990-х годов, исходя их убеждения в том, что архив интернет-ресурсов станет в будущем ключевым документом, необходимым для научных исследований, деловой деятельности и государственного управления. Интернет-ресурсы рассматриваются как часть культурного наследия и, соответственно, их сохранность обеспечивается аналогично сохранению входящих в состав культурно-исторического наследия  печатных изданий. Многие учреждения, занимающиеся веб-архивацией, рассматривают её как продолжение своей традиционной миссии по сохранению национального наследия, и во многих странах веб-архивация одобряется и поддерживается законодательством, таким, как законодательство об обязательных экземплярах.

В Интернете существует множество разнообразных ресурсов, в том числе тексты, графические изображения, видео- и звукозаписи и иные мультимедийные форматы. Помимо связанных ссылками веб-страниц, существуют также новостийные группы, информационные бюллетени, блоги и интерактивные сервисы (например, игровые), доступ к которым осуществляется с использованием различных протоколов взаимодействия и передачи данных. В веб-архивах накапливаются копии интернет-ресурсов, автоматически и, как правило, на регулярной основе, создаваемые специальным программным обеспечением (harvesting software), Ставится задача воспроизведения работы этих ресурсов, включая поддержку внутренних взаимосвязей (например, гипертекстовых ссылок), как можно ближе к их поведению в момент захвата. Основной задачей веб-архивации является постоянное сохранение документов, отражающих историю Интернета, по возможности ближе к их первоначальной форме, в интересах науки, профессиональной деятельности и для личных целей.

Веб-архивация – это недавно появившийся, но расширяющий свои масштабы вид деятельности, который постоянно требует новых подходов и инструментов, чтобы идти в ногу с быстро развивающимися веб-технологиями. Исходя из придаваемого этому виду деятельности архивными учреждениями стратегического значения, из имеющихся средств, а иногда и из требований законодательства, были разработаны различные подходы к архивации интернет-ресурсов, начиная от захвата отдельных веб-страниц и до целых доменов верхнего уровня. В плане использования организациями, веб-архивация также находится на разных уровнях зрелости. В то время, как в одних организациях она стала элементом обычной деловой деятельности, другие организации лишь начинают пилотные программы по изучению этой проблемы.

В зависимости от масштаба и целей веб-архива, можно провести различие между двумя широкими классами стратегий веб-архивации: массовый захват (bulk harvesting) и выборочный захват (selective harvesting). Крупномасштабный массовый захват (как, например, захват всего национального домена) делается для создания «снимка» всего домена (или его подмножества). Выборочный захват осуществляется в гораздо меньших масштабах, является более нацеленным и выполняется чаще, нередко на основе таких критериев, как тема, событие, формат (например, аудио- или видеофайлы), или на основе соглашения с владельцами контента. Главное различие между этими двумя стратегиями заключается в уровне контроля качества и в оценке захваченных сайтов с тем, чтобы определить, были ли достигнуты предварительно заданные стандарты качества. Масштабы деятельности при захвате домена не позволяют выполнять «вручную» какие-либо визуальные сопоставления собранного контента и «живой» версии ресурса, - что при выборочном захвате является обычным методом контроля качества.

Данный Технический отчет призван показать, как можно оценивать веб-архивы и управлять ими как составной частью более обширных коллекций культурно-исторического наследия, используя схожие/согласованные подходы, опирающиеся на традиционные библиотечные процессы. В Техническом отчете рассматриваются развитие коллекций, их характеризация и описание, обеспечение долговременной сохранности и использования, а также организационная структура. При этом  показывается, что большинство элементов традиционных процессов управления коллекциями, в принципе. остаются в силе и для веб-архивации, хотя на практике требуется определенная их «подстройка».

Хотя Технический отчет содержит обзор текущего состояния веб-архивации, основное внимание в нем уделяется определению и использованию статистических данных веб-архива и показателей качества. Получение определенных статистических данных зависит от программного обеспечения, используемого для захвата, индексации и просмотра веб-ресурсов, и иной выбор программного обеспечения может привести к дисперсии в результатах. Данный технический отчет, однако, не одобряет и не рекомендует какое-либо конкретное программное обеспечение. В нём предлагается набор показателей, помогающих оценить производительность и качество веб-архивов в целом.»
Источник: сайт ISO / рассылка NISO
http://www.iso.org/iso/home/store/catalogue_tc/catalogue_detail.htm?csnumber=55211
https://www.iso.org/obp/ui/#iso:std:iso:tr:14873:ed-1:v1:en

Комментариев нет:

Отправить комментарий