вторник, 6 февраля 2018 г.

Национальные Архивы Великобритании: Моделирование наших электронных архивных данных


Данная заметка руководителя отдела электронной архивации Национальных Архивов Великобритании Соньи Ранада (Sonia Ranade – на фото) была опубликована 26 января 2018 года на блоге Национальных Архивов.

В «Электронной стратегии» (Digital Strategy) Национальных Архивов Великобритании на 2017-2019 годы  (см. http://www.nationalarchives.gov.uk/documents/the-national-archives-digital-strategy-2017-19.pdf , о ней также см. мой пост здесь: https://rusrim.blogspot.ru/2017/03/blog-post_9.html - Н.Х.) идентифицированы те проблемы, с которыми мы сталкиваемся по мере того, как становимся электронным архивом второго поколения. Стратегия содержит видение архива, который является запроектировано-электронным (Digital by Design), способным обеспечить долговременную сохранность и доступ к широкому спектру богатых электронных документов, которые лучше отражают деятельность электронного правительства (о котором см. https://gds.blog.gov.uk/about/ ). В частности, стратегия подчеркивает необходимость нового подхода к предоставлению доступа к электронным архивным документам.

Электронные документы, которые мы к настоящему времени приняли на хранение, намного разнообразнее физических документов (см. также http://blog.nationalarchives.gov.uk/blog/identifying-digital-file-formats-collaborative-effort/ ). Это не просто тексты, они могут включать в себя всевозможные другие материалы, начиная от обсуждений в виде цепочек сообщений, сформированных с помощью веб-инструментов, - и вплоть до видеозаписей, веб-сайтой, структурированных наборов данных и даже компьютерных кодов. Эти документы могут быть сложными, и они часто состоят из различных компонентов, у которых потенциально могут быть разные создатели и владельцы. И мы знаем, что в ближайшие годы в нашу коллекцию будут добавляться материалы во всё более специализированных форматах.

Все эти новые электронные объекты в той же мере являются государственными документами, что и бумажные дела, которые они заменили, и нам нужно по крайней мере сделать их столь же доступными, как сейчас доступны аналоговые документы. При этом мы не можем просто взять стандарты, процессы и инструменты, которые используются нами в бумажном мире, и применить их в электронном мире - эти два мира существенно отличаются друг от друга.

Мы начали изучать возможности для предоставления доступа новым способом, изначально разработанным с учётом того, как наши пользователи хотят работать с электронными документами сегодня, который также будет поддерживать соответствие ожиданиям пользователей в будущем. Ключевое различие заключается в том, что, хотя мы по-прежнему будем предлагать нашим «читателям» возможность просмотра отдельных документов, мы также должны сделать документы доступными для компьютерного анализа, что позволит нашим «пользователям данных» работать с большими массивами документов и задавать очень разные типы исследовательских вопросов.

Параллельно мы сами будем активно обрабатывать материалы нашей коллекции с целью обогащения архивного описания и установление контекста для документов (контекстуализации). Результатом этой работы станет информация, отличная по объёмам и форме от наших традиционных описаний в каталогах. Например, мы можем представить себе контекстуализацию документов через их ссылки на другие ресурсы, часто принадлежащие другим учреждениям; или путем обогащения архивных описаний, что также сделает более эффективным поиск - или путем применения вероятностных методов, которые учитывают неопределенность, характерную для исторических документов.

Существует четыре вида полезной отдачи, которые электронный архив предлагает своим пользователям: обеспечение долговременной сохранности, контекстуализация, представлении и поддержка возможности использования (см. рис.).


Когда мы начали работу в этом направлении, в качестве ключевого «строительного блока» была идентифицирована потребность в модели, описывающей наши документы как данные. Ныне существующие каталоги просто не в состоянии вместить весь диапазон информации, которой нам теперь нужно управлять: нам нужно адаптироваться к тому, чтобы поддерживать более многогранную интерпретацию наших документов.

Решая эту задачу, мы готовы учиться у тех, кто уже сталкивался с подобными проблемами, использовать опыт уже проделанной работы по поддержке повторного использования и внедрять инновации с целью создания новых подходов там, где это требуется. Сейчас существует множество моделей данных. Некоторые из них были специально созданы для архивных коллекций (например, модель Международного совета архивов «Документы в контекстах», RiC, https://www.ica.org/en/egad-ric-conceptual-model и модель PREMIS, см. https://www.loc.gov/standards/premis/v3/premis-3-0-final.pdf ), в то время как другие созданы  для иных сфер деятельности, сталкивающихся с аналогичными проблемами (примером могут служить модели METS, см. https://www.loc.gov/standards/mets/METSOverview.v2.html , или FRBR, https://www.ifla.org/files/assets/cataloguing/frbr/frbr_2008.pdf ). Существуют модели, пытьющиеся объединить несколько подходов (например, EDM, https://pro.europeana.eu/resources/standardization-tools/edm-documentation ). Все они предлагают определённую точку зрения на описание электронных коллекций.

В настоящее время мы изучаем виды информации, которые хотели бы сохранять, - начиная от метаданных, созданных выпустившим электронный объект государственным органом или учреждением, от ценных сведений, «встроенных» в электронные объекты (например, геокодирования в изображениях), и вплоть до свойств, которые впоследствии установлены внешней стороной как для отдельных объектов, так и для их совокупностей. Наша модель будет признавать и принимать во внимание наличие неопределенности, вариации с течением времени и создаваемый и предоставляемый пользователями контент.

Если Вы работаете над похожими задачами или если у Вас есть особый интерес к какой-либо из названных выше тем, мы будем рады установить с Вами контакт. Вы можете оставить свой комментарий под этим постом либо написать нам по адресу discovery@nationalarchives.gov.uk .

Сонья Ранада (Sonia Ranade)

Источник: блог Национальных Архивов Великобритании
http://blog.nationalarchives.gov.uk/blog/modelling-digital-archival-data/ 

Комментариев нет:

Отправить комментарий