суббота, 13 мая 2023 г.

Использование архивных стандартов для поддержки возможности экспорта данных

Данная заметка архивиста и консультанта Марго Ноут (Margot Note – на фото) была опубликована 17 мая 2021 года на сайте компании Lucidea.

Система управления архивными коллекциями (collections management system, CMS) должна поддерживать создание и кодирование описательных метаданных, тем самым упрощая выявление имеющих непреходящую ценность документов.

Следует выбрать CMS-систему, соответствующую стандартам, которые подходят для конкретного учреждения и его фондов. Архивисты также используют стандарты для того, чтобы упростить экспорт данных и их передачу между системами.

Важность стандартов

CMS-система управления архивными коллекциями должна соответствовать стандартам архивного описания, таким как DACS, EAD, MARC, RAD, ISAD(G) и Dublin Core (Дублинское ядро).

Мой комментарий:

  • DACS – опубликованный Обществом американских архивистов (Society of American Archivists, SAA) стандарт «Архивное описание: Стандарт содержания» (Describing Archival: A Content Standard). Редакция 2019 года доступна по адресу доступен по адресу https://files.archivists.org/pubs/DACS_2019.0.3_Version.pdf  . Самую свежую версию стандарта 2022 года можно найти по адресу: https://saa-ts-dacs.github.io/ . См. также мой пост http://rusrim.blogspot.com/2021/01/2019-dacs.html ;

  • EAD - стандарт EAD (Encoded Archival Description – Кодированное описание архивных материалов) является непроприетарным стандартом кодирования архивных описей для использования в онлайн-среде. Документация по стандарту хранится на сайте Библиотеки Конгресса США. Разработку и поддержку стандарта осуществляет Технический подкомитет по стандартам кодированного архивного описания (Technical Subcommittee for Encoded Archival Description, TS-EAD) Комитета SAA по стандартам, см. https://www2.archivists.org/groups/technical-subcommittee-on-encoded-archival-standards-ts-eas/encoded-archival-description-ead . Версия 3 стандарта EAD  (EAD3) была опубликована в 2015 году, о ней см. также мой пост здесь: http://rusrim.blogspot.com/2015/08/3-ead.html ;

  • MARC - стандарты MARC (от «machine-readable cataloging» - машиночитаемая каталогизация) представляю собой набор цифровых форматов для описания каталогизируемых библиотеками объектов, таких как книги. В мире существует несколько версий MARC, среди которых наиболее популярными являются MARC 21 и UNIMARC (в России распространяется в версии RUSMARC);

  • RAD - канадские «Правила архивного описания» (Rules for Archival Description), разработанные комитетом по архивному описанию (Canadian Committee on Archival Description, CCAD) при канадском Совете архивов (Canadian Council of Archives, CCA). Редакция 2008 года доступна по адресу https://archivescanada.ca/wp-content/uploads/2022/08/RADComplete_July2008.pdf ;

  • ISAD(G) – стандарт Международного совета архивов «Основной международный стандарт архивного описания» (General International Standard Archival Description, ISAD(G), 2000 год). Доступен по адресу https://www.ica.org/sites/default/files/CBPS_2000_Guidelines_ISAD(G)_Second-edition_EN.pdf ;

  • Dublin Core – речь идёт о стандартах Международной организации по стандартизации (ИСО) ISO 15836-1:2017 «Информация и документация - Набор элементов метаданных «Дублинское ядро» - Часть 1. Основные элементы» (Information and documentation - The Dublin Core metadata element set - Part 1: Core elements) и ISO 15836-2:2019 «Информация и документация - Набор элементов метаданных «Дублинское ядро» - Часть 2: Свойства и классы DCMI» (Information and documentation - The Dublin Core metadata element set - Part 2: DCMI Properties and classes), которые в России были адаптированы соответственно как ГОСТ Р 7.0.10-2019 «Система стандартов по информации, библиотечному и издательскому делу. Набор элементов метаданных «Дублинское ядро». Основные (ядерные) элементы», см. http://protect.gost.ru/v.aspx?control=8&baseC=6&id=224665 и ГОСТ Р ИСО 15836-2-2022 «Система стандартов по информации, библиотечному и издательскому делу. Набор элементов метаданных «Дублинское ядро». Часть 2. Свойства и классы DCMI», см. https://protect.gost.ru/v.aspx?control=8&baseC=6&id=233515 .

Кроме того, при описании материалов коллекций следует использовать тезаурусы, соответствующие международным стандартам. Многие учреждения могут пожелать следовать определённым стандартам при описании своих фондов, однако при этом они также могут захотеть добавить типы полей для сохранения уникальной информации об их организации, которая выходит за рамки стандарта. Они также могут захотеть сохранить эту информацию в контекстно-зависимом поле, а не в поле примечаний, с тем, чтобы иметь возможность использовать её для более точного поиска и в качестве категории в рамках схемы классификации (фасета) на своём портале. CMS-система может поддерживать создание полей, дополняющих существующий, соответствующий стандартам предопределённый набор полей, что даёт возможность архивистам захватывать, при желании, соответствующие данные.

CMS-система должна поддерживать поля, соответствующие международным стандартам и иерархическому описанию; а также экспорт и импорт соответствующих этим стандартам записей, а стратегии поиска должны предусматривать использование логические операций и ключевых слов. Например, программа может импортировать в отсканированные изображения с цифровых камер или сканеров, формируя документы. Один такой документ может состоять из нескольких графических образов, что помогает при описании и идентификации имеющих непреходящую ценность документов. Метаданные о размере файлов, их формате и расположении импортируются автоматически, что устраняет необходимость двойного ввода данных персоналом. Архивисты имеют возможность создавать дополнительные метаданные, включая такие, как заголовок (caption), создатель, дата создания, разрешение, размер, программное обеспечение и оборудование, использованное для захвата изображения.

Контролируемые словари

При управлении использованием авторизованных названий, архивисты также могут полагаться на регламентирующие документы (controlling authorities). Например, CMS-система может использовать «Международный стандарт по созданию архивных авторитетных записей для юридических, физических лиц и семей» (International Standard Archival Authority Records—Corporate Bodies, Persons, and Families, ISAAR(CPF)). Такой «авторитетный контроль» (authority control, см. http://www.ciscra.org/mat/mat/term/2112/2608 - Н.Х.) обеспечивает согласованность библиографической информации – например, единообразное, чёткое написание имени или названия.

Однажды у меня был клиент, у которого имелась базой данных собственной разработки без авторитетного контроля. Когда мы вели поиск по темам, результаты были неполными из-за вариативности имён, которые использовали художники. Например, Тупак Шакур (Tupac Shakur) был зарегистрирован и как «Тупак Шакур» (Tupac Shakur), и под его сценическим именем «2Pac», а также под псевдонимом «Макавели» (Makaveli). Одно из моих предложений по упрощению использования системы заключалось в том, чтобы использовать Предметные рубрики Библиотеки Конгресса США (Library of Congress Subject Headings, LCSH) - контролируемый словарь предметных рубрик для всех библиографических записей в системе.

В то время как CMS обеспечивает структуру благодаря простоте применения стандартов, она также должна быть гибкой и поддерживать полную иерархическую модель, в которой часто нуждаются исторические материалы – т.е. уровни «коллекции», «серии» и «элементы». У архивистов должна быть возможность использовать столько иерархических структур, сколько им необходимо для описания коллекций. Выбор подходящего стандарта метаданных и пакета программ, способного использовать контролируемые словари, позволит сократить количество вариантов при выборе CMS-системы.

Кодировка EAD

Надежная CMS-система также должна обеспечивать кодирование описей в соответствии со стандартом EAD. Система должна автоматизировать создание EAD-описаний, так чтобы записи верхнего уровня и все записи нижележащих уровней экспортировались вместе с соответствующими изображениями и текстами. EAD можно экспортировать, что даёт пользователям возможность получать доступ к базе данных, когда архивисты экспортируют описательные записи в формате EAD/XML и обратные ссылки. Впоследствии исследователи могут перейти ко всем взаимосвязанным материалам, а также выполнить дополнительный поиск.

CMS-система также позволяет создавать отчеты, включающие фирменный знак, специальное форматирование, расчеты и/или диаграммы. Отчеты можно распечатать либо в виде PDF-файла, либо экспортировать данные в виде CSV-файла (Comma-Separated Values – файл со значениями, разделённые запятыми).

Экспорт данных

При выборе подходящей CMS-системы для своих организаций архивистам следует искать системы, которые поддерживают стандарты, позволяющие им экспортировать данные. Процесс развёртывания CMS-системы – это возможность улучшить архивные процессы. Наряду с системными требованиями подумайте о том, как можно сделать архивную работу более эффективной за счёт большей автоматизации, интеграции систем и использования стандартов, - а также о том, чем эта система поможет Вашему учреждению, его миссии и его историческим коллекциям.

Марго Ноут (Margot Note)

Источник: сайт компании Lucidea
https://lucidea.com/blog/using-archival-standards-to-make-data-exportable/

Комментариев нет:

Отправить комментарий