воскресенье, 28 июля 2024 г.

Новая статья: «О выборе словарей для архивных данных»

Данный пост старшего аналитика по вопросам политик управления электронными документами Национальных Архивов США и эксперта ИСО Энди Поттера (Andy Potter - на фото) был опубликован в социальной сети LinkedIn 15 июля 2024 года в учётной записи технического подкомитета ИСО TC46/SC11 «Управление документами».

Мой комментарий: речь идёт о статье В. Замборлини (Zamborlini, V.), Л. ван Виссен (van Wissen, L.), А. Мероно Пенуэла (Merono Penuela, A.) и К. ван ден Хеувел (van den Heuvel, C.) «О выборе словарей для архивных данных» (On the Choice of Vocabularies for Archival Data), в: Семинар «Современные онтологии для цифровых архивов» (ContemporarY Ontologies for Digital Archives, YODA), 14-я Международная конференция по формальной онтологии в информационных системах (International Conference on Formal Ontology in Information Systems, FOIS 2024), 2024. Статья объёмом 15 страниц доступна на сайте Королевского колледжа Лондона (King’s College London) по адресу https://kclpure.kcl.ac.uk/portal/en/publications/on-the-choice-of-vocabularies-for-archival-data . Прямая ссылка на PDF-файл: https://kclpure.kcl.ac.uk/portal/files/272749586/FOIS_2024_paper_4767.pdf либо https://www.albertmeronyo.org/wp-content/uploads/2024/06/FOIS_2024_paper_4767.pdf

В аннотации на статью отмечается:

«Снова и снова исследователи сталкиваются с проблемой выбора наиболее подходящего словаря для публикации архивных данных, особенно в семантической сети. Возможности варьируются от самых популярных вариантов, таких как словари на сайте http://schema.org/ , до более всесторонних, как, например CIDOC-CRM. У каждого из этих вариантов есть свои плюсы и минусы, но нет рекомендаций в отношении того, как делать выбор.

Мой комментарий: CIDOC-CRM – это концептуальная эталонная модель (Conceptual Reference Model, CRM), разработанная комитетом по документации CIDOC при Международном совете музеев (ИКОМ - International Council of Museums, ICOM). Модель CIDOC-CRM представляет собой обширную онтологию для понятий и информации в сфере документации по музеям и культурному наследию (см. Википедию, https://en.wikipedia.org/wiki/CIDOC_Conceptual_Reference_Model ).

Цель данной статьи – предложить ряд рекомендаций, основанных на анализе имеющихся данных, а также требований поставщиков и пользователей данных. Например, архивы часто воздерживаются от дополнительных интерпретаций, просто предоставляя доступ к категоризированным документам, имеющим простые аннотации (такие, как указания на имена людей или названия мест).

Более того, возможны тонкости, связанные с архивными данными, равно как и с их оцифрованными версиями - например, является ли документ оригинальным или же он был изменён, упрощён, скопирован или переведен на другой язык. Эти сведения часто опускаются. Таким образом, в зависимости от того, насколько подробная информация на самом деле доступна, а также от требований поставщиков/пользователей данных, - данные могут быть «размещены» на разных уровнях контентной «грамотности»/детализации и происхождения.

Имея чёткое представление о возможностях и ограничениях каждого уровня, выбор одного или нескольких словарей сводится к тому словарю, который должен обеспечить необходимую выразительность. Естественно, не одного словаря, а нескольких также требует определённых усилий по интеграции».

Энди Поттер (Andy Potter)

Источник: сайт LinkedIn
https://www.linkedin.com/feed/update/urn:li:activity:7218616152741089280

Комментариев нет:

Отправить комментарий