четверг, 14 сентября 2023 г.

Модель информации о происхождении данных PROV консорциума W3C

В последнее время я всё чаще сталкиваюсь с вопросами происхождения данных, больших данных и обучающих наборов данных для моделей искусственного интеллекта. В этой связи стоит упомянуть модель информации о происхождении данных PROV, опубликованную Консорциумом всемирной паутины (World Wide Web Consortium, http://www.w3.org/ - международное сообщество, разрабатывающего открытые стандарты, обеспечивающие развитие интернета в долговременной перспективе).


Информацию о модели PROV можно найти по адресу: https://www.w3.org/TR/prov-overview/ .

В обзорном документе ( https://www.w3.org/TR/prov-overview/ ) отмечается, что «Информация о происхождении (provenance) - это сведения о сущностях, действиях и людях, вовлеченных в создание данных или вещи. Такие сведения могут быть использованы для оценки их [данных] качества, надежности или достоверности. Семейство документов PROV определяет модель, соответствующие сериализации (представления) и другие вспомогательные определения, поддерживающие интероперабельный обмен информацией о происхождении в гетерогенных средах, таких как Интернет.»

В состав семейства документов PROV входят:

  • PROV-OVERVIEW (справочный документ) – обзор семейства документов PROV, см. https://www.w3.org/TR/2013/NOTE-prov-overview-20130430/

  • PROV-PRIMER (справочный документ) – введение в модель PROV, см. https://www.w3.org/TR/2013/NOTE-prov-primer-20130430/

  • PROV-O (рекомендация) – онтология PROV, представляющая модель данных PROV на языке веб-онтологий OWL2, https://www.w3.org/TR/2013/REC-prov-o-20130430/ 

  • PROV-DM (рекомендация) – модель данных PROV для информации о происхождении, см. https://www.w3.org/TR/2013/REC-prov-dm-20130430/

  • PROV-N (рекомендация) – нотация для информации о происхождении, предназначенная для использования человеком, см. https://www.w3.org/TR/2013/REC-prov-n-20130430/

  • PROV-CONSTRAINTS (рекомендация) – описывает набор ограничений, применимых к модели данных PROV. Соответствующие этим ограничениям PROV-блоки (instances), состоящие из набора утверждений (statements), считаются действительными (valid), см. https://www.w3.org/TR/2013/REC-prov-constraints-20130430/ 

  • PROV-XML (справочный документ) – XML-схема для модели данных PROV, см. https://www.w3.org/TR/2013/NOTE-prov-xml-20130430/ 

  • PROV-AQ (справочный документ) – описывает механизмы доступа и выполнения запросов к информации о происхождении, объясняя, как использовать стандартные веб-протоколы, в т.ч. HTTP, для получения информации о происхождении веб-ресурсов, см. https://www.w3.org/TR/2013/NOTE-prov-aq-20130430/

  • PROV-DICTIONARY (справочный документ) – описывает расширения PROV, облегчающее создание моделей информации о происхождении для структур данных справочников, см. https://www.w3.org/TR/2013/NOTE-prov-dictionary-20130430/

  • PROV-DC (справочный документ) устанавливает соответствие между PROV-O и элементами модели метаданных Дублинское ядро (Dublin Core), см. https://www.w3.org/TR/2013/NOTE-prov-dc-20130430/

  • PROV-SEM (справочный документ) - данный документ представляет теоретико-модельную семантику для модели данных PROV, рассматривая операторы PROV-DM как атомарные формулы в смысле логики первого порядка и рассматривая ограничения и выводы, указанные в PROV-CONSTRAINTS, как теорию первого порядка, см. https://www.w3.org/TR/2013/NOTE-prov-sem-20130430/

  • PROV-LINKS (справочный документ) вводит механизм установления связей между определенными в PROV-DM «пакетами» (bundles) описаний происхождения, см. https://www.w3.org/TR/2013/NOTE-prov-links-20130430/

По своей сути информация о происхождении описывает использование и производство сущностей (entities) посредством деятельности (activities), на которую агенты (agents) могут различным образом влиять. Эти основные элементы модели и их взаимоотношения показаны на рисунке 1.


Рис.1 Основные структуры модели PROV

Источники: сайт W3C / Википедия
https://www.w3.org/TR/prov-overview/
https://wiki5.ru/wiki/PROV_(Provenance)

Комментариев нет:

Отправить комментарий