суббота, 27 мая 2023 г.

В международном журнале «Вычисления и культурное наследие» опубликована статья «Позиционирование параданных: Концептуальные рамки документации ИИ-процессов в контексте архивного дела и управления документами»

Как сообщил 28 апреля 2023 года сайт американской Ассоциация по вычислительной технике (Association for Computing Machinery, ACM), в издаваемом ассоциацией международном журнале «Вычисления и культурное наследие» (ACM Journal on Computing and Cultural Heritage) была опубликована статья Скотта Кэмерона (Scott Cameron), Пэт Фрэнкс (Patricia C. Franks) и Бабака Хамидзаде (Babak Hamidzadeh) под названием «Позиционирование параданных: Концептуальные рамки документации ИИ-процессов в контексте архивного дела и управления документами» (Positioning Paradata: A Conceptual Frame for AI Processual Documentation in Archives and Recordkeeping Contexts) объёмом 22 страницы, полный текст которой доступен по адресу https://doi.org/10.1145/3594728 , прямая ссылка на PDF-файл: https://dl.acm.org/doi/pdf/10.1145/3594728 .

Статья интересна обсуждением концепции «параданных», которые предлагается отличать от «метаданных» (правда, полезность такого различение, на мой взгляд, довольно-таки спорная). Параданные, в частности, привлекли внимание в рамках авторитетного международного проекта InterPARES, текущий этап которого связан с обеспечением доверия к технологиям искусственного интеллекта.

В статье упоминаются следующие интерпретации понятия «параданные»:

  • Статистические науки: параданные - качественные или количественные данные о процессе сбора или компоновки статистических данных.

  • Виртуальная визуализация культурно-исторического наследия (Бентковска-Кафел - Bentkowska-Kafel): параданные отражают выбор вариантов дизайна, сделанный в процессе создания визуализации объектов культурно-исторического наследия.

  • Документация по исследовательским наборам данных (Huvila): параданные - «данные, которые могут помочь пролить свет на прошлые, текущие и потенциальные процессы, связанные с данными»; категория метаданных, которые также могут пересекаться с контекстной информацией и информацией о происхождении, в зависимости от конкретного случая.

  • Мнение проекта InterPARES (разделяемое авторами статьи): параданные – информация о процедурах и инструментах, используемых для создания и обработки информационных ресурсов, вместе с информацией о лицах, выполняющих эти процедуры.

    Сравните: метаданные - информация об ином информационном ресурсе

  • Общие моменты, присутствующие во всех источниках: параданные –информация о других информационных ресурсах; фиксируется как с целью документирования процессов создания, курирования и/или управления другими информационными ресурсами.

В резюме статьи отмечается следующее:

«Появление сложных инструментов искусственного интеллекта и машинного обучения бросает вызов специалистам в области архивного дела и управления документами, которые привыкли понимать и документировать действия людей, а не часто непрозрачные процессы функционирования сложных ИИ-систем.

На предварительном этапе работы термин «параданные» был предложен для описания уникальных потребностей в документации, которые возникают у архивистов, использующих ИИ-инструменты для обработки документов в своих коллекциях.

В контексте использования ИИ архивистами, параданные здесь понимаются как зафиксированная и сохраняемая информация об обработке документов с помощью ИИ-инструментов; это категория данных, которая определяется как её связью с другими наборами данных, так и документальной целью, которой она служит.

В данной статье приводится обзор соответствующей литературы в трёх контекстах, с целью сбора соответствующих научных знаний, которые архивисты могут использовать для формирования надлежащих практик документирования ИИ. Начиная от статистических методов социальных наук и области визуального культурно-исторического наследия, в статье обсуждаются существующие определения «параданных» и их неоднозначная, часто контекстно-зависимая взаимосвязь с существующими категориями метаданных.

Подходя к проблеме с социотехнической точки зрения, литература по объяснимому ИИ (explainable AI) подчеркнуто настаивает на том, чтобы объяснимость соответствовала сформулированным потребностям конкретных пользователей -потребностям, которые архивисты могут лучше сформулировать, используя концептуальные рамки параданных.

Что особенно важно, в статье ИИ рассматривается как вызов подотчетности, прозрачности и беспристрастности в архивах, связанный с введением незнакомого и не являющегося человеком действующего лица – вызов, который раздвигает границы существующей архивной практики и требует разработки новых концепций и словарей для формирования облика будущих технологических и методологических разработок в архивах.»

Источник: сайт ACM
https://doi.org/10.1145/3594728
https://dl.acm.org/doi/pdf/10.1145/3594728

Комментариев нет:

Отправить комментарий