пятница, 5 июня 2026 г.

Локальный ИИ-помощник PlumA для архивного описания документов с использованием ИИ

Данная заметка испанского специалиста, исполнительного директора Испанского общества научной документации и информации (Sociedad Española de Documentación e Información Científica, SEDIC) Виктора Вильяпалоса Пардиньяса (Víctor Villapalos Pardiñas – на фото) была опубликована 14 мая 2026 года в социальной сети LinkedIn,

Новые локальные ИИ-помощники для архивного описания: Локальный ИИ-помощник PlumA для архивного описания документов с использованием ИИ

Мой комментарий: Эта новость интересна тем, что она показывает – начали разрабатываться специализированные ИИ-инструменты для архивистов.

После нескольких месяцев итеративной разработки и завершения закрытого альфа-тестирования я выпускаю первую публичную бета-версию решения PlumA - инструмента с открытым исходным кодом, призванного помочь архивистам в выполнении одной из самых рутинных задач повседневной архивной работы: извлечения из документов структурированной информации и её сопоставлении с международными стандартами архивного описания.

Решение PlumA не заменяет архивиста, не автоматизирует процесс принятия профессиональных суждений. Программа считывает оцифрованный документ и предлагает варианты значений для полей, опираясь на стандарты архивного описания ISAD(G), DACS, ISAAR(CPF), ISDF, ISDIAH, а также на упрощенную модель нового стандарта архивного описания «Документы в контекстах» (RiC). При этом каждое предложение программы подкрепляется обосновывающими его буквальными цитатами из исходного документа.

Специалист-человек сохраняет контроль над процессом: он просматривает, корректирует и принимает окончательное решение о том, какие данные следует передать в ArchivesSpace, AtoM или любую иную систему архивного описания.

Основная идея, лежащая в основе решения PlumA, проста: многие архивные документы нельзя отправлять на обработку в облачные ИИ-сервисы. Организационно-распорядительная документация, персональные данные, метрические книги, нотариальные акты и чувствительные документы организаций требуют иного подхода.

Именно поэтому решение PlumA работает полностью локально, используя контейнерную платформу Docker и локальный движок ИИ на базе Ollama. После установки программы, документы не покидают компьютер архивиста. В системе отсутствуют телеметрия, внешняя обработка данных и подключения к удаленным серверам.

В первую бета-версию включены следующие функциональные возможности:

  • Поддержка стандартов архивного описания ISAD(G), DACS, ISAAR(CPF), ISDF, ISDIAH и упрощенного варианта RiC;

  • Режимы извлечения данных: извлечение только важнейших данных, полное извлечение данных и настраиваемый (пользовательский) режим;

  • Автоматическое определение типа документа;

  • Поддержка текстовых и сканированных PDF-файлов, документов формата DOCX, а также файлов изображений;

  • Экспорт данных в форматы JSON, CSV, EAD3 и EAC-CPF;

  • Предложения и заполнении полей, подкрепляемые цитатами из источника, с использованием индикаторов уверенности;

  • Двуязычный интерфейс (испанский и английский языки).

Данная версия по-прежнему находится на стадии бета-тестирования. Она предназначена для целей тестирования, обучения, демонстрации возможностей, а также для выполнения контролируемых пилотных проектов с использованием материалов коллекций, не содержащих конфиденциальной информации. Данный инструмент пока не предназначен для промышленной эксплуатации при работе с конфиденциальными документами организаций или же для пакетной обработки без контроля со стороны оператора.

Решение PlumA является частью более широкого набора локальных архивных инструментов с открытым исходным кодом, который я разрабатываю для поддержки выполнения типовых профессиональных задач: описания документов, создания авторитетных записей и словарей, обеспечения интероперабельности, а также для подготовки научно-справочного аппарата.

Я буду признателен за отзывы и предложения от архивистов, специалистов по управлению документами, преподавателей архивного дела и специалистов галерей, библиотек, архивов и музеев (GLAM).

Ссылка на репозиторий: https://github.com/Token-Vean/Pluma 

Релиз v0.5.0-beta доступен по адресу: https://github.com/Token-Vean/Pluma/releases/tag/v0.5.0-beta ; см. также https://github.com/Token-Vean/Pluma/releases 

Решение PlumA распространяется под лицензией GNU AGPL-3.0.

Виктор Вильяпалос Пардиньяс (Víctor Villapalos Pardiñas)

Источник: сайт LinkedIn
https://www.linkedin.com/feed/update/urn:li:activity:7458244092368625664 
https://www.linkedin.com/feed/update/urn:li:groupPost:2620672-7458243834502672385  

Комментариев нет:

Отправить комментарий