Новые локальные ИИ-помощники для архивного описания: Локальный ИИ-помощник PlumA для архивного описания документов с использованием ИИ
Мой комментарий: Эта новость интересна тем, что она показывает – начали разрабатываться специализированные ИИ-инструменты для архивистов.
После нескольких месяцев итеративной разработки и завершения закрытого альфа-тестирования я выпускаю первую публичную бета-версию решения PlumA - инструмента с открытым исходным кодом, призванного помочь архивистам в выполнении одной из самых рутинных задач повседневной архивной работы: извлечения из документов структурированной информации и её сопоставлении с международными стандартами архивного описания.
Решение PlumA не заменяет архивиста, не автоматизирует процесс принятия профессиональных суждений. Программа считывает оцифрованный документ и предлагает варианты значений для полей, опираясь на стандарты архивного описания ISAD(G), DACS, ISAAR(CPF), ISDF, ISDIAH, а также на упрощенную модель нового стандарта архивного описания «Документы в контекстах» (RiC). При этом каждое предложение программы подкрепляется обосновывающими его буквальными цитатами из исходного документа.
Специалист-человек сохраняет контроль над процессом: он просматривает, корректирует и принимает окончательное решение о том, какие данные следует передать в ArchivesSpace, AtoM или любую иную систему архивного описания.
Основная идея, лежащая в основе решения PlumA, проста: многие архивные документы нельзя отправлять на обработку в облачные ИИ-сервисы. Организационно-распорядительная документация, персональные данные, метрические книги, нотариальные акты и чувствительные документы организаций требуют иного подхода.
Именно поэтому решение PlumA работает полностью локально, используя контейнерную платформу Docker и локальный движок ИИ на базе Ollama. После установки программы, документы не покидают компьютер архивиста. В системе отсутствуют телеметрия, внешняя обработка данных и подключения к удаленным серверам.
В первую бета-версию включены следующие функциональные возможности:
- Поддержка стандартов архивного описания ISAD(G), DACS, ISAAR(CPF), ISDF, ISDIAH и упрощенного варианта RiC;
- Режимы извлечения данных: извлечение только важнейших данных, полное извлечение данных и настраиваемый (пользовательский) режим;
- Автоматическое определение типа документа;
- Поддержка текстовых и сканированных PDF-файлов, документов формата DOCX, а также файлов изображений;
- Экспорт данных в форматы JSON, CSV, EAD3 и EAC-CPF;
- Предложения и заполнении полей, подкрепляемые цитатами из источника, с использованием индикаторов уверенности;
- Двуязычный интерфейс (испанский и английский языки).
Данная версия по-прежнему находится на стадии бета-тестирования. Она предназначена для целей тестирования, обучения, демонстрации возможностей, а также для выполнения контролируемых пилотных проектов с использованием материалов коллекций, не содержащих конфиденциальной информации. Данный инструмент пока не предназначен для промышленной эксплуатации при работе с конфиденциальными документами организаций или же для пакетной обработки без контроля со стороны оператора.
Решение PlumA является частью более широкого набора локальных архивных инструментов с открытым исходным кодом, который я разрабатываю для поддержки выполнения типовых профессиональных задач: описания документов, создания авторитетных записей и словарей, обеспечения интероперабельности, а также для подготовки научно-справочного аппарата.
Я буду признателен за отзывы и предложения от архивистов, специалистов по управлению документами, преподавателей архивного дела и специалистов галерей, библиотек, архивов и музеев (GLAM).
Ссылка на репозиторий: https://github.com/Token-Vean/Pluma
Релиз v0.5.0-beta доступен по адресу: https://github.com/Token-Vean/Pluma/releases/tag/v0.5.0-beta ; см. также https://github.com/Token-Vean/Pluma/releases
Решение PlumA распространяется под лицензией GNU AGPL-3.0.
Виктор Вильяпалос Пардиньяс (Víctor Villapalos Pardiñas)
Источник: сайт LinkedIn
https://www.linkedin.com/feed/update/urn:li:activity:7458244092368625664
https://www.linkedin.com/feed/update/urn:li:groupPost:2620672-7458243834502672385










