Порой новое – это забытое или же малоизвестное старое. На пленарной встрече международного проекта InterPARES в октябре 2024 года, во время обсуждения возможностей применения искусственного интеллекта в работе архивов, американские коллеги (в том числе Кеннет Тибодё, под руководством которого в своё время создавался федеральный Электронный архив документов (ERA)), рассказали о проекте PERPOS, который выполнялся в течение ряда лет, включал ИИ-элементы и был доведен до внедрения в нескольких президентских библиотеках, контролируемых Национальными Архивами США. Они также дали ссылку на статью об этом проекте, опубликованную в январе 2007 года.
Итак, речь идёт о статье Уильяма Андервуд (William Underwood, Университет Мэриленда) и Сандры Лайб (Sandra Laib, Технологический институт Джорджии) «Система хранения и архивной обработки электронных документов PERPOS» (PERPOS: An Electronic Records Repository and Archival Processing System) объёмом 7 страниц, которую можно скачать со страницы сайта ResearchGate по адресу https://www.researchgate.net/publication/255582490_PERPOS_An_Electronic_Records_Repository_and_Archival_Processing_System
В аннотации на статью сказано следующее:
«Система хранения и архивной обработки электронных документов «Пилотная система для президентских электронных документов» (Presidential Electronic Records Pilot System, PERPOS) были разработана для помощи архивистам в архивной обработке президентских электронных документов. В системе поддерживаются приём на хранение, упорядочивание, обеспечение долговременной сохранности, экспертиза, описание документов и создание научно-справочного аппарата. Подсистема управления данными включает схему для хранилища, а также метаданные для упорядочивания, экспертизы, обеспечения долговременной сохранности и описания. Прототип системы поддерживает среду для экспериментального применения передовых информационных технологий в архивных процессах.
Первой целью проекта разработки системы PERPOS была поддержка архивистов в обеспечении интеллектуального и физического контроля над персональными компьютерными документами, которые были созданы и использовались в период администрации президента Джорджа Буша-старшего. Второй целью являлось применение передовых информационных технологий для поддержки принятия архивистами решений в ходе обработки президентских электронных документов.
Программная система (также называемая PERPOS) была разработана с использованием метода, известного как «эволюционное прототипирование». Первоначальный прототип был создан для того, чтобы лучше разобраться в проблемах отделения файлов операционной системы и файлов прикладного офисного программного обеспечения от файлов, созданных пользователем; и просмотра компьютерных файлов в устаревших файловых форматах. После использования прототипа для обработки реальных файлов с персональных компьютеров из офисов Белого дома и накопления необходимых знаний, прототип был адаптирован для удовлетворения теперь уже лучше понимаемых потребностей.
Использовавшие PERPOS архивисты обнаружили, что некоторые файлы нельзя было просмотреть. Это были защищённые паролем или зашифрованные файлы, повреждённые файлы и файлы в устаревших форматах, для которых не было средств просмотра. Прототип был доработан, чтобы включить в него возможности для восстановления паролей для защищённых или зашифрованных файлов, использования восстановленных паролей для расшифровки файлов, для восстановления повреждённых файлов и для преобразования устаревших файловых форматов современные или стандартные форматы, для которых имелись средства просмотра. Затем прототип был снова использован для обработки электронных документов с ПК администрации Буша, были накоплены дополнительные знания и опыт, а затем прототип был повторно доработан на основе рекомендаций архивистов. Далее этот процесс использования и доработки был ещё раз повторен.
Данный циклический процесс использования прототипа, обучения и повторной доработки повторяется до тех пор, пока система-прототип не удовлетворит всем потребностям и, таким образом, не превратится в пригодную для эксплуатации систему. Полученная, но продолжающая эволюционировать система представляет собой «Систему хранения и архивной обработки электронных документов».
В статье описываются действия по приёму на хранение и систематической обработке документов. Затем обсуждается модель данных хранилища. Система-прототип PERPOS состоит из двух подсистем: «Инструмента архивного хранилища» (Archival Repository Tool, ART) и «Инструмента архивной обработки» (Archival Processing Tool, APT).»
Существует также опубликованный в 2006 году отчёт Технологического института Джорджии «Обработка запросов на основании закона о свободе доступа к государственной информации с использованием системы PERPOS» (FOIA Processing in the Presidential Electronic Records PilOt System), см. https://www.archives.gov/files/applied-research/papers/presidential-electronic-records-pilot.pdf ; и отчёт 2007 года «Результаты пилотного тестирования обработки запросов на основании закона о свободе доступа к государственной информации с использованием системы PERPOS» (Results of Pilot Testing of FOIA Processing Using PERPOS), см. https://www.archives.gov/files/applied-research/papers/pilot-testing.pdf .
В отчёте 2007 года отмечается, что в системе PERPOS были использованы следующие инновационные технологии: автоматическое распознавание типов документов и извлечение метаданных, автоматическое описание содержания документов, папок и серий документов, а также поддержка проведения архивистами анализа раскрываемых документов (включая вымарывание конфиденциальной информации). Определённый интерес представляет проиллюстрированный в отчёте 2006 года интерфейс архивиста, используемый при архивной обработке документов.
Источник: сайт ResearchGate / сайт Национальных Архивов США
https://www.researchgate.net/profile/Sandra-Laib/publication/255582490_PERPOS_An_Electronic_Records_Repository_and_Archival_Processing_System/links/54d393430cf2b0c6146dbfa1/PERPOS-An-Electronic-Records-Repository-and-Archival-Processing-System.pdf
https://www.researchgate.net/publication/255582490_PERPOS_An_Electronic_Records_Repository_and_Archival_Processing_System
https://www.archives.gov/files/applied-research/papers/presidential-electronic-records-pilot.pdf
https://www.archives.gov/files/applied-research/papers/pilot-testing.pdf
Комментариев нет:
Отправить комментарий