среда, 14 февраля 2024 г.

Использование искусственного интеллекта для обеспечения долговременной сохранности электронных документов для будущих поколений

Данная статься Тая Берка (Tyrone “Ty” Burke – на фото) была опубликована 15 января 2024 года в новостном разделе сайта Карлтонского университет (Carleton university, Канада).

В сфере технологий изменения происходят быстро. Для сегодняшних детей дискеты, которые в 1990-е годы были основным носителем данных, являются незнакомыми артефактами. Точно так же на смену преобладавшим в начале 2010-х годов USB-накопителям теперь пришли облачные сервисы хранения данных. Да и компьютерные технологии сегодняшнего дня однажды будут заменены новыми, более качественными и быстродействующими.

Технологическое устаревание является серьёзной проблемой для архивов. На протяжении веков архивы являлись хранилищами важных документов о нашем прошлом – от древних свитков и пыльных манускриптов до земельных кадастров, исторических карт и судебных протоколов столетней давности. Сохраняемые в архивах источники информации играют центральную роль в поддержке нашей способности понимать и интерпретировать историю, а также управлять будущим. Они помогают нам познавать себя и управлять собой.

Быстрые темпы технологических изменений поднимают вопрос о том, получат ли будущие поколения аналогичную отдачу от электронной (цифровой) информации, которую мы производим сегодня. Даже если данные сохранятся, будут ли у архивов оборудование и ноу-хау, необходимые для доступа к ним, для их использования и просмотра?

Это лишь один из многих вопросов, касающихся будущего архивного дела. Участники международного научно-исследовательского проекта InterPARES Trust AI (этап «Доверие к ИИ» проекта InterPARES, или сокращённо «I Trust AI» – «Я доверяю ИИ») предвидят эти проблемы и стремится обеспечить долговременную сохранность современных цифровых артефактов – компьютерных игр, цифровых двойников, видео на Tik Tok – на предстоящие века.


Семинар в рамках встречи участников проекта InterPARES

Проблемы архивирования в эпоху массового производства данных

В рамках пятилетнего многонационального, многосекторального и междисциплинарного исследовательского проекта InterPARES Trust AI, финансируемого канадским Советом по исследованиям в области общественных и гуманитарных наук (Social Sciences and Humanities Research Council, SSHRC) и выполняемого под руководством д-ра Лючианы Дюранти (Dr Luciana Duranti) и Мухаммада Абдул-Маджида (Muhammad Abdul-Mageed) из Университета Британской Колумбии (University of British Columbia, UBC), будут изучаться возможности использования искусственного интеллекта (ИИ) для архивирования достоверных государственных документов.

Трейси Лорио (Tracey Lauriault, https://carleton.ca/sjc/profile/lauriault-tracey/ - на фото), доцент кафедры ключевых средств массовой информации и больших данных (Critical Media and Big Data) факультета журналистики и коммуникаций ( https://carleton.ca/sjc/ ) Карлтонского университета (Carleton University, г. Оттава, Канада) является одним из участников данного проекта, а также возглавляет в Карлтонском университете партнёрство, в котором участвуют факультеты коммуникаций и медиа-исследований, архитектуры, инженерного дела и информатики.

Её усилия в рамках проекта будут сосредоточены на вопросе о том, как архивировать сложные цифровые системы, вроде тех, что используются в географических информационных системах (ГИС), информационном моделировании зданий (building information modelling, BIM), в интеллектуальных энергосетях, а также для установления того, был ли документ создан искусственным интеллектом или нет.

«В проекте «I Trust AI» ставится вопрос о том, какими образом мы могли бы обеспечить сохранность электронных документов в течение следующих двухсот-трехсот лет», - поясняет Лорио.

Эта проблема особенно остро стоит для сложных цифровых систем. Например, решение «Иммерсивная медиа-студия университета Карлтон» (Carleton Immersive Media Studio, CIMS, https://cims.carleton.ca/ ) создает гипер-реалистичные цифровые двойники Канады, которые погружают зрителей в многомерную реплику окружающей среды. Решение CIMS создаёт подробные BIM-модели (от слова building information modeling, BIM -  «информационное моделирование зданий» - Н.Х.), такие, например, как проект архитектурной реставрации и консервации как объекта культурного наследия здания парламента Канады.

В этой удостоенной премий модели использованы данные облака точек для воспроизведения геометрии искривленных поверхностей, сложных деталей и поверхностных деформаций физического пространства - от горгулий и строительных материалов и до всей территории здания. Цифровые двойники включают в себя данные наземного лазерного сканирования и фотограмметрии с географической привязкой, программное обеспечение для автоматизированного проектирования, исторические фотографии, а также технические и научно-исследовательские отчёты. Лишь посредством интеграции этих различных методов и инструментов решение CIMS способно формировать передовые иммерсивные модели.

 «Здесь задействованы сотни различных файловых форматов, компьютерных коды и всевозможные системы», - отмечает Лорио. «В проекте «I Trust AI» ставится вопрос о том, сможет ли искусственный интеллект сможет обеспечить сохранность всего этого комплекта цифровых элементов и обеспечить, что они будут работать».

Далее Лорио объясняет, что «сегодня мы можем обратиться в Архивно-библиотечную службу Канады (Library and Archives Canada, LAC) и посмотреть там на бумажные карты 16-го века, - однако мы не уверены в том, что в будущем люди смогут увидеть сложные геопространственные артефакты, которые мы создаем сегодня. Мы создаем эти замечательные привлекательные системы и среду окружающего нас мира, совсем не думая о долговременной сохранности. В проекте «I Trust AI» изучается, как всё это работает, и прорабатываются способы сделать эти артефакты доступными в работоспособном состоянии для будущих поколений творцов, исследователей, инженеров и архивистов».
 

Снижение трудозатрат цифровых архивистов

Другие системы (такие как интеллектуальные энергосети, включающие механизмы Интернета вещей) сталкиваются с аналогичными проблемами: невозможно понять целое без наличия всех частей. Но есть и другие проблемы, с которыми сталкиваются архивы, такие, как колоссальные объёмы производимой нами информации – просто подумайте о миллионах фотографий, видеозаписей и компьютерных игр. И здесь ИИ тоже может помочь.

Каждую минуту на YouTube загружается более 500 часов видеозаписей. Люди не в состоянии просмотреть их все, не говоря уже о проведении каталогизации, сортировки и об управлении ими. ИИ может помочь снизить нагрузку на архивистов, поскольку можно разработать модели машинного обучения, предназначенные для чтения, курирования, сортировки и генерирования описаний. Представьте себе, что вы пытаетесь обеспечить долговременную сохранность данных и способа их распространения на платформах, генерирующих большие объёмы информации, таких как Facebook или Reddit.

Раньше архивисты могли просмотреть все фильмы, которые они приняли на хранения, однако сейчас они не в силах просмотреть 200 тысяч видеозаписей», - отмечает Лорио. «ИИ поможет провести экспертизу ценности этих материалов и описать их, однако нужно, чтобы результаты были точными и надёжными. И как нам определить, не были ли эти материалы сами созданы с помощью ИИ?»


Доверие и стратегическое управление при обеспечении долговременной сохранности архивов материалов, созданных с помощью ИИ

Объёмы данных, которыми архивисты должны управлять, постоянно растут, и с учетом появления приложений порождающего (генеративного) ИИ, таких как интеллектуальный чат-бот ChatGPT, документами в этих архивах будут те материалы, которые ChatGPT-подобные решения по всему миру будут использовать для создания нового контента. Такие ИИ-системы опираются на огромное количество текстов и изображений, а затем генерируют ещё больше материалов такого же рода, и не всегда будет очевидно, был ли конкретный контент сгенерирован ИИ или же является артефактом, созданным человеком (автором, режиссером или художником).

Лорио в сотрудничестве с учеными-компьютерщиками из Карлтонского университета проводят в интересах проекта «I Trust AI» исследования, которые помогут определить, какой контент был создан с помощью ИИ.

Эта работа в рамках проекта «I Trust AI» особенно важна, поскольку архивам по всему миру необходимо будет проводить экспертизу и принимать на хранение «правдивые» и «достоверные» тексты, изображения, аудио и видеоматериалы, поступившие, например, с мест боевых действий; документацию, связанную с нарушениями прав человека, а также артефакты, отражающие представляющие интерес события.

Это лишь некоторые из целого ряда ключевых вопросов, которые будут определять будущее архивов. В течение следующих пяти лет Карлтонский университет будет участвовать в исследованиях, проводимых в рамках проекта «I Trust AI» с целью решения этих проблем.


«Двигаясь вперед, мы захотим оглянуться назад на те системы, которые мы создаем сегодня», - говорит Лорио.

«Лет через пятьдесят они могут нам понадобиться. Возможно, нам потребуется взглянуть на цифровой двойник города Оттавы в том виде, в каком он существует сегодня – например, в случае, если город пострадает в результате стихийного бедствия, такого как наводнение; или для принятия профилактических мер и предотвращения будущих бедствий, связанных с изменением климата. И нам следует подумать о том, как осуществлять стратегическое управление этими сложными пространствами - например, сегодняшняя интеллектуальная энергосеть поможет сформировать будущие электроэнергетические системы. Следует также подумать, какие соглашения о данных нам нужны для создания цифровых двойников, для управления интеллектуальными энергосетями, для экспертизы создаваемого ИИ контента; как проводить экспертизу их ценности и как обеспечить их сохранность в нетронутом виде для будущих поколений.»

«Как нам сохранить эти модели в работоспособном состоянии, чтобы будущие поколения могли оглядываться назад и взаимодействовать с этими артефактами, учиться с их помощью, и лучше планировать?»

Тай Берк (Ty Burke)

Источник: сайт Карлтонского университета (Канада)
https://newsroom.carleton.ca/story/i-trust-ai-preserve-digital-records/

Комментариев нет:

Отправить комментарий