Данная статься Тая Берка (Tyrone “Ty” Burke – на фото) была опубликована 15 января 2024 года в новостном разделе сайта Карлтонского университет (Carleton university, Канада).
В сфере технологий изменения происходят быстро. Для сегодняшних детей дискеты, которые в 1990-е годы были основным носителем данных, являются незнакомыми артефактами. Точно так же на смену преобладавшим в начале 2010-х годов USB-накопителям теперь пришли облачные сервисы хранения данных. Да и компьютерные технологии сегодняшнего дня однажды будут заменены новыми, более качественными и быстродействующими.
Технологическое устаревание является серьёзной проблемой для архивов. На протяжении веков архивы являлись хранилищами важных документов о нашем прошлом – от древних свитков и пыльных манускриптов до земельных кадастров, исторических карт и судебных протоколов столетней давности. Сохраняемые в архивах источники информации играют центральную роль в поддержке нашей способности понимать и интерпретировать историю, а также управлять будущим. Они помогают нам познавать себя и управлять собой.
Быстрые темпы технологических изменений поднимают вопрос о том, получат ли будущие поколения аналогичную отдачу от электронной (цифровой) информации, которую мы производим сегодня. Даже если данные сохранятся, будут ли у архивов оборудование и ноу-хау, необходимые для доступа к ним, для их использования и просмотра?
Это лишь один из многих вопросов, касающихся будущего архивного дела. Участники международного научно-исследовательского проекта InterPARES Trust AI (этап «Доверие к ИИ» проекта InterPARES, или сокращённо «I Trust AI» – «Я доверяю ИИ») предвидят эти проблемы и стремится обеспечить долговременную сохранность современных цифровых артефактов – компьютерных игр, цифровых двойников, видео на Tik Tok – на предстоящие века.
Проблемы архивирования в эпоху массового производства данных
В рамках пятилетнего многонационального, многосекторального и междисциплинарного исследовательского проекта InterPARES Trust AI, финансируемого канадским Советом по исследованиям в области общественных и гуманитарных наук (Social Sciences and Humanities Research Council, SSHRC) и выполняемого под руководством д-ра Лючианы Дюранти (Dr Luciana Duranti) и Мухаммада Абдул-Маджида (Muhammad Abdul-Mageed) из Университета Британской Колумбии (University of British Columbia, UBC), будут изучаться возможности использования искусственного интеллекта (ИИ) для архивирования достоверных государственных документов.
Трейси Лорио (Tracey Lauriault, https://carleton.ca/sjc/profile/lauriault-tracey/ - на фото), доцент кафедры ключевых средств массовой информации и больших данных (Critical Media and Big Data) факультета журналистики и коммуникаций ( https://carleton.ca/sjc/ ) Карлтонского университета (Carleton University, г. Оттава, Канада) является одним из участников данного проекта, а также возглавляет в Карлтонском университете партнёрство, в котором участвуют факультеты коммуникаций и медиа-исследований, архитектуры, инженерного дела и информатики.
Её усилия в рамках проекта будут сосредоточены на вопросе о том, как архивировать сложные цифровые системы, вроде тех, что используются в географических информационных системах (ГИС), информационном моделировании зданий (building information modelling, BIM), в интеллектуальных энергосетях, а также для установления того, был ли документ создан искусственным интеллектом или нет.
«В проекте «I Trust AI» ставится вопрос о том, какими образом мы могли бы обеспечить сохранность электронных документов в течение следующих двухсот-трехсот лет», - поясняет Лорио.
Эта проблема особенно остро стоит для сложных цифровых систем. Например, решение «Иммерсивная медиа-студия университета Карлтон» (Carleton Immersive Media Studio, CIMS, https://cims.carleton.ca/ ) создает гипер-реалистичные цифровые двойники Канады, которые погружают зрителей в многомерную реплику окружающей среды. Решение CIMS создаёт подробные BIM-модели (от слова building information modeling, BIM - «информационное моделирование зданий» - Н.Х.), такие, например, как проект архитектурной реставрации и консервации как объекта культурного наследия здания парламента Канады.
В этой удостоенной премий модели использованы данные облака точек для воспроизведения геометрии искривленных поверхностей, сложных деталей и поверхностных деформаций физического пространства - от горгулий и строительных материалов и до всей территории здания. Цифровые двойники включают в себя данные наземного лазерного сканирования и фотограмметрии с географической привязкой, программное обеспечение для автоматизированного проектирования, исторические фотографии, а также технические и научно-исследовательские отчёты. Лишь посредством интеграции этих различных методов и инструментов решение CIMS способно формировать передовые иммерсивные модели.
«Здесь задействованы сотни различных файловых форматов, компьютерных коды и всевозможные системы», - отмечает Лорио. «В проекте «I Trust AI» ставится вопрос о том, сможет ли искусственный интеллект сможет обеспечить сохранность всего этого комплекта цифровых элементов и обеспечить, что они будут работать».
Далее Лорио объясняет, что «сегодня мы можем обратиться в Архивно-библиотечную службу Канады (Library and Archives Canada, LAC) и посмотреть там на бумажные карты 16-го века, - однако мы не уверены в том, что в будущем люди смогут увидеть сложные геопространственные артефакты, которые мы создаем сегодня. Мы создаем эти замечательные привлекательные системы и среду окружающего нас мира, совсем не думая о долговременной сохранности. В проекте «I Trust AI» изучается, как всё это работает, и прорабатываются способы сделать эти артефакты доступными в работоспособном состоянии для будущих поколений творцов, исследователей, инженеров и архивистов».
Снижение трудозатрат цифровых архивистов
Другие системы (такие как интеллектуальные энергосети, включающие механизмы Интернета вещей) сталкиваются с аналогичными проблемами: невозможно понять целое без наличия всех частей. Но есть и другие проблемы, с которыми сталкиваются архивы, такие, как колоссальные объёмы производимой нами информации – просто подумайте о миллионах фотографий, видеозаписей и компьютерных игр. И здесь ИИ тоже может помочь.
Каждую минуту на YouTube загружается более 500 часов видеозаписей. Люди не в состоянии просмотреть их все, не говоря уже о проведении каталогизации, сортировки и об управлении ими. ИИ может помочь снизить нагрузку на архивистов, поскольку можно разработать модели машинного обучения, предназначенные для чтения, курирования, сортировки и генерирования описаний. Представьте себе, что вы пытаетесь обеспечить долговременную сохранность данных и способа их распространения на платформах, генерирующих большие объёмы информации, таких как Facebook или Reddit.
Раньше архивисты могли просмотреть все фильмы, которые они приняли на хранения, однако сейчас они не в силах просмотреть 200 тысяч видеозаписей», - отмечает Лорио. «ИИ поможет провести экспертизу ценности этих материалов и описать их, однако нужно, чтобы результаты были точными и надёжными. И как нам определить, не были ли эти материалы сами созданы с помощью ИИ?»
Доверие и стратегическое управление при обеспечении долговременной сохранности архивов материалов, созданных с помощью ИИ
Объёмы данных, которыми архивисты должны управлять, постоянно растут, и с учетом появления приложений порождающего (генеративного) ИИ, таких как интеллектуальный чат-бот ChatGPT, документами в этих архивах будут те материалы, которые ChatGPT-подобные решения по всему миру будут использовать для создания нового контента. Такие ИИ-системы опираются на огромное количество текстов и изображений, а затем генерируют ещё больше материалов такого же рода, и не всегда будет очевидно, был ли конкретный контент сгенерирован ИИ или же является артефактом, созданным человеком (автором, режиссером или художником).
Лорио в сотрудничестве с учеными-компьютерщиками из Карлтонского университета проводят в интересах проекта «I Trust AI» исследования, которые помогут определить, какой контент был создан с помощью ИИ.
Эта работа в рамках проекта «I Trust AI» особенно важна, поскольку архивам по всему миру необходимо будет проводить экспертизу и принимать на хранение «правдивые» и «достоверные» тексты, изображения, аудио и видеоматериалы, поступившие, например, с мест боевых действий; документацию, связанную с нарушениями прав человека, а также артефакты, отражающие представляющие интерес события.
Это лишь некоторые из целого ряда ключевых вопросов, которые будут определять будущее архивов. В течение следующих пяти лет Карлтонский университет будет участвовать в исследованиях, проводимых в рамках проекта «I Trust AI» с целью решения этих проблем.
«Двигаясь вперед, мы захотим оглянуться назад на те системы, которые мы создаем сегодня», - говорит Лорио.
«Лет через пятьдесят они могут нам понадобиться. Возможно, нам потребуется взглянуть на цифровой двойник города Оттавы в том виде, в каком он существует сегодня – например, в случае, если город пострадает в результате стихийного бедствия, такого как наводнение; или для принятия профилактических мер и предотвращения будущих бедствий, связанных с изменением климата. И нам следует подумать о том, как осуществлять стратегическое управление этими сложными пространствами - например, сегодняшняя интеллектуальная энергосеть поможет сформировать будущие электроэнергетические системы. Следует также подумать, какие соглашения о данных нам нужны для создания цифровых двойников, для управления интеллектуальными энергосетями, для экспертизы создаваемого ИИ контента; как проводить экспертизу их ценности и как обеспечить их сохранность в нетронутом виде для будущих поколений.»
«Как нам сохранить эти модели в работоспособном состоянии, чтобы будущие поколения могли оглядываться назад и взаимодействовать с этими артефактами, учиться с их помощью, и лучше планировать?»
Тай Берк (Ty Burke)
Источник: сайт Карлтонского университета (Канада)
https://newsroom.carleton.ca/story/i-trust-ai-preserve-digital-records/
Подписаться на:
Комментарии к сообщению (Atom)
Комментариев нет:
Отправить комментарий