Кто не идёт вперед, тот идёт назад: Использование искусственного интеллекта для обеспечения долговременной сохранности электронных документов для будущих поколений

среда, 14 февраля 2024 г.

Использование искусственного интеллекта для обеспечения долговременной сохранности электронных документов для будущих поколений

Данная статься Тая Берка (Tyrone “Ty” Burke – на фото) была опубликована 15 января 2024 года в новостном разделе сайта Карлтонского университет (Carleton university, Канада).

В сфере технологий изменения происходят быстро. Для сегодняшних детей дискеты, которые в 1990-е годы были основным носителем данных, являются незнакомыми артефактами. Точно так же на смену преобладавшим в начале 2010-х годов USB-накопителям теперь пришли облачные сервисы хранения данных. Да и компьютерные технологии сегодняшнего дня однажды будут заменены новыми, более качественными и быстродействующими.

Технологическое устаревание является серьёзной проблемой для архивов. На протяжении веков архивы являлись хранилищами важных документов о нашем прошлом – от древних свитков и пыльных манускриптов до земельных кадастров, исторических карт и судебных протоколов столетней давности. Сохраняемые в архивах источники информации играют центральную роль в поддержке нашей способности понимать и интерпретировать историю, а также управлять будущим. Они помогают нам познавать себя и управлять собой.

Быстрые темпы технологических изменений поднимают вопрос о том, получат ли будущие поколения аналогичную отдачу от электронной (цифровой) информации, которую мы производим сегодня. Даже если данные сохранятся, будут ли у архивов оборудование и ноу-хау, необходимые для доступа к ним, для их использования и просмотра?

Это лишь один из многих вопросов, касающихся будущего архивного дела. Участники международного научно-исследовательского проекта InterPARES Trust AI (этап «Доверие к ИИ» проекта InterPARES, или сокращённо «I Trust AI» – «Я доверяю ИИ») предвидят эти проблемы и стремится обеспечить долговременную сохранность современных цифровых артефактов – компьютерных игр, цифровых двойников, видео на Tik Tok – на предстоящие века.

Семинар в рамках встречи участников проекта InterPARES

Проблемы архивирования в эпоху массового производства данных

В рамках пятилетнего многонационального, многосекторального и междисциплинарного исследовательского проекта InterPARES Trust AI, финансируемого канадским Советом по исследованиям в области общественных и гуманитарных наук (Social Sciences and Humanities Research Council, SSHRC) и выполняемого под руководством д-ра Лючианы Дюранти (Dr Luciana Duranti) и Мухаммада Абдул-Маджида (Muhammad Abdul-Mageed) из Университета Британской Колумбии (University of British Columbia, UBC), будут изучаться возможности использования искусственного интеллекта (ИИ) для архивирования достоверных государственных документов.

Трейси Лорио (Tracey Lauriault, https://carleton.ca/sjc/profile/lauriault-tracey/ - на фото), доцент кафедры ключевых средств массовой информации и больших данных (Critical Media and Big Data) факультета журналистики и коммуникаций ( https://carleton.ca/sjc/ ) Карлтонского университета (Carleton University, г. Оттава, Канада) является одним из участников данного проекта, а также возглавляет в Карлтонском университете партнёрство, в котором участвуют факультеты коммуникаций и медиа-исследований, архитектуры, инженерного дела и информатики.

Её усилия в рамках проекта будут сосредоточены на вопросе о том, как архивировать сложные цифровые системы, вроде тех, что используются в географических информационных системах (ГИС), информационном моделировании зданий (building information modelling, BIM), в интеллектуальных энергосетях, а также для установления того, был ли документ создан искусственным интеллектом или нет.

«В проекте «I Trust AI» ставится вопрос о том, какими образом мы могли бы обеспечить сохранность электронных документов в течение следующих двухсот-трехсот лет», - поясняет Лорио.

Эта проблема особенно остро стоит для сложных цифровых систем. Например, решение «Иммерсивная медиа-студия университета Карлтон» (Carleton Immersive Media Studio, CIMS, https://cims.carleton.ca/ ) создает гипер-реалистичные цифровые двойники Канады, которые погружают зрителей в многомерную реплику окружающей среды. Решение CIMS создаёт подробные BIM-модели (от слова building information modeling, BIM - «информационное моделирование зданий» - Н.Х.), такие, например, как проект архитектурной реставрации и консервации как объекта культурного наследия здания парламента Канады.

В этой удостоенной премий модели использованы данные облака точек для воспроизведения геометрии искривленных поверхностей, сложных деталей и поверхностных деформаций физического пространства - от горгулий и строительных материалов и до всей территории здания. Цифровые двойники включают в себя данные наземного лазерного сканирования и фотограмметрии с географической привязкой, программное обеспечение для автоматизированного проектирования, исторические фотографии, а также технические и научно-исследовательские отчёты. Лишь посредством интеграции этих различных методов и инструментов решение CIMS способно формировать передовые иммерсивные модели.

«Здесь задействованы сотни различных файловых форматов, компьютерных коды и всевозможные системы», - отмечает Лорио. «В проекте «I Trust AI» ставится вопрос о том, сможет ли искусственный интеллект сможет обеспечить сохранность всего этого комплекта цифровых элементов и обеспечить, что они будут работать».

Далее Лорио объясняет, что «сегодня мы можем обратиться в Архивно-библиотечную службу Канады (Library and Archives Canada, LAC) и посмотреть там на бумажные карты 16-го века, - однако мы не уверены в том, что в будущем люди смогут увидеть сложные геопространственные артефакты, которые мы создаем сегодня. Мы создаем эти замечательные привлекательные системы и среду окружающего нас мира, совсем не думая о долговременной сохранности. В проекте «I Trust AI» изучается, как всё это работает, и прорабатываются способы сделать эти артефакты доступными в работоспособном состоянии для будущих поколений творцов, исследователей, инженеров и архивистов».

Снижение трудозатрат цифровых архивистов

Другие системы (такие как интеллектуальные энергосети, включающие механизмы Интернета вещей) сталкиваются с аналогичными проблемами: невозможно понять целое без наличия всех частей. Но есть и другие проблемы, с которыми сталкиваются архивы, такие, как колоссальные объёмы производимой нами информации – просто подумайте о миллионах фотографий, видеозаписей и компьютерных игр. И здесь ИИ тоже может помочь.

Каждую минуту на YouTube загружается более 500 часов видеозаписей. Люди не в состоянии просмотреть их все, не говоря уже о проведении каталогизации, сортировки и об управлении ими. ИИ может помочь снизить нагрузку на архивистов, поскольку можно разработать модели машинного обучения, предназначенные для чтения, курирования, сортировки и генерирования описаний. Представьте себе, что вы пытаетесь обеспечить долговременную сохранность данных и способа их распространения на платформах, генерирующих большие объёмы информации, таких как Facebook или Reddit.

Раньше архивисты могли просмотреть все фильмы, которые они приняли на хранения, однако сейчас они не в силах просмотреть 200 тысяч видеозаписей», - отмечает Лорио. «ИИ поможет провести экспертизу ценности этих материалов и описать их, однако нужно, чтобы результаты были точными и надёжными. И как нам определить, не были ли эти материалы сами созданы с помощью ИИ?»

Доверие и стратегическое управление при обеспечении долговременной сохранности архивов материалов, созданных с помощью ИИ

Объёмы данных, которыми архивисты должны управлять, постоянно растут, и с учетом появления приложений порождающего (генеративного) ИИ, таких как интеллектуальный чат-бот ChatGPT, документами в этих архивах будут те материалы, которые ChatGPT-подобные решения по всему миру будут использовать для создания нового контента. Такие ИИ-системы опираются на огромное количество текстов и изображений, а затем генерируют ещё больше материалов такого же рода, и не всегда будет очевидно, был ли конкретный контент сгенерирован ИИ или же является артефактом, созданным человеком (автором, режиссером или художником).

Лорио в сотрудничестве с учеными-компьютерщиками из Карлтонского университета проводят в интересах проекта «I Trust AI» исследования, которые помогут определить, какой контент был создан с помощью ИИ.

Эта работа в рамках проекта «I Trust AI» особенно важна, поскольку архивам по всему миру необходимо будет проводить экспертизу и принимать на хранение «правдивые» и «достоверные» тексты, изображения, аудио и видеоматериалы, поступившие, например, с мест боевых действий; документацию, связанную с нарушениями прав человека, а также артефакты, отражающие представляющие интерес события.

Это лишь некоторые из целого ряда ключевых вопросов, которые будут определять будущее архивов. В течение следующих пяти лет Карлтонский университет будет участвовать в исследованиях, проводимых в рамках проекта «I Trust AI» с целью решения этих проблем.

«Двигаясь вперед, мы захотим оглянуться назад на те системы, которые мы создаем сегодня», - говорит Лорио.

«Лет через пятьдесят они могут нам понадобиться. Возможно, нам потребуется взглянуть на цифровой двойник города Оттавы в том виде, в каком он существует сегодня – например, в случае, если город пострадает в результате стихийного бедствия, такого как наводнение; или для принятия профилактических мер и предотвращения будущих бедствий, связанных с изменением климата. И нам следует подумать о том, как осуществлять стратегическое управление этими сложными пространствами - например, сегодняшняя интеллектуальная энергосеть поможет сформировать будущие электроэнергетические системы. Следует также подумать, какие соглашения о данных нам нужны для создания цифровых двойников, для управления интеллектуальными энергосетями, для экспертизы создаваемого ИИ контента; как проводить экспертизу их ценности и как обеспечить их сохранность в нетронутом виде для будущих поколений.»

«Как нам сохранить эти модели в работоспособном состоянии, чтобы будущие поколения могли оглядываться назад и взаимодействовать с этими артефактами, учиться с их помощью, и лучше планировать?»

Тай Берк (Ty Burke)

Источник: сайт Карлтонского университета (Канада)
https://newsroom.carleton.ca/story/i-trust-ai-preserve-digital-records/

Кто не идёт вперед, тот идёт назад

среда, 14 февраля 2024 г.

Использование искусственного интеллекта для обеспечения долговременной сохранности электронных документов для будущих поколений

Комментариев нет:

Отправить комментарий

Dr Natasha Khramtsovsky

Обо мне: Наташа Храмцовская / Dr Natasha Khramtsovsky

Поиск по блогу / Search this blog

Искать по блогу / Search this blog 2

Архив блога / Blog Archives

Используйте теги / Click the tags!

География моих читателей (RU)

Постоянные читатели

Кто не идёт вперед, тот идёт назад

среда, 14 февраля 2024 г.

Использование искусственного интеллекта для обеспечения долговременной сохранности электронных документов для будущих поколений

Комментариев нет:

Отправить комментарий

Dr Natasha Khramtsovsky

Обо мне: Наташа Храмцовская / Dr Natasha Khramtsovsky

Поиск по блогу / Search this blog

Искать по блогу / Search this blog 2

Архив блога / Blog Archives

Используйте теги / Click the tags!

География моих читателей (RU)

Постоянные читатели

среда, 14 февраля 2024 г.